لطفا جهت اطلاع از آخرین دوره ها و اخبار سایت در
کانال تلگرام
عضو شوید.
آموزش علم داده و یادگیری ماشین با پایتون - دست به کار شوید!
Data Science and Machine Learning with Python - Hands On!
نکته:
آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیوها:
توضیحات دوره:
دانشمندان داده یکی از پردرآمدترین مشاغل را دارند که طبق گفتههای Glassdoor و Indeed، میانگین حقوق 120000 دلار است. این فقط میانگین است! و این فقط در مورد پول نیست - کار جالبی نیز هست!
اگر تجربه برنامه نویسی یا اسکریپت نویسی دارید، این دوره تکنیک های مورد استفاده توسط دانشمندان داده واقعی در صنعت فناوری را به شما آموزش می دهد - و شما را برای حرکت به این مسیر شغلی داغ آماده می کند. این دوره جامع شامل 68 سخنرانی است که تقریباً 9 ساعت ویدیو را در بر می گیرد و بیشتر موضوعات شامل کدهای پایتون عملی است. نمونه هایی که می توانید برای مرجع و تمرین استفاده کنید. من از تجربه 9 ساله خود در آمازون و IMDb استفاده خواهم کرد تا شما را در مورد آنچه مهم است و چه چیزی مهم نیست راهنمایی کنم.
هر مفهوم به زبان انگلیسی ساده معرفی شده است، و از گیج شدن نمادهای ریاضی و اصطلاحات تخصصی جلوگیری می شود. سپس با استفاده از کد پایتون نشان داده میشود که میتوانید با آن آزمایش کنید و روی آن بسازید، همراه با یادداشتهایی که میتوانید برای مراجع بعدی نگه دارید. شما در این دوره پوشش آکادمیک و عمیقاً ریاضی این الگوریتم ها را نخواهید یافت - تمرکز بر درک عملی و کاربرد آنها است.
موضوعات این دوره از تجزیه و تحلیل الزامات واقعی در فهرستهای شغلی دانشمندان داده از بزرگترین کارفرمایان فناوری میآیند. ما تکنیکهای یادگیری ماشین و دادهکاوی را که کارفرمایان واقعی به دنبال آن هستند، از جمله:
پوشش خواهیم داد
تحلیل رگرسیون
K-Means Clustering
تجزیه و تحلیل مؤلفه اصلی
آموزش/آزمایش و اعتبارسنجی متقابل
روشهای بیزی
درختان تصمیم و جنگل های تصادفی
رگرسیون چند متغیره
مدل های چند سطحی
ماشینهای بردار پشتیبانی
یادگیری تقویتی
فیلتر مشارکتی
K-نزدیکترین همسایه
مبادله تعصب/واریانس
آموزش گروهی
فرکانس اصطلاح/فرکانس معکوس سند
طراحی آزمایشی و آزمون های A/B
...و خیلی بیشتر! همچنین یک بخش کامل در مورد یادگیری ماشین با Apache Spark وجود دارد که به شما امکان میدهد این تکنیکها را به «دادههای بزرگ» تجزیهوتحلیل شده در یک خوشه محاسباتی ارتقا دهید.
اگر تازه وارد پایتون هستید، نگران نباشید - دوره با یک دوره خراب شروع می شود. اگر قبلاً برنامه نویسی انجام داده اید، باید سریع آن را انتخاب کنید. این دوره به شما نشان می دهد که چگونه بر روی رایانه های شخصی مبتنی بر ویندوز مایکروسافت راه اندازی کنید. کد نمونه روی سیستمهای دسکتاپ MacOS یا Linux نیز اجرا میشود، اما من نمیتوانم از آنها پشتیبانی ویژه سیستمعامل ارائه کنم.
اگر برنامه نویسی هستید که به دنبال تغییر مسیر شغلی جدید و هیجان انگیز هستید، یا یک تحلیلگر داده هستید که به دنبال انتقال به صنعت فناوری است - این دوره تکنیک های اساسی مورد استفاده توسط دانشمندان داده صنعت دنیای واقعی را به شما آموزش می دهد. فکر می کنم از آن لذت خواهید برد!
فایل SkillShareProject.zip پیوست شده را از حالت فشرده خارج کنید و فایل FinalProject-SkillShare.ipynb را برای چالش نهایی خود باز کنید!
وظیفه شما این است که از یادگیری ماشینی برای طبقه بندی توده های موجود در ماموگرافی به عنوان خوش خیم یا بدخیم استفاده کنید. شما از انواع تکنیک های طبقه بندی که در این دوره توضیح داده شده است استفاده خواهید کرد و خواهید دید که چگونه آنها را از نظر دقت مقایسه می کنند.
وقتی کارتان تمام شد، راه حل من در نوت بوک FinalProjectSolution-SkillShare.ipynb است. قبل از اینکه کارتان تمام شود، نگاهی به چشم نمیاندازید!
سرفصل ها و درس ها
درس ها
Lessons
یافتن شباهت های فیلم
Finding Movie Similarities
کاهش ابعاد؛ تجزیه و تحلیل مؤلفه های اصلی
Dimensionality Reduction; Principal Component Analysis
بهبود نتایج شباهت های فیلم
Improving the Results of Movie Similarities
TF/IDF
TF / IDF
کوواریانس و همبستگی
Covariance and Correlation
فیلتر مشارکتی مبتنی بر کاربر
User-Based Collaborative Filtering
مدیریت داده های نامتعادل: نمونه برداری بیش از حد، نمونه برداری کم، و SMOTE
Handling Unbalanced Data: Oversampling, Undersampling, and SMOTE
دستورالعمل راه اندازی لینوکس
Linux Setup Instructions
آموزش نظارت شده در مقابل یادگیری بدون نظارت، آموزش/آزمون
Supervised vs. Unsupervised Learning, Train / Test
اندازه گیری آنتروپی
Measuring Entropy
استفاده از قطار/آزمایش برای جلوگیری از نصب بیش از حد
Using Train/Test to Prevent Overfitting
مدل های چند سطحی
Multi-Level Models
راه حل تمرین: احتمال شرطی
Exercise Solution: Conditional Probability
معرفی پانداها
Intro to Pandas
تشخیص نقاط پرت
Detecting Outliers
مبانی پایتون، قسمت 2
Python Basics, Part 2
استفاده از KNN برای پیش بینی رتبه بندی یک فیلم
Using KNN to Predict a Rating for a Movie
جستجوی ویکی پدیا با اسپارک
Searching Wikipedia with Spark
رگرسیون چندگانه
Multiple Regression
دوره تصادف در matplotlib
A Crash Course in matplotlib
خوشه بندی افراد بر اساس درآمد و سن
Clustering People by Income and Age
روش های بیزی: مفاهیم
Bayesian Methods: Concepts
فیلتر مشارکتی مبتنی بر آیتم
Item-Based Collaborative Filtering
دستورالعمل های راه اندازی مک
Mac Setup Instructions
عملی با Q-Learning
Hands-On with Q-Learning
استقرار مدل ها در تولید
Deploying Models to Production
مثال PCA با مجموعه داده های Iris
PCA Example with the Iris Data Set
پاک کردن داده های گزارش وب
Cleaning Web Log Data
دست به کار با T-Tests
Hands-On with T-Tests
استفاده از SVM برای خوشه بندی افراد
Using SVM to Cluster People
فرانک 9 سال را در آمازون و IMDb گذراند و فناوری را توسعه و مدیریت کرد که به طور خودکار توصیه های محصول و فیلم را به صدها میلیون مشتری ارائه می دهد. زمان. فرانک دارای 17 حق ثبت اختراع صادر شده در زمینه های محاسبات توزیع شده ، داده کاوی و یادگیری ماشین است. در سال 2012، فرانک شرکت موفق خود را به نام Sundog Software راه اندازی کرد که بر فناوری محیط واقعیت مجازی تمرکز دارد و به دیگران در مورد تجزیه و تحلیل داده های بزرگ آموزش می دهد.
نمایش نظرات