لطفا جهت اطلاع از آخرین دوره ها و اخبار سایت در
کانال تلگرام
عضو شوید.
آموزش جرقه ای برای یادگیری ماشین و هوش مصنوعی
Spark for Machine Learning & AI
نکته:
آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیوها:
توضیحات دوره:
Apache Spark یکی از پرکاربردترین و پشتیبانی شده ترین ابزارهای منبع باز برای یادگیری ماشین و داده های بزرگ است. در این دوره ، نحوه کار با این بستر قدرتمند برای یادگیری ماشین را کشف کنید. مربی دن سالیوان در مورد MLlib - کتابخانه یادگیری ماشین Spark - بحث می کند که ابزاری را برای دانشمندان و تحلیل گران داده فراهم می کند که ترجیح می دهند راه حل هایی برای مشکلات تجاری پیدا کنند تا کدگذاری ، آزمایش و نگهداری کتابخانه های یادگیری ماشین خود. وی نحوه استفاده از DataFrames برای سازماندهی ساختار داده را نشان می دهد ، و تهیه داده ها و انواع متداول الگوریتم های یادگیری ماشین را شامل می شود: خوشه بندی ، طبقه بندی ، رگرسیون و توصیه ها. با پایان دوره ، شما تجربه بارگذاری داده ها در Spark ، پیش پردازش داده ها را در صورت لزوم برای استفاده از الگوریتم های MLlib و استفاده از این الگوریتم ها برای انواع مشکلات یادگیری ماشین خواهید داشت.
موضوعات شامل:
گردش کار یادگیری ماشین li>
سازماندهی داده ها در DataFrames
مراحل پیش پردازش و آماده سازی داده ها برای یادگیری ماشین li>
خوشه بندی داده ها li>
الگوریتم های طبقه بندی li>
روشهای رگرسیون موجود در Spark MLlib
رویکردهای متداول در طراحی سیستم های توصیه li>
سرفصل ها و درس ها
مقدمه
Introduction
خوش آمدی
Welcome
1. آشنایی با جرقه و MLlib
1. Introduction to Spark and MLlib
آشنایی با جرقه
Introduction to Spark
مراحل در فرایند یادگیری ماشین
Steps in the machine learning process
جرقه را نصب کنید
Install Spark
سازماندهی داده ها در DataFrames
Organizing data in DataFrames
اجزای جرقه MLlib
Components of Spark MLlib
2. تهیه و تبدیل داده ها
2. Data Preparation and Transformation
مقدمه ای برای پیش پردازش
Introduction to preprocessing
عادی سازی داده های عددی
Normalize numeric data
داده های عددی را استاندارد کنید
Standardize numeric data
داده های عددی سطل را بزنید
Bucketize numeric data
داده های متن را نشان دهید
Tokenize text data
TF-IDF
TF-IDF
خلاصه پیش پردازش
Summary of preprocessing
3. خوشه بندی
3. Clustering
آشنایی با خوشه بندی
Introduction to clustering
K- به معنی خوشه بندی است
K-means clustering
خوشه بندی سلسله مراتبی
Hierarchical clustering
خلاصه تکنیک های خوشه بندی
Summary of clustering techniques
4- طبقه بندی
4. Classification
مقدمه ای برای طبقه بندی
Introduction to classification
پردازش مجموعه داده های Iris
Preprocessing the Iris data set
طبقه بندی ساده بیز
Naive Bayes classification
طبقه بندی پرسپترون چند لایه
Multilayer perceptron classification
طبقه بندی درخت تصمیم گیری
Decision trees classification
خلاصه الگوریتم های طبقه بندی
Summary of classification algorithms
5- رگرسیون
5. Regression
آشنایی با رگرسیون
Introduction to regresssion
پیش پردازش داده های رگرسیون
Preprocessing regression data
رگرسیون خطی
Linear regression
رگرسیون درخت تصمیم گیری
Decision tree regression
رگرسیون درخت رشد شیب
Gradient-boosted tree regression
خلاصه الگوریتم های رگرسیون
Summary of regression algorithms
6. توصیه ها
6. Recommendations
سیستم های توصیه را درک کنید
Understand recommendation systems
فیلتر همکاری
Collaborative filtering
نتیجه
Conclusion
نکاتی در مورد استفاده از Spark MLlib
Tips for using Spark MLlib
لینکدین: شبکه اجتماعی حرفهای برای ارتباط و کارآفرینی
لینکدین به عنوان یکی از بزرگترین شبکههای اجتماعی حرفهای، به میلیونها افراد در سراسر جهان این امکان را میدهد تا ارتباط برقرار کنند، اطلاعات حرفهای خود را به اشتراک بگذارند و فرصتهای شغلی را کشف کنند. این شبکه اجتماعی به کاربران امکان میدهد تا رزومه حرفهای خود را آپدیت کنند، با همکاران، دوستان و همکاران آینده ارتباط برقرار کنند، به انجمنها و گروههای حرفهای ملحق شوند و از مقالات و مطالب مرتبط با حوزه کاری خود بهرهمند شوند.
لینکدین همچنین به کارفرمایان امکان میدهد تا به دنبال نیروهای با تجربه و مهارت مورد نیاز خود بگردند و ارتباط برقرار کنند. این شبکه حرفهای به عنوان یک پلتفرم کلیدی برای بهبود دسترسی به فرصتهای شغلی و گسترش شبکه حرفهای خود، نقش مهمی را ایفا میکند. از این رو، لینکدین به عنوان یکی از مهمترین ابزارهای کارآفرینی و توسعه حرفهای در دنیای امروز مورد توجه قرار دارد.
معمار سازمانی ، کارشناس بزرگ داده
دان سالیوان ، دکترای علوم ، یک معمار سازمانی و متخصص داده های بزرگ است.
دان متخصص در معماری داده ، تجزیه و تحلیل ، داده کاوی ، آمار ، مدل سازی داده ها ، داده های بزرگ و رایانش ابری است. علاوه بر این ، او دارای دکترای ژنتیک ، بیوانفورماتیک و زیست محاسباتی است. Dan به طور منظم با Spark ، Oracle ، NoSQL ، MongoDB ، Redis ، R و Python کار می کند. وی تجربه نوشتن گسترده ای در موضوعاتی از جمله رایانش ابری ، داده های بزرگ ، Hadoop و امنیت دارد.
نمایش نظرات