تحلیل دادهها، علم داده و هوش مصنوعی برای کسبوکار و دنیای واقعی ۲۰۲۰
این یک دوره عملی است؛ دورهای که آرزو داشتم وقتی برای اولین بار یادگیری علم داده را شروع کردم، وجود داشت.
این دوره بر درک تمام تئوریهای پایه و مهارتهای برنامهنویسی مورد نیاز یک دانشمند داده تمرکز دارد، اما بهترین بخش آن شامل بیش از ۳۵ مطالعه موردی عملی است که بسیاری از مشکلات رایج کسبوکار که دانشمندان داده در دنیای واقعی با آن مواجه میشوند را پوشش میدهد.
در حال حاضر، حتی با وجود انقباض اقتصادی ناشی از کووید-۱۹، کسبوکارهای سنتی با سرعت بسیار زیاد دانشمند داده استخدام میکنند!
و آنها انتظار دارند که کارمندان جدید بتوانند راهحلهای علم داده را برای حل مشکلاتشان به کار گیرند. دانشمندان دادهای که قادر به انجام این کار باشند، در دهههای آینده به یکی از ارزشمندترین داراییها در کسبوکار تبدیل خواهند شد!
طبق گفته Harvard Business Review و Glassdoor، "دانشمند داده برای ۴ سال متوالی به عنوان شغل برتر در ایالات متحده شناخته شده است!"
با این حال، علم داده یک منحنی یادگیری دشوار دارد - چگونه میتوان در این صنعت پر از رمز و راز، سردرگمی، ریاضیات و کدنویسیِ ظاهراً غیرممکن، شروع کرد؟ حتی اگر کمی با آن آشنا شوید، به کارگیری دانش علم داده جدیدتان در یک مشکل دنیای واقعی حتی گیجکنندهتر است.
این دوره در صدد پر کردن تمام این شکافهای دانشی است که مبتدیان را میترساند و همزمان دانش علم داده و یادگیری عمیق شما را در مشکلات واقعی کسبوکار به کار میگیرد.
این دوره دارای سرفصل جامع است که تمام اجزای اصلی دانش علم داده را پوشش میدهد.
مسیر یادگیری کامل علم داده ۲۰۲۰ ما شامل موارد زیر است:
استفاده از علم داده برای حل مشکلات رایج کسبوکار
ابزارهای مدرن یک دانشمند داده - Python، Pandas، Scikit-learn، NumPy، Keras، Prophet، Statsmod، SciPy و موارد دیگر!
آمار برای علم داده به تفصیل - نمونهگیری، توزیعها، توزیع نرمال، آمار توصیفی، همبستگی و کوواریانس، آزمون اهمیت احتمال و آزمون فرضیه.
تئوری بصریسازی برای علم داده و تجزیه و تحلیل با استفاده از Seaborn، Matplotlib و Plotly (دستکاری دادهها و ایجاد بصریسازیها و نمودارهای جذاب اطلاعاتی).
طراحی داشبورد با Google Data Studio
تئوری یادگیری ماشین - رگرسیون خطی، رگرسیون لجستیک، درختهای تصمیم، جنگلهای تصادفی، KNN، SVM، ارزیابی مدل، تشخیص دادههای پرت، ROC و AUC و منظمسازی
تئوری و ابزارهای یادگیری عمیق - TensorFlow 2.0 و Keras (شبکههای عصبی، CNN، RNN و LSTM)
حل مشکلات با استفاده از مدلسازی پیشبینانه، طبقهبندی و یادگیری عمیق
مطالعات موردی تجزیه و تحلیل دادهها و آمار - حل و تجزیه و تحلیل مشکلات و مجموعه دادههای دنیای واقعی.
علم داده در بازاریابی - مدلسازی نرخ تعامل و انجام آزمون A/B
علم داده در خردهفروشی - بخشبندی مشتریان، ارزش طول عمر مشتری و تجزیه و تحلیل مشتری/محصول
یادگیری بدون نظارت - خوشهبندی K-Means، PCA، t-SNE، خوشهبندی سلسله مراتبی تجمعی، Mean Shift، DBSCAN و خوشهبندی E-M GMM
سیستمهای توصیهگر - فیلترینگ مشارکتی و فیلترینگ مبتنی بر محتوا + یادگیری استفاده از LiteFM + سیستمهای توصیهگر یادگیری عمیق
پردازش زبان طبیعی - Bag of Words، Lemmatizing/Stemming، TF-IDF Vectorizer و Word2Vec
کلان داده با PySpark - چالشهای کلان داده، Hadoop، MapReduce، Spark، PySpark، RDD، Transformcations، Actions، Lineage Graphs & Jobs، پاکسازی و دستکاری دادهها، یادگیری ماشین در PySpark (MLLib)
استقرار در فضای ابری با استفاده از Heroku برای ساخت API یادگیری ماشین
مطالعات موردی جذاب و سرگرمکننده ما شامل:
شانزده (۱۶) مطالعه موردی آماری و تجزیه و تحلیل دادهها:
پیشبینی انتخابات ۲۰۲۰ ایالات متحده با استفاده از چندین مجموعه داده نظرسنجی
پیشبینی موارد دیابت از دادههای بهداشتی
تحلیل سبد بازار با استفاده از الگوریتم Apriori
پیشبینی جام جهانی فوتبال
تجزیه و تحلیل کووید و ایجاد بصریسازیهای شگفتانگیز Flourish (مسابقه نمودار میلهای)
تجزیه و تحلیل دادههای المپیک
آیا برتری خانگی در فوتبال یا بسکتبال واقعی است؟
تجزیه و تحلیل دادههای کریکت IPL
خدمات پخش (Netflix، Hulu، Disney Plus و Amazon Prime) - تجزیه و تحلیل فیلم
تجزیه و تحلیل پیتزا فروشی - محبوبترین پیتزاها در سراسر ایالات متحده
تجزیه و تحلیل میکرو آبجو سازی و میخانه
تجزیه و تحلیل زنجیره تامین
تجزیه و تحلیل انتخابات هند
تجزیه و تحلیل بحران اقتصادی آفریقا
شش (۶) مطالعه موردی مدلسازی پیشبینانه و طبقهبندیکننده:
فهمیدن اینکه کدام کارمندان ممکن است شغل را ترک کنند (تحلیل حفظ و نگهداری)
فهمیدن اینکه کدام مشتریان ممکن است ریزش کنند (تحلیل ریزش)
چه کسانی را برای کمک مالی هدف قرار دهیم؟
پیشبینی حق بیمه
پیشبینی قیمت Airbnb
تشخیص کلاهبرداری کارت اعتباری
چهار (۴) مطالعه موردی علم داده در بازاریابی:
تجزیه و تحلیل نرخ تبدیل کمپینهای بازاریابی
پیشبینی تعامل - چه چیزی باعث عملکرد تبلیغات میشود؟
آزمون A/B (بهینهسازی تبلیغات)
بهترین مشتریان شما چه کسانی هستند؟ و ارزش طول عمر مشتری (CLV)
چهار (۴) مطالعه موردی علم داده در خردهفروشی:
تجزیه و تحلیل محصول (تکنیکهای اکتشافی تجزیه و تحلیل دادهها)
خوشهبندی دادههای مشتریان از آژانس مسافرتی
سیستمهای توصیهگر محصول - اقلام فروشگاه آنلاین
سیستم توصیهگر فیلم با استفاده از LiteFM
دو (۲) مطالعه موردی پیشبینی سریهای زمانی:
پیشبینی فروش برای یک فروشگاه
معاملات سهام با استفاده از یادگیری تقویتی
پیشبینی قیمت نفت برنت
سه (۳) مطالعه موردی پردازش زبان طبیعی (NLP):
خلاصهسازی نظرات
تشخیص احساسات در متن
تشخیص هرزنامه
یک (۱) مطالعه موردی کلان داده PySpark:
طبقهبندی سرفصل اخبار
یک (۱) پروژه استقرار:
استقرار مدل یادگیری ماشین شما در فضای ابری با استفاده از Flask و Heroku
Nidia Sahjara
مهندس NLP و تحقیقاتریدیدیا دارای زمینه های متنوعی است که مطالعات کارشناسی ارشد خود را شامل علوم رایانه ای در دانشگاه Derby، انگلستان و مهندسی مدنی و محیط زیست در دانشگاه غرب غربی ها است. تحقیقات فعلی او شامل استفاده از NLP برای تجزیه و تحلیل داده های منبع باز و راه حل های معدنی در علوم اجتماعی می شود. او در حال حاضر ثبت نام کرده است تا مطالعات تحصیلات تکمیلی خود را در کالج پادشاهان لندن در سال 2021 ادامه دهد.
Rajeev D Ratan
دانشمند داده، کارشناس بینایی کامپیوتر و مهندس برق
نمایش نظرات