🔔 با توجه به بهبود نسبی اینترنت، آمادهسازی دورهها آغاز شده است. به دلیل تداوم برخی اختلالات، بارگذاری دورهها ممکن است با کمی تأخیر انجام شود. مدت اشتراکهای تهیهشده محفوظ است.
لطفا جهت اطلاع از آخرین دوره ها و اخبار سایت در
کانال تلگرام
عضو شوید.
آموزش آمار برای علم داده و یادگیری ماشین با پایتون
- آخرین آپدیت
دانلود Statistics For Data Science and Machine Learning with Python
نکته:
ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.
نمونه ویدیوها:
توضیحات دوره:
آمار کاربردی با پایتون برای علم داده و یادگیری ماشین: مدلسازی آماری با استفاده از Sci-kit Learn و Scipy
در این دوره چه چیزی خواهید آموخت؟
استفاده از تحلیل اکتشافی داده (EDA) در علم داده.
رایجترین انواع داده مانند دادههای پیوسته و دستهبندیشده.
معیارهای گرایش مرکزی و معیارهای پراکندگی در آمار.
مفاهیم دادههای جامعه آماری در مقابل دادههای نمونه.
مفهوم نمونهگیری تصادفی و تأثیر آن بر تحلیل داده.
آشنایی با دادههای پرت (Outliers) و خطاهای نمونهگیری و ارتباط آنها با تحلیل داده.
نحوه بصریسازی توزیع دادهها با استفاده از نمودارهای جعبهای (Boxplots)، ویولن (Violin plots)، هیستوگرام (Histograms) و نمودارهای چگالی (Density plots).
نحوه بصریسازی دادههای دستهبندیشده با استفاده از نمودارهای میلهای (Bar plots) و دایرهای (Pie charts).
محاسبه همبستگی (Correlation) و کوواریانس (Covariance) بین ویژگیها در مجموعه داده.
بصریسازی ماتریس همبستگی با استفاده از نقشههای حرارتی (Heat Maps).
رایجترین توزیعهای احتمالی مانند توزیع نرمال و توزیع دوجملهای.
نحوه انجام آزمونهای نرمالیتی برای بررسی انحراف از نرمال بودن.
نحوه تست توزیعهای کج (Skewed) در دادههای واقعی.
نحوه استانداردسازی (Standardize) و نرمالسازی (Normalize) دادهها برای داشتن مقیاس یکسان.
نحوه تبدیل دادههای کج به توزیع نرمال با استفاده از روشهای تبدیل مختلف مانند تبدیل لگاریتمی، ریشه دوم و تبدیل توانی.
نحوه محاسبه فواصل اطمینان (Confidence Intervals) برای تخمینهای آماری مانند دقت مدل.
یادگیری بوتاسترپینگ (Bootstrapping) در آمار و نحوه استفاده از آن در یادگیری ماشین.
نحوه ارزیابی مدلهای یادگیری ماشین.
درک عملی مفاهیم بایاس (Bias) و واریانس (Variance) در مدلسازی داده.
درک مفهوم Underfitting و Overfitting در یادگیری ماشین و مدلسازی آماری.
رایجترین معیارهای ارزیابی برای مدلهای رگرسیون در یادگیری ماشین.
معیارهای ارزیابی برای مدلهای طبقهبندی.
نحوه اعتبارسنجی مدلهای پیشبینیکننده یادگیری ماشین مانند مدلهای رگرسیون و طبقهبندی.
نحوه استفاده از تکنیکهای اعتبارسنجی مختلف برای یادگیری ماشین مانند اعتبارسنجی Hold-out و اعتبارسنجی متقابل (Cross-validation).
پیشنیازها:
هیچ پیشزمینهای در آمار نیاز نیست؛ همه چیز در این دوره توضیح داده خواهد شد. آشنایی اولیه با پایتون مفید است.
این دوره برای شما ایدهآل است اگر میخواهید در روشهای آماری مورد نیاز برای علم داده (Data Science) و یادگیری ماشین (Machine Learning) دانش کسب کنید!
یادگیری آمار بخش ضروری تبدیل شدن به یک دانشمند داده حرفهای است. بسیاری از فراگیران علم داده، پایتون را برای علم داده میآموزند و یادگیری آمار را نادیده میگیرند یا به تعویق میاندازند. یکی از دلایل این امر، کمبود منابع و دورههایی است که آمار را برای علم داده و یادگیری ماشین آموزش میدهند.
آمار یک حوزه علمی گسترده است، اما خبر خوب برای فراگیران علم داده این است که تمام مباحث آمار برای علم داده و یادگیری ماشین ضروری نیست. با این حال، همین واقعیت مطالعه آمار را برای فراگیران دشوارتر میکند زیرا مطمئن نیستند از کجا شروع کنند و مرتبطترین مباحث آماری برای علم داده کدامند.
این دوره برای پر کردن این شکاف طراحی شده است.
این دوره هم برای مبتدیان بدون پیشزمینه در آمار برای علم داده و هم برای کسانی که به دنبال گسترش دانش خود در زمینه آمار کاربردی برای علم داده هستند، طراحی شده است.
من این دوره را به گونهای سازماندهی کردهام که به عنوان یک کتابخانه ویدیویی برای شما باشد تا بتوانید در آینده از آن به عنوان مرجع استفاده کنید. هر سخنرانی در این دوره جامع، یک موضوع واحد را پوشش میدهد.
در این دوره جامع، شما را برای یادگیری رایجترین و ضروریترین روشهای آماری برای تحلیل و مدلسازی داده راهنمایی خواهم کرد.
دوره من معادل یک دوره در سطح دانشگاه در زمینه آمار برای علم داده و یادگیری ماشین است که معمولاً هزاران دلار هزینه دارد. در اینجا، من به شما فرصت میدهم تا تمام این اطلاعات را با کسری از هزینه یاد بگیرید! این دوره شامل ۷۷ سخنرانی ویدیویی HD، تمرینات متعدد و دو پروژه همراه با راهحل است.
تمام مطالب ارائه شده در این دوره به صورت دفترچههای قابل دانلود و مفصل برای هر سخنرانی ارائه شدهاند.
بسیاری از دانشجویان بر یادگیری کدهای پایتون برای علم داده تمرکز میکنند، اما این برای تبدیل شدن به یک دانشمند داده ماهر کافی نیست. شما همچنین باید اساس آماری متدهای پایتون را درک کنید. مدلها و تحلیل داده را میتوان به راحتی در پایتون ایجاد کرد، اما برای انتخاب روش صحیح یا بهترین مدل، باید روشهای آماری مورد استفاده در این مدلها را درک کنید. در ادامه برخی از مباحث کلیدی که در این دوره جامع خواهید آموخت، آورده شدهاند:
انواع و ساختارهای داده
تحلیل اکتشافی داده (EDA)
معیارهای گرایش مرکزی
معیارهای پراکندگی
بصریسازی توزیعهای داده
همبستگی، نمودارهای پراکندگی و نقشههای حرارتی
توزیع داده و نمونهبرداری داده
مقیاسگذاری و تبدیل داده
فواصل اطمینان
معیارهای ارزیابی برای یادگیری ماشین
تکنیکهای اعتبارسنجی مدل در یادگیری ماشین
همین امروز در این دوره ثبتنام کنید و دانش ضروری روشهای آماری را برای علم داده کسب کنید!
سرفصل ها و درس ها
مقدمه
Introduction
مرور کلی سرفصلهای دوره
Overview of Course Curriculum
با داشتن سابقه در علم و مدل سازی داده ها ، من در اوایل کار خود با تجارت فارکس و تجارت بورس سهام علاقه مند شدم. 15 سال پیش من سفر خود را به عنوان یک تاجر خرده فروشی خصوصی آغاز کرده ام و در این جاده پر از دست انداز خودآموزی و توسعه خود راه خود را طی کرده ام. برای تسلط بر برخی جنبه های تجارت فارکس که ممکن است سالها طول بکشد تا سایر مبتدیان درک کنند ، زمان زیادی لازم نبود.
من خوش شانس بودم که با بسیاری از تجار باتجربه و گورو ، که از بسیاری جهات ، نحوه تجارت فارکس در حال حاضر را شکل داده اند ، ملاقات و دوستی برقرار کردم. آنها چشم و ذهن من را به روی تکنیک هایی باز کرده اند که هر دو مربوط به تجزیه و تحلیل اقدام قیمت و جنبه های روانشناختی هستند. و این دانش منحصر به فرد از آن خودیهای باورنکردنی نه تنها به من نشان داد که من برای موفقیت لازم هستم ، بلکه باعث شد که من بخواهم به معامله گران دیگر کمک کنم تا شروع دشوار تجارت را کنار بگذارند و به آنها کمک کنم تا منحنی یادگیری خود را کوتاه کنند وقت و هزینه برای آنها.
من ده سال پیش مدرسه تجارت محلی خود را افتتاح کردم و هدف من تنها کمک به بازرگانان در آغاز کار خود بود.
نمایش نظرات