علوم داده، متن کاوی و پردازش زبان طبیعی در R:
انجام وظایف پیش پردازش، تجسم و یادگیری ماشینی مانند: خوشه بندی، طبقه بندی و رگرسیون در R را بیاموزید. شما قادر خواهید بود از داده های متنی و توییتر بینش استخراج کنید تا به شرکت خود مزیت رقابتی بدهید.
از یک دانشمند داده خبره با +5 سال تجربه بیاموزید:
نام من مینروا سینگ است و من فارغ التحصیل کارشناسی ارشد دانشگاه آکسفورد (جغرافیا و محیط زیست) هستم. من اخیراً دکترای خود را در دانشگاه کمبریج (اکولوژی و حفاظت گرمسیری) به پایان رساندم.
من چندین سال تجربه در تجزیه و تحلیل داده های واقعی از منابع مختلف با استفاده از تکنیک های مرتبط با علم داده و تولید نشریات برای مجلات بین المللی دارم. در طول تحقیقاتم متوجه شدم که تقریباً تمام دورهها و کتابهای علوم داده R ماهیت چند بعدی موضوع را در نظر نمیگیرند و از علم داده به جای یادگیری ماشین استفاده میکنند.
این به دانشآموزان دانش ناقصی از موضوع میدهد. . برخلاف سایر دورههای آموزشی، ما در یادگیری ماشینی متوقف نمیشویم. ما همچنین دادهکاوی، وباسکریپ، متن کاوی و پردازش زبان طبیعی را به همراه استخراج سایتهای رسانههای اجتماعی مانند Twitter و Facebook برای دادههای متنی پوشش خواهیم داد.
نیازی به دانش قبلی یا آمار/ماشینی نیست:
شما با جذب ارزشمندترین اصول و تکنیک های R Data Science شروع خواهید کرد. من از روشهای ساده و کاربردی برای سادهسازی و پرداختن به سختترین مفاهیم در R استفاده میکنم.
دوره آموزشی من به شما کمک میکند روشها را با استفاده از دادههای واقعی بهدستآمده از منابع مختلف پیادهسازی کنید. بسیاری از دورهها از دادههای ساختگی استفاده میکنند که دانشآموزان را قادر به پیادهسازی علم داده مبتنی بر R در زندگی واقعی نمیکند. پس از گذراندن این دوره، به راحتی از بسته هایی مانند caret، dplyr برای کار با داده های واقعی در R استفاده می کنید. همچنین یاد خواهید گرفت که از بسته های رایج NLP برای استخراج بینش از داده های متنی استفاده کنید.
من حتی شما را با برخی از مطالعات موردی بسیار مهم و کاربردی آشنا خواهم کرد - مانند تشخیص بازپرداخت وام و تشخیص تومور با استفاده از یادگیری ماشین. شما همچنین توییت های مربوط به موضوعات پرطرفدار را استخراج می کنید و احساسات اساسی آنها را تجزیه و تحلیل می کنید و موضوعات را با تخصیص نهفته دیریکله شناسایی می کنید. با این دوره آموزشی قدرتمند All-In-One R Data Science، همه چیز را خواهید دانست: تجسم، آمار، یادگیری ماشین، داده کاوی و شبکه های عصبی!
انگیزه اساسی این دوره این است که اطمینان حاصل شود که می توانید علم داده مبتنی بر R را بر روی داده های واقعی در عمل امروز اعمال کنید. تجزیه و تحلیل دادهها را برای پروژههای خود، فارغ از سطح مهارت خود، شروع کنید و کارفرمایان بالقوه خود را با نمونههای واقعی پروژههای علم داده خود تحت تأثیر قرار دهید.
این چیزی است که دریافت خواهید کرد:
(a) این دوره شما را از سطح پایه به انجام برخی از رایج ترین تکنیک های پیشرفته علم داده با استفاده از ابزارهای قدرتمند مبتنی بر R می برد.
(ب) شما را به استفاده از R برای انجام کارهای مختلف اکتشافی و تجسمی برای مدلسازی دادهها مجهز میکند.
(ج) شما را با برخی از مهمترین مفاهیم یادگیری ماشین به شیوه ای عملی آشنا می کند تا بتوانید این مفاهیم را برای تجزیه و تحلیل و تفسیر داده های عملی به کار ببرید. (د) درکی قوی از برخی از مهم ترین تکنیک های داده کاوی، متن کاوی و پردازش زبان طبیعی خواهید داشت.
(ه) میتوانید تصمیم بگیرید که کدام تکنیکهای علم داده برای پاسخ به سؤالات تحقیق شما مناسبتر هستند و برای دادههای شما و تفسیر نتایج قابل استفاده هستند.
به طور خاص، آنچه در این دوره پوشش داده شده است:
شروع به کار با R، R Studio و Rattle برای اجرای تکنیک های مختلف علم داده
ساختارهای داده و خواندن در پانداها، از جمله دادههای CSV، Excel، JSON، HTML.
چگونه دادههای R خود را با حذف NA/بدون داده، مدیریت دادههای شرطی، گروهبندی بر اساس ویژگیها و غیره، از قبل پردازش کنید و «مقاله» کنید.
ایجاد تجسم دادهها مانند هیستوگرام، نمودار جعبه، نمودار پراکنده، بارپلات، نمودار پای/خط، و موارد دیگر
تحلیل آماری، استنتاج آماری، و روابط بین متغیرها.
یادگیری ماشینی، یادگیری تحت نظارت، یادگیری بدون نظارت در R
شبکه های عصبی برای طبقه بندی و رگرسیون
خراش دادن وب با استفاده از R
استخراج داده های متنی از Twitter و Facebook با استفاده از API
متن کاوی
تکنیکهای رایج پردازش زبان طبیعی مانند تحلیل احساسات و مدلسازی موضوع
ما مدتی را صرف پرداختن به برخی از مفاهیم نظری مرتبط با علم داده خواهیم کرد. با این حال، اکثر دوره بر پیاده سازی تکنیک های مختلف بر روی داده های واقعی و تفسیر نتایج تمرکز می کند.
بعد از هر ویدیو، مفهوم یا تکنیک جدیدی را یاد خواهید گرفت که می توانید آن را در پروژه های خود به کار ببرید.
همه داده ها و کدهای استفاده شده در دوره به صورت رایگان در دسترس قرار گرفته است و شما می توانید هر طور که دوست دارید از آن استفاده کنید. همچنین به سخنرانی های اضافی که در آینده به صورت رایگان اضافه می شوند دسترسی خواهید داشت.
همین حالا به دوره بپیوندید!
دانشمند تحصیل کرده آکسبریج
سلام. من فارغ التحصیل دکترا از دانشگاه کمبریج هستم که در آنجا در اکولوژی گرمسیری تخصص دارم. من همچنین یک دانشمند داده هستم. به عنوان بخشی از تحقیقاتم، باید تجزیه و تحلیل گسترده دادهها، از جمله تجزیه و تحلیل دادههای مکانی را انجام دهم. یا برای این منظور ترجیح میدهم از ترکیبی از ابزارهای رایگان نرمافزار R، QGIS و Python استفاده کنم. بیشتر کار تجزیه و تحلیل دادههای مکانی خود را با استفاده از R انجام میدهم. و QGIS. اینها جدا از رایگان بودن، ابزارهای بسیار قدرتمندی برای تجسم، پردازش و تجزیه و تحلیل داده ها هستند. من همچنین دارای مدرک کارشناسی ارشد جغرافیا و محیط زیست از دانشگاه آکسفورد هستم. من مهارت های آماری و تجزیه و تحلیل داده های خود را از طریق تعدادی MOOC از جمله The Analytics Edge (دوره آماری مبتنی بر R و یادگیری ماشین ارائه شده توسط EdX)، یادگیری آماری (دوره یادگیری ماشین مبتنی بر R ارائه شده توسط Standford آنلاین) تقویت کرده ام. علاوه بر تجزیه و تحلیل داده های مکانی، در تجزیه و تحلیل آماری، یادگیری ماشین و داده کاوی نیز مهارت دارم. من همچنین از برنامه نویسی عمومی، تجسم داده ها و توسعه وب لذت می برم. من علاوه بر اینکه یک دانشمند و اعداد شکن هستم، یک مسافر مشتاق هستم
نمایش نظرات