به هوش مصنوعی پیشرفته خوش آمدید!
این از نظر فنی یادگیری عمیق در پایتون قسمت 11 از سری یادگیری عمیق من و سومین دوره آموزشی تقویتی من است.
یادگیری تقویتی عمیق در واقع ترکیبی از 2 موضوع است: یادگیری تقویتی و یادگیری عمیق (شبکه های عصبی).
در حالی که هر دوی اینها مدت زیادی است که وجود داشته است، اخیراً Deep Learning و در کنار آن، Reinforcement Learning واقعاً شروع به کار کرده است.
بلوغ یادگیری عمیق باعث پیشرفت در یادگیری تقویتی شده است، که از دهه 1980 وجود داشته است، اگرچه برخی از جنبه های آن، مانند معادله بلمن، برای مدت طولانی تری وجود داشته است.
اخیراً، این پیشرفتها به ما این امکان را داده است که نشان دهیم یادگیری تقویتی چقدر میتواند قدرتمند باشد.
ما دیدهایم که AlphaZero چگونه میتواند با استفاده از خودبازی بر بازی Go مسلط شود.
این تنها چند سال پس از آن است که AlphaGo اصلی قبلاً یک قهرمان جهان را در Go شکست داده است.
ما رباتهای دنیای واقعی را دیدهایم که یاد میگیرند چگونه راه بروند، و حتی پس از لگد خوردن، بهبود مییابند، علیرغم اینکه فقط با استفاده از شبیهسازی آموزش دیدهاند.
شبیه سازی خوب است زیرا به سخت افزار واقعی نیاز ندارد که گران است. اگر نماینده شما سقوط کند، هیچ آسیب واقعی وارد نشده است.
ما رباتهای دنیای واقعی را دیدهایم که مهارت دست را یاد میگیرند، که کار کوچکی نیست.
پیاده روی یک چیز است، اما شامل حرکات خشن است. مهارت دست پیچیده است - شما درجات زیادی از آزادی دارید و بسیاری از نیروهای درگیر بسیار ظریف هستند.
تصور کنید از پای خود برای انجام کاری استفاده می کنید که معمولاً با دست خود انجام می دهید، و بلافاصله متوجه می شوید که چرا این کار دشوار است.
آخرین اما نه کم اهمیت - بازی های ویدیویی.
حتی با در نظر گرفتن چند ماه گذشته، ما شاهد پیشرفت های شگفت انگیزی بوده ایم. هوش مصنوعی اکنون بازیکنان حرفه ای را در CS:GO و Dota 2 شکست می دهد.
پس چه چیزی این دوره را با دو دوره اول متفاوت می کند؟
اکنون که می دانیم یادگیری عمیق با یادگیری تقویتی کار می کند، این سوال پیش می آید: چگونه این الگوریتم ها را بهبود بخشیم؟
این دوره چند راه مختلف را به شما نشان میدهد: از جمله الگوریتم قدرتمند A2C (Advantage Actor-Critic)، الگوریتم DDPG (Deep Deterministic Policy Gradient) و استراتژیهای تکامل.
استراتژیهای تکامل برداشتی جدید و تازه از یادگیری تقویتی است، که نوعی از نظریههای قدیمی را به نفع رویکرد "جعبه سیاه" تر، الهام گرفته از تکامل بیولوژیکی دور میاندازد.
چیزی که در مورد این دوره جدید نیز عالی است، تنوع محیطهایی است که میتوانیم به آنها نگاه کنیم.
ابتدا، ما به محیطهای کلاسیک آتاری نگاه میکنیم. اینها مهم هستند زیرا نشان می دهند که عوامل یادگیری تقویتی می توانند تنها بر اساس تصاویر یاد بگیرند.
دوم، ما به MuJoCo که یک شبیهساز فیزیک است نگاه میکنیم. این اولین قدم برای ساختن رباتی است که می تواند در دنیای واقعی حرکت کند و فیزیک را درک کند - ابتدا باید نشان دهیم که می تواند با فیزیک شبیه سازی شده کار کند.
در نهایت، میخواهیم به Flappy Bird، بازی موبایل مورد علاقه همه چند سال پیش نگاه کنیم.
از اینکه خواندید متشکرم، و شما را در کلاس می بینم!
"اگر نمی توانید آن را پیاده سازی کنید، آن را درک نمی کنید"
یا همانطور که فیزیکدان بزرگ ریچارد فاینمن گفت: "آنچه را که نمی توانم خلق کنم، نمی فهمم".
دورههای من تنها دورههایی هستند که در آنها نحوه پیادهسازی الگوریتمهای یادگیری ماشین را از ابتدا یاد خواهید گرفت
دورههای دیگر به شما یاد میدهند که چگونه دادههای خود را به کتابخانه وصل کنید، اما آیا واقعاً برای 3 خط کد به کمک نیاز دارید؟
پس از انجام همان کار با 10 مجموعه داده، متوجه می شوید که 10 چیز را یاد نگرفته اید. شما یک چیز یاد گرفتید و فقط همان 3 خط کد را 10 بار تکرار کردید...
پیش نیازهای پیشنهادی:
حساب
احتمال
برنامه نویسی شی گرا
کدنویسی پایتون: if/else، حلقهها، فهرستها، دستورات، مجموعهها
کدگذاری Numpy: عملیات ماتریس و برداری
رگرسیون خطی
نزول شیب
با نحوه ایجاد یک شبکه عصبی کانولوشن (CNN) در TensorFlow آشنا شوید
فرآیندهای تصمیم گیری مارکوف (MDP)
به چه ترتیبی باید در دوره های شما شرکت کنم؟:
سخنرانی "نقشه راه پیش نیاز یادگیری ماشین و هوش مصنوعی" (در پرسشهای متداول هر یک از دورههای من، از جمله دوره رایگان Numpy موجود است) را بررسی کنید.
ویژگی های منحصر به فرد
هر خط کد با جزئیات توضیح داده شده است - در صورت مخالفت هر زمان که خواستید به من ایمیل بزنید
همانند سایر دورهها، زمان را تلف نمیکنید - بیایید صادق باشیم، هیچکس واقعاً نمیتواند کدی بنویسد که ارزش یادگیری آن را تنها در 20 دقیقه از ابتدا داشته باشد
از ریاضیات در سطح دانشگاه نمی ترسید - جزئیات مهمی را در مورد الگوریتم هایی که سایر دوره ها کنار گذاشته اند دریافت کنید
یودمی یکی از بزرگترین پلتفرمهای آموزشی آنلاین است که به میلیونها کاربر در سراسر جهان امکان دسترسی به دورههای متنوع و کاربردی را فراهم میکند. این پلتفرم امکان آموزش در زمینههای مختلف از فناوری اطلاعات و برنامهنویسی گرفته تا زبانهای خارجی، مدیریت، و هنر را به کاربران ارائه میدهد. با استفاده از یودمی، کاربران میتوانند به صورت انعطافپذیر و بهینه، مهارتهای جدیدی را یاد بگیرند و خود را برای بازار کار آماده کنند.
یکی از ویژگیهای برجسته یودمی، کیفیت بالای دورهها و حضور استادان مجرب و با تجربه در هر حوزه است. این امر به کاربران اعتماد میدهد که در حال دریافت آموزش از منابع قابل اعتماد و معتبر هستند و میتوانند به بهترین شکل ممکن از آموزشها بهره ببرند. به طور خلاصه، یودمی به عنوان یکی از معتبرترین و موثرترین پلتفرمهای آموزشی آنلاین، به افراد امکان میدهد تا به راحتی و با کیفیت، مهارتهای مورد نیاز خود را ارتقا دهند و به دنبال رشد و پیشرفت شغلی خود باشند.
امروز ، بیشتر وقتم را به عنوان یک مهندس هوش مصنوعی و یادگیری ماشین با تمرکز بر یادگیری عمیق می گذرانم ، اگرچه همچنین به عنوان دانشمند داده ، مهندس داده های بزرگ و مهندس نرم افزار کامل پشته نیز شناخته شده ام. من مدرک کارشناسی ارشد خود را در رشته مهندسی کامپیوتر با گرایش یادگیری ماشین و تشخیص الگو دریافت کردم. این تجربه شامل تبلیغات آنلاین و رسانه های دیجیتالی به عنوان دانشمند داده (بهینه سازی نرخ کلیک و تبدیل) و مهندس داده های بزرگ (ساخت خطوط لوله پردازش داده) است. برخی از فناوری های کلان داده ای که من مرتباً استفاده می کنم ، Hadoop ، Pig ، Hive ، MapReduce و Spark هستند. من مدل های یادگیری عمیق را برای پیش بینی میزان کلیک و رفتار کاربر و همچنین برای پردازش تصویر و سیگنال و مدل سازی متن ایجاد کرده ام. کار من در سیستم های پیشنهادی از آموزش تقویت و فیلتر کردن مشارکتی استفاده کرده است و ما نتایج را با استفاده از تست A / B معتبر کردیم.
نمایش نظرات