خوش آمدید! این پیش نیازهای یادگیری عمیق، یادگیری ماشین و علم داده است: The Numpy Stack در پایتون.
یک سوال یا نگرانی که من زیاد متوجه شدم این است که مردم می خواهند یادگیری عمیق و علم داده را بیاموزند، بنابراین این دوره ها را می گذرانند، اما آنها را پشت سر می گذارند زیرا به اندازه کافی در مورد پشته Numpy نمی دانند تا بتوانند این دوره ها را تغییر دهند. مفاهیم به کد.
حتی اگر کد را به طور کامل بنویسم، اگر Numpy را نمیشناسید، خواندن آن همچنان بسیار سخت است.
این دوره برای حذف این مانع طراحی شده است - تا به شما نشان دهد چگونه کارهایی را در پشته Numpy انجام دهید که اغلب در یادگیری عمیق و علم داده مورد نیاز است.
پس آن چیزها چیست؟
Numpy . این اساس هر چیز دیگری را تشکیل می دهد. شیء مرکزی در Numpy آرایه Numpy است که می توانید عملیات مختلفی را روی آن انجام دهید.
کلید این است که آرایه Numpy فقط یک آرایه معمولی نیست که در زبانی مانند جاوا یا C++ میبینید، بلکه در عوض مانند یک شی ریاضی مانند بردار یا ماتریس است.
یعنی میتوانید عملیات بردار و ماتریس مانند جمع، تفریق و ضرب را انجام دهید.
مهمترین جنبه آرایه های Numpy این است که برای سرعت بهینه شده اند. بنابراین ما قصد داریم یک نسخه نمایشی انجام دهیم که در آن به شما ثابت میکنم که استفاده از یک عملیات بردار Numpy سریعتر از استفاده از لیست Python است.
سپس به چند عملیات ماتریس پیچیدهتر مانند محصولات، معکوسها، تعیینکنندهها و حل سیستمهای خطی نگاه خواهیم کرد.
پانداها. پانداها عالی هستند زیرا کارهای زیادی را در زیر کاپوت انجام میدهند که زندگی شما را آسانتر میکند زیرا دیگر نیازی به کدنویسی دستی آن چیزها ندارید.
اگر با R آشنایی دارید، پانداها کار با مجموعههای داده را بسیار شبیه به R میکنند.
شیء مرکزی در R و Pandas DataFrame است.
ما بررسی خواهیم کرد که بارگیری یک مجموعه داده با استفاده از Pandas در مقابل تلاش برای انجام دستی آن چقدر آسانتر است.
سپس به برخی از عملیات قاب داده مفید در یادگیری ماشین نگاه خواهیم کرد، مانند فیلتر کردن بر اساس ستون، فیلتر کردن بر اساس ردیف و تابع اعمال.
فریمهای داده پانداها شما را به یاد جداول SQL میاندازند، بنابراین اگر پسزمینه SQL دارید و دوست دارید با جداول کار کنید، پانداها چیز بعدی عالی برای یادگیری خواهند بود.
از آنجایی که Pandas نحوه بارگیری داده ها را به ما می آموزد، مرحله بعدی بررسی داده ها خواهد بود. برای آن از Matplotlib استفاده خواهیم کرد.
در این بخش به بررسی برخی از نمودارهای رایج مانند نمودار خطی، نمودار پراکندگی و هیستوگرام خواهیم پرداخت.
ما همچنین نحوه نمایش تصاویر با استفاده از Matplotlib را بررسی خواهیم کرد.
۹۹٪ مواقع، از نوعی از طرحهای بالا استفاده میکنید.
Scipy .
من دوست دارم Scipy را به عنوان یک کتابخانه افزونه برای Numpy در نظر بگیرم.
در حالی که Numpy بلوکهای ساختمانی اولیه مانند بردارها، ماتریسها و عملیات روی آنها را ارائه میکند، Scipy از آن بلوکهای ساختمانی عمومی برای انجام کارهای خاص استفاده میکند.
برای مثال، Scipy میتواند بسیاری از محاسبات آماری رایج، از جمله دریافت مقدار PDF، مقدار CDF، نمونهبرداری از یک توزیع، و آزمایش آماری را انجام دهد.
ابزارهای پردازش سیگنال دارد تا بتواند کارهایی مانند کانولوشن و تبدیل فوریه را انجام دهد.
در مجموع:
اگر یک دوره یادگیری عمیق یا یادگیری ماشینی را گذرانده اید، و تئوری را درک کرده اید، و می توانید کد را ببینید، اما نمی توانید بین نحوه تبدیل آن الگوریتم ها به کد در حال اجرا واقعی ارتباط برقرار کنید، این دوره برای شما است.
"اگر نمی توانید آن را پیاده سازی کنید، آن را درک نمی کنید"
یا همانطور که فیزیکدان بزرگ ریچارد فاینمن گفت: "آنچه را که نمی توانم خلق کنم، نمی فهمم".
دورههای من تنها دورههایی هستند که در آنها نحوه پیادهسازی الگوریتمهای یادگیری ماشین را از ابتدا یاد خواهید گرفت
دورههای دیگر به شما یاد میدهند که چگونه دادههای خود را به کتابخانه وصل کنید، اما آیا واقعاً برای 3 خط کد به کمک نیاز دارید؟
پس از انجام همان کار با 10 مجموعه داده، متوجه می شوید که 10 چیز را یاد نگرفته اید. شما یک چیز یاد گرفتید و فقط همان 3 خط کد را 10 بار تکرار کردید...
پیش نیازهای پیشنهادی:
حساب ماتریس
احتمال
کدنویسی پایتون: if/else، حلقهها، فهرستها، دستورات، مجموعهها
از قبل باید بدانید "چرا" چیزهایی مانند محصول نقطهای، وارونگی ماتریس، و توزیعهای احتمال گاوسی مفید هستند و برای چه چیزی میتوان از آنها استفاده کرد
به چه ترتیبی باید در دوره های شما شرکت کنم؟:
سخنرانی "نقشه راه پیش نیاز یادگیری ماشین و هوش مصنوعی" (در پرسشهای متداول هر یک از دورههای من موجود است) را بررسی کنید.
امروز ، بیشتر وقتم را به عنوان یک مهندس هوش مصنوعی و یادگیری ماشین با تمرکز بر یادگیری عمیق می گذرانم ، اگرچه همچنین به عنوان دانشمند داده ، مهندس داده های بزرگ و مهندس نرم افزار کامل پشته نیز شناخته شده ام. من مدرک کارشناسی ارشد خود را در رشته مهندسی کامپیوتر با گرایش یادگیری ماشین و تشخیص الگو دریافت کردم. این تجربه شامل تبلیغات آنلاین و رسانه های دیجیتالی به عنوان دانشمند داده (بهینه سازی نرخ کلیک و تبدیل) و مهندس داده های بزرگ (ساخت خطوط لوله پردازش داده) است. برخی از فناوری های کلان داده ای که من مرتباً استفاده می کنم ، Hadoop ، Pig ، Hive ، MapReduce و Spark هستند. من مدل های یادگیری عمیق را برای پیش بینی میزان کلیک و رفتار کاربر و همچنین برای پردازش تصویر و سیگنال و مدل سازی متن ایجاد کرده ام. کار من در سیستم های پیشنهادی از آموزش تقویت و فیلتر کردن مشارکتی استفاده کرده است و ما نتایج را با استفاده از تست A / B معتبر کردیم.
نمایش نظرات