این دوره شامل انتخاب های مهمی در طراحی است که یک متخصص داده باید هنگام استفاده از مدل های از قبل آموزش دیده با استفاده از آموزش انتقال ، انجام دهد. همچنین جنبه های پیاده سازی رویکردهای مختلف آموزش انتقال در PyTorch را پوشش می دهد.
این دوره تمام جنبه های مهم پشتیبانی موجود در scikit-learn را برای ساخت و آموزش شبکه های عصبی شامل پرسپترون، MLPClassifier و MLPRregressor و همچنین ماشین های محدود بولتزمن پوشش می دهد.
در این دوره آموزش مدل های شبکه عصبی با استفاده از TensorFlow و PyTorch، انجام آموزش توزیع شده با استفاده از فریم ورک Horovod و تنظیم هایپرپارامتر با استفاده از Hyperopt را خواهید آموخت.
با این شیرجه عمیق در معماری و تنظیمات پیشرفته، مهارت های Snowflake خود را افزایش دهید.
این دوره شما را با مفاهیم مورد نیاز برای شناسایی موارد استفاده برای یادگیری ماشین، فرمولبندی یک مسئله ML، برشمردن مسائل متعارفی که ML برای حل آنها استفاده میشود، و جزئیات نحوه اعمال ML بر روی دادههای پیچیده مانند متن، تصاویر را معرفی میکند. .
این دوره منابع مهمی را برای علوم داده از جمله کتابخانه های تجسم ، چارچوب های یادگیری عمیق و محیط های مبتنی بر ابر معرفی می کند. همچنین BigML و Google Colab — منابع قدرتمندی برای ساخت و اشتراک تجزیه و تحلیل ها را جستجو می کند.
این دوره جنبه های مفهومی استفاده از یادگیری ماشین را برای مشکلات صنعت خدمات مالی بررسی می کند و در مورد مطالعات موردی یادگیری ماشینی مورد استفاده در خدمات مالی بحث می کند.
این دوره بسیاری از جنبه های ساخت مدل های یادگیری عمیق در PyTorch ، از جمله نورون ها و شبکه های عصبی ، و چگونگی استفاده PyTorch از حساب دیفرانسیل برای آموزش این مدل ها و ایجاد نمودارهای محاسباتی پویا در یادگیری عمیق را شامل می شود.
این دوره جنبه های مفهومی و عملی تصاویر قبل از پردازش را برای به حداکثر رساندن اثر الگوریتم های پردازش تصویر و همچنین پیاده سازی استخراج ویژگی ، کاهش ابعاد و شناسایی عامل نهفته در بر می گیرد.
این دوره به شما می آموزد که DAG های کارآمد را با استفاده از شاخه بندی، حسگرهای فایل، PythonOperators و DummyOperators ایجاد کنید و عملگرهای سفارشی را برای ورود به سیستم بسازید که به شما امکان می دهد پردازش داده های پیچیده را به راحتی انجام دهید.
این دوره شامل ابزارهای مختلف پردازش داده ها - از جمله صفحات گسترده ، پایتون و پایگاه داده های رابطه ای است - و به مشکلات کیفیت داده ها و تجسم داده ها برای تولید بینش می پردازد.
درباره برچسبگذاری دادهها، اینکه چرا برای انجام یادگیری ماشینی لازم است و چگونه میتوانید از برچسبگذاری دادهها به طور موثر استفاده کنید، بیاموزید.
این دوره به شما مفاهیم، تئوری و اجرای آمار پایه، احتمال، آزمون فرضیه و تحلیل رگرسیون مورد نیاز برای ساخت و تفسیر مدلهای یادگیری ماشین معنادار را آموزش میدهد.
در این دوره ، شما می آموزید که چگونه با استفاده از عملکردهای Cloud Google با کمک چندین راه انداز ، عملکردهای بدون سرور را به طور مثر مستقر کنید. پس از این دوره ، با نوشتن ، استقرار و اجرای توابع Google Cloud بسیار راحت خواهید بود.
این دوره شامل دو ابزار خاص در جعبه ابزار TensorFlow - tfdbg و TensorBoard است. از این ابزارها می توان برای بررسی وضعیت داخلی برنامه های TensorFlow و تجسم معیارها و حالت اجرا استفاده کرد.
این دوره بر روی طراحی پایان به پایان یک معماری ابر ، به طور خاص از منظر بهینه سازی این معماری برای پردازش داده های بزرگ ، تجزیه و تحلیل زمان واقعی و پیش بینی زمان واقعی با استفاده از ML و AI متمرکز است.
به دلیل در دسترس بودن انبارهای عظیم داده و توسعه آسان چارچوب های یادگیری ، یادگیری عمیق در فعالیت های عادی بسیاری از شرکت ها ادغام می شود. در اینجا ، شما از Keras برای توسعه چنین شبکه ای یا پیاده سازی در مدل خود استفاده خواهید کرد.
این دوره جنبه های نظری و عملی ساختن راه حل های یادگیری مجموعه در یادگیری دقیق را پوشش می دهد. از جنگل های تصادفی ساخته شده با استفاده از کیسه بندی و چسباندن گرفته تا تقویت انطباقی و شیب دار و انباشت مدل و تنظیم فوق پارامتر.
GCP خدمات مختلفی را در ارتباط با شبکه و متعادل سازی بار ارائه می دهد که برای بدست آوردن زیرساختی بسیار بهینه و مقیاس بندی استفاده می شود. مانند Cloud CDN برای سرویس دهی سریع محتوای وب و توازن بار بهینه شده GCP برای خوشه های ظرف.
بینش موجود در داده ها اغلب نتیجه محاسبات نسبتاً پیچیده است و عبارات Qlik Sense به شما امکان می دهند چنین محاسباتی را به صورت گام به گام بسازید. نتایج پویا هستند و به عنوان تغییرات اساسی داده ها به روز می شوند.
در این ویدیو نحوه استفاده از Keras و TensorFlow برای رمزگذاری متن با استفاده از بردارهای شمارش را بیاموزید.
این دوره تکنیک های مهم در ارزیابی مدل برای برخی از محبوب ترین انواع تکنیک های داده کاوی را پوشش می دهد. این تکنیک ها از یادگیری قوانین ارتباط گرفته تا خوشه بندی ، رگرسیون و طبقه بندی را شامل می شوند.
این دوره به شما یاد می دهد که چگونه داده های دسته ای را با استفاده از Apache Spark در پلتفرم Azure Databricks با استفاده از پرس و جوهای انتخاب، فیلتر و تجمیع، توابع داخلی و تعریف شده توسط کاربر تبدیل و جمع آوری کنید و پنجره سازی و پیوستن را انجام دهید.
این دوره به شما می آموزد که جریان های کاری جریان هوا را نظارت، حفظ و عیب یابی کنید و از اجرای به موقع و مدیریت موثر خطا با اعلان های ایمیل و ردیابی SLA اطمینان حاصل کنید.
این دوره به شما می آموزد که چگونه تصمیم گیری در یک محیط سازمانی می تواند بر اساس داده ها باشد. چارچوب های مهم تصمیم گیری مبتنی بر داده معرفی خواهند شد و مطالعات موردی با استفاده از تصمیم گیری مبتنی بر داده مورد بررسی قرار خواهند گرفت.
این دوره شما را با پرس و جوهای تحلیلی و پردازش داده های بزرگ با استفاده از Apache Spark در Azure Databricks آشنا می کند. شما یاد خواهید گرفت که چگونه با استفاده از Databricks Runtime با تبدیل ها، اقدامات، تجسم ها و توابع Spark کار کنید.
این دوره چندین روش مهم را که برای پیاده سازی طبقه بندی در یادگیری دقیق استفاده می شود ، شامل رگرسیون لجستیک ، رفتن به تجزیه و تحلیل متمایز ، Naive Bayes و استفاده از درختان تصمیم ، و سپس حتی پیشرفته تر ، شامل می شود.
این دوره مهمترین جنبه های تجزیه و تحلیل داده های اکتشافی را با استفاده از آمارهای مختلف تک متغیره ، دو متغیره و چند متغیره از اکسل و پایتون ، از جمله استفاده از طبقه بندی کننده های Naive Bayes و Seaborn برای تجسم روابط ، پوشش می دهد.
Elasticsearch یک موتور جستجو و تجزیه و تحلیل بسیار محبوب است که به شما کمک می کند با جستجوی سایت یا برنامه خود در کمترین زمان فعال و فعال شوید. این دوره شامل چگونگی بهبود تفاوت های ظریف در جستجو با طراحی طرح صحیح اسناد شما می باشد.
این دوره بر درک مفهومی و پیاده سازی قوی روشهای مختلف بوت استرپ در تخمین متمرکز است ، از جمله استفاده صحیح از بوت استرپ غیر پارامتری ، گسترش روش بوت استرپ به دنیای بیزی و غیره.
اگر با استفاده از شبکه های عصبی با داده های متنی کار می کنید ، RNN یک انتخاب طبیعی برای توالی ها است. این دوره از طریق مشکلات مدل سازی زبان با استفاده از RNNS - شناسایی نوری شخصیت یا OCR و تولید متن با استفاده از پیش بینی کاراکتر کار می کند.
این دوره بر روی اتصالات شبکه که در آن یکی یا هر دو شبکه متصل در GCP هستند تمرکز دارد. این شامل درک همسان سازی و اتصال به یکدیگر و همچنین نحوه اجرای VPC های مشترک و VPN استاتیک و پویا است.
Google Cloud AI طیف گسترده ای از خدمات یادگیری ماشین را ارائه می دهد. AutoML از فناوری پیشرفته ای برخوردار است که با استفاده از داده های آموزشی شما بهترین مدل را برای موارد استفاده شما پیدا می کند. در این دوره ، شما می آموزید که یک مدل یادگیری ماشین سفارشی بسازید.
راهنمای مقابله با XSS، ربودن جلسه، XSRF، مدیریت اعتبار، SQLi و بسیاری موارد دیگر
این دوره جنبه های مفهومی و عملی جمع آوری از منابع مختلف داده ، با طرح ها و جهت های مختلف ، به یک کل منسجم را با استفاده از اکسل ، پایتون و ابزارهای مختلف موجود در بستر ابر Azure در بر می گیرد.
پردازش میلیاردها رکورد به درک عمیقی از محاسبات توزیع شده نیاز دارد. در این دوره ، شما با Hadoop آشنا خواهید شد ، یک چارچوب محاسباتی توزیع شده منبع باز که می تواند به شما در انجام این کار کمک کند.
ملزومات ایمنی محتوای هوش مصنوعی Azure را کاوش کنید. این دوره به شما یاد می دهد که چگونه محتوای متن و تصویر را تعدیل کنید و با استفاده از فیلترهای پیشرفته و سپرهای سریع، مطالب مضر یا نامناسب را شناسایی کنید.
این دوره بر توانایی ها ، مدل ها و مجموعه داده های موجود در بسته MASS در R. تمرکز دارد. در این راه ، شما دانش تخمین احتمال بقا و کار با نرخ های خطر را در مدل چند حالته کسب خواهید کرد.
این دوره جنبه های مفهومی استفاده از یادگیری ماشینی را برای مشکلات در صنعت مراقبت های بهداشتی بررسی می کند، در مورد مطالعات موردی یادگیری ماشینی مورد استفاده در مراقبت های بهداشتی بحث می کند، و پیاده سازی های عملی تکنیک ها را در دنیای واقعی کشف می کند.
این دوره تمام جنبههای مهم نظارت بر Stackdriver را پوشش میدهد، که در تمام منابع پلتفرم Google Cloud کار میکند و راهاندازی بررسیهای زمان آپدیت، پروفایلسازی و ادغام با دیگر پلتفرمهای ابری و ابزارهای نظارت را راحت میکند.
Apache MXNet یک چارچوب یادگیری عمیق است که ریشه در خدمات وب آمازون (AWS) دارد و یک جایگزین قدرتمند برای TensorFlow است. این دوره به شما می آموزد که چگونه نمودارهای محاسبه پویا و استاتیک را با استفاده از Gluon API بسازید.
بیاموزید که چگونه مدلهای خود نظارت میتوانند به استفاده از دادههای بدون برچسب و استفاده از مدلهای خود نظارت در یادگیری انتقال کمک کنند.
این دوره شامل ابزارهای مهم برای بازیابی محتوای وب با استفاده از کتابخانه های HTTP مانند Requests ، Httplib2 و Urllib و همچنین فناوری های قدرتمند برای تجزیه وب است. اینها شامل Beautiful Soup (کتاب سوپ زیبا) است که کتابخانه ای پرطرفدار است و Scrap ، ...
بسیاری از منابع داده در دنیای واقعی به شکل جریان در دسترس هستند. از سنسورهای خودروهای خودران گرفته تا مانیتورهای آب و هوا. Apache Spark 2 یک موتور تحلیلی قدرتمند، توزیع شده است که پشتیبانی عالی از برنامه های پخش جریانی ارائه می دهد
این دوره چندین تکنیک مهم را که برای پیاده سازی خوشه در یادگیری scikit یادگیری استفاده می شود ، شامل الگوریتم های خوشه بندی K-means ، medium-shift و DBScan و همچنین نقش تنظیم hyperparameter و انجام خوشه بندی بر روی داده های تصویر را شامل می شود.
این دوره به شما می آموزد که DAG های کارآمد را با استفاده از شاخه بندی، حسگرهای فایل، PythonOperators و DummyOperators ایجاد کنید و عملگرهای سفارشی را برای ورود به سیستم بسازید که به شما امکان می دهد پردازش داده های پیچیده را به راحتی انجام دهید.
این دوره به شما یاد میدهد که چگونه میتوانید دادهها را ایجاد کنید، دریافت کنید و با آن کار کنید، Delta Lakes، یک لایه ذخیرهسازی منبع باز که قابلیت اطمینان را برای دادههای ذخیره شده در دریاچههای داده به ارمغان میآورد. دریاچه های دلتا تراکنش های ACID، پردازش دسته ای و جریانی یکپارچه را ارائه می دهند.
Dataproc پیشنهاد Hadoop تحت مدیریت Google در فضای ابری است. این دوره به شما می آموزد که چگونه جداسازی فضای ذخیره سازی و محاسبه به شما امکان می دهد از خوشه ها صرفاً برای پردازش داده ها و نه برای ذخیره سازی استفاده کنید.
این دوره چندین تکنیک را برای ساده سازی بهینه داده های مورد استفاده در برنامه های یادگیری ماشین تحت نظارت استفاده می کند ، از تکنیک های نسبتاً ساده انتخاب ویژگی تا برنامه های بسیار پیچیده خوشه بندی با استفاده از شبکه های عصبی عمیق.
مهارتهای Google Cloud Platform را برای مدیریت برنامههای Hadoop، دادههای بزرگ و یادگیری ماشین توسعه دهید
به لطف هوش مصنوعی، برنامه های مدرن تعاملی تر و هوشمندتر از همیشه هستند. APIهای خدمات شناختی مایکروسافت، مدلهای یادگیری ماشینی با کاربرد آسان را ارائه میکنند که بر روی مخازن وسیعی از دادهها آموزش داده شدهاند تا راهحلهایی را برای موارد استفاده رایج ارائه دهند.
پایگاه های داده سنتی بر پردازش معاملات متمرکز هستند ، در حالی که Hive به پردازش تحلیلی استخراج شده از مجموعه های عظیم داده کمک می کند. این دوره روی شباهت ها و تفاوت های SQL با Hive تمرکز دارد.
آموزش ساخت خطوط لوله داده پیچیده با Apache Airflow. این دوره به شما میآموزد که DAGهایی ایجاد کنید که دادهها را میخوانند، اعتبارسنجی میکنند، جمعآوری میکنند و در حین مدیریت وابستگیهای وظایف، با استفاده از XComs برای انتقال دادهها بین وظایف، دادهها را بارگذاری میکنند.
این دوره معماری توزیع فهرست Elasticsearch ، پیکربندی خوشه ، خرده ریزها و کپی ها ، مدل های شباهت ، جستجوی پیشرفته و اسناد ترکیبی از زبان را توضیح می دهد ، همه اینها عملکرد جستجوهای جستجو را بهبود می بخشد.
نحوه کار با TaskFlow API، انجام عملیات با استفاده از TaskFlow، ادغام PostgreSQL در Airflow، استفاده از حسگرها در Airflow و کار با قلاب ها در Airflow را بررسی کنید.
اکثر سازمان ها مایلند از قدرت یادگیری ماشین (ML) برای بهبود محصولات خود استفاده کنند ، اما ممکن است آنها همیشه تخصص داخلی را نداشته باشند. این دوره به شما نشان می دهد که چگونه می توانید از ML برای موارد استفاده با استفاده از تماس های API استفاده کنید.
Apache Flink بر اساس مفهوم معماری جریان اول ساخته شده است که جریان منبع حقیقت است.
این دوره شامل دسته ای از تکنیک های مهندسی ویژگی است که برای گرفتن بهترین نتیجه از یک مدل یادگیری ماشین مورد استفاده قرار می گیرد ، از جمله انتخاب ویژگی ها ، و چندین روش استخراج ویژگی برای بیان مجدد ویژگی ها به مناسب ترین شکل.
Dataflow یک سرویس بدون سرور و کاملاً مدیریت شده در Google Cloud Platform برای پردازش دسته ای و جریانی است.
این دوره ملاحظات مهم برای مدلهای یادگیری scikit را در بهبود تأخیر و توان عملیاتی پیش بینی پوشش می دهد. نمایش ویژگی های خاص و تکنیک های یادگیری جزئی ، و همچنین پیاده سازی های یادگیری افزایشی ، ...
راههای کار با کنترل دسترسی مبتنی بر نقش، مدیریت SLA، زمانبندی DAG با مجموعه دادهها، کار با پلاگینهای جریان هوا، و مقیاسبندی جریان هوا را کاوش کنید.
Cloud Storage سرویس ذخیره سازی اشیای الاستیک Google Cloud Platform است که با S3 در AWS و Blob Storage در Azure رقابت می کند. این قابلیت برای هر نوع داده قابلیت پرداخت به عنوان هزینه استفاده شما را دارد و ادغام آسان با سایر سرویس های GCP را ارائه می دهد.
روند کلی در هر صنعت این است که کارهای تکراری خودکار شوند و بشر در مشاغل دارای مهارت بالاتر مستقر شود. Google Dialogflow یک رابط گفتگوی پیشرفته برای ربات ها ، دستگاه ها و برنامه ها است.
این دوره به شما می آموزد که چگونه می توانید مدل های یادگیری ماشین سنتی خود را با استفاده از Databricks Machine Learning و MLflow برای مدیریت چرخه عمر یادگیری ماشین انتها به انتها بسازید و آموزش دهید.
Matplotlib یکی از مشهورترین کتابخانه های تجسم است که توسط تحلیل گران داده و دانشمندان داده ای که در پایتون کار می کنند استفاده می شود ، اما استفاده از آنها اغلب می تواند ترسناک باشد. این دوره کار ساده و ساده کار با Matplotlib را انجام می دهد.
پردازش رویداد پیچیده در بالای کتابخانه های اصلی Flink ساخته شده است. این به شما امکان می دهد الگوها را در یک جریان بی نهایت از رویدادها یا در یک پنجره زمانی شناسایی و پردازش کنید. این دوره به شما می آموزد که پردازش رویدادهای پیچیده را برای ...
این دوره به Keras به عنوان بخشی از اکوسیستم TensorFlow 2.0 متمرکز است ، از جمله API های متوالی برای ساخت مدل های نسبتاً ساده لایه های انباشته ، API های کاربردی برای مدل های پیچیده تر و طبقه بندی های فرعی مدل و لایه های سفارشی.
این دوره بر معرفی چارچوب TensorFlow 2.0 - بررسی ویژگی ها و عملکردهایی که برای ساخت و آموزش شبکه های عصبی ارائه می دهد ، متمرکز است. این دوره درباره تفاوت TensorFlow 2.0 با TensorFlow 1.x و چگونگی تفاوت ...
کشف کنید که چه پیش نیازهایی باید داشته باشید تا از یادگیری خود نهایت استفاده را ببرید.
این دوره TensorFlow ، یک کتابخانه جریان داده منبع باز برای محاسبات عددی با استفاده از نمودارهای جریان داده را معرفی می کند.
این دوره به شما یاد می دهد که چگونه می توانید ویژگی های یادگیری ماشینی پیش پردازش شده خود را با استفاده از Databricks Feature Store ذخیره، دسترسی، مدیریت و به اشتراک بگذارید.
محافظ شما برای زمانی که داده ها خیلی بزرگ می شوند، این دوره قوی اما دوستانه، خنده دار و در عین حال عمیق، متحرک و در عین حال متفکرانه است.
با بزرگتر شدن اندازه داده هایی که ذخیره می کنید ، پایگاه های داده رابطه ای سنتی ممکن است دیگر کار نکنند. HBase توانایی مقابله با میلیاردها ردیف داده را دارد و هر رکورد می تواند شامل میلیون ها فیلد باشد. این دوره به شما کمک می کند تا با HBase شروع کنید.
در این دوره آموزشی کدگذاری تعاملی به سبک کارگاهی، نحوه ساخت و آموزش شبکه های متخاصم مولد (GANs) با استفاده از شبکه های عصبی متراکم را بیاموزید.
قبلا با نام API.AI شناخته می شد
تحلیل گران و دانشمندان همیشه در جستجوی منابع جدید داده ، هوش رقابتی و سیگنال های جدید برای مدل های اختصاصی در برنامه ها هستند. بسته Scrapy در پایتون استخراج محتوای وب خام را آسان و قابل توسعه می کند.
این دوره شامل تکنیک های مهمی در تهیه داده ها ، تمیز کردن داده ها و انتخاب ویژگی هایی است که برای موفقیت در مدل یادگیری ماشین شما لازم است. شما همچنین یاد خواهید گرفت که چگونه از مقصر برای مقابله با داده ها و استراتژی های از دست رفته استفاده کنید ...
این دوره جنبه های مهم کار با نوت بوک های Jupyter را شامل می شود ، از جمله نصب و نقش هسته ها ، عملکردهای جادویی و اجرای دستورات پوسته. علاوه بر این ، قدرت نوت بوک های Jupyter میزبان ابر در AWS ، ...
این دوره شامل تفاوت های مهم بین مشکلات مختلف متعارف در یادگیری ماشین ، و همچنین ملاحظات در انتخاب روش های صحیح راه حل ، بر اساس ویژگی های مسئله ای است که می خواهید حل کنید و ...
برخی از قدرتمندترین ویژگی ها، برنامه ها و راه حل های ارائه شده توسط H20.ai، خالق پلت فرم H20 AI Cloud را کاوش کنید.
این دوره جنبه های مفهومی استفاده از یادگیری ماشین را برای مشکلات در بازاریابی بررسی می کند، در مورد مطالعات موردی یادگیری ماشینی مورد استفاده در بخش بازاریابی بحث می کند، و پیاده سازی های عملی تکنیک ها را بر روی داده های دنیای واقعی کشف می کند.
این دوره دلایل مهم مفهومی را برای عدم عملکرد مناسب مدل ها پس از استقرار ، اجرای واقعی استقرار مدل با استفاده از Python Flask ، استفاده از گزینه های محاسباتی مبتنی بر ابر بدون سرور و استفاده از دستگاه مخصوص پلت فرم پوشش می دهد ...
بلاکچین های درجه شرکتی که همتایان شناخته شده ، امنیت بهتر و تعهدات معاملاتی قابل پیش بینی را ارائه می دهند اکنون یک امر عادی است. پارچه هایپرلجر یک گزینه مناسب است که بر بسیاری از اشکالاتی که در چارچوب Ethereum بدتر شده غلبه می کند.
شبکه های عصبی راجعه (RNN) برای در نظر گرفتن توالی داده ها ایده آل هستند. در این دوره ، نحوه استفاده از جاسازی کلمات برای تجزیه و تحلیل احساسات با استفاده از شبکه های عصبی را کشف خواهید کرد.
این دوره به شما ترجمه متن با نویسهگردانی و جستجوی فرهنگ لغت را با استفاده از SDK زبان و REST API آموزش میدهد. بیاموزید که چگونه ترجمه می تواند در پشتیبانی چند زبانه مشتری و بومی سازی منابع به شما کمک کند.
این دوره استفاده از ساختارها و معماری های شبکه عصبی پیشرفته، مانند شبکه های عصبی تکراری، جاسازی کلمات و RNN های دو طرفه را برای حل مسائل پیچیده مدل سازی کلمه و زبان با استفاده از PyTorch پوشش می دهد.
از آنجا که کار با مجموعه داده های عددی عادی تبدیل به عادی می شود ، استفاده از ابزارها و کتابخانه های مناسب برای کار با داده ها بسیار مهم می شود. NumPy به تحلیلگران داده و دانشمندان داده اجازه می دهد تا با داده های چند بعدی برای حل این مشکلات کار کنند.
گردش اطلاعات نشان دهنده یک رویکرد کاملاً متفاوت نسبت به موتورهای محاسباتی مانند Spark در پردازش داده های بزرگ است. گردش اطلاعات بدون سرور و کاملاً مدیریت شده است و از خطوط لوله در حال اجرا که با استفاده از API های Apache Beam طراحی شده اند پشتیبانی می کند.
این دوره ابزارهای آماری و فنی کلیدی مورد نیاز برای انتقال بینشهای واضح و کاربردی از دادهها به مدیران ارشد را پوشش میدهد، از جمله استفاده از تجسمهای قدرتمند مانند نمودارهای سانکی، نمودارهای قیفی و نمودارهای کندل استیک.
این دوره به شما می آموزد که جریان های کاری جریان هوا را نظارت، حفظ و عیب یابی کنید و از اجرای به موقع و مدیریت موثر خطا با اعلان های ایمیل و ردیابی SLA اطمینان حاصل کنید.
این دوره شامل بخشهایی از سیستمهای طبقه بندی تصویر درجه سازمانی مانند پیش پردازش تصویر ، انتخاب بین CNN و DNN ، محاسبه ابعاد خروجی CNN و استفاده از مدلهای از قبل آموزش دیده با استفاده از آموزش انتقال PyTorch است.
در این دوره ، شما یاد خواهید گرفت که چگونه می توانید با استفاده از Weka ، یک نرم افزار یادگیری ماشین منبع باز برای آماده سازی داده ها ، یادگیری ماشین و استقرار مدل پیش بینی ، جریان کار یادگیری ماشین خود را توسعه دهید.
استفاده از ابزارهای آماری برای کاوش و تجزیه و تحلیل داده های خود قبل از استفاده در مدل های ML بسیار مهم است. این دوره نحوه کارکرد مدلهای آماری پایه و نحوه استفاده از بسته StatsModel Python را برای تخمین و اکتشاف آموزش می دهد.
این دوره شامل مدل های مختلف انتخاب در Qlik ، از جمله گزینه های کلیک ، افسانه و lasso و مدل انتخاب انجمنی و همچنین نقش جستجوی هوشمند ، موتور شناختی Qlik Sense و حالت های پیش فرض و جایگزین است.
دانستن چگونگی برنامه نویسی MapReduce تنها نیمی از تلاش است. در این دوره ، شما می آموزید که چگونه MapReduce صحیح را براساس آنچه می خواهید به انجام برسانید ، تنظیم کنید.
این دوره جنبه های مهم انتقال سبک عصبی ، یک روش برای تبدیل تصاویر را پوشش می دهد و در مورد شبکه های خصمانه تولیدی به منظور ایجاد موثر تصاویر و فیلم های واقع گرایانه بحث می کند.
این دوره اقدامات تمایل مرکزی و پراکندگی مورد نیاز برای شناسایی بینش کلیدی در داده ها را پوشش می دهد. همچنین شامل موارد زیر است: همبستگی ، کوواریانس ، انحراف ، کورتوز و پیاده سازی در کتابخانه های پایتون مانند Pandas ، SciPy و StatsModels.
این دوره مقدمه ای عمیق برای SageMaker و پشتیبانی آن برای آموزش و استقرار مدل های یادگیری ماشین در یک محیط توزیع شده است.
این دوره هر دو دلیل و چگونگی استفاده از یادگیری scikit را فرا می گیرد. شما در طبقه بندی همیشه در حال رشد کتابخانه های یادگیری ماشین و جنبه های مهم کار با برآوردگرها و خطوط لوله یادگیری scikit یاد خواهید گرفت.
در این دوره ، شما کتابخانه Python-scikit-image را کشف خواهید کرد که به شما امکان می دهد تکنیک های پیچیده پردازش تصویر را بر روی تصاویر اعمال کنید و به سرعت اطلاعات مهم یا تصاویر قبل از پردازش را برای ورود به مدل های یادگیری ماشین استخراج کنید.
++C هرگز دیگر ترسناک به نظر نمی رسد، پس از اتمام این مثال ها.
این دوره به شما می آموزد که جریان های کاری جریان هوا را نظارت، حفظ و عیب یابی کنید و از اجرای به موقع و مدیریت موثر خطا با اعلان های ایمیل و ردیابی SLA اطمینان حاصل کنید.
این دوره جنبه های استخراج اطلاعات از اسناد متنی و ساخت مدل های طبقه بندی از جمله بردارسازی ویژگی ها ، هش حساس به مکان ، حذف کلمات متغیر ، لمسی سازی و موارد دیگر از پردازش زبان طبیعی را شامل می شود.
این دوره بر درک مفهومی و اجرای تکنیک های عددی برای حل معادلات دیفرانسیل ، از جمله معادلات دیفرانسیل معمولی/جزئی/تأخیری ، و سیستم معادلات معروف به معادلات جبری دیفرانسیل متمرکز است.
Dataflow رویکردی اساساً متفاوت برای پردازش Big Data نسبت به موتورهای محاسباتی مانند Spark دارد. جریان داده بدون سرور و کاملاً مدیریت شده است، به این معنی که تأمین منابع و مقیاسبندی میتواند برای معمار داده شفاف باشد.
آشنایی با Apache Airflow - کاربردها، ساختار، نحوه راهاندازی و اجرای آن، و نحوه ایجاد و اجرای گردشهای کاری.
این دوره شامل استفاده از PyTorch برای ساخت مدل های مختلف پیش بینی ، استفاده از شبکه های عصبی تکرار شونده ، نورون های حافظه طولانی در پیش بینی متن و ارزیابی آنها با استفاده از معیاری است که به عنوان میانگین میانگین دقیق @ K شناخته می شود.
BigQuery انبار داده Google Cloud Platform در فضای ابری است. در این دوره ، شما یاد خواهید گرفت که چگونه می توانید با BigQuery در مجموعه داده های عظیم بدون سربار اداری و بدون هیچ کاری کار کنید.
Caffe2 یک چارچوب یادگیری عمیق است که در آوریل 2017 توسط منبع فیس بوک تهیه شده است. Caffe2 به طور صریح برای استقرار تولید در مقیاس بزرگ و استفاده در یک محیط منبع محدود مانند دستگاه های تلفن همراه ساخته شده است.
این دوره به شما می آموزد که چگونه Apache Airflow را با Google Cloud Storage، Google Cloud BigQuery و AWS S3 متصل کنید که مدیریت و پردازش داده ها را در پلتفرم های ابری امکان پذیر می کند.
این دوره بر درک مفهومی و اجرای تکنیک های عددی برای حل مسائل ریاضی متمرکز است. حل بسیاری از مشکلات در دنیای واقعی به صورت تحلیلی دشوار یا غیرممکن است ، اما حل عددی آن آسان است.
این دوره جنبه های مهم استفاده از PyTorch در سرویس های وب آمازون (AWS) ، Microsoft Azure و بستر Google Cloud (GCP) را شامل می شود ، از جمله استفاده از نوت بوک های میزبان ابر ، یادگیری عمیق نمونه های VM با پشتیبانی GPU و PyTorch .. .
نحوه استفاده از پلتفرم Confluent برای اشکال زدایی و عیب یابی آپاچی کافکا را بیاموزید.
Google App Engine یک چارچوب وب و پلت فرم رایانش ابری برای توسعه و میزبانی برنامه های کاربردی وب در مراکز داده تحت مدیریت گوگل است. با استفاده از App Engine میتوانید به راحتی یک برنامه وب بسیار پیچیده را راهاندازی کنید و فقط روی نوشتن کد تمرکز کنید.
این دوره ارتباط مستمر Data Mining امروز را در زمینه استفاده از تکنیک های یادگیری ماشین در داده های بزرگ توضیح می دهد. این شامل جزئیات مفهومی و عملی تکنیک های قدرتمند مانند یادگیری قوانین اتحادیه و ...
این دوره جنبه های مهم عملی نصب PyTorch را از ابتدا روی انواع مختلف سیستم عامل و استفاده از مدل های طبقه بندی و رگرسیون را پوشش می دهد.
این دوره طیف گسترده ای از تکنیک های مهم کاهش ابعاد و انتخاب ویژگی های موجود در یادگیری scikit را شامل می شود ، به سازندگان مدل اجازه می دهد تا با کاهش نصب بیش از حد ، صرفه جویی در وقت آموزش مدل و ... عملکرد مدل را بهینه کنند.
Google Bigtable یک پیشنهاد NoSQL پیچیده در Google Cloud Platform با تأخیر بسیار کم است. با پایان این دوره ، خواهید فهمید که چرا Bigtable با مقیاس گذاری خطی داده های شما ، بسیار قدرتمندتر از HBase است.
این دوره جنبه های مهم انجام آموزش توزیع شده مدل های PyTorch ، با استفاده از روشهای پردازش چندگانه ، موازی داده و توزیع شده موازی داده را پوشش می دهد. همچنین بحث می شود که شما می توانید مدل های PyTorch را برای پیش بینی میزبانی کنید.
با استفاده از Taskflow API، گردش کار Airflow خود را افزایش دهید. این دوره به شما یاد می دهد که چگونه از Taskflow API برای ساخت DAG و انتقال داده ها بین وظایف استفاده کنید.
این دوره به شما می آموزد که تکنیک های مهمی را برای تجزیه و تحلیل پیش بینی کننده مانند رگرسیون و طبقه بندی با استفاده از Apache Spark MLlib بر روی Databricks درک و پیاده سازی کنید.
در این دوره آموزشی، نحوه تنظیم موثر قوانین اعتبارسنجی داده ها برای داده های متنی، عددی و تاریخ و پیکربندی لیست های کشویی ایستا و پویا را خواهید آموخت که به حفظ دقیق و قابل اعتماد پایگاه داده های کارکنان و سازمانی کمک می کند.
این دوره شما را قادر می سازد تا توابع منطقی، توابع جستجو و مرجع، تجزیه و تحلیل what-if، و تجسم را با خطوط جرقه، با استفاده از مجموعه داده ها برای ارزیابی فروش، واجد شرایط بودن اعتبار، داده های کارکنان و سناریوهای سرمایه گذاری پیاده سازی کنید.
این دوره شامل گزینه های اصلی پیرامون محاسبه ، ذخیره سازی و شبکه سازی است و نشان می دهد که چگونه می توان با کنار هم قرار دادن بلوک های ساختاری قدرتمندی که GCP فراهم می کند ، معماری های پیچیده به راحتی جمع می شوند.
این دوره جنبه های مهم انتخاب محیط توسعه برای پایتون ، تفاوت های Conda و Pip برای کار با کتابخانه های پایتون ، IDE های معروف مانند PyCharm ، IDLE ، Eclipse و Spyder و همچنین اجرای پایتون را پوشش می دهد ...
این دوره به طور خاص با موارد استفاده پیشرفته و واقعی در دنیای واقعی شامل استفاده از GKE از جمله به روزرسانی و بازگشت به عقب ، مدیریت امنیت خوشه و شبکه و اجرای خطوط لوله CI/CD با Jenkins و GKE سروکار دارد.
در این دوره آموزشی تعاملی کدنویسی به سبک کارگاهی، نحوه ساخت یک شبکه عصبی با PyTorch Lightning را بیاموزید.
این دوره به معرفی شبکه و VPC در Google Cloud Platform (GCP) می پردازد. این شامل: VPC های خودکار و سفارشی ، تفاوت بین VPC ها در GCP در مقابل خدمات وب آمازون (AWS) ، طراحی زیر شبکه ها و ویژگی های پیشرفته مانند VPC مشترک.
نحوه استفاده از خلاصه سازی متن با هوش مصنوعی Hugging Face را بیاموزید.
در یادگیری و ایجاد پایگاه های داده توزیع شده با Apache Ignite غوطه ور شوید.
این دوره تکنیک های مختلفی را برای رمزگذاری داده های دسته بندی ، از اشکال آشنای رمزگذاری یکپارچه و برچسب ، قبل از انتقال به طرح های برنامه نویسی کنتراست مانند کدگذاری ساده ، کدگذاری Helmert و کدگذاری چند جمله ای متعامد ، شامل می شود.
Hyperledger در حال ظهور به عنوان بستری چتر برای کاربران جدی در سطح سازمانی است که به دنبال مجموعه ای کامل از فناوری ها هستند که به آنها کمک می کند شبکه های بلاکچین خود را بسازند و این دوره به شما کمک می کند زمان و نحوه استفاده از آن را بفهمید.
این دوره به مهندسان و دانشمندان داده کمک خواهد کرد تا بیاموزند که چگونه مدلهای یادگیری ماشین را با استفاده از scikit-learn ، یکی از مشهورترین کتابخانه های ML در پایتون بسازند. بدون تجربه قبلی با ML ، فقط دانش اولیه برنامه نویسی پایتون لازم است.
این دوره انواع مهم الگوریتم های یادگیری ماشین ، تکنیک های راه حل مبتنی بر ویژگی های مسئله ای را که می خواهید حل کنید و همچنین گردش کار کلاسیک یادگیری ماشین را در بر می گیرد.
این دوره جنبه های مهم خراش دادن وب سایت ها با استفاده از سوپ زیبا را پوشش می دهد. شما می توانید ساخت ، دستکاری و عبور از درخت تجزیه و همچنین استفاده از ویژگی های پیشرفته مانند کار با فیلترها ، CSS و XPath را بیاموزید.
این دوره به شما یاد می دهد که چگونه داده های دسته ای را با استفاده از Apache Spark در پلتفرم Azure Databricks با استفاده از پرس و جوهای انتخاب، فیلتر و تجمیع، توابع داخلی و تعریف شده توسط کاربر تبدیل و جمع آوری کنید و پنجره سازی و پیوستن را انجام دهید.
با استفاده از Taskflow API، گردش کار Airflow خود را افزایش دهید. این دوره به شما یاد می دهد که چگونه از Taskflow API برای ساخت DAG و انتقال داده ها بین وظایف استفاده کنید.
آموزش ساخت خطوط لوله داده پیچیده با Apache Airflow. این دوره به شما میآموزد که DAGهایی ایجاد کنید که دادهها را میخوانند، اعتبارسنجی میکنند، جمعآوری میکنند و در حین مدیریت وابستگیهای وظایف، با استفاده از XComs برای انتقال دادهها بین وظایف، دادهها را بارگذاری میکنند.
BigQuery ML در Google Cloud Platform با اجازه دادن به تحلیلگران و مهندسان داده برای ساخت و استفاده از مدل های یادگیری ماشین مستقیماً از SQL بدون استفاده از زبان برنامه نویسی سطح بالاتر ، یادگیری ماشین را دموکراتیک می کند.
بوکه یک کتابخانه پایتون قابل دسترسی و با کاربرد آسان است که به حتی برنامه نویسان تازه کار اجازه می دهد تجسم های پیچیده و تعاملی را به روشی شهودی بسازند. بیاموزید که چگونه نقشه های تعاملی را برای پشتیبانی از تصمیم گیری تجاری با بوکه بسازید.
جریان ساختاری موتور پردازش جریان مقیاس پذیر و متحمل خطا در Apache Spark 2 است که می تواند برای پردازش جریان های با سرعت بالا مورد استفاده قرار گیرد.
این دوره به شما می آموزد که چگونه می توانید شبکه های Hyperledger Fabric را ایجاد و پیکربندی کنید و قراردادهای هوشمند را بر روی آنها توسعه دهید. این دوره همچنین کلاینت Hyperledger Besu Ethereum مورد استفاده برای شبکه های خصوصی اتریوم را پوشش می دهد.
Scala به عنوان یک گزینه محبوب برای کار با مجموعه داده ها و چارچوب های بزرگ مانند Spark در حال ظهور است. این دوره در مورد پشتیبانی Scala از توابع درجه یک و درجه بالاتر و تفاوت بین روش ها و توابع به شما آموزش می دهد.
این دوره بردارهای ویژگی متن و سند را که می تواند به مدل های یادگیری ماشین منتقل شود ، مدل سازی موضوع با استفاده از تجزیه و تحلیل معنای نهفته ، تخصیص پنهان دیریشله ، ضریب ماتریس غیر منفی و استخراج کلمات کلیدی با استفاده از RAKE بحث می کند.
مدل برنامه نویسی MapReduce استاندارد واقعی پردازش موازی داده های بزرگ است. این دوره MapReduce را معرفی می کند ، نحوه جریان داده ها از طریق برنامه MapReduce را توضیح می دهد و شما را از طریق نوشتن اولین برنامه MapReduce در جاوا راهنمایی می کند.
این دوره به شما می آموزد که چگونه Apache Airflow را با Google Cloud Storage، Google Cloud BigQuery و AWS S3 متصل کنید که مدیریت و پردازش داده ها را در پلتفرم های ابری امکان پذیر می کند.
این دوره در مورد کار با Apigee است ، یک پلت فرم مدیریت API که ارائه دهندگان را قادر به طراحی ، ایمن سازی ، استقرار ، نظارت و مقیاس سازی API ها می کند. Apigee در سال 2016 توسط گوگل خریداری شد ، محبوب است و به طور یکپارچه با Google App Engine کار می کند.
این دوره به دانشمند یا مهندس داده کمک خواهد کرد تا با استفاده از یک مدل عالی ML ، ساخته شده در TensorFlow ، این مدل را برای تولید به صورت محلی یا در سه سیستم عامل اصلی ابر به کار گیرد. لاجوردی ، AWS یا GCP.
این دوره به شما می آموزد که چگونه از پنجره سازی، واترمارکینگ و پیوستن به عملیات جریان داده در Spark برای موارد استفاده خاص خود استفاده کنید.
دوره ای که مانند هیچ کس نشانگرها، لیست های پیوندی، برنامه نویسی عمومی، الگوریتم ها و بازگشت را آموزش می دهد.
این دوره به طور جامع تکنیک های پیش پردازش داده ها را تحت پوشش قرار داده و دگرگونی های موجود در یادگیری ناکافی را فراهم می کند ، و به شما امکان ساخت ویژگی های بسیار بهینه شده را می دهد که به روش های کاملاً ریاضی مقیاس بندی شده ، عادی شده و تبدیل می شوند تا کاملا ...
تکنیک های یادگیری بدون نظارت با مجموعه داده های بزرگ برای یافتن الگوهای درون داده ها کار می کنند. این دوره به شما جزئیات خوشه بندی و رمزگذاری خودکار، دو تکنیک همه کاره یادگیری بدون نظارت و نحوه پیاده سازی آنها را در TensorFlow می آموزد.
این دوره به شما می آموزد که DAG های کارآمد را با استفاده از شاخه بندی، حسگرهای فایل، PythonOperators و DummyOperators ایجاد کنید و عملگرهای سفارشی را برای ورود به سیستم بسازید که به شما امکان می دهد پردازش داده های پیچیده را به راحتی انجام دهید.
بیاموزید که چگونه Apache NiFi می تواند به شما در مدیریت داده کمک کند.
65 نمونه ای که اسکالا را برای شما زنده می کند
این دوره با موتور Google Kubernetes ، قوی ترین و یکپارچه ترین روش برای اجرای بارهای کانتینر دار در GCP سروکار دارد. ایجاد خوشه ، استفاده از انتزاعات ذخیره سازی حجم و اشیاress ورودی و خدماتی همه در این دوره پوشش داده می شوند.
این دوره به شما می آموزد که چگونه Apache Airflow را با Google Cloud Storage، Google Cloud BigQuery و AWS S3 متصل کنید که مدیریت و پردازش داده ها را در پلتفرم های ابری امکان پذیر می کند.
این دوره به شما می آموزد که چگونه معماری Data Lakehouse بهترین ها را در بین Data Lakes و Data Warehouse ها به شما ارائه می دهد و به شما امکان می دهد نیازهای داده خود را برای پردازش کلان داده، تجزیه و تحلیل SQL و یادگیری ماشین در یک پلت فرم واحد برآورده کنید.
این دوره به شما می آموزد که چگونه از انتزاعات Spark برای استریم داده ها استفاده کنید و با استفاده از API های جریان ساختار یافته Spark در Azure Databricks، روی داده های جریانی تبدیل کنید.
Apache Beam یک مدل واحد منبع باز برای پردازش داده های دسته ای و جریانی به روشی موازی است. خطوط لوله Beam که برای پشتیبانی از Backend Cloud Dataflow Google ساخته شده اند ، می توانند بر روی هرگونه پردازش باطله پشتیبانی شده اجرا شوند.
Hive End-to-End: HQL، Partitioning، Bucketing، UDFs، Windowing، Optimization، Map Joins، Indexes
با این شیرجه عمیق در معماری و تنظیمات پیشرفته، مهارت های Snowflake خود را افزایش دهید.
PyTorch یک چارچوب یادگیری عمیق منبع باز است که در ابتدا توسط تیم های هوش مصنوعی در فیس بوک توسعه یافته است. PyTorch API های سطح بالایی را ارائه می دهد که ساخت شبکه های عصبی را آسان می کند و از آموزش توزیع شده و پیش بینی پشتیبانی می کند.
Flink سیستمی با وضوح ، تحمل و مقیاس بزرگ با تأخیر و توان عملیاتی عالی است. با مجموعه داده های محدود و نامحدود با استفاده از همان معماری زمینه ای جریان اول و تمرکز بر جریان یا داده های بی حد و مرز کار می کند.
ملزومات ایمنی محتوای هوش مصنوعی Azure را کاوش کنید. این دوره به شما یاد می دهد که چگونه محتوای متن و تصویر را تعدیل کنید و با استفاده از فیلترهای پیشرفته و سپرهای سریع، مطالب مضر یا نامناسب را شناسایی کنید.
این دوره تکنیک های آمار استنباطی را پوشش می دهد. برای انجام آزمایش های تصادفی روی دو نسخه از یک متغیر ، تکنیک های پیشرفته را برای مقایسه میانگین در بین گروه ها ، مدل های پیش بینی کننده رگرسیون و طبقه بندی و آزمایش A/B بیاموزید.
در این دوره، یاد خواهید گرفت که چگونه می توانید از سرویس Amazon Kinesis Data Analytics برای پردازش داده های جریانی با استفاده از زمان اجرا Apache Flink و زمان اجرا SQL استفاده کنید. شما برنامه های استریم خود را با Kinesis Data Streams ادغام خواهید کرد،...
Pig یک موتور منبع باز برای اجرای تبدیل داده های موازی است که در Hadoop اجرا می شود. این دوره به شما نشان می دهد که چگونه Pig می تواند به شما کمک کند تا روی داده های ناقص با یک طرح ناسازگار کار کنید ، یا شاید بدون هیچ طرحواره ای.
این دوره بر چگونگی نشان دادن نمودار با استفاده از سه کلاس متداول الگوریتم های نمودار متمرکز است - مرتب سازی توپولوژیکی برای مرتب سازی رئوس بر اساس روابط تقدم ، الگوریتم کوتاه ترین مسیر و در آخر الگوریتم های درخت پوشا.
این دوره شامل تکنیک های مربوط به آمار استنباطی ، از جمله آزمون فرضیه ، آزمون t و آزمون مجذور کای پیرسون ، همراه با ANOVA است که برای تجزیه و تحلیل اثرات بین متغیرهای طبقه ای و تعامل بین متغیرها استفاده می شود.
داستانهای داده راهی برای گردآوری منسجم بینشها و دادههایی است که در برنامه Qlik Sense خود جمعآوری کردهاید. با استفاده از «داستانهای داده»، میتوانید نقاط داده را به یک روایت قانعکننده بپیوندید تا به مخاطب ارائه کنید. این یک ...
بسیاری از داده های دنیای واقعی در جریان ها موجود است. از سنسورهای اتومبیل خودران تا مانیتورهای هوا Apache Spark 2 یک موتور تحلیلی قدرتمند با پشتیبانی درجه یک برای انجام عملیات جریانی با استفاده از پردازش میکرو دسته ای و مداوم است.
Flink سیستمی مناسب ، قابل تحمل و در مقیاس بزرگ است که دارای ویژگی های تأخیر و توان عملیاتی عالی است. با مجموعه داده های محدود و نامحدود با استفاده از همان معماری زمینه ای جریان اول ، تمرکز بر جریان یا داده های بدون محدودیت ، کار می کند.
Firebase پلتفرم جامع توسعه موبایل و برنامه Google است که دارای چندین ویژگی و خدمات است که با پلتفرم Google Cloud یکپارچه شده و تکمیل کننده آن است.
ماژول Spark Streaming به شما امکان می دهد با استفاده از انتزاعات پردازش دسته ای آشنا ، با داده های جریان در مقیاس بزرگ کار کنید. این دوره با نحوه انجام تحولات و عملکردهای استاندارد در جریان ها شروع می شود و به سمت موضوعات پیشرفته تر حرکت می کند.
نسخه های 2.x Spark نمایانگر ویژگی های کاملاً متفاوت و به روز شده ای هستند. این دوره ، هم در تئوری و هم در عمل ، روی همه این تغییرات متمرکز خواهد شد.
این دوره اصول شروع کار با پایتون را شامل می شود ، از جمله معانی معنایی متغیرها ، انواع داده های ساده و پیچیده و استفاده از حلقه ها برای تکرار و توابع برای استفاده مجدد کد. شما همچنین برخی از ...
Flink یک سیستم متغیر ، قابل تحمل و در مقیاس بزرگ است که با مجموعه داده های محدود و غیرمحدود با استفاده از همان معماری زمینه ای جریان اول کار می کند.
یاد بگیرید تا بتوانید آن را با چشمان بسته ببینید
این دوره شامل مراحل مهمی در پیش پردازش داده ها ، از جمله استاندارد سازی ، عادی سازی ، کشف تازگی و آشکار سازی ، پیش پردازش تصویر و داده های متنی ، و همچنین تقریب های صریح هسته مانند RBF و Nystroem ...
این دوره به شما می آموزد که چگونه عملکرد خوشه های Spark را در Azure Databricks با شناسایی و کاهش مسائل مختلف مانند مشکلات دریافت داده ها و گلوگاه های عملکرد بهینه کنید.
یادگیری تقویتی نوعی یادگیری ماشینی است که به تصمیم گیرندگان اجازه می دهد در یک محیط ناشناخته عمل کنند. در دنیای ماشینهای خودران و رباتهای کاوشگر، RL یک رشته تحصیلی مهم برای هر دانشجوی یادگیری ماشینی است.
Cloud Firestore یک NoSQL میزبانی ابری، پایگاه داده سند محور است که اسناد از فیلدها تشکیل شده و در مجموعه ها ذخیره می شوند. Firestore یک سرویس کاملاً مدیریت شده است که به بهروزرسانیهای بیدرنگ اجازه میدهد تا دادهها را در چندین مشتری همگام نگه دارد.
این دوره جنبه های مفهومی و عملی ساخت و ارزیابی مدل های یادگیری ماشین را به گونه ای که به طور منطقی از داده ها استفاده می کند ، پوشش می دهد ، در حالی که ملاحظاتی مانند ترتیب و روابط درون داده ها و سایر تعصبات را نیز در نظر می گیرد.
چندین روش مورد استفاده برای ساخت نمودارها و تجسم ها را در Qlik کشف کنید ، از انواع نمودارها و خصوصیات نسبتاً ساده گرفته تا برنامه های بسیار پیچیده که نمودارها را به عبارات پیوند می دهد و از معیارها و ابعاد اصلی استفاده می کند.
چارچوب Ethereum محبوب ترین بستر بلاکچین برای ساخت برنامه های غیرمتمرکز است. در این زمینه ، AWS امکان استفاده و راه اندازی با شبکه Ethereum خود را بر روی ابر AWS با استفاده از الگوهای بلاکچین آسان کرده است.
Kinesis Data Analytics سرویسی برای تبدیل و تجزیه و تحلیل جریان داده ها با Apache Flink و SQL با استفاده از فناوری های بدون سرور است. شما یاد خواهید گرفت که از سرویس Amazon Kinesis Data Analytics برای پردازش داده های جریانی با استفاده از زمان اجرا Apache Flink استفاده کنید.
با بزرگتر شدن مجموعه های داده ، کاوش و تجسم م dataثر این داده ها قبل از ورود به تجزیه و تحلیل داده ها ، از اهمیت بیشتری برخوردار می شود. کتابخانه های تجسم ، مانند Plotly ، می توانند به ما در پردازش و حفظ همه این اطلاعات به بهترین روش کمک کنند.
این دوره تقریباً همه تکنیک های مهم کاهش ابعاد موجود در R را در بر می گیرد ، به سازندگان مدل این امکان را می دهد تا عملکرد مدل را با کاهش نصب بیش از حد و صرفه جویی در هزینه و زمان آموزش مدل بهینه کنند.
این دوره به شما می آموزد که چگونه با استفاده از سرویس مدیریت شده MLflow در Databricks، چرخه عمر پایان به انتها مدل های یادگیری ماشین خود را مدیریت کنید.
App Engine پیشنهاد PaaS در GCP است و برای توسعه دهندگانی که قصد ساخت و استقرار برنامه های وب را دارند در حالی که تمرکز خود را روی نوشتن کد دارند ، ایده آل است. در این دوره ، با محیط استاندارد و انعطاف پذیر App Engine آشنا خواهید شد.
تحلیلگران و دانشمندان وظیفه دارند اطلاعات و بینش هایی را از مجموعه داده های عظیم استخراج کنند. این دوره کتابخانه Seaborn Python را به مهندسان کمک می کند تا با استفاده از ابزار تجسم سطح بالا و قدرتمند خود ، در برقراری ارتباط اطلاعات کمک کنند.
این دوره به شما یاد می دهد که چگونه می توانید مدل های رگرسیون، طبقه بندی و پیش بینی را با استفاده از Databricks AutoML بسازید و آموزش دهید. AutoML آماده سازی داده ها و آموزش مدل را خودکار می کند، بنابراین به شما امکان می دهد مدل هایی را بدون کد بسازید.
این دوره نکات دقیق ساخت چنین مدلهایی و همچنین رگرسیون لجستیک، روشهای نزدیکترین همسایه و معیارهای ارزیابی طبقهبندیکنندهها مانند دقت، دقت و یادآوری را پوشش میدهد.
این دوره به شما یاد می دهد که چگونه با استفاده از GraphFrames در Apache Spark، داده های گراف را ایجاد و نمایش دهید و الگوریتم های نمودار مانند Shortest Path و PageRank را در Azure Databricks پیاده سازی کنید.
آموزش مدلهای ML یک عملیات محاسباتی فشرده است و بهتر است در یک محیط توزیع شده انجام شود. این دوره به شما می آموزد که چگونه Spark می تواند به طور موثر اکتشاف داده، تمیز کردن، تجمع و آموزش مدل های ML را روی یک پلت فرم انجام دهد.
Hive یک انبار داده است که در بالای چارچوب محاسبات توزیع شده Hadoop اجرا می شود. روی مجموعه داده های عظیمی کار می کند ، بنابراین این دوره برای درک ویژگی های آن مفید است تا بتوانید پرس و جوهای کارآمد ، سریع و بهینه بنویسید.
بیاموزید که مدل های مبتنی بر توجه چیست، چگونه کار می کنند و چه کاری می توانند برای شبکه های عصبی مکرر انجام دهند.
این دوره تکنیک های مهمی مانند رگرسیون حداقل مربعات معمولی ، حرکت به لاسو ، رج و شبکه الاستیک و تکنیک های پیشرفته مانند پشتیبانی از رگرسیون برداری برداری و رگرسیون نزول گرادیان تصادفی را شامل می شود.
Elasticsearch یک موتور جستجوی سازمانی محبوب است ، که به شما امکان می دهد قابلیت جستجوی قدرتمندی ایجاد کنید. این دوره بر درک م componentsلفه ها و الگوریتم های جستجو از اصول اولیه و استفاده از آنها در عمل با استفاده از REST API متمرکز است.
Cloud SQL سرویس مدیریت شده SQL Google Cloud Platform است که قابلیت های ساده و قدرتمند RDBMS را ارائه می دهد. Cloud SQL هم از MySQL و هم از PostgreSQL در cloud پشتیبانی می کند.
جریان ساختاری موتور پردازش جریان مقیاس پذیر و متحمل خطا در Apache Spark 2 است. فریم داده ها در Spark 2.x از داده های بی نهایت پشتیبانی می کنند ، بنابراین به طور موثر برنامه های دسته ای و جریان را متحد می کند.
مدل واحد Apache Beam به ما امکان پردازش دسته ای و همچنین پخش جریانی داده را با استفاده از همان API می دهد. چندین مورد اجرا مانند Google Cloud Dataflow ، Apache Spark و Apache Flink با Beam سازگار هستند.
این دوره جنبه های مفهومی استفاده از یادگیری ماشین را برای مشکلات در صنعت خرده فروشی بررسی می کند، در مورد مطالعات موردی یادگیری ماشین مورد استفاده خرده فروشان بحث می کند، و پیاده سازی های عملی تکنیک ها را بر روی داده های دنیای واقعی بررسی می کند.
این دوره تکنیک های مهم کاوش داده ها به منظور یافتن روابط بین متغیرها را شامل می شود ، از جمله تکنیک های خلاصه سازی و توصیف داده های شما ، و چندین ابزار قدرتمند تجسم برای بیان روابط در آن داده ها.
این دوره بر روی طراحی و اجرای اسکن امنیتی ، محافظت در برابر حملات انکار سرویس توزیع شده (DDoS) و ممیزی امنیتی تمرکز دارد. این دوره همچنین شامل استفاده از Data Loss Prevention API در محافظت از ...
مبانی شبکههای متخاصم مولد (GAN) و مدلهای انتشار، دو مورد از رایجترین مدلهای مولد در یادگیری ماشین را بررسی کنید.
با استفاده از Taskflow API، گردش کار Airflow خود را افزایش دهید. این دوره به شما یاد می دهد که چگونه از Taskflow API برای ساخت DAG و انتقال داده ها بین وظایف استفاده کنید.
این دوره شامل تکنیک های مهم از هر دو مدل سازی ریاضی و آماری ، از جمله استفاده از معادلات دیفرانسیل معمولی برای مدل سازی سیستم های قطعی ، جستجوی محلی کلاسیک و بازپخت شبیه سازی شده برای کاوش در فضاهای جستجوی بزرگ است.
در این دوره ، شما یاد خواهید گرفت که چگونه می توانید با استفاده از RapidMiner Studio ، یک بستر علوم داده برای آماده سازی داده ها ، یادگیری ماشین و استقرار مدل پیش بینی ، گردش کار یادگیری ماشین خود را توسعه دهید.
آموزش ساخت خطوط لوله داده پیچیده با Apache Airflow. این دوره به شما میآموزد که DAGهایی ایجاد کنید که دادهها را میخوانند، اعتبارسنجی میکنند، جمعآوری میکنند و در حین مدیریت وابستگیهای وظایف، با استفاده از XComs برای انتقال دادهها بین وظایف، دادهها را بارگذاری میکنند.
با افزایش محبوبیت رایانش ابری ، اولین مورد استفاده تهیه و مدیریت ماشین های مجازی رایانش ابری است. این دوره به شما مزایای نمونه های Cloud VM را در Google Cloud Platform نسبت به دستگاههای موجود نشان می دهد.
با تنظیم دقیق آپاچی کافکا، مهارت های پیشرفته ای را برای بهینه سازی عملکرد خود توسعه دهید.