نکته:
آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیویی برای نمایش وجود ندارد.
توضیحات دوره:
داده ها در قلب یادگیری ماشین هستند. این دوره به شما یاد می دهد که چگونه داده ها را از منابع مختلف به جاوا بیاورید و همچنین نحوه مرتب سازی و تغییر شکل اساسی را با توجه به پردازش بیشتر توسط کتابخانه های تخصصی Java ML انجام دهید. الگوریتم های یادگیری ماشین نیاز به قالب بندی و ارائه داده ها به صورت کاملاً خاص دارند. راه ها. در این دوره ، آماده سازی داده ها برای یادگیری ماشین با جاوا ، یاد خواهید گرفت که از API استاندارد Java برای آماده سازی داده ها برای کتابخانه های ML استفاده کنید. ابتدا گزینه های مختلفی را برای خواندن فایلها در اشیا Java جاوا و ساختارهای داده جستجو خواهید کرد. در مرحله بعدی ، خواهید فهمید که چگونه وب را برای داده هایی که می توانید در مدل های ML خود استفاده کنید ، خراش دهید. در آخر ، شما خواهید آموخت که چگونه تحول را در جاوا وانیلی و در مقیاس با Beam SDK انجام دهید. پس از پایان این دوره ، مهارت و دانش جمع آوری اطلاعات مورد نیاز برای دیجیتالی کردن منابع مختلف در ساختار داده های جاوا را خواهید داشت.
سرفصل ها و درس ها
بررسی اجمالی دوره
Course Overview
-
بررسی اجمالی دوره
Course Overview
بلعیدن داده ها از پرونده ها در قالب های مختلف
Ingesting Data from Files in Various Formats
-
مقدمه
Introduction
-
آماده سازی داده چیست؟
What Is Data Preparation?
-
مصرف فایلهای CSV و Excel
Ingesting CSV and Excel Files
-
مصرف فایلهای JSON و XML
Ingesting JSON and XML Files
-
نسخه ی نمایشی: بلعیدن
Demo: Ingestion
-
خلاصه
Summary
خودکار جمع آوری و برنامه ریزی داده ها
Automating Data Collection and Scheduling
-
مقدمه
Introduction
-
نظارت بر پوشه
Folder Monitoring
-
برنامه ریزی وظیفه
Task Scheduling
-
نسخه ی نمایشی: با استفاده از File Watcher API
Demo: Using the File Watcher API
-
نسخه ی نمایشی: استفاده از کتابخانه Quartz Scheduler
Demo: Using the Quartz Scheduler Library
-
سلنیوم
Selenium
-
نسخه ی نمایشی: با استفاده از Selenium IDE
Demo: Using the Selenium IDE
-
نسخه ی نمایشی: کدگذاری برای سلنیوم
Demo: Coding for Selenium
-
خلاصه
Summary
تمیز کردن داده ها با استفاده از Regex و Formatter
Data Cleaning Using Regex and Formatter
-
مقدمه
Introduction
-
لامبدا و نهرها
Lambdas and Streams
-
نمای کلی عبارات منظم
Regular Expressions Overview
-
استفاده از عبارات منظم در جاوا
Using Regular Expressions in Java
-
نسخه ی نمایشی: خط لوله پاک سازی داده ها
Demo: Data Cleaning Pipeline
-
خلاصه
Summary
تبدیل داده ها
Data Transformation
-
مقدمه
Introduction
-
مبانی تبدیل داده
Data Transformation Basics
-
مقیاس گذاری ، انحراف داده ها و تعصب داده ها
Scaling, Data Skew, and Data Bias
-
نسخه ی نمایشی: خط انتقال داده
Demo: Data Transformation Pipeline
-
خلاصه
Summary
آماده سازی داده ها در مقیاس
Data Preparation at Scale
-
مقدمه
Introduction
-
خطوط داده توزیع شده
Distributed Data Pipelines
-
مفاهیم پرتوی SDK
Beam SDK Concepts
-
Beam SDK Engines و GCP Dataflow
Beam SDK Engines and GCP Dataflow
-
نسخه ی نمایشی: در حال توسعه خطوط لوله Beam SDK
Demo: Developing Beam SDK Pipelines
-
نسخه ی نمایشی: استقرار خطوط لوله SDK Beam در GCP Dataflow
Demo: Deploying Beam SDK Pipelines to GCP Dataflow
-
خلاصه
Summary
-
بسته شدن
Wrap Up
نمایش نظرات