لطفا جهت اطلاع از آخرین دوره ها و اخبار سایت در
کانال تلگرام
عضو شوید.
آموزش اتوماسیون خط لوله داده با اقدامات GitHub با استفاده از R و Python
Data Pipeline Automation with GitHub Actions Using R and Python
نکته:
آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیوها:
توضیحات دوره:
در این دوره آموزشی، نحوه تنظیم گردش کار در GitHub Actions را برای خودکارسازی فرآیندها با R و Python یاد بگیرید. مربی Rami Krispin شما را از طریق فرآیند اتوماسیون راهنمایی می کند و نمونه هایی از دنیای واقعی را به اشتراک می گذارد. او به شما نشان می دهد که چگونه یک خط لوله داده راه اندازی کنید، ابرداده را از یک خط لوله بیرون بکشید و یک داشبورد زنده با اقدامات و صفحات GitHub اجرا کنید. اگر از صرف ساعتها صرف اجرای دستی اسکریپتها یا کاهش سرعت گردش کار خود با کشیدن دادهها از API یا بهروزرسانی داشبورد خسته شدهاید، در این دوره آموزشی به Rami بپیوندید تا ببینید اتوماسیون چگونه میتواند سرعت کار شما را افزایش دهد.
سرفصل ها و درس ها
معرفی
Introduction
اتوماسیون خط لوله داده با GitHub Actions
Data pipeline automation with GitHub Actions
آنچه شما باید بدانید
What you should know
1. EIA API
1. EIA API
رسیدگی به درخواست داده های بزرگ با پایتون
Handling a large data request with Python
رسیدگی به درخواست داده های بزرگ با R
Handling a large data request with R
کشیدن ابرداده از API با R
Pulling metadata from API with R
داشبورد EIA API
The EIA API dashboard
تنظیم یک متغیر محیطی
Setting an environment variable
ارسال یک درخواست ساده GET با R
Sending a simple GET request with R
جستجوی داده ها از طریق مرورگر
Querying the data via the browser
ساختار درخواست GET
GET request structure
پرس و جو داده ها با R و Python
Querying data with R and Python
راه حل: API را با R پرس و جو کنید
Solution: Query the API with R
راه حل: API را با پایتون پرس و جو کنید
Solution: Query the API with Python
کشیدن ابرداده از API با پایتون
Pulling metadata from API with Python
محدودیت های API با پایتون
API limitations with Python
ارسال یک درخواست GET ساده با پایتون
Sending a simple GET request with Python
محدودیت های API با R
API limitations with R
EIA API
EIA API
چالش: از API پرس و جو کنید
Challenge: Query the API
2. اتوماسیون داده ها
2. Data Automation
بررسی کیفیت داده ها
Data quality checks
توابع پشتیبانی ETL
ETL supporting functions
پر کردن داده ها
Data backfilling
فرآیند به روز رسانی داده ها
Data refresh process
خروجی تازه سازی داده ها
Data refresh output
محدوده و الزامات خط لوله داده
Data pipeline scope and requirements
معماری خط لوله داده
Data pipeline architecture
3. استقرار
3. Deployment
تنظیم اسرار و متغیرهای محیطی
Setting secrets and environment variables
تنظیم گردش کار GitHub Actions
Setting GitHub Actions workflow
گردش کار پیشرفته
Advanced workflow
بررسی گزارشهای گردش کار
Reviewing workflows logs
استقرار خط لوله داده
Data pipeline deployment
استقرار با Docker
Deployment with Docker
مقدمه ای بر GitHub Actions
Introduction to GitHub Actions
4. نظارت
4. Monitoring
استقرار داشبورد در صفحات GitHub
Deploying dashboard to GitHub Pages
تعمیر و نگهداری خط لوله داده
Data pipeline maintenance
لینکدین: شبکه اجتماعی حرفهای برای ارتباط و کارآفرینی
لینکدین به عنوان یکی از بزرگترین شبکههای اجتماعی حرفهای، به میلیونها افراد در سراسر جهان این امکان را میدهد تا ارتباط برقرار کنند، اطلاعات حرفهای خود را به اشتراک بگذارند و فرصتهای شغلی را کشف کنند. این شبکه اجتماعی به کاربران امکان میدهد تا رزومه حرفهای خود را آپدیت کنند، با همکاران، دوستان و همکاران آینده ارتباط برقرار کنند، به انجمنها و گروههای حرفهای ملحق شوند و از مقالات و مطالب مرتبط با حوزه کاری خود بهرهمند شوند.
لینکدین همچنین به کارفرمایان امکان میدهد تا به دنبال نیروهای با تجربه و مهارت مورد نیاز خود بگردند و ارتباط برقرار کنند. این شبکه حرفهای به عنوان یک پلتفرم کلیدی برای بهبود دسترسی به فرصتهای شغلی و گسترش شبکه حرفهای خود، نقش مهمی را ایفا میکند. از این رو، لینکدین به عنوان یکی از مهمترین ابزارهای کارآفرینی و توسعه حرفهای در دنیای امروز مورد توجه قرار دارد.
رامی کریسپین یک مدیر علوم داده و مهندسی است که عمدتاً بر تجزیه و تحلیل سری های زمانی، پیش بینی و برنامه های کاربردی MLOps تمرکز دارد. او علاقه زیادی به منبع باز، Docker و MLOps، کار با داده ها و API ها، یادگیری ماشین، آمار بیزی، تجسم داده ها و داده های GIS دارد.
رامی همچنین یک مشارکت کننده منبع باز و نویسنده تحلیل سری های زمانی دستی با R و چندین بسته R برای تحلیل سری های زمانی و برنامه های کاربردی یادگیری ماشین است.
نمایش نظرات