آموزش پایتون: استخراج داده‌های وب در مقیاس بزرگ و گردش‌کارهای API - آخرین آپدیت

دانلود Python: Scalable Web Scraping and API Workflows

نکته: ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.
نمونه ویدیوها:
توضیحات دوره: مدیریت استخراج داده‌ها (Web Scraping) در مقیاس بالا می‌تواند چالش‌برانگیز باشد. در این دوره آموزشی با عنوان «پایتون: استخراج داده‌های وب در مقیاس بزرگ و گردش‌کارهای API»، شما یاد می‌گیرید که چگونه با استفاده از Requests، BeautifulSoup و Celery، گردش‌کارهای کارآمد و قابل نگهداری برای استخراج داده بسازید. در ابتدا، نحوه دریافت بهینه داده‌های وب با کتابخانه Requests و مدیریت هدرها، نشست‌ها (Sessions) و محدودیت‌های نرخ درخواست (Rate Limits) را بررسی می‌کنید. سپس، می‌آموزید که چگونه اطلاعات مفید را از HTML با استفاده از BeautifulSoup استخراج کنید و ساختارهای داده‌ای نامنظم یا ناسازگار را مدیریت نمایید. در نهایت، یاد می‌گیرید که چگونه با استفاده از Celery و Redis، وظایف استخراج داده‌های خود را مقیاس‌بندی کرده، پردازش‌ها را به صورت ناهمگام (Asynchronous) اجرا کنید و عملکرد سیستم را بهبود ببخشید. پس از اتمام این دوره، شما مهارت‌ها و دانش لازم برای استخراج داده‌های وب در مقیاس بزرگ و یکپارچه‌سازی API را خواهید داشت تا بتوانید استخراج داده‌های حجیم را به طور بهینه مدیریت کنید، از اشتباهات رایج دوری کنید و گردش‌کارهای خود را در برنامه‌های عملیاتی و آماده تولید (Production-ready) پیاده‌سازی نمایید.

سرفصل ها و درس ها

مقدمه‌ای بر استخراج داده‌های وب و چالش‌های مقیاس‌پذیری Introduction to Web Scraping and Scaling Challenges

  • مقدمه‌ای بر استخراج داده‌های وب و چالش‌های مقیاس‌پذیری Introduction to Web Scraping and Scaling Challenges

  • چالش‌های موجود در استخراج داده‌های وب Challenges in Web Scraping

  • مرور کلی دوره و محدوده پروژه Course Overview and Project Scope

ارسال درخواست‌ها و مدیریت پاسخ‌ها Making Requests and Handling Responses

  • آشنایی با کتابخانه Requests Introduction to Requests

  • مدیریت پاسخ‌ها و خطاها Handling Responses and Errors

  • کار با هدرها، کوکی‌ها و نشست‌ها (Sessions) Working with Headers, Cookies, and Sessions

  • رعایت فایل robots.txt و محدودیت‌های نرخ درخواست Respecting robots.txt and Rate Limits

تجزیه HTML با BeautifulSoup Parsing HTML with BeautifulSoup

  • آشنایی با BeautifulSoup Introduction to BeautifulSoup

  • یافتن و استخراج داده‌ها Finding and Extracting Data

  • ناوبری و پاک‌سازی HTML Navigating and Cleaning HTML

استخراج ناهمگام داده‌ها با Celery Asynchronous Scraping with Celery

  • چرا از Celery استفاده کنیم؟ Why Use Celery?

  • راه‌اندازی Celery به همراه Message Broker Setting Up Celery with a Message Broker

  • اجرای وظایف استخراج داده به صورت ناهمگام Running Asynchronous Scraping Tasks

  • مدیریت شکست وظایف و تلاش مجدد (Retries) Handling Task Failures and Retries

طراحی خط لوله (Pipeline) مقیاس‌پذیر استخراج داده A Scalable Web Scraping Pipeline

  • معماری خط لوله استخراج داده‌های وب Architecting the Web Scraping Pipeline

  • پیاده‌سازی کامل خط لوله (Pipeline) Implementing the Full Pipeline

  • ذخیره‌سازی و خروجی گرفتن از داده‌های استخراج شده Saving and Exporting Scraped Data

  • مانیتورینگ، لاگ‌گذاری و بهینه‌سازی Monitoring, Logging, and Optimization

  • جمع‌بندی نهایی و گام‌های بعدی Final Recap and Next Steps

نمایش نظرات

آموزش پایتون: استخراج داده‌های وب در مقیاس بزرگ و گردش‌کارهای API
جزییات دوره
1h 15m
19
Pluralsight (پلورال سایت) Pluralsight (پلورال سایت)
(آخرین آپدیت)
3
از 5
دارد
دارد
دارد
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Kevin Cunningham Kevin Cunningham

کوین کانینگهام یک مربی توسعه دهنده، سخنران و نویسنده ساکن ایرلند شمالی است. تخصص او شامل توسعه وب در زبان ها و چارچوب های مختلف است. او به عنوان یک توسعه‌دهنده، با کتابخانه‌ها، دانشگاه‌ها و شرکت‌های انتشاراتی بزرگ برای ارائه تجربیات قدرتمند و همه‌کاره مبتنی بر وب کار کرده است. به عنوان یک مشاور، او در هدایت تیم ها از طریق مهاجرت های پشته فناوری، تضمین معماری کد موثر و شیوه های توسعه دهنده تخصص دارد. او یک تعهد مادام العمر به آموزش دارد که از طریق تجربیات یادگیری متنوعی که ایجاد می کند، چه به صورت آنلاین و چه حضوری نشان داده است. دور از صفحه کلید، کوین از فعالیت های خارج از منزل مانند پیاده روی، کوهنوردی و کایاک سواری با خانواده اش لذت می برد.