آموزش پایتون: استخراج داده‌های وب (Web Scraping) مقیاس‌پذیر و گردش‌کارهای API - آخرین آپدیت

دانلود Python: Scalable Web Scraping and API Workflows

نکته: ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.
نمونه ویدیوها:
توضیحات دوره: مدیریت استخراج داده‌ها در مقیاس بزرگ می‌تواند چالش‌برانگیز باشد. در دوره «پایتون: استخراج داده‌های وب مقیاس‌پذیر و گردش‌کارهای API»، شما یاد می‌گیرید که چگونه با استفاده از Requests، BeautifulSoup و Celery، گردش‌کارهای کارآمد و قابل نگهداری برای وب اسکرپینگ بسازید. در ابتدا، نحوه دریافت بهینه داده‌های وب با استفاده از کتابخانه Requests و مدیریت هدرها، نشست‌ها (Sessions) و محدودیت‌های نرخ درخواست (Rate Limits) را بررسی خواهید کرد. سپس، می‌آموزید که چگونه اطلاعات معنادار را از HTML با استفاده از BeautifulSoup استخراج کنید و با ساختارهای داده‌ای نامنظم یا ناسازگار مقابله نمایید. در نهایت، یاد می‌گیرید که چگونه با استفاده از Celery و Redis، وظایف استخراج داده‌های خود را مقیاس‌پذیر کرده و با پردازش غیرهمزمان (Asynchronous)، عملکرد سیستم را بهبود ببخشید. پس از اتمام این دوره، شما مهارت‌ها و دانش لازم برای استخراج داده‌ها در مقیاس وسیع و ادغام APIها را کسب خواهید کرد تا بتوانید استخراج داده‌های حجیم را به طور بهینه مدیریت کنید، از اشتباهات رایج دوری نمایید و گردش‌کارهای اسکرپینگ خود را در برنامه‌های عملیاتی (Production-ready) پیاده‌سازی کنید.

سرفصل ها و درس ها

مقدمه‌ای بر وب اسکرپینگ و چالش‌های مقیاس‌پذیری Introduction to Web Scraping and Scaling Challenges

  • مقدمه‌ای بر وب اسکرپینگ و چالش‌های مقیاس‌پذیری Introduction to Web Scraping and Scaling Challenges

  • چالش‌های موجود در استخراج داده‌های وب Challenges in Web Scraping

  • بررسی کلی دوره و محدوده پروژه Course Overview and Project Scope

ارسال درخواست‌ها و مدیریت پاسخ‌ها Making Requests and Handling Responses

  • آشنایی با کتابخانه Requests Introduction to Requests

  • مدیریت پاسخ‌ها و خطاها Handling Responses and Errors

  • کار با هدرها، کوکی‌ها و نشست‌ها Working with Headers, Cookies, and Sessions

  • رعایت قوانین robots.txt و محدودیت‌های نرخ درخواست Respecting robots.txt and Rate Limits

تجزیه HTML با BeautifulSoup Parsing HTML with BeautifulSoup

  • آشنایی با BeautifulSoup Introduction to BeautifulSoup

  • یافتن و استخراج داده‌ها Finding and Extracting Data

  • پیمایش و پاک‌سازی HTML Navigating and Cleaning HTML

استخراج داده‌های غیرهمزمان با Celery Asynchronous Scraping with Celery

  • چرا از Celery استفاده کنیم؟ Why Use Celery?

  • راه‌اندازی Celery با یک Message Broker Setting Up Celery with a Message Broker

  • اجرای وظایف استخراج داده به صورت غیرهمزمان Running Asynchronous Scraping Tasks

  • مدیریت شکست در وظایف و تلاش مجدد (Retries) Handling Task Failures and Retries

یک خط لوله (Pipeline) مقیاس‌پذیر برای وب اسکرپینگ A Scalable Web Scraping Pipeline

  • معماری خط لوله استخراج داده‌های وب Architecting the Web Scraping Pipeline

  • پیاده‌سازی کامل خط لوله Implementing the Full Pipeline

  • ذخیره‌سازی و خروجی گرفتن از داده‌های استخراج شده Saving and Exporting Scraped Data

  • مانیتورینگ، لاگ‌گیری و بهینه‌سازی Monitoring, Logging, and Optimization

  • مرور نهایی و گام‌های بعدی Final Recap and Next Steps

نمایش نظرات

آموزش پایتون: استخراج داده‌های وب (Web Scraping) مقیاس‌پذیر و گردش‌کارهای API
جزییات دوره
1h 15m
19
Pluralsight (پلورال سایت) Pluralsight (پلورال سایت)
(آخرین آپدیت)
3
از 5
دارد
دارد
دارد
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Kevin Cunningham Kevin Cunningham

کوین کانینگهام یک مربی توسعه دهنده، سخنران و نویسنده ساکن ایرلند شمالی است. تخصص او شامل توسعه وب در زبان ها و چارچوب های مختلف است. او به عنوان یک توسعه‌دهنده، با کتابخانه‌ها، دانشگاه‌ها و شرکت‌های انتشاراتی بزرگ برای ارائه تجربیات قدرتمند و همه‌کاره مبتنی بر وب کار کرده است. به عنوان یک مشاور، او در هدایت تیم ها از طریق مهاجرت های پشته فناوری، تضمین معماری کد موثر و شیوه های توسعه دهنده تخصص دارد. او یک تعهد مادام العمر به آموزش دارد که از طریق تجربیات یادگیری متنوعی که ایجاد می کند، چه به صورت آنلاین و چه حضوری نشان داده است. دور از صفحه کلید، کوین از فعالیت های خارج از منزل مانند پیاده روی، کوهنوردی و کایاک سواری با خانواده اش لذت می برد.