آموزش وب اسکرپینگ فوق‌العاده قدرتمند با Asyncio و پایتون - آخرین آپدیت

دانلود Supercharged Web Scraping with Asyncio and Python

نکته: ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.
نمونه ویدیوها:
توضیحات دوره:

آموزش جامع خراشیدن وب ناهمگام با پایتون: افزایش چشمگیر سرعت استخراج داده

با اصول خراشیدن وب ناهمگام و استخراج داده در پایتون آشنا شوید تا سرعت استخراج داده‌های خود را به‌طور چشمگیری افزایش دهید.

سرفصل‌های کلیدی دوره:

پیش‌نیازها:

وب اسکرپینگ (Web Scraping) یا خراشیدن وب، به زبان ساده، به معنای باز کردن خودکار وب‌سایت‌ها و جمع‌آوری داده‌های مهم از آن‌ها است. این فرآیند برای اینترنت، موتورهای جستجو، علم داده، اتوماسیون، یادگیری ماشین و بسیاری حوزه‌های دیگر، بنیادی و حیاتی است.

باز کردن وب‌سایت‌ها و استخراج داده‌ها تنها بخشی از جذابیت خراشیدن وب هستند. ارزش واقعی در تجزیه و تحلیل داده‌های استخراج شده نهفته است.

این پروژه شامل موارد زیر خواهد بود:

  • خراشیدن وب پایه با پایتون
  • خراشیدن وب با Selenium
  • همگام (Sync) در مقابل ناهمگام (Async)
  • خراشیدن وب ناهمگام با Asyncio

چرا کد ناهمگام؟ مفهوم و مزایای آن چیست؟

کد ناهمگام (Asynchronous code) روشی برای اجرای چندین تابع به‌طور همزمان است. این اجرا کاملاً هم‌زمان نیست، اما بسیار نزدیک به آن است (آن‌ها به‌صورت هم‌رَوَند اجرا می‌شوند). این به این معناست که ما می‌توانیم کارهای بیشتری را در زمان کمتر انجام دهیم و در زمینه استخراج و جمع‌آوری داده، این صرفه‌جویی در زمان، فوق‌العاده چشمگیر است.

تصور کنید در حال بازآفرینی موتور جستجوی گوگل هستید. شما باید تعداد تریلیون‌ها (اگر نگوییم بیشتر) صفحه وب را به‌طور منظم خراش دهید تا به نتایج جستجو کمک کنید. البته شما تمام این صفحات را یک‌باره خراش نخواهید داد، اما ایده این است که خراش دادن ۱۰۰۰ صفحه به‌صورت همگام (مانند استفاده از کتابخانه requests پایتون یا صرفاً سلنیوم) زمان بسیار زیادی می‌برد.

اگر قبلاً تجربه زیادی در خراشیدن وب داشته‌اید اما از پایتون `asyncio` استفاده نکرده‌اید، این دوره به شما کمک می‌کند تا اصول آن را بهتر درک کرده و سطح مهارت‌های خراشیدن خود را به مرحله بالاتری برسانید.

بیایید شروع کنیم!


سرفصل ها و درس ها

خوش آمدید Welcome

  • خوش آمدید Welcome

  • دموی پروژه Project Demo

  • نیازمندی ها Requirements

مبانی Fundamentals

  • همگام در مقابل ناهمگام Sync vs Async

  • مسدود کردن و اتمام زمان Blocking & Timeouts

  • استخراج با سلنیوم Scraping with Selenium

  • استخراج وب ناهمگام با درایور کروم و آرسنیک Async Web Scraping with chrome driver and arsenic

  • پنهان کردن لاگ‌های آرسنیک Hide Arsenic logs

استخراج و قالب‌بندی Extraction & Formatting

  • داده‌های ناهمگام با پانداس پایتون Async Data with Python Pandas

  • آماده‌سازی برای استخراج چندین URL Prepare to Scrape Multiple URLs

  • استخراج داده‌های محصول Extract Product Data

  • استخراج ناهمگام داده‌های محصول Async Product Data Extraction

آماده‌سازی برای استفاده مجدد Prepare for Re-usability

  • ماژول‌ها و زیرماژول‌ها Modules & Submodules

  • زیرماژول مخصوص سرویس Service Specific Submodule

  • جدا کردن لاگینگ و اسکرپر Decouple Logging & Scraper

ذخیره‌سازی داده‌ها Storing Data

  • ذخیره‌سازی SQL همگام با پانداس Synchronous SQL Storage with Pandas

  • ذخیره داده‌های استخراج‌شده در جداول SQL Store Scrapped Data to SQL Tables

  • بازرسی داده‌های ذخیره‌شده در جوپیتر Inspect Stored Data in Jupyter

  • استخراج URLها از جدول لینک‌های ذخیره‌شده Scraping URLS from Stored Links Table

  • استخراج نمای لیست صفحه‌بندی شده Scrape Paginated List View

  • نتایج و زمان‌بندی Results & Timing

سپاس و گام‌های بعدی Thank you and next steps

  • سپاس و گام‌های بعدی Thank you & next steps

نمایش نظرات

آموزش وب اسکرپینگ فوق‌العاده قدرتمند با Asyncio و پایتون
جزییات دوره
3 hours
22
Udemy (یودمی) Udemy (یودمی)
(آخرین آپدیت)
30,672
4.4 از 5
ندارد
دارد
دارد
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Justin Mitchel Justin Mitchel

کدنویس، معلم، کارآفرین

  • دانشجوی مشتاق زندگی!
  • من عاشق یادگیری چیزهای جدید هستم و نکته جالب در مورد کد این است که همیشه چیزهای جدیدی وجود دارد.
  • من معتقدم بهترین راه برای یادگیری، آموزش است. به همین دلیل است که من در واقع شروع کردم. اکنون به دیگران کمک می کنم در حالی که مهارت های خود را تقویت می کنم.
  • در
  • به من بپیوندید
  • استاد کمکی در دانشکده بازرگانی مارشال در دانشگاه کالیفرنیای جنوبی
  • دوره های اصلی من (4+ سال پیش)  
  • بودند
  • من یک کارآفرین هستم که خودآموخته توسعه‌دهنده جنگو/پایتون هستم

من یک دوره کاملاً جدید ایجاد کرده ام که به طور خاص برای مخاطبان SkillShare ساخته شده است.