آموزش اسکریپینگ وب با پایتون: BeautifulSoup، Requests و Selenium - آخرین آپدیت

دانلود Web Scraping with Python: BeautifulSoup, Requests & Selenium

نکته: ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.
نمونه ویدیوها:
توضیحات دوره:

آموزش Web Scraping و خزیدن در وب با پایتون: Beautiful Soup، Requests و Selenium

مروری بر پایتون: ساختارهای داده، شرطی‌ها و کار با فایل

مروری کامل بر مفاهیم پایه‌ای پایتون از جمله ساختارهای داده (لیست‌ها، دیکشنری‌ها، تاپل‌ها) و نحوه کار با فایل‌ها.

آشنایی با میزبانی وب‌سایت‌ها روی سرورها و روش‌های ارتباط (GET, POST)

درک نحوه میزبانی وب‌سایت‌ها و ارتباط بین مرورگر و سرور با استفاده از متدهای GET و POST.

Web Scraping با پایتون، Beautiful Soup و Requests

آموزش گام به گام استخراج داده از وب‌سایت‌ها با استفاده از کتابخانه‌های Beautiful Soup و Requests در پایتون.

استفاده از Selenium برای مدیریت JavaScript و AJAX

یادگیری نحوه استفاده از Selenium برای تعامل با وب‌سایت‌هایی که از JavaScript و AJAX برای بارگذاری محتوا استفاده می‌کنند.

تمرین‌های متنوع Web Scraping

مجموعه‌ای از تمرین‌های عملی برای تقویت مهارت‌های Web Scraping و یادگیری تکنیک‌های مختلف استخراج داده.

کدهای منبع (*.py files) برای تمامی تمرین‌ها قابل دانلود است.
Q&A board برای ارسال سوالات و دریافت پاسخ سریع.

پیش‌نیازها

داشتن تجربه برنامه‌نویسی پایتون (به عنوان مثال، آشنایی با ساختارهای داده و برنامه‌نویسی شی‌گرا) مفید خواهد بود. این دوره شامل یک بخش کامل برای یادآوری مفاهیم پایه پایتون است.

مبتدیان می‌توانند ابتدا یک دوره مقدماتی پایتون را بگذرانند و سپس به این دوره بپیوندند.

این دوره یک رویکرد گام به گام را اتخاذ می‌کند و از شما می‌خواهد که یک ویرایشگر پایتون را باز کنید، فایل‌های کد *.py موجود را دانلود کنید و شروع به استفاده از مثال‌ها و تمرین‌های ارائه شده کنید.

پایتون 3: کدهای این دوره بر روی پایتون 3 تست شده‌اند. اگر می‌خواهید آن‌ها را در پایتون 2 اجرا کنید، این به عهده شماست که آن‌ها را سازگار کنید.

Web Scraping (که به آن Screen Scraping، Web Data Extraction، Web Harvesting و غیره نیز گفته می‌شود) تکنیکی برای استخراج مقادیر زیادی از داده‌ها از وب‌سایت‌ها و ذخیره داده‌های استخراج شده در یک فایل محلی یا پایگاه داده است.

در این دوره، شما یاد خواهید گرفت که چگونه با استفاده از پایتون 3 و Beautiful Soup، یک کتابخانه رایگان و متن باز نوشته شده در پایتون برای تجزیه HTML، به Web Scraping بپردازید.

ما از lxml استفاده خواهیم کرد، که یک کتابخانه گسترده برای تجزیه اسناد XML و HTML با سرعت بسیار بالا است. حتی می‌تواند تگ‌های بهم ریخته را نیز مدیریت کند. همچنین به دلیل بهبود در سرعت و خوانایی، به جای ماژول urllib2 از قبل ساخته شده، از ماژول Requests نیز استفاده خواهیم کرد.

در نهایت، برای خزیدن در صفحات AJAX و JavaScript از Selenium در کنار Beautiful Soup استفاده خواهیم کرد.

این دوره موضوعات زیر را پوشش می‌دهد: دسترسی برنامه ای به صفحات وب. خراشیدن صفحات وب برای استخراج داده های مورد نیاز با استفاده از Beautiful Soup برای تجزیه صفحات وب. تعامل با صفحات وب برای انجام کارهای مختلف با آنها به صورت برنامه ای. و استفاده از Selenium برای خراشیدن وب و زمانی که به آن نیاز داریم.

در پایان این دوره، شما قادر خواهید بود تا نحوه عملکرد وب‌سایت‌ها و سرورها، تکنیک‌های متنوع استخراج داده و روش‌های مدیریت و سازماندهی داده‌ها را درک کنید.

این دوره Web Scraping موضوعات زیر را پوشش می‌دهد:

  • مرور ساختارهای داده (لیست‌ها، دیکشنری‌ها، تاپل‌ها، کار با فایل)
  • نحوه میزبانی وب‌سایت‌ها روی سرورها
  • فراخوانی سرور (متدهای GET, POST)
  • مرور HTML و CSS
  • مروری بر ماژول‌های Requests و BeautifulSoup
  • تجزیه HTML با استفاده از BeautifulSoup
  • فیلتر کردن عناصر با استفاده از BeautifulSoup و پیمایش درخت تجزیه
  • مروری بر JavaScript و AJAX
  • Selenium و نیاز به آن
  • انتخاب عناصر با استفاده از Selenium
  • انتخابگرهای CSS
  • انتخابگرهای XPath
  • پیمایش صفحات با استفاده از Selenium
  • پروژه‌های عملی

سرفصل ها و درس ها

Web Scraping Course Overview

  • مرور کلی دوره وب اسکرپینگ Web Scraping Course Overview

مرور پایتون: ساختارهای داده (اختیاری) Python Refresher: Data Structures (Optional)

  • لیست‌ها Lists

  • دیکشنری‌ها Dictionaries

  • تاپل‌ها Tuples

  • لیست کامپرهنشن‌ها - بخش ۱ List Comprehensions - Part 1

  • لیست کامپرهنشن‌ها - بخش ۲ List Comprehensions - Part 2

  • دستور if-else درون خطی و لیست کامپرهنشن‌ها Inline - if else and List Comprehensions

  • نصب xlrd و XlsxWriter برای خواندن/نوشتن در فایل‌های اکسل Installing xlrd and XlsxWriter​ to Read/Write to Excel Files

  • نوشتن در فایل‌های اکسل Wrting to Excel Files

  • خواندن از فایل‌های اکسل Reading from Excel Files

  • ویرایشگر پایتون و نرم‌افزارهای دیگر Python Editor & Other Software

  • تمرین ۱: شما: متخصص وب اسکرپینگ Exercise #1: YOU: Web Scraping Expert

سرورها چگونه کار می‌کنند How Servers Work

  • وب‌سایت‌ها چگونه میزبانی می‌شوند How Websites are Hosted

  • مرور HTML HTML Revision

تمرین گرم‌کننده BeautifulSoup BeautifulSoup Warm-up Exercise

  • تمرین حل شده BeautifulSoup BeautifulSoup Solved Exercise

  • اسکرپر ساده Simple Scraper

نصب پکیج‌های پایتون مورد نیاز Installing Required Python Packages

  • نصب پکیج‌های پایتون مورد نیاز Installing Required Python Packages

مقدمه‌ای بر کتابخانه Requests پایتون Introduction to Requests Python Library

  • متد Get در Requests Requests Get Method

  • یوزر ایجنت User Agent

  • نصب پکیج fake_useragent Installing fake_useragent Package

مقدمه‌ای بر کتابخانه Beautiful Soup پایتون Introduction to Beautiful Soup Python Library

  • وب اسکرپینگ با Beautiful Soup - مرور کلی Web Scraping with Beautiful Soup - Overview

  • وب اسکرپینگ با Beautiful Soup - مرور کلی بخش ۲ Web Scraping with Beautiful Soup - Overview P.2

  • دسترسی به تگ‌ها Accessing Tags

  • رشته‌های قابل پیمایش (Navigable Strings) Navigable Strings

پیمایش با Beautiful Soup - به سمت پایین Navigating with Beautiful Soup - Going Down

  • پیمایش از طریق نام تگ‌ها Navigating through Tag Names

  • متدهای Contents و Children Contents and Children Methods

  • متد Descendants Descendants Method

پیمایش با Beautiful Soup - به سمت بالا Navigating with Beautiful Soup - Going Up

  • متد Parent Parent Method

  • متد Parents Parents Method

پیمایش با Beautiful Soup - به سمت پهلو Navigating with Beautiful Soup - Going Sideways

  • next_sibling next_sibling

  • previous_sibling previous_sibling

  • next_siblings و previous_siblings next_siblings & previous_siblings

عبارات باقاعده با پایتون Regular Expressions with Python

  • مرور کلی متاکاراکترها Metacharacters Overview

  • تابع Compile و کلاس کاراکتر Compile Function and Character Class

  • دنباله‌های خاص Special Sequences

  • تکرار کردن با * Repeating Things

  • تکرار کردن با + + Repeating Things

  • تکرار کردن با ? و {m,n} ? and {m,n} Repeating Things

  • متاکاراکترها بخش ۲ Metacharacters part2

جستجو در درخت تجزیه با استفاده از Beautiful Soup Searching the Parse Tree Using Beautiful Soup

  • مقدمه‌ای بر جستجو با BeautifulSoup Introduction to Searching with BeautifulSoup

  • تابع find_all find_all Function

  • پارامترهای بیشتر برای find_all find_all More Parameters

  • تابع find find Function

  • اسکرپر Craigslist - سطح ۱ Craigslist Scraper - Level 1

پروژه ۱: اسکرپینگ وب‌سایت CustomerReports Project 1: Scraping CustomerReports Website

  • وب اسکرپینگ CustomerReports - بخش ۱ Web Scraping CustomerReports - part 1

  • وب اسکرپینگ CustomerReports - بخش ۲ Web Scraping CustomerReports - part 2

پروژه ۲: وب اسکرپینگ وب‌سایت CodingBat با Beautiful Soup Project 2: Web Scraping CodingBat Website with Beautiful Soup

  • توضیحات پروژه ۲ Project 2 Description

  • وب اسکرپینگ CodingBat - بخش ۱ Web Scraping CodingBat - part 1

  • وب اسکرپینگ CodingBat - بخش ۲ Web Scraping CodingBat - part 2

  • وب اسکرپینگ CodingBat - بخش ۳ Web Scraping CodingBat - part 3

استفاده از Selenium برای مدیریت صفحات وب مبتنی بر AJAX و جاوا اسکریپت Using Selenium to Handle AJAX & JavaScript Driven Web Pages

  • مقدمه‌ای بر JavaScript، AJAX و Selenium JavaScript, AJAX and Selenium intro

  • نصب Selenium Installing Selenium

  • نصب ChromeDriver Installing ChromeDriver

  • مقدمه‌ای بر Selenium Introduction to Selenium

  • جستجوی عناصر و وارد کردن داده Searching Elements and Inputting Data

  • کلیک کردن روی عناصر Clicking Elements

  • مقدمه‌ای بر XPath XPath Introduction

  • مثال‌های XPath XPath Examples

پروژه ۳: وب اسکرپینگ حساب اینستاگرام شما Project 3: Web Scraping Your Instagram Account

  • توضیحات پروژه ۳ Project 3 Description

  • ورود به اینستاگرام Logging in to Instagram

  • تب تنظیمات! Settings Tab!

  • باز کردن پروفایل هدف (جدید) Opening Target Profile (NEW)

  • اسکرول به پایین نسخه ۱ (جدید) Scrolling Down v.1 (NEW)

  • اسکرول به پایین نسخه ۲ (جدید) Scrolling Down v.2 (NEW)

  • مدیریت خطا (جدید) Exception Handling (NEW)

  • ایجاد پوشه (جدید) Making Folders (NEW)

  • دانلود تصاویر نسخه ۱ (جدید) Downloading Images v.1 (NEW)

  • دانلود تصاویر نسخه ۲ (جدید) Downloading Images v.2 (NEW)

  • دانلود کپشن‌ها (جدید) Downloading Captions (NEW)

  • نوشتن کپشن‌ها در فایل اکسل (جدید) Writing Captions to Excel File (NEW)

  • کد نهایی اینستاگرام - به‌روزرسانی شده: ۲۰۲۰-۰۶-۲۲ Instagram Final Code - Updated: 2018-06-22

بهترین روش‌های وب اسکرپینگ Web Scraping Best Practices

  • بهترین روش‌های وب اسکرپینگ Web Scraping Best Practices

پاداش: استخراج داده با API ها Bonus: Data Extraction with APIs

  • استخراج داده با API ها (آموزش رایگان) Data Extraction with APIs (Free Tutorial)

پاداش: Scrapy: فریم‌ورک قدرتمند وب اسکرپینگ و خزش در پایتون Bonus: Scrapy: Powerful Web Scraping and Crawling Framework in Python

  • کوپن برای دوره "Scrapy: وب اسکرپینگ قدرتمند و خزش با پایتون" Coupon for "Scrapy: Powerful Web Scraping & Crawling with Python" Course

نمایش نظرات

آموزش اسکریپینگ وب با پایتون: BeautifulSoup، Requests و Selenium
جزییات دوره
8 hours
72
Udemy (یودمی) Udemy (یودمی)
(آخرین آپدیت)
6,472
4.4 از 5
دارد
دارد
دارد
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

GoTrained Academy GoTrained Academy

حرفه ای های آموزش الکترونیکی

Waqar Ahmed Waqar Ahmed