آموزش خراش دادن وب در Python BeautifulSoup، Selenium & Scrapy 2023

Web Scraping in Python BeautifulSoup, Selenium & Scrapy 2023

نکته: آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیوها:
توضیحات دوره: به روز رسانی 2023 | 4 پروژه با BS4, Selenium & Scrapy | ChatGPT برای خراش دادن وب | کسب درآمد از مهارت های خراش دادن وب خود یاد بگیرید که از ابتدا وب سایت را با سوپ زیبا خراش دهید چگونه در 2 سال گذشته از مهارت های خراش دادن وب خود درآمد کسب کردم موارد ضروری را که قبل از یادگیری وب اسکراپی نیاز دارید بیاموزید (Python، HTML، XPath) نحوه استفاده از ChatGPT برای خراش دادن وب 4 پروژه اسکرپینگ وب (از پروژه های مبتدی تا پیشرفته) صفحه بندی را با هر ابزار اسکراپی مدیریت کنید آموزش خراش دادن وب سایت جاوا اسکریپت با سلنیوم و Scrapy-Splash ذخیره داده های استخراج شده در MongoDb و SQLite3 Scrape scroll infinite websites ورود به وب سایت ها با استفاده از Selenium & Scrapy پیشها: دانش پایه در دسترسی به اینترنت پایتون

آیا تا به حال به اهمیت داده ها در زندگی روزمره ما فکر کرده اید؟

مهم نیست که دانشمند داده، تحلیلگر داده یا برنامه نویس باشید، دسترسی به داده های مورد نیاز مهم است! به همین دلیل است که برخی از شرکت‌های برتر فورچون 500 مانند Walmart، Target و CNN از وب اسکرپینگ استفاده می‌کنند تا از داده‌ها جلوتر بمانند. می توان گفت این یکی از بهترین سلاح های مخفی آنهاست.

به Web Scraping در Python با BeautiuflSoup، Selenium و Scrapy خوش آمدید!

کامل ترین و پروژه محورترین دوره . در این دوره، ما قصد داریم پروژه‌های جالبی را که به ما کمک می‌کنند تا داده‌ها را از برخی از شناخته‌شده‌ترین وب‌سایت‌ها حذف کنیم، آموزش می‌دهیم. برای نام بردن چند مورد:


  • Amazon Audible

  • تویتر

  • Google

  • آمار فوتبال

  • جهان سنج

  • صفحات فیلم


این کاملترین دوره آموزش خراش دادن وب در پایتون است و به 3 قسمت تقسیم شده است: BeautiuflSoup، Selenium و Scrapy. هدف من این است که شما در زمینه خراش دادن وب متخصص شوید. به همین دلیل است که تنها 10٪ از محتوای این دوره بر روی سوپ زیبا متمرکز شده است، در حالی که 40٪ به سلنیوم و 50٪ به Scrapy اختصاص دارد.


چرا دوره را به این شکل ساختم؟

سوپ زیبا محدودیت‌های زیادی دارد، اما همچنان برای مقدمه‌ای ملایم با خراش دادن وب مفید است. در مقابل، اگر سلنیوم را یاد بگیرید، می توانید هر وب سایتی را خراش دهید. و اگر Scrapy را به جعبه ابزار خود اضافه کنید، می‌توانید هر وب‌سایتی را سریع‌تر از سایر کتابخانه‌های خراش دادن وب خراش دهید. در طول این دوره، قدرت اسکراپینگ وب با هر کتابخانه پایتون را خواهید دید.


چه چیزی این دوره را متفاوت از سایر دوره ها می کند و چرا باید ثبت نام کنید؟

  • این به‌روزترین و کامل‌ترین دوره آموزش اسکراپینگ در پایتون است. شما از Python 3.7، Scrapy 2.4، Selenium 3.141.0 و BS4

    استفاده خواهید کرد.
  • این پروژه محورترین دوره ای است که می توانید پیدا کنید. ما بسیاری از شناخته شده ترین وب سایت ها

    را پاک خواهیم کرد
  • راهنمای گام به گام عمیقی در مورد نحوه تبدیل شدن به یک وب اسکراپر حرفه ای خواهید داشت.

  • شما یاد خواهید گرفت که چگونه از Selenium، Scrapy و Splash برای خراش دادن وب سایت های مبتنی بر جاوا اسکریپت استفاده کنید. شما هیچ آموزشی را در آنجا پیدا نخواهید کرد که نحوه استفاده از این ابزارهای وب را به روش من در این دوره آموزش دهد.

  • می‌آموزید که چگونه در 2 سال گذشته از مهارت‌های اسکراپینگ وب کسب درآمد کرده‌ام

  • با نحوه استفاده از ChatGPT برای خراش دادن وب آشنا خواهید شد

  • 30 روز ضمانت بازگشت وجه توسط Udemy


در پایان دوره، می‌دانید که چگونه می‌توانید وب scraper خود را بسازید تا داده‌های جدید به دست آورید، بهترین تکنیک‌ها را برای خراش دادن وب و موارد دیگر بیاموزید.


اکنون به من بپیوندید و بیایید با هم خراشیدن وب را شروع کنیم!


سرفصل ها و درس ها

معرفی Introduction

  • بهترین کتابخانه اسکرپینگ وب چیست؟ BS4 در مقابل سلنیوم در مقابل اسکرپی What is the best web scraping library? BS4 vs Selenium vs Scrapy

  • قبل از شروع این مطلب را بخوانید Read This Before You Start

  • نصب Python و PyCharm Installing Python and PyCharm

  • مبانی پایتون برای اسکراپینگ وب Python Basics for Web Scraping

  • برگه تقلب Web Scraping برای دوره (آن را از دست ندهید) Web Scraping Cheat Sheet for The Course (Don't skip it)

  • HTML برای Web Scraping: برچسب ها و عناصر HTML for Web Scraping: Tags and Elements

  • HTML برای Web Scraping: ساختار درختی HTML for Web Scraping: Tree Structure

آشنایی با سوپ زیبا Introduction to Beautiful Soup

  • نمای کلی بخش Section Overview

  • نصب سوپ زیبا Installing Beautiful Soup

  • اصول اولیه سوپ زیبا Beautiful Soup Basics

  • نحوه دریافت HTML از یک وب سایت How To Get The HTML from a Website

  • چگونه یک صفحه را خراش دهیم How to Scrape a Single Page

  • صادرات داده به یک فایل TXT Exporting Data to a TXT File

خراش دادن چندین صفحه با سوپ زیبا Scraping Multiple Pages with Beautiful Soup

  • نمای کلی بخش Section Overview

  • خراش دادن چندین پیوند در همان صفحه Scraping Multiple Links within The Same Page

  • صفحه بندی Pagination

XPath XPath

  • نکته مهم (از دست ندهید) Important Note (Don't skip it)

  • سینتکس XPath، توابع و اپراتورها XPath Syntax, Functions and Operators

  • XPath خود را تست کنید Test Your XPath

  • کاراکترهای خاص و نحو Special Characters and Syntax

مقدمه ای بر سلنیوم Introduction to Selenium

  • نمای کلی بخش (+ نکته مهم) Section Overview (+ Important Note)

  • نحوه شناسایی وب سایت های مبتنی بر اسکریپت جاوا How to Identify Java Script Driven Websites

  • نصب سلنیوم و کروم درایور Installing Selenium and ChromeDriver

  • واردات کتابخانه ها و ایجاد درایور Importing Libraries and Creating The Driver

  • نحوه یافتن عناصر با سلنیوم (تئوری) How to Find Elements with Selenium (Theory)

  • با کلیک بر روی یک دکمه Clicking on a Button

  • استخراج داده ها از یک جدول Extracting Data from a Table

  • صادرات داده به فایل CSV با پانداها Exporting Data to a CSV File with Pandas

  • انتخاب عناصر در یک کشویی Selecting Elements within a Dropdown

پروژه شماره 1: برخورد با صفحات متعدد با استفاده از سلنیوم (ربات صوتی آمازون) Project #1: Dealing with Multiple Pages using Selenium (Amazon Audible Bot)

  • نکته مهم (به روز رسانی) Important Note (Update)

  • ساخت ربات Building the bot

  • حالت بدون سر Headless Mode

  • مدیریت صفحه بندی Handling Pagination

  • انتظارات ضمنی در مقابل انتظارهای صریح Implicit vs Explicit Waits

پروژه شماره 2: اسکرول و ورود بی نهایت (ربات توییتر) Project #2: Infinite Scrolling & Login (Twitter Bot)

  • یادداشت مهم Important Note

  • نحوه ورود به وب سایت ها How to Login to Websites

  • ساخت یک تابع Building a Function

  • اسکرول بی نهایت Infinite Scrolling

  • خراش دادن وب سایت با اسکرول بی نهایت Scraping the Website with Infinite Scrolling

مقدمه ای بر اسکرپی Introduction to Scrapy

  • نمای کلی بخش Section Overview

  • نصب اسکراپی Scrapy Installation

  • راه اندازی Scrapy با Pycharm Setting up Scrapy with Pycharm

  • توجه: نحوه نمایش پوشه های مخفی در مک Note: How to Show Hidden Folders on Mac

  • دستورات اسکرپی Scrapy's Commands

  • ایجاد اولین پروژه و عنکبوت ما Creating our First Project and Spider

  • الگوهای Scrapy و نحوه یافتن عناصر با Scrapy Scrapy Templates & How to Find Elements with Scrapy

  • فرمان پوسته Scrapy's Shell Scrapy's Shell Command

  • ساختن یک عنکبوت Building a Spider

  • دریافت لینک های فهرست شده در یک وب سایت Getting links listed in a website

  • پیوندهای نسبی در مقابل مطلق Relative vs Absolute Links

  • خراش دادن داده ها از چندین پیوند Scraping Data from Multiple Links

برخورد با چندین صفحه با استفاده از Scrapy Dealing with Multiple Pages using Scrapy

  • ساخت عنکبوت Building The Spider

  • صفحه بندی Pagination

  • تغییر User-Agent Changing User-Agent

پروژه شماره 3: ساخت خزنده با Scrapy Project #3: Building Crawlers with Scrapy

  • خزنده - قوانین Crawler - Rules

  • خزنده - صفحه بندی Crawler - Pagination

  • خزنده - تغییر عامل کاربر Crawler - Changing User-Agent

صادرات داده به پایگاه داده: MongoDB و SQLite Exporting Data to a Database: MongoDB and SQLite

  • خطوط لوله Pipelines

  • MongoDB MongoDB

  • SQLite3 SQLite3

Scraping API ها و ورود به وب سایت با Scrapy Scraping APIs & Login to website with Scrapy

  • Scraping APIs - Building the Spider Scraping APIs - Building the Spider

  • Scraping APIs - مقابله با صفحه بندی Scraping APIs - Dealing with Pagination

  • ورود به وب سایت - ساخت عنکبوت Login to website - Building the Spider

مبانی اسپلش Splash Basics

  • نمای کلی بخش Section Overview

  • راه اندازی Splash با Docker Setting up Splash with Docker

  • مقدمه ای بر Splash Introduction to Splash

  • چگونه عناصر را با Splash پیدا کنیم How to Find Elements with Splash

پروژه شماره 4: خراش دادن وب سایت های جاوا اسکریپت با استفاده از Scrapy/Splash Project #4: Scraping JavaScript websites using Scrapy/Splash

  • ساخت اسکریپت در Splash Building the Script in Splash

  • استفاده از Splash با Scrapy Using Splash with Scrapy

  • تجزیه Parsing

  • تغییر User-Agent Changing User-Agent

چگونه با استفاده از Web Scraping کسب درآمد کنیم How to Make Money Using Web Scraping

  • نمای کلی بخش Section Overview

  • چگونه در 2 سال گذشته از مهارت های اسکراپینگ وب خود درآمد کسب کردم How I Monetized My Web Scraping Skills Over The Past 2 Years

  • شروع به کار - قسمت 1 Getting Started - Part 1

  • شروع - قسمت 2 Getting Started - Part 2

ChatGPT برای Web Scraping ChatGPT for Web Scraping

  • نمای کلی بخش Section Overview

  • خراش دادن وب با ChatGPT - قسمت 1 Web Scraping with ChatGPT - Part 1

  • خراش دادن وب با ChatGPT - قسمت 2 Web Scraping with ChatGPT - Part 2

  • تبریک می گویم! Congratulations!

امتیاز: Python برای Data Science Bootcamp 2022: From Zero to Hero Bonus: Python for Data Science Bootcamp 2022: From Zero to Hero

  • نمای کلی بخش (+ برگه تقلب جدید) Section Overview (+New Cheat Sheet)

  • بررسی اجمالی مجموعه داده و ساخت جدول محوری Dataset Overview and Making Pivot Table

  • طرح خطی Lineplot

  • بارپلات Barplot

  • نمودار دایره ای Piechart

  • نمودار جعبه Boxplot

  • هیستوگرام Histogram

  • طرح پراکنده Scatterplot

  • Save Plot and Export Pivot Table Save Plot and Export Pivot Table

  • تجسم تعاملی با پانداها Interactive Visualization with Pandas

نمایش نظرات

آموزش خراش دادن وب در Python BeautifulSoup، Selenium & Scrapy 2023
جزییات دوره
10 hours
89
Udemy (یودمی) Udemy (یودمی)
(آخرین آپدیت)
5,276
4.6 از 5
دارد
دارد
دارد
Frank Andrade
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Frank Andrade Frank Andrade

دانشمند داده