دسترسی سریع:

مسیر:

صفحه اصلی

لطفا جهت اطلاع از آخرین دوره ها و اخبار سایت در کانال تلگرام عضو شوید.

آموزش خراش دادن وب با اسکرپی و پایتون برای مبتدیان [ویدئو]

Web Scraping Tutorial with Scrapy and Python for Beginners [Video]

نکته: آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.

نمونه ویدیوها: (صرفا برای مشاهده نمونه ویدیو، ممکن هست نیاز به شکن داشته باشید.)

توضیحات دوره: وب اسکرپینگ فرآیند خراش دادن وب سایت ها و استخراج داده های مورد نظر از آن ها است و در این دوره با راهنمای گام به گام و عمیق، اسکریپ وب با استفاده از پایتون و اسکرپی را یاد خواهید گرفت و به آن مسلط خواهید شد. این دوره با آشنایی شما با فرآیند خراش دادن وب (با اینفوگرافیک - بدون کد) شروع می شود. یاد بگیرید که چگونه داده ها را از وب سایت ها خراش دهید و چگونه از Scrapy برای این کار استفاده کنید. پس از روشن شدن اصول اولیه، با استفاده از پایتون و چارچوب Scrapy، اسکراپی کردن وب را انجام خواهید داد! بعد از اینکه یک وب اسکراپر واقعی ساختید، ایده ای از نحوه عملکرد وب اسکراپی به دست خواهید آورد. سپس به مفاهیم اساسی وب اسکرپینگ و اسکرپی نگاه خواهید کرد. یادگیری نحوه خراش دادن وب سایت ها و موارد ضروری در حال حاضر شما را به یک وب اسکراپر کامل تبدیل می کند، اما این کار را حتی فراتر خواهید برد و تکنیک های پیشرفته خراش دادن وب را یاد خواهید گرفت تا متخصص شوید. موضوعات پیشرفته مانند خزیدن چندین صفحه و استخراج داده ها - صفحه بندی، خراش دادن داده ها با استفاده از عبارات منظم (RegEx)، خراش دادن وب سایت های پویا یا رندر شده با جاوا اسکریپت با استفاده از Scrapy Playwright - به طور کامل توضیح داده خواهد شد. در نهایت، سه پروژه را در پایان اجرا خواهید کرد: جدول لیگ قهرمانان [ESPN]، ردیاب محصول [آمازون] و برنامه Scraper [GUI]. در پایان این دوره، نحوه انجام وب اسکرپینگ با استفاده از پایتون و اسکرپی را خواهید آموخت. تمام فایل های منبع به مخزن GitHub در آدرس زیر اضافه می شوند: https://github.com/PacktPublishing/Web-Scraping-Tutorial-with-Scrapy-and-Python-for-Beginners- درخواستی به آدرس اینترنتی برای خراش دادن وب سایت ها با استفاده از Scrapy Spider ارسال کنید. پاسخ HTML را از URL دریافت کنید و آن را برای خراش دادن وب تجزیه کنید از دستورات پوسته Scrapy برای تست و تأیید CSS Selectors یا XPath استفاده کنید داده های خراشیده شده را به پایگاه های داده آنلاین مانند MongoDB صادر و ذخیره کنید با استفاده از صفحه بندی Scrapy داده ها را از چندین صفحه وب خراش دهید با استفاده از Scrapy FormRequest با توکن‌های CSRF به وب‌سایت‌ها وارد شوید این دوره برای توسعه‌دهندگان مبتدی پایتون که می‌خواهند در اسکراپینگ وب یا وب‌اسکراپرهای آزاد که به دنبال تقویت مهارت‌های خود هستند، تسلط پیدا کنند، ایده‌آل است. هر فرد یا دانشجویی که روی پروژه‌های خود کار می‌کند و می‌خواهد با استفاده از پایتون و ماژول Scrapy بر روی وب اسکراپی مسلط شود، این دوره برای شما مناسب است. درک اولیه از برنامه نویسی پایتون یک امر ضروری است و دانش اولیه از مبانی HTML یک امتیاز مثبت است اما اجباری نیست. یک دوره کاملاً متعادل و ساختاریافته با پروژه‌های عملی در پایان * جدول لیگ قهرمانان را Scrape [ESPN]، Product Tracker [Amazon]، و ساخت برنامه Scraper [GUI] * ویدیوهایی با اندازه بیت و همراه با تمام مواد لازم

سرفصل ها و درس ها

مقدمه دوره Introduction to the Course

Web Scraping چیست؟ What Is Web Scraping
نحوه عملکرد Web Scraping How Web Scraping Works
خراش دادن وب با اسکرپی Web Scraping with Scrapy

نصب اسکراپی Scrapy Installation

نصب Scrapy برای ویندوز Scrapy Installation for Windows
نصب Scrapy برای اوبونتو (لینوکس) Scrapy Installation for Ubuntu (Linux)
ایجاد پروژه Scrapy Creating Scrapy Project
بررسی پروژه Project Walkthrough

خراش عنکبوت Scrapy Spider

ایجاد عنکبوت Creating Spider
ارسال درخواست Sending Request
دریافت پاسخ Getting the Response
انتخابگر CSS Scrapy Scrapy CSS Selector
انتخاب همه داده ها Selecting All the Data
استخراج داده ها Extracting Data
بررسی اجمالی عنکبوت Spider Overview

انتخابگرهای CSS CSS Selectors

انتخابگرهای CSS در مقابل XPath: نحوه انتخاب عناصر وب CSS Selectors Versus XPath: How to Select Web Elements
انتخابگرهای برچسب، کلاس و شناسه Tagname, Class, and Id Selectors
انتخابگرهای ویژگی Attribute Selectors

XPath XPath

عبارات XPath XPath Expressions
انتخابگرهای ویژگی XPath XPath Attribute Selectors
تابع XPath text( ). XPath text( ) Function

پوسته خراشیده Scrapy Shell

پوسته Scrapy چیست و چگونه از آن استفاده کنیم؟ What Is the Scrapy Shell and How to Use It?
پاسخ fetch( ) fetch( ) Response
پیکربندی پوسته Shell Configuration

اقلام خراشیده Scrapy Items

ساختار داده‌ها در مورد Scrapy Structuring Data into Scrapy Item
استفاده از آیتم در عنکبوت Using Item in Spiders
پردازنده های ورودی و خروجی را برای فیلدهای آیتم تعریف کنید Define Input and Output Processors for Item Fields
بارگیری اقلام با لودرهای Scrapy ItemLoader Loading Items with Scrapy ItemLoaders
بررسی اجمالی آیتم ها، پردازشگرها و آیتم لودرها Items, Processors, and ItemLoaders Overview

صادرات داده Exporting Data

خروجی داده های استخراج شده در فرمت های JSON، CSV و XML Output Extracted Data in JSON, CSV, and XML Formats
بازنویسی خروجی قبلی Overwrite Previous Output
افزودن داده به خروجی قبلی Appending Data to Previous Output

خط لوله اقلام خراشیده Scrapy Item Pipeline

نحوه استفاده از خطوط لوله اسکراپی How to Use Scrapy Item Pipelines
ذخیره داده ها به صورت محلی در فایل های اکسل (XLSX). Saving Data Locally to Excel ( XLSX ) Files
Item Pipelines را در تنظیمات فعال کنید Enable Item Pipelines in Settings
راه اندازی MongoDB (حساب). MongoDB (Account) Setup
ذخیره داده ها در MongoDB Saving Data to MongoDB

صفحه بندی Pagination

استخراج لینک از ویژگی های href Extracting Links from href Attributes
ارسال درخواست به صفحه بعدی Send Request to the Next Page
روش start_requests( ). start_requests( ) Method

دنبال کردن لینک ها Following Links

نحوه فالو کردن لینک ها How to Follow Links
نحوه انتخاب داده ها با استفاده از عبارات منظم با Scrapy How to Select Data Using Regular Expressions with Scrapy
تنظیم عملکرد سفارشی برگشت به تماس Setting Up Custom Callback Function
صفحه جزئیات محصول را تجزیه کنید Parse Product Details Page

جداول تراشیدن Scraping Tables

جداول HTML HTML Tables
انتخاب داده های جداول Selecting Tables Data
استخراج داده ها از جداول HTML Extract Data from HTML Tables

ورود به وب سایت ها Logging into Websites

داده ها با فرم های ورود به سیستم پنهان می شوند Data Hidden with Logging Forms
بررسی فرم های HTML و فعالیت وب سایت با ابزار Dev Inspecting HTML Forms and Website Activity with Dev Tools
ورود به وب سایت ها با FormRequest Logging into Websites with FormRequest
فرم های ورود محافظت شده CSRF CSRF Protected Login Forms
استخراج مقادیر CSRF از فرم ها Extract CSRF Values from Forms

خراش دادن وب سایت های رندر شده جاوا اسکریپت Scraping JavaScript Rendered Websites

وب سایت های رندر/دینامیک جاوا اسکریپت چیست؟ What Are JavaScript Rendered/Dynamic Websites?
اسکرپی-نمایشنامه نویس نصب scrapy-playwright Installation
راه اندازی نمایشنامه نویس در پروژه Scrapy Setting Up Playwright in Scrapy Project
استفاده از نمایشنامه نویس برای ارائه وب سایت ها Using Playwright to Render Websites
خراش دادن داده ها از وب سایت های پویا Scraping Data from Dynamic Websites

نمایشنامه نویس اسکرپی Scrapy Playwright

مروری بر نمایشنامه نویس Playwright Overview
نمایشنامه نویس صفحه شی Playwright Page Object
ورود به سیستم با نمایشنامه نویس Logging in with Playwright
وب سایت های پویا با صفحه های بارگذاری Dynamic Websites with Loading Screens
منتظر Selector/Elements با استفاده از صفحات کوروتین باشید Wait for Selector/Elements Using Page Coroutines
وب سایت های پویا با اسکرول بی نهایت Dynamic Websites with Infinite Scroll
گرفتن اسکرین شات از وب سایت ها Taking Screenshot of Websites
رندر کردن وب سایت ها به PDF Rendering Websites to PDF

نقاط پایانی API API Endpoints

شناسایی تماس های API Identifying API Calls
درخواست داده از API Requesting Data from API
استخراج داده از API Extracting Data from API

تنظیمات Settings

تنظیمات پروژه اسکرپی Scrapy Project Settings
متن روبات ها Robots Text
میان افزار Middleware
پسوند خودکار دریچه گاز Autothrottle Extension

عوامل کاربر و پروکسی ها User Agents and Proxies

عوامل کاربر چیست؟ What Are User Agents?
عوامل کاربر با Scrapy User Agents with Scrapy
پروکسی ها چیست؟ What Are Proxies?
پروکسی با Scrapy Proxies with Scrapy

نکات و ترفندها Tips and Tricks

استدلال عنکبوت Spider Arguments
عنکبوت های مستقل Standalone Spiders
Scrapy Shell با bpython Scrapy Shell with bpython
Scrapy Get Versus Extract Method Scrapy Get Versus Extract Method
ورود به سیستم Logging

پروژه 1: جدول لیگ قهرمانان از ESPN.com Project 1: Champions League Table from ESPN.com

بررسی اجمالی Overview
بازرسی بصری وب سایت Website Visual Inspection
پیدا کردن انتخابگرها Finding the Selectors
ساخت عنکبوت: استخراج داده های تیم Building the Spider: Extract Teams Data
Building the Spider: استخراج جزئیات تیم Building the Spider: Extract Teams Details

پروژه 2: رتبه محصول آمازون Project 2: Amazon Product Rank

بررسی اجمالی Overview
تجسم اسکراپر Scraper Visualization
پیدا کردن انتخابگرها Finding the Selectors
ساختن عنکبوت Building the Spider

پروژه 3: گسترش Scraper با رابط کاربری گرافیکی Project 3: Extending Scraper with GUI

برنامه Scraper Scraper Application
ساخت رابط کاربری گرافیکی (رابط برنامه) Building the GUI (Application Interface)
اجرای Spider از برنامه Running the Spider from the Application

برای ارسال نظر ثبت نام کنید.

نمایش نظرات

آموزش خراش دادن وب با اسکرپی و پایتون برای مبتدیان [ویدئو]

جزییات دوره

زمان دوره: 7 h 36 m

تعداد ویدیو ها: 92

شرکت: Packtpub

تاریخ انتشار مرجع: (آخرین آپدیت)

بازدید مرجع :

امتیاز مرجع: از 5

فایل تمرین: ندارد

زیرنویس زبان اصلی: دارد

زیرنویس فارسی: (توسط هوش مصنوعی) دارد

مدرس: Rahul Mula

لینک کوتاه این دوره

https://donyad.com/d/a378e0

جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

نرم افزارهای مورد نیاز

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Rahul Mula

Python Developera Python توسعه دهنده، نویسنده و دانش آموز Rahul در اینجا. من چند کتاب در مورد علوم رایانه ای مانند پایتون برای مبتدیان، علم داده ها با پایتون و غیره نوشته ام که در آمازون منتشر شده اند. شما می توانید آنها را بررسی کنید اگر می خواهید در آمازون بخواهید آن را با عنوان کتاب و نام من جستجو کنید.

Python MongoDB Ubuntu Server Scrapy PyCharm Visual Studio سرور اوبونتو Programming Programming Language برنامه نویسی زبان برنامه نویسی

آموزش خراش دادن وب با اسکرپی و پایتون برای مبتدیان [ویدئو]

Web Scraping Tutorial with Scrapy and Python for Beginners [Video]

مقدمه دوره Introduction to the Course

Web Scraping چیست؟ What Is Web Scraping

نحوه عملکرد Web Scraping How Web Scraping Works

خراش دادن وب با اسکرپی Web Scraping with Scrapy

نصب اسکراپی Scrapy Installation

نصب Scrapy برای ویندوز Scrapy Installation for Windows

نصب Scrapy برای اوبونتو (لینوکس) Scrapy Installation for Ubuntu (Linux)

ایجاد پروژه Scrapy Creating Scrapy Project

بررسی پروژه Project Walkthrough

خراش عنکبوت Scrapy Spider

ایجاد عنکبوت Creating Spider

ارسال درخواست Sending Request

دریافت پاسخ Getting the Response

انتخابگر CSS Scrapy Scrapy CSS Selector

انتخاب همه داده ها Selecting All the Data

استخراج داده ها Extracting Data

بررسی اجمالی عنکبوت Spider Overview

انتخابگرهای CSS CSS Selectors

انتخابگرهای CSS در مقابل XPath: نحوه انتخاب عناصر وب CSS Selectors Versus XPath: How to Select Web Elements

انتخابگرهای برچسب، کلاس و شناسه Tagname, Class, and Id Selectors

انتخابگرهای ویژگی Attribute Selectors

XPath XPath

عبارات XPath XPath Expressions

انتخابگرهای ویژگی XPath XPath Attribute Selectors

تابع XPath text( ). XPath text( ) Function

پوسته خراشیده Scrapy Shell

پوسته Scrapy چیست و چگونه از آن استفاده کنیم؟ What Is the Scrapy Shell and How to Use It?

پاسخ fetch( ) fetch( ) Response

پیکربندی پوسته Shell Configuration

اقلام خراشیده Scrapy Items

ساختار داده‌ها در مورد Scrapy Structuring Data into Scrapy Item

استفاده از آیتم در عنکبوت Using Item in Spiders

پردازنده های ورودی و خروجی را برای فیلدهای آیتم تعریف کنید Define Input and Output Processors for Item Fields

بارگیری اقلام با لودرهای Scrapy ItemLoader Loading Items with Scrapy ItemLoaders

بررسی اجمالی آیتم ها، پردازشگرها و آیتم لودرها Items, Processors, and ItemLoaders Overview

صادرات داده Exporting Data

خروجی داده های استخراج شده در فرمت های JSON، CSV و XML Output Extracted Data in JSON, CSV, and XML Formats

بازنویسی خروجی قبلی Overwrite Previous Output

افزودن داده به خروجی قبلی Appending Data to Previous Output

خط لوله اقلام خراشیده Scrapy Item Pipeline

نحوه استفاده از خطوط لوله اسکراپی How to Use Scrapy Item Pipelines

ذخیره داده ها به صورت محلی در فایل های اکسل (XLSX). Saving Data Locally to Excel ( XLSX ) Files

Item Pipelines را در تنظیمات فعال کنید Enable Item Pipelines in Settings

راه اندازی MongoDB (حساب). MongoDB (Account) Setup

ذخیره داده ها در MongoDB Saving Data to MongoDB

صفحه بندی Pagination

استخراج لینک از ویژگی های href Extracting Links from href Attributes

ارسال درخواست به صفحه بعدی Send Request to the Next Page

روش start_requests( ). start_requests( ) Method

دنبال کردن لینک ها Following Links

نحوه فالو کردن لینک ها How to Follow Links

نحوه انتخاب داده ها با استفاده از عبارات منظم با Scrapy How to Select Data Using Regular Expressions with Scrapy

تنظیم عملکرد سفارشی برگشت به تماس Setting Up Custom Callback Function

صفحه جزئیات محصول را تجزیه کنید Parse Product Details Page

جداول تراشیدن Scraping Tables

جداول HTML HTML Tables

انتخاب داده های جداول Selecting Tables Data

استخراج داده ها از جداول HTML Extract Data from HTML Tables

ورود به وب سایت ها Logging into Websites

داده ها با فرم های ورود به سیستم پنهان می شوند Data Hidden with Logging Forms

بررسی فرم های HTML و فعالیت وب سایت با ابزار Dev Inspecting HTML Forms and Website Activity with Dev Tools

ورود به وب سایت ها با FormRequest Logging into Websites with FormRequest

فرم های ورود محافظت شده CSRF CSRF Protected Login Forms

استخراج مقادیر CSRF از فرم ها Extract CSRF Values from Forms

خراش دادن وب سایت های رندر شده جاوا اسکریپت Scraping JavaScript Rendered Websites

وب سایت های رندر/دینامیک جاوا اسکریپت چیست؟ What Are JavaScript Rendered/Dynamic Websites?

اسکرپی-نمایشنامه نویس نصب scrapy-playwright Installation

راه اندازی نمایشنامه نویس در پروژه Scrapy Setting Up Playwright in Scrapy Project

استفاده از نمایشنامه نویس برای ارائه وب سایت ها Using Playwright to Render Websites

خراش دادن داده ها از وب سایت های پویا Scraping Data from Dynamic Websites

نمایشنامه نویس اسکرپی Scrapy Playwright

مروری بر نمایشنامه نویس Playwright Overview

نمایشنامه نویس صفحه شی Playwright Page Object

ورود به سیستم با نمایشنامه نویس Logging in with Playwright

وب سایت های پویا با صفحه های بارگذاری Dynamic Websites with Loading Screens

منتظر Selector/Elements با استفاده از صفحات کوروتین باشید Wait for Selector/Elements Using Page Coroutines

وب سایت های پویا با اسکرول بی نهایت Dynamic Websites with Infinite Scroll

گرفتن اسکرین شات از وب سایت ها Taking Screenshot of Websites