آموزش اسکرپی: وب اسکرپینگ و خزش وب قدرتمند با پایتون - آخرین آپدیت

دانلود Scrapy: Powerful Web Scraping & Crawling with Python

نکته: ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.

نمونه ویدیوها: (صرفا برای مشاهده نمونه ویدیو، ممکن هست نیاز به شکن داشته باشید.)

توضیحات دوره:

آموزش Scrapy پایتون - یاد بگیرید چگونه با Scrapy، Splash و پایتون وبسایت‌ها را اسکرپینگ کرده و یک وب کرالر قدرتمند بسازید.

ساخت یک وب کرالر با Scrapy
کراول کردن یک یا چند صفحه و اسکرپینگ داده‌ها
استقرار و زمان‌بندی اسپایدرها در ScrapingHub
ورود به وبسایت‌ها با Scrapy (احراز هویت)
اجرای Scrapy به عنوان یک اسکریپت مستقل
ادغام Splash با Scrapy برای اسکرپینگ وبسایت‌های رندر شده با جاوا اسکریپت
استفاده از Scrapy با Selenium در موارد خاص، مثلاً برای اسکرپینگ صفحات وب مبتنی بر جاوا اسکریپت
ساخت اسپایدر پیشرفته Scrapy
توابع بیشتری که Scrapy پس از اتمام اسکرپینگ توسط اسپایدر ارائه می‌دهد
ویرایش و استفاده از پارامترهای Scrapy
خروجی گرفتن داده‌های استخراج شده توسط Scrapy به فایل‌های CSV، اکسل، XML یا JSON
ذخیره داده‌های استخراج شده توسط Scrapy در پایگاه داده‌های MySQL و MongoDB
چندین پروژه وب اسکرپینگ واقعی، شامل Craigslist، LinkedIn و بسیاری دیگر
کد منبع پایتون تمام تمرینات این آموزش Scrapy قابل دانلود است
بخش پرسش و پاسخ برای ارسال و دریافت پاسخ سریع به سوالات شما

پیش‌نیازها:

سطح پایتون: متوسط. این آموزش Scrapy فرض می‌کند که شما با اصول اولیه نوشتن برنامه‌های ساده پایتون آشنایی دارید و به طور کلی با ویژگی‌های اصلی پایتون (ساختارهای داده، کار با فایل‌ها، توابع، کلاس‌ها، ماژول‌ها، کتابخانه‌های رایج و غیره) آشنا هستید.
پایتون 2.7+ یا پایتون 3.3+
هر سیستم عاملی (لینوکس، مک، ویندوز) مناسب است.
مثبت‌اندیشی و تمایل به یادگیری چیزهای جدید و پرسیدن سوال (در صورت وجود) در بخش پرسش و پاسخ دوره.
اگر نمی‌دانید Scrapy چیست یا چرا باید از آن استفاده کنید، لطفاً توضیحات دوره را مطالعه کرده و سخنرانی‌های پیش‌نمایش را قبل از پیوستن به دوره مشاهده کنید.

چرا این دوره؟

به محبوب‌ترین دوره وب اسکرپینگ با Scrapy، Selenium و Splash بپیوندید.
از یک مدرس حرفه‌ای، لازار تلباک، مشاور تمام وقت وب اسکرپینگ، بیاموزید.
نمونه‌های واقعی و پروژه‌های عملی وب اسکرپینگ وبسایت‌های محبوب را به کار ببرید.
جدیدترین و تنها دوره با بیش از ۱۰ ساعت محتوای قابل پخش را دریافت کنید.
دانش خود را با یک بخش پرسش و پاسخ فعال برای پاسخ به تمام سوالات خود تقویت کنید.
ضمانت بازگشت وجه ۳۰ روزه.

Scrapy (اسکرپی) یک فریم‌ورک رایگان و متن‌باز وب کرالینگ است که با پایتون نوشته شده. Scrapy برای وب اسکرپینگ و استخراج داده‌های ساختاریافته مفید است که می‌تواند برای طیف گسترده‌ای از کاربردهای مفید مانند داده‌کاوی، پردازش اطلاعات یا بایگانی تاریخی استفاده شود. این آموزش Scrapy پایتون، اصول اولیه Scrapy را پوشش می‌دهد.

وب اسکرپینگ یک تکنیک برای جمع‌آوری داده‌ها یا اطلاعات از صفحات وب است. شما می‌توانید هر بار که وبسایت مورد علاقه‌تان به‌روز می‌شود، برای اطلاعات جدید دوباره از آن بازدید کنید، یا می‌توانید یک وب اسکرپر بنویسید تا این کار را برای شما انجام دهد!

وب کرالینگ معمولاً اولین گام در تحقیق داده است. چه به دنبال جمع‌آوری داده از یک وبسایت باشید، چه ردیابی تغییرات در اینترنت، یا استفاده از API یک وبسایت، وب کرالرها راهی عالی برای به دست آوردن داده‌های مورد نیاز شما هستند.

یک وب کرالر، که با نام وب اسپایدر (Web Spider) نیز شناخته می‌شود، برنامه‌ای است که قادر است شبکه جهانی وب را اسکن کرده و اطلاعات را به صورت خودکار استخراج کند. در حالی که وب کرالرها از اجزای زیادی تشکیل شده‌اند، اساساً یک فرآیند ساده را دنبال می‌کنند: دانلود داده‌های خام، پردازش و استخراج آن‌ها، و در صورت تمایل، ذخیره داده‌ها در یک فایل یا پایگاه داده. راه‌های زیادی برای انجام این کار وجود دارد و می‌توانید وب کرالر یا اسپایدر خود را با زبان‌های برنامه‌نویسی مختلفی بسازید.

قبل از Scrapy، توسعه‌دهندگان برای این کار در پایتون به پکیج‌های نرم‌افزاری مختلفی مانند urllib2 و BeautifulSoup که به طور گسترده‌ای استفاده می‌شدند، متکی بودند. Scrapy یک پکیج جدید پایتون است که هدف آن وب کرالینگ آسان، سریع و خودکار است و اخیراً محبوبیت زیادی پیدا کرده است.

Scrapy اکنون توسط بسیاری از کارفرمایان، هم برای کارهای فریلنسینگ و هم برای مشاغل داخلی، به شدت مورد تقاضا است و این یکی از دلایل مهم برای ایجاد این دوره Scrapy پایتون و این آموزش Scrapy پایتون بود تا به شما در ارتقاء مهارت‌ها و کسب درآمد بیشتر کمک کند.

در این آموزش Scrapy، شما نحوه نصب Scrapy را خواهید آموخت. همچنین یک اسپایدر پایه و پیشرفته خواهید ساخت و در نهایت بیشتر با معماری Scrapy آشنا خواهید شد. سپس در مورد استقرار اسپایدرها و ورود به وبسایت‌ها با Scrapy خواهید آموخت. ما یک وب کرالر عمومی با Scrapy خواهیم ساخت و همچنین Splash و Selenium را برای کار با Scrapy به منظور پیمایش صفحات ادغام خواهیم کرد. یک اسپایدر پیشرفته با گزینه پیمایش صفحات با Scrapy خواهیم ساخت و با استفاده از تابع Close در Scrapy آن را به پایان خواهیم رساند، سپس در مورد آرگومان‌های Scrapy بحث خواهیم کرد. در نهایت، در این دوره، یاد می‌گیرید که چگونه خروجی را در پایگاه‌های داده MySQL و MongoDB ذخیره کنید. یک بخش اختصاصی برای تمرینات حل شده متنوع وب اسکرپینگ وجود دارد... و در حال به‌روزرسانی است.

یکی از مزایای اصلی Scrapy این است که بر پایه Twisted، یک فریم‌ورک شبکه غیرهمزمان (Asynchronous)، ساخته شده است. "غیرهمزمان" به این معنی است که لازم نیست منتظر بمانید تا یک درخواست به پایان برسد و سپس درخواست دیگری را ارسال کنید؛ حتی می‌توانید با سطح بالایی از عملکرد به این امر دست یابید. با اجرای کد غیرمسدودکننده (یا همان غیرهمزمان) برای همزمانی، Scrapy واقعاً کارآمد است.

شایان ذکر است که Scrapy نه تنها سعی در حل مشکل استخراج محتوا (که اسکرپینگ نامیده می‌شود) دارد، بلکه به مسیریابی به صفحات مربوطه برای استخراج (که کرالینگ نامیده می‌شود) نیز می‌پردازد. برای دستیابی به این هدف، یک مفهوم اصلی در این فریم‌ورک، "اسپایدر" است -- در عمل، یک شیء پایتون با چند ویژگی خاص که شما کد آن را می‌نویسید و فریم‌ورک مسئول اجرای آن است.

Scrapy بسیاری از توابع مورد نیاز برای دانلود وبسایت‌ها و سایر محتواهای اینترنتی را فراهم می‌کند و فرآیند توسعه را سریع‌تر و با نیاز کمتر به برنامه‌نویسی پیچیده می‌سازد. این آموزش Scrapy پایتون به شما یاد خواهد داد که چگونه از Scrapy برای ساخت وب کرالرها و وب اسپایدرها استفاده کنید.

Scrapy محبوب‌ترین ابزار برای وب اسکرپینگ و کرالینگ نوشته شده در پایتون است. این ابزار ساده و قدرتمند است، با امکانات و افزونه‌های متعدد.

مباحث آموزش Scrapy پایتون:

این دوره Scrapy با پوشش اصول اولیه استفاده از Scrapy آغاز می‌شود و سپس بر ویژگی‌های پیشرفته Scrapy در ایجاد و خودکارسازی وب کرالرها تمرکز می‌کند. مباحث اصلی این آموزش Scrapy پایتون به شرح زیر است:

Scrapy چیست، تفاوت‌های Scrapy با سایر کتابخانه‌های وب اسکرپینگ مبتنی بر پایتون مانند BeautifulSoup، LXML، Requests و Selenium، و اینکه چه زمانی بهتر است از Scrapy استفاده کنید.

این آموزش با نحوه ایجاد یک پروژه Scrapy و سپس ساخت یک اسپایدر پایه برای اسکرپینگ داده‌ها از یک وبسایت آغاز می‌شود.

کاوش دستورات XPath و نحوه استفاده از آن با Scrapy برای استخراج داده.

ساخت یک اسپایدر Scrapy پیشرفته‌تر برای پیمایش صفحات متعدد یک وبسایت و اسکرپینگ داده از هر صفحه.

معماری Scrapy: ساختار کلی یک پروژه Scrapy؛ هر فیلد چه چیزی را نشان می‌دهد و چگونه می‌توانید از آن‌ها در کد اسپایدر خود استفاده کنید.

بهترین روش‌های وب اسکرپینگ برای جلوگیری از مسدود شدن توسط وبسایت‌هایی که در حال اسکرپینگ آن‌ها هستید.

در این آموزش Scrapy، همچنین یاد می‌گیرید که چگونه یک وب کرالر Scrapy را به راحتی در پلتفرم Scrapy Cloud استقرار دهید. Scrapy Cloud یک پلتفرم از Scrapinghub برای اجرای، خودکارسازی و مدیریت وب کرالرهای شما در فضای ابری است، بدون نیاز به راه‌اندازی سرورهای خودتان.

این آموزش Scrapy همچنین نحوه استفاده از Scrapy برای وب اسکرپینگ جلسات کاربری احراز هویت شده (ورود به سیستم) را پوشش می‌دهد، یعنی در وبسایت‌هایی که قبل از نمایش داده‌ها به نام کاربری و رمز عبور نیاز دارند.

این دوره عمدتاً بر نحوه ایجاد یک وب کرالر پیشرفته با Scrapy تمرکز دارد. ما استفاده از Scrapy CrawlSpider را پوشش خواهیم داد که رایج‌ترین اسپایدر برای کرالینگ وبسایت‌های معمولی است، زیرا مکانیزم مناسبی برای دنبال کردن لینک‌ها با تعریف مجموعه‌ای از قوانین فراهم می‌کند. همچنین از شیء Link Extractor استفاده خواهیم کرد که نحوه استخراج لینک‌ها از هر صفحه کرال شده را تعریف می‌کند؛ این امکان را به ما می‌دهد که تمام لینک‌های یک صفحه را، بدون توجه به تعداد آنها، دریافت کنیم.

علاوه بر این، یک بخش کامل در این آموزش Scrapy برای نشان دادن نحوه ترکیب Splash یا Selenium با Scrapy برای ایجاد وب کرالر صفحات وب پویا وجود دارد. زمانی که نمی‌توانید داده‌ها را مستقیماً از منبع واکشی کنید، اما نیاز به بارگذاری صفحه، پر کردن فرم، کلیک کردن در جایی، اسکرول کردن به پایین و غیره دارید، به عبارت دیگر اگر در حال تلاش برای اسکرپینگ داده از وبسایتی هستید که دارای تماس‌های AJAX و اجرای جاوا اسکریپت زیادی برای رندر کردن صفحات وب است، استفاده از Splash یا Selenium همراه با Scrapy بسیار مفید است.

ما همچنین توابع بیشتری را که Scrapy پس از اتمام وب اسکرپینگ توسط اسپایدر ارائه می‌دهد، و نحوه ویرایش و استفاده از پارامترهای Scrapy را مورد بحث قرار خواهیم داد.

از آنجا که هدف اصلی وب اسکرپینگ، استخراج داده است، شما یاد خواهید گرفت که چگونه خروجی را در فایل‌های CSV، JSON و XML بنویسید.

در نهایت، یاد خواهید گرفت که چگونه داده‌های استخراج شده توسط Scrapy را در پایگاه‌های داده MySQL و MongoDB ذخیره کنید.

سرفصل ها و درس ها

Scrapy در مقابل سایر فریمورک‌های پایتون برای وب اسکرپینگ Scrapy vs. Other Python Web Scraping Frameworks

Scrapy در مقابل Beautiful Soup در مقابل Selenium Scrapy vs. Beautiful Soup vs. Selenium
نکات دوره (حتماً بخوانید) Course Tips (Must Read)

نصب Scrapy Scrapy Installation

نصب Scrapy در لینوکس Linux Scrapy Installation
نصب Scrapy در مک Mac Scrapy Installation
نصب Scrapy در ویندوز Windows Scrapy Installation
دستورالعمل‌های نصب Scrapy Scrapy Installation Instructions
ویرایشگر پایتون: Sublime Text Python Editor: Sublime Text

ساخت اسپایدر پایه با Scrapy Building Basic Spider with Scrapy

اسپایدر ساده Scrapy - بخش 1 Scrapy Simple Spider - Part 1
اسپایدر ساده Scrapy - بخش 2 Scrapy Simple Spider - Part 2
اسپایدر ساده Scrapy - بخش 3 Scrapy Simple Spider - Part 3

ساختار XPath XPath Syntax

استفاده از XPath با Scrapy Using XPath with Scrapy
ابزارهایی برای دریافت آسان XPath Tools to Easily Get XPath

پرسش و پاسخ Q&A

مبانی Scrapy Scrapy Basics
آیا تاکنون سؤالی دارید؟ Do you have questions so far?
ساختار XPath XPath Syntax

ساخت اسپایدر پیشرفته‌تر با Scrapy Building More Advanced Spider with Scrapy

اسپایدر پیشرفته Scrapy - بخش 1 Scrapy Advanced Spider - Part 1
اسپایدر پیشرفته Scrapy - بخش 2 Scrapy Advanced Spider - Part 2
اسپایدر پیشرفته Scrapy - بخش 3 Scrapy Advanced Spider - Part 3
اسپایدر پیشرفته Scrapy - بخش 4 Scrapy Advanced Spider - Part 4
معماری Scrapy Scrapy Architecture

بهترین روش‌های وب اسکرپینگ Web Scraping Best Practices

از مسدود شدن جلوگیری کنید! Avoid Getting Banned!

استقرار و زمان‌بندی اسپایدر Scrapy در ScrapingHub Deploying & Scheduling Scrapy Spider on ScrapingHub

ScrapingHub: استقرار و زمان‌بندی اسپایدرهای Scrapy (به‌روزرسانی شده) ScrapingHub: Deploying & Scheduling Scrapy Spiders (UPDATED)

ورود به وب‌سایت‌ها با استفاده از Scrapy Logging into Websites Using Scrapy

ورود به وب‌سایت‌ها با استفاده از Scrapy Logging into Websites Using Scrapy

Scrapy به عنوان یک اسکریپت مستقل (به‌روزرسانی شده) Scrapy as a Standalone Script (UPDATED)

Scrapy به عنوان یک اسکریپت مستقل (به‌روزرسانی شده) Scrapy as a Standalone Script (UPDATED)

ساخت خزنده وب با Scrapy Building Web Crawler with Scrapy

ساخت خزنده وب با Scrapy Building Web Crawler with Scrapy

Scrapy با Selenium Scrapy with Selenium

چرا/چه زمانی باید از Selenium استفاده کنیم Why/When We Should Use Selenium
Selenium WebDriver + Scrapy Selector برای استخراج URLها Selenium WebDriver + Scrapy Selector to Extract URLs
بارگذاری بعدی با Selenium برای استخراج داده (قابل استفاده حتی با صفحات JavaScript) Selenium Loading Next for Data Extraction (usable even with JavaScript pages)
دریافت داده Getting Data

Scrapy با Splash - وب‌سایت‌های JavaScript Scrapy with Splash - JavaScript Websites

پیش‌نیاز Splash: نصب داکر (جدید) Splash Prerequisite: Install Docker (NEW)
نصب Splash (جدید) Splash Installation (NEW)
نحوه استفاده از Splash با Scrapy (جدید) How to use Splash with Scrapy (NEW)
پروژه پیشرفته Splash: اسکرپینگ Baierl.com بخش 1 (جدید) Splash Advanced Project: Scraping Baierl.com p.1 (NEW)
پروژه پیشرفته Splash: اسکرپینگ Baierl.com بخش 2 (جدید) Splash Advanced Project: Scraping Baierl.com p.2 (NEW)
پروژه پیشرفته Splash: اسکرپینگ Baierl.com بخش 3 (جدید) Splash Advanced Project: Scraping Baierl.com p.3 (NEW)

اسپایدر Scrapy - کتابفروشی Scrapy Spider - Bookstore

دریافت URLها Grabbing URLs
استخراج داده Data Extraction

اطلاعات بیشتر در مورد Scrapy More about Scrapy

آرگومان‌های Scrapy Scrapy Arguments
تابع بستن Scrapy Scrapy Close Function
آیتم‌های Scrapy Scrapy Items

خروجی گرفتن به فایل‌ها Export Output to Files

خروجی‌های فید Scrapy به CSV، JSON یا XML Scrapy Feed Exports to CSV, JSON, or XML
خروجی گرفتن به اکسل Export Output to Excel
دانلود تصاویر با Scrapy Pipelines Downloading Images with Scrapy Pipelines
تغییر نام تصاویر با Scrapy Pipelines Renaming Images with Scrapy Pipelines

پروژه Scrapy شماره 1: اسکرپینگ مشاغل مهندسی Craigslist در نیویورک Scrapy Project #1: Scraping Craigslist Eng Jobs in NY

اسکرپر Craigslist - نمای کلی Craigslist Scraper - Overview
ساخت اسپایدر Scrapy Craigslist Creating Scrapy Craigslist Spider
اسپایدر Scrapy Craigslist #1 – عناوین Craigslist Scrapy Spider #1 – Titles
اسپایدر Scrapy Craigslist #2 – یک صفحه Craigslist Scrapy Spider #2 – One Page
اسپایدر Scrapy Craigslist #3 – چند صفحه Craigslist Scrapy Spider #3 – Multiple Pages
اسپایدر Scrapy Craigslist #4 – توضیحات شغل Craigslist Scrapy Spider #4 – Job Descriptions
ویرایش settings.py در Scrapy (مثلاً محدود کردن، عامل کاربر و غیره) Editing Scrapy settings.py (e.g. throttling, user agent, etc.)
آموزش نهایی Scrapy، کد اسپایدر Craigslist Final Scrapy Tutorial, Craigslist Spider Code

استخراج داده به پایگاه‌های داده - MySQL و MongoDB Extracting Data to Databases - MySQL & MongoDB

نصب MySQL Installing MySQL
نصب و استفاده از MySQL MySQL Installation and Usage
نوشتن داده در MySQL Writing Data to MySQL
نصب MongoDB Installing MongoDB
نصب و استفاده از MongoDB MongoDB Installation and Usage
نوشتن داده در MongoDB Writing Data to MongoDB

پروژه Scrapy شماره 2: وب اسکرپینگ Class-Central.com Scrapy Project #2: Web Scraping Class-Central.com

اسکرپینگ Class-Central - بخش 1: موضوعات (به‌روزرسانی شده) Scraping Class-Central - Part 1: Subjects (UPDATED)
اسکرپینگ Class-Central - بخش 2: دوره‌ها (به‌روزرسانی شده) Scraping Class-Central - Part 2: Courses (UPDATED)

مباحث پیشرفته Scrapy Scrapy Advanced Topics

عامل کاربر Scrapy Scrapy User Agent
اسکرپینگ جداول (به‌روزرسانی شده) Scraping Tables (UPDATED)
اسکرپینگ صفحات JSON Scraping JSON Pages
درخواست فرم Scrapy (به‌روزرسانی شده) Scrapy FormRequest (UPDATED)
استفاده از چندین پراکسی با Crawlera (اختیاری) Using Multiple Proxies with Crawlera (Optional)

پروژه Scrapy شماره 3: وب اسکرپینگ وب‌سایت داینامیک eplanning.ie Scrapy Project #3: Web Scraping Dynamic Website eplanning.ie

نمای کلی پروژه اسکرپینگ ePlanning ePlanning Scraping Project Overview
ePlanning: استخراج URLهای اولیه ePlanning: Extracting Initial URLs
ePlanning: خزیدن در صفحات داخلی ePlanning: Crawling Internal Pages
ePlanning: درخواست‌های فرم Scrapy ePlanning: Scrapy Form Requests
ePlanning: اسکرپینگ داده ePlanning: Scraping Data
ePlanning: بررسی وجود داده ePlanning: Checking Data Existence
ePlanning: اسکرپینگ داده از جدول ePlanning: Scraping Data from Table

پروژه شماره 4: اسکرپینگ قیمت کفش‌ها از درخواست API Project #4: Scraping Shoes' Prices from API Request

اسکرپینگ قیمت محصولات از درخواست API بخش 1 (جدید) Scraping Product Prices from API Request p.1 (NEW)
اسکرپینگ قیمت محصولات از درخواست API بخش 2 (جدید) Scraping Product Prices from API Request p.2 (NEW)
اسکرپینگ قیمت محصولات از درخواست API بخش 3 (جدید) Scraping Product Prices from API Request p.3 (NEW)

پروژه شماره 5: وب اسکرپینگ LinkedIn.com (به‌روزرسانی شده) Project #5: Web Scraping LinkedIn.com (UPDATED)

پروژه اسکرپینگ لینکدین: نمای کلی و الزامات (به‌روزرسانی شده) LinkedIn Scraping Project: Overview & Requirements (UPDATED)
ورود به لینکدین (به‌روزرسانی شده) LinkedIn Logging in (UPDATED)
یافتن پروفایل‌های لینکدین: بخش 1 (به‌روزرسانی شده) Finding LinkedIn Profiles: Part 1 (UPDATED)
یافتن پروفایل‌های لینکدین: بخش 2 (به‌روزرسانی شده) Finding LinkedIn Profiles: Part 2 (UPDATED)
اسکرپینگ نقاط داده از پروفایل‌های لینکدین: بخش 1 (به‌روزرسانی شده) Scraping Data Points from LinkedIn Profiles: Part 1 (UPDATED)
اسکرپینگ نقاط داده از پروفایل‌های لینکدین: بخش 2 (به‌روزرسانی شده) Scraping Data Points from LinkedIn Profiles: Part 2 (UPDATED)
اتصال به پروفایل‌های لینکدین (به‌روزرسانی شده) Connecting to LinkedIn Profiles (UPDATED)

تمرینات حل شده وب اسکرپینگ Solved Web Scraping Exercises

تولید آیتم‌های داده از 2 تابع Yield Data Items from 2 Functions
نحوه مرتب‌سازی داده‌های خروجی گرفته شده How to Order Exported Data
توابع contains() و starts-with() در XPath Xpath contains() and starts-with() functions

پاداش: استخراج داده با APIها Bonus: Data Extraction with APIs

استخراج داده با APIها (آموزش رایگان) Data Extraction with APIs (Free Tutorial)

پاداش: دوره وب اسکرپینگ با Beautiful Soup، Requests و Selenium Bonus: Web Scraping with Beautiful Soup, Requests & Selenium Course

کوپن برای وب اسکرپینگ با Beautiful Soup، Requests و Selenium و سایر دوره‌ها Coupon for Web Scraping with Beautiful Soup, Requests & Selenium & Other Courses

برای ارسال نظر ثبت نام کنید.

آموزش اسکرپی: وب اسکرپینگ و خزش وب قدرتمند با پایتون - آخرین آپدیت

دانلود Scrapy: Powerful Web Scraping & Crawling with Python

Scrapy در مقابل سایر فریمورک‌های پایتون برای وب اسکرپینگ Scrapy vs. Other Python Web Scraping Frameworks

Scrapy در مقابل Beautiful Soup در مقابل Selenium Scrapy vs. Beautiful Soup vs. Selenium

نکات دوره (حتماً بخوانید) Course Tips (Must Read)

نصب Scrapy Scrapy Installation

نصب Scrapy در لینوکس Linux Scrapy Installation

نصب Scrapy در مک Mac Scrapy Installation

نصب Scrapy در ویندوز Windows Scrapy Installation

دستورالعمل‌های نصب Scrapy Scrapy Installation Instructions

ویرایشگر پایتون: Sublime Text Python Editor: Sublime Text

ساخت اسپایدر پایه با Scrapy Building Basic Spider with Scrapy

اسپایدر ساده Scrapy - بخش 1 Scrapy Simple Spider - Part 1

اسپایدر ساده Scrapy - بخش 2 Scrapy Simple Spider - Part 2

اسپایدر ساده Scrapy - بخش 3 Scrapy Simple Spider - Part 3

ساختار XPath XPath Syntax

استفاده از XPath با Scrapy Using XPath with Scrapy

ابزارهایی برای دریافت آسان XPath Tools to Easily Get XPath

پرسش و پاسخ Q&A

مبانی Scrapy Scrapy Basics

آیا تاکنون سؤالی دارید؟ Do you have questions so far?

ساختار XPath XPath Syntax

ساخت اسپایدر پیشرفته‌تر با Scrapy Building More Advanced Spider with Scrapy

اسپایدر پیشرفته Scrapy - بخش 1 Scrapy Advanced Spider - Part 1

اسپایدر پیشرفته Scrapy - بخش 2 Scrapy Advanced Spider - Part 2

اسپایدر پیشرفته Scrapy - بخش 3 Scrapy Advanced Spider - Part 3

اسپایدر پیشرفته Scrapy - بخش 4 Scrapy Advanced Spider - Part 4

معماری Scrapy Scrapy Architecture

بهترین روش‌های وب اسکرپینگ Web Scraping Best Practices

از مسدود شدن جلوگیری کنید! Avoid Getting Banned!

استقرار و زمان‌بندی اسپایدر Scrapy در ScrapingHub Deploying & Scheduling Scrapy Spider on ScrapingHub

ScrapingHub: استقرار و زمان‌بندی اسپایدرهای Scrapy (به‌روزرسانی شده) ScrapingHub: Deploying & Scheduling Scrapy Spiders (UPDATED)

ورود به وب‌سایت‌ها با استفاده از Scrapy Logging into Websites Using Scrapy

ورود به وب‌سایت‌ها با استفاده از Scrapy Logging into Websites Using Scrapy

Scrapy به عنوان یک اسکریپت مستقل (به‌روزرسانی شده) Scrapy as a Standalone Script (UPDATED)

Scrapy به عنوان یک اسکریپت مستقل (به‌روزرسانی شده) Scrapy as a Standalone Script (UPDATED)

ساخت خزنده وب با Scrapy Building Web Crawler with Scrapy

ساخت خزنده وب با Scrapy Building Web Crawler with Scrapy

Scrapy با Selenium Scrapy with Selenium

چرا/چه زمانی باید از Selenium استفاده کنیم Why/When We Should Use Selenium

Selenium WebDriver + Scrapy Selector برای استخراج URLها Selenium WebDriver + Scrapy Selector to Extract URLs

بارگذاری بعدی با Selenium برای استخراج داده (قابل استفاده حتی با صفحات JavaScript) Selenium Loading Next for Data Extraction (usable even with JavaScript pages)

دریافت داده Getting Data

Scrapy با Splash - وب‌سایت‌های JavaScript Scrapy with Splash - JavaScript Websites

پیش‌نیاز Splash: نصب داکر (جدید) Splash Prerequisite: Install Docker (NEW)

نصب Splash (جدید) Splash Installation (NEW)

نحوه استفاده از Splash با Scrapy (جدید) How to use Splash with Scrapy (NEW)

پروژه پیشرفته Splash: اسکرپینگ Baierl.com بخش 1 (جدید) Splash Advanced Project: Scraping Baierl.com p.1 (NEW)

پروژه پیشرفته Splash: اسکرپینگ Baierl.com بخش 2 (جدید) Splash Advanced Project: Scraping Baierl.com p.2 (NEW)

پروژه پیشرفته Splash: اسکرپینگ Baierl.com بخش 3 (جدید) Splash Advanced Project: Scraping Baierl.com p.3 (NEW)

اسپایدر Scrapy - کتابفروشی Scrapy Spider - Bookstore

دریافت URLها Grabbing URLs

استخراج داده Data Extraction

اطلاعات بیشتر در مورد Scrapy More about Scrapy

آرگومان‌های Scrapy Scrapy Arguments

تابع بستن Scrapy Scrapy Close Function

آیتم‌های Scrapy Scrapy Items

خروجی گرفتن به فایل‌ها Export Output to Files

خروجی‌های فید Scrapy به CSV، JSON یا XML Scrapy Feed Exports to CSV, JSON, or XML

خروجی گرفتن به اکسل Export Output to Excel

دانلود تصاویر با Scrapy Pipelines Downloading Images with Scrapy Pipelines

تغییر نام تصاویر با Scrapy Pipelines Renaming Images with Scrapy Pipelines

پروژه Scrapy شماره 1: اسکرپینگ مشاغل مهندسی Craigslist در نیویورک Scrapy Project #1: Scraping Craigslist Eng Jobs in NY

اسکرپر Craigslist - نمای کلی Craigslist Scraper - Overview

ساخت اسپایدر Scrapy Craigslist Creating Scrapy Craigslist Spider

اسپایدر Scrapy Craigslist #1 – عناوین Craigslist Scrapy Spider #1 – Titles

اسپایدر Scrapy Craigslist #2 – یک صفحه Craigslist Scrapy Spider #2 – One Page

اسپایدر Scrapy Craigslist #3 – چند صفحه Craigslist Scrapy Spider #3 – Multiple Pages

اسپایدر Scrapy Craigslist #4 – توضیحات شغل Craigslist Scrapy Spider #4 – Job Descriptions

ویرایش settings.py در Scrapy (مثلاً محدود کردن، عامل کاربر و غیره) Editing Scrapy settings.py (e.g. throttling, user agent, etc.)

آموزش نهایی Scrapy، کد اسپایدر Craigslist Final Scrapy Tutorial, Craigslist Spider Code

استخراج داده به پایگاه‌های داده - MySQL و MongoDB Extracting Data to Databases - MySQL & MongoDB

نصب MySQL Installing MySQL

نصب و استفاده از MySQL MySQL Installation and Usage

نوشتن داده در MySQL Writing Data to MySQL

نصب MongoDB Installing MongoDB

نصب و استفاده از MongoDB MongoDB Installation and Usage

نوشتن داده در MongoDB Writing Data to MongoDB

پروژه Scrapy شماره 2: وب اسکرپینگ Class-Central.com Scrapy Project #2: Web Scraping Class-Central.com

اسکرپینگ Class-Central - بخش 1: موضوعات (به‌روزرسانی شده) Scraping Class-Central - Part 1: Subjects (UPDATED)