🔔 با توجه به بهبود نسبی اینترنت، آمادهسازی دورهها آغاز شده است. به دلیل تداوم برخی اختلالات، بارگذاری دورهها ممکن است با کمی تأخیر انجام شود. مدت اشتراکهای تهیهشده محفوظ است.
لطفا جهت اطلاع از آخرین دوره ها و اخبار سایت در
کانال تلگرام
عضو شوید.
آموزش اسکرپی: وب اسکرپینگ و خزش وب قدرتمند با پایتون
- آخرین آپدیت
دانلود Scrapy: Powerful Web Scraping & Crawling with Python
نکته:
ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.
نمونه ویدیوها:
توضیحات دوره:
آموزش Scrapy پایتون - یاد بگیرید چگونه با Scrapy، Splash و پایتون وبسایتها را اسکرپینگ کرده و یک وب کرالر قدرتمند بسازید.
ساخت یک وب کرالر با Scrapy
کراول کردن یک یا چند صفحه و اسکرپینگ دادهها
استقرار و زمانبندی اسپایدرها در ScrapingHub
ورود به وبسایتها با Scrapy (احراز هویت)
اجرای Scrapy به عنوان یک اسکریپت مستقل
ادغام Splash با Scrapy برای اسکرپینگ وبسایتهای رندر شده با جاوا اسکریپت
استفاده از Scrapy با Selenium در موارد خاص، مثلاً برای اسکرپینگ صفحات وب مبتنی بر جاوا اسکریپت
ساخت اسپایدر پیشرفته Scrapy
توابع بیشتری که Scrapy پس از اتمام اسکرپینگ توسط اسپایدر ارائه میدهد
ویرایش و استفاده از پارامترهای Scrapy
خروجی گرفتن دادههای استخراج شده توسط Scrapy به فایلهای CSV، اکسل، XML یا JSON
ذخیره دادههای استخراج شده توسط Scrapy در پایگاه دادههای MySQL و MongoDB
چندین پروژه وب اسکرپینگ واقعی، شامل Craigslist، LinkedIn و بسیاری دیگر
کد منبع پایتون تمام تمرینات این آموزش Scrapy قابل دانلود است
بخش پرسش و پاسخ برای ارسال و دریافت پاسخ سریع به سوالات شما
پیشنیازها:
سطح پایتون: متوسط. این آموزش Scrapy فرض میکند که شما با اصول اولیه نوشتن برنامههای ساده پایتون آشنایی دارید و به طور کلی با ویژگیهای اصلی پایتون (ساختارهای داده، کار با فایلها، توابع، کلاسها، ماژولها، کتابخانههای رایج و غیره) آشنا هستید.
پایتون 2.7+ یا پایتون 3.3+
هر سیستم عاملی (لینوکس، مک، ویندوز) مناسب است.
مثبتاندیشی و تمایل به یادگیری چیزهای جدید و پرسیدن سوال (در صورت وجود) در بخش پرسش و پاسخ دوره.
اگر نمیدانید Scrapy چیست یا چرا باید از آن استفاده کنید، لطفاً توضیحات دوره را مطالعه کرده و سخنرانیهای پیشنمایش را قبل از پیوستن به دوره مشاهده کنید.
چرا این دوره؟
به محبوبترین دوره وب اسکرپینگ با Scrapy، Selenium و Splash بپیوندید.
از یک مدرس حرفهای، لازار تلباک، مشاور تمام وقت وب اسکرپینگ، بیاموزید.
نمونههای واقعی و پروژههای عملی وب اسکرپینگ وبسایتهای محبوب را به کار ببرید.
جدیدترین و تنها دوره با بیش از ۱۰ ساعت محتوای قابل پخش را دریافت کنید.
دانش خود را با یک بخش پرسش و پاسخ فعال برای پاسخ به تمام سوالات خود تقویت کنید.
ضمانت بازگشت وجه ۳۰ روزه.
Scrapy (اسکرپی) یک فریمورک رایگان و متنباز وب کرالینگ است که با پایتون نوشته شده. Scrapy برای وب اسکرپینگ و استخراج دادههای ساختاریافته مفید است که میتواند برای طیف گستردهای از کاربردهای مفید مانند دادهکاوی، پردازش اطلاعات یا بایگانی تاریخی استفاده شود. این آموزش Scrapy پایتون، اصول اولیه Scrapy را پوشش میدهد.
وب اسکرپینگ یک تکنیک برای جمعآوری دادهها یا اطلاعات از صفحات وب است. شما میتوانید هر بار که وبسایت مورد علاقهتان بهروز میشود، برای اطلاعات جدید دوباره از آن بازدید کنید، یا میتوانید یک وب اسکرپر بنویسید تا این کار را برای شما انجام دهد!
وب کرالینگ معمولاً اولین گام در تحقیق داده است. چه به دنبال جمعآوری داده از یک وبسایت باشید، چه ردیابی تغییرات در اینترنت، یا استفاده از API یک وبسایت، وب کرالرها راهی عالی برای به دست آوردن دادههای مورد نیاز شما هستند.
یک وب کرالر، که با نام وب اسپایدر (Web Spider) نیز شناخته میشود، برنامهای است که قادر است شبکه جهانی وب را اسکن کرده و اطلاعات را به صورت خودکار استخراج کند. در حالی که وب کرالرها از اجزای زیادی تشکیل شدهاند، اساساً یک فرآیند ساده را دنبال میکنند: دانلود دادههای خام، پردازش و استخراج آنها، و در صورت تمایل، ذخیره دادهها در یک فایل یا پایگاه داده. راههای زیادی برای انجام این کار وجود دارد و میتوانید وب کرالر یا اسپایدر خود را با زبانهای برنامهنویسی مختلفی بسازید.
قبل از Scrapy، توسعهدهندگان برای این کار در پایتون به پکیجهای نرمافزاری مختلفی مانند urllib2 و BeautifulSoup که به طور گستردهای استفاده میشدند، متکی بودند. Scrapy یک پکیج جدید پایتون است که هدف آن وب کرالینگ آسان، سریع و خودکار است و اخیراً محبوبیت زیادی پیدا کرده است.
Scrapy اکنون توسط بسیاری از کارفرمایان، هم برای کارهای فریلنسینگ و هم برای مشاغل داخلی، به شدت مورد تقاضا است و این یکی از دلایل مهم برای ایجاد این دوره Scrapy پایتون و این آموزش Scrapy پایتون بود تا به شما در ارتقاء مهارتها و کسب درآمد بیشتر کمک کند.
در این آموزش Scrapy، شما نحوه نصب Scrapy را خواهید آموخت. همچنین یک اسپایدر پایه و پیشرفته خواهید ساخت و در نهایت بیشتر با معماری Scrapy آشنا خواهید شد. سپس در مورد استقرار اسپایدرها و ورود به وبسایتها با Scrapy خواهید آموخت. ما یک وب کرالر عمومی با Scrapy خواهیم ساخت و همچنین Splash و Selenium را برای کار با Scrapy به منظور پیمایش صفحات ادغام خواهیم کرد. یک اسپایدر پیشرفته با گزینه پیمایش صفحات با Scrapy خواهیم ساخت و با استفاده از تابع Close در Scrapy آن را به پایان خواهیم رساند، سپس در مورد آرگومانهای Scrapy بحث خواهیم کرد. در نهایت، در این دوره، یاد میگیرید که چگونه خروجی را در پایگاههای داده MySQL و MongoDB ذخیره کنید. یک بخش اختصاصی برای تمرینات حل شده متنوع وب اسکرپینگ وجود دارد... و در حال بهروزرسانی است.
یکی از مزایای اصلی Scrapy این است که بر پایه Twisted، یک فریمورک شبکه غیرهمزمان (Asynchronous)، ساخته شده است. "غیرهمزمان" به این معنی است که لازم نیست منتظر بمانید تا یک درخواست به پایان برسد و سپس درخواست دیگری را ارسال کنید؛ حتی میتوانید با سطح بالایی از عملکرد به این امر دست یابید. با اجرای کد غیرمسدودکننده (یا همان غیرهمزمان) برای همزمانی، Scrapy واقعاً کارآمد است.
شایان ذکر است که Scrapy نه تنها سعی در حل مشکل استخراج محتوا (که اسکرپینگ نامیده میشود) دارد، بلکه به مسیریابی به صفحات مربوطه برای استخراج (که کرالینگ نامیده میشود) نیز میپردازد. برای دستیابی به این هدف، یک مفهوم اصلی در این فریمورک، "اسپایدر" است -- در عمل، یک شیء پایتون با چند ویژگی خاص که شما کد آن را مینویسید و فریمورک مسئول اجرای آن است.
Scrapy بسیاری از توابع مورد نیاز برای دانلود وبسایتها و سایر محتواهای اینترنتی را فراهم میکند و فرآیند توسعه را سریعتر و با نیاز کمتر به برنامهنویسی پیچیده میسازد. این آموزش Scrapy پایتون به شما یاد خواهد داد که چگونه از Scrapy برای ساخت وب کرالرها و وب اسپایدرها استفاده کنید.
Scrapy محبوبترین ابزار برای وب اسکرپینگ و کرالینگ نوشته شده در پایتون است. این ابزار ساده و قدرتمند است، با امکانات و افزونههای متعدد.
مباحث آموزش Scrapy پایتون:
این دوره Scrapy با پوشش اصول اولیه استفاده از Scrapy آغاز میشود و سپس بر ویژگیهای پیشرفته Scrapy در ایجاد و خودکارسازی وب کرالرها تمرکز میکند. مباحث اصلی این آموزش Scrapy پایتون به شرح زیر است:
Scrapy چیست، تفاوتهای Scrapy با سایر کتابخانههای وب اسکرپینگ مبتنی بر پایتون مانند BeautifulSoup، LXML، Requests و Selenium، و اینکه چه زمانی بهتر است از Scrapy استفاده کنید.
این آموزش با نحوه ایجاد یک پروژه Scrapy و سپس ساخت یک اسپایدر پایه برای اسکرپینگ دادهها از یک وبسایت آغاز میشود.
کاوش دستورات XPath و نحوه استفاده از آن با Scrapy برای استخراج داده.
ساخت یک اسپایدر Scrapy پیشرفتهتر برای پیمایش صفحات متعدد یک وبسایت و اسکرپینگ داده از هر صفحه.
معماری Scrapy: ساختار کلی یک پروژه Scrapy؛ هر فیلد چه چیزی را نشان میدهد و چگونه میتوانید از آنها در کد اسپایدر خود استفاده کنید.
بهترین روشهای وب اسکرپینگ برای جلوگیری از مسدود شدن توسط وبسایتهایی که در حال اسکرپینگ آنها هستید.
در این آموزش Scrapy، همچنین یاد میگیرید که چگونه یک وب کرالر Scrapy را به راحتی در پلتفرم Scrapy Cloud استقرار دهید. Scrapy Cloud یک پلتفرم از Scrapinghub برای اجرای، خودکارسازی و مدیریت وب کرالرهای شما در فضای ابری است، بدون نیاز به راهاندازی سرورهای خودتان.
این آموزش Scrapy همچنین نحوه استفاده از Scrapy برای وب اسکرپینگ جلسات کاربری احراز هویت شده (ورود به سیستم) را پوشش میدهد، یعنی در وبسایتهایی که قبل از نمایش دادهها به نام کاربری و رمز عبور نیاز دارند.
این دوره عمدتاً بر نحوه ایجاد یک وب کرالر پیشرفته با Scrapy تمرکز دارد. ما استفاده از Scrapy CrawlSpider را پوشش خواهیم داد که رایجترین اسپایدر برای کرالینگ وبسایتهای معمولی است، زیرا مکانیزم مناسبی برای دنبال کردن لینکها با تعریف مجموعهای از قوانین فراهم میکند. همچنین از شیء Link Extractor استفاده خواهیم کرد که نحوه استخراج لینکها از هر صفحه کرال شده را تعریف میکند؛ این امکان را به ما میدهد که تمام لینکهای یک صفحه را، بدون توجه به تعداد آنها، دریافت کنیم.
علاوه بر این، یک بخش کامل در این آموزش Scrapy برای نشان دادن نحوه ترکیب Splash یا Selenium با Scrapy برای ایجاد وب کرالر صفحات وب پویا وجود دارد. زمانی که نمیتوانید دادهها را مستقیماً از منبع واکشی کنید، اما نیاز به بارگذاری صفحه، پر کردن فرم، کلیک کردن در جایی، اسکرول کردن به پایین و غیره دارید، به عبارت دیگر اگر در حال تلاش برای اسکرپینگ داده از وبسایتی هستید که دارای تماسهای AJAX و اجرای جاوا اسکریپت زیادی برای رندر کردن صفحات وب است، استفاده از Splash یا Selenium همراه با Scrapy بسیار مفید است.
ما همچنین توابع بیشتری را که Scrapy پس از اتمام وب اسکرپینگ توسط اسپایدر ارائه میدهد، و نحوه ویرایش و استفاده از پارامترهای Scrapy را مورد بحث قرار خواهیم داد.
از آنجا که هدف اصلی وب اسکرپینگ، استخراج داده است، شما یاد خواهید گرفت که چگونه خروجی را در فایلهای CSV، JSON و XML بنویسید.
در نهایت، یاد خواهید گرفت که چگونه دادههای استخراج شده توسط Scrapy را در پایگاههای داده MySQL و MongoDB ذخیره کنید.
سرفصل ها و درس ها
Scrapy در مقابل سایر فریمورکهای پایتون برای وب اسکرپینگ
Scrapy vs. Other Python Web Scraping Frameworks
Scrapy در مقابل Beautiful Soup در مقابل Selenium
Scrapy vs. Beautiful Soup vs. Selenium
ورود به وبسایتها با استفاده از Scrapy
Logging into Websites Using Scrapy
ورود به وبسایتها با استفاده از Scrapy
Logging into Websites Using Scrapy
Scrapy به عنوان یک اسکریپت مستقل (بهروزرسانی شده)
Scrapy as a Standalone Script (UPDATED)
Scrapy به عنوان یک اسکریپت مستقل (بهروزرسانی شده)
Scrapy as a Standalone Script (UPDATED)
ساخت خزنده وب با Scrapy
Building Web Crawler with Scrapy
ساخت خزنده وب با Scrapy
Building Web Crawler with Scrapy
Scrapy با Selenium
Scrapy with Selenium
چرا/چه زمانی باید از Selenium استفاده کنیم
Why/When We Should Use Selenium
Selenium WebDriver + Scrapy Selector برای استخراج URLها
Selenium WebDriver + Scrapy Selector to Extract URLs
بارگذاری بعدی با Selenium برای استخراج داده (قابل استفاده حتی با صفحات JavaScript)
Selenium Loading Next for Data Extraction (usable even with JavaScript pages)
دریافت داده
Getting Data
Scrapy با Splash - وبسایتهای JavaScript
Scrapy with Splash - JavaScript Websites
ورود به لینکدین (بهروزرسانی شده)
LinkedIn Logging in (UPDATED)
یافتن پروفایلهای لینکدین: بخش 1 (بهروزرسانی شده)
Finding LinkedIn Profiles: Part 1 (UPDATED)
یافتن پروفایلهای لینکدین: بخش 2 (بهروزرسانی شده)
Finding LinkedIn Profiles: Part 2 (UPDATED)
اسکرپینگ نقاط داده از پروفایلهای لینکدین: بخش 1 (بهروزرسانی شده)
Scraping Data Points from LinkedIn Profiles: Part 1 (UPDATED)
اسکرپینگ نقاط داده از پروفایلهای لینکدین: بخش 2 (بهروزرسانی شده)
Scraping Data Points from LinkedIn Profiles: Part 2 (UPDATED)
اتصال به پروفایلهای لینکدین (بهروزرسانی شده)
Connecting to LinkedIn Profiles (UPDATED)
تمرینات حل شده وب اسکرپینگ
Solved Web Scraping Exercises
تولید آیتمهای داده از 2 تابع
Yield Data Items from 2 Functions
نحوه مرتبسازی دادههای خروجی گرفته شده
How to Order Exported Data
توابع contains() و starts-with() در XPath
Xpath contains() and starts-with() functions
پاداش: استخراج داده با APIها
Bonus: Data Extraction with APIs
استخراج داده با APIها (آموزش رایگان)
Data Extraction with APIs (Free Tutorial)
پاداش: دوره وب اسکرپینگ با Beautiful Soup، Requests و Selenium
Bonus: Web Scraping with Beautiful Soup, Requests & Selenium Course
کوپن برای وب اسکرپینگ با Beautiful Soup، Requests و Selenium و سایر دورهها
Coupon for Web Scraping with Beautiful Soup, Requests & Selenium & Other Courses
نمایش نظرات