دسترسی سریع:

مسیر:

صفحه اصلی

لطفا جهت اطلاع از آخرین دوره ها و اخبار سایت در کانال تلگرام عضو شوید.

آموزش Web Scraping و اصول API در پایتون

Web Scraping and API Fundamentals in Python

نکته: آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.

نمونه ویدیوها: (صرفا برای مشاهده نمونه ویدیو، ممکن هست نیاز به شکن داشته باشید.)

توضیحات دوره: آموزش خراش دادن وب با سوپ زیبا و درخواست ها-html. هر زمان که در دسترس است از API ها استفاده کنید. جمع آوری داده ها به صورت خودکار اصول Web Scraping را بیاموزید API ها را در برنامه های خود پیاده کنید استاد کار با Beautiful Soup شروع به استفاده از درخواست ها-html ایجاد خراش های کارآمد خراش دادن جاوا اسکریپت با HTML آشنا شوید انتخابگرهای CSS را بشناسید درخواست های HTTP را درک کنید کوکی های وب سایت را کاوش کنید محتوای خراشیده شده در پشت یک گزارش قفل شده است. در سیستم محدود کردن میزان درخواست ها پیش نیازها:پایتون 3 و توزیع آناکوندا دانش پایه پایتون کنجکاوی و اشتیاق به یادگیری و تمرین

آیا از کپی و چسباندن دستی مقادیر در یک صفحه گسترده خسته شده اید؟

آیا می خواهید یاد بگیرید که چگونه با یک اسکریپت ساده، اطلاعات جالب، هم زمان و حتی کمیاب را از اینترنت به دست آورید؟

آیا مشتاق به دست آوردن یک مهارت ارزشمند هستید تا در این دنیای داده محور از رقبا پیشی بگیرید؟

اگر پاسخ مثبت است، در زمان مناسب به مکان مناسب آمده اید!

به Web Scraping و API Fundamentals در پایتون خوش آمدید!

دوره نهایی جمع آوری داده ها!

Web Scraping تکنیکی برای به دست آوردن اطلاعات از صفحات وب یا سایر منابع داده مانند API ها از طریق استفاده از برنامه های خودکار هوشمند است. Web Scraping به ما امکان می دهد تا داده ها را از صدها یا هزاران صفحه با چند خط کد جمع آوری کنیم.

از گزارش گیری تا علم داده، استخراج خودکار داده ها از وب از انجام کارهای تکراری جلوگیری می کند. به عنوان مثال، اگر در یک سازمان جدی کار کرده اید، مطمئناً می دانید که گزارش یک موضوع تکراری است. گزارش های روزانه، هفتگی، ماهانه، فصلی و سالانه وجود دارد. خواه هدف آنها سازماندهی داده‌های وب‌سایت، داده‌های تراکنش، داده‌های مشتری، یا حتی اطلاعات آسان‌تر مانند پیش‌بینی آب‌وهوا باشد - گزارش‌ها در دنیای کنونی ضروری هستند. و در حالی که گاهی مراقبت از آن وظیفه کارآموز است، تعداد کمی از وظایف نسبت به اتوماسیون گزارش ها صرفه جویی در هزینه دارند.

وقتی نوبت به علم داده می‌رسد – داده‌های بیشتری از منابع خارجی مانند صفحات وب، فایل‌های قابل دانلود و APIها به دست می‌آیند. دانستن چگونگی استخراج و ساختار سریع آن داده ها یک مهارت ضروری است که شما را در بازار کار متمایز می کند.

بله، وقت آن است که بازی خود را ارتقا دهید و یاد بگیرید که چگونه می توانید استفاده از API ها و استخراج اطلاعات مفید از وب سایت ها را خودکار کنید.

در قسمت اول دوره، با API ها شروع می کنیم. API ها به طور خاص برای ارائه داده به توسعه دهندگان طراحی شده اند، بنابراین آنها اولین مکانی هستند که هنگام جستجوی داده ها بررسی می شوند. ما در مورد درخواست های GET، درخواست های POST و فرمت JSON خواهیم آموخت.

این مفاهیم همه از طریق مثال‌های جالب و به صورت مستقیم بررسی می‌شوند.

با این حال، گاهی اوقات ممکن است اطلاعات از طریق استفاده از یک API در دسترس نباشد، اما در یک صفحه وب موجود است. در این سناریو چه کاری می توانیم انجام دهیم؟ از صفحه دیدن کنید و داده ها را به صورت دستی یادداشت کنید؟

لطفاً هرگز این کار را نکنید!

ما یاد خواهیم گرفت که چگونه از کتابخانه‌های قدرتمندی مانند «سوپ زیبا» و «HTML درخواست‌ها» برای خراش دادن هر وب‌سایتی، صرف نظر از ترکیبی از زبان‌ها - HTML، جاوا اسکریپت و CSS استفاده کنیم.

مطمئناً، برای خراش دادن، باید یک یا دو چیز در مورد توسعه وب بدانید. به همین دلیل است که ما یک بخش اختیاری را نیز گنجانده ایم که اصول اولیه HTML را پوشش می دهد. در نظر بگیرید که یک جایزه برای تمام دانشی که کسب خواهید کرد!

ما همچنین چندین پروژه خراش دادن را بررسی خواهیم کرد. ما داده‌های مربوط به فیلم‌ها را از فهرست رتبه‌بندی «Rotten Tomatoes» به دست می‌آوریم و ساختار می‌دهیم و هر مرحله از این فرآیند را به طور دقیق بررسی می‌کنیم. این به شما کمک می کند تا احساس کنید که خراشیدن در دنیای واقعی چگونه است.

ما همچنین به نحوه پاک کردن داده ها از بسیاری از صفحات وب به طور همزمان خواهیم پرداخت، که در استخراج داده ها یک نیاز کاملاً معمول است.

و سپس نوبت شما خواهد بود که آنچه را که آموخته اید با چندین پروژه که برای شما تنظیم خواهیم کرد، تمرین کنید.

اما موارد بیشتری نیز وجود دارد!

Web Scraping ممکن است همیشه طبق برنامه پیش نرود (به همین دلیل است که شما این دوره را می گذرانید). وب سایت های مختلف به روش های مختلفی ساخته می شوند و اغلب ربات های ما ممکن است مسدود شوند. به همین دلیل، ما تلاش بیشتری برای کشف موانع رایجی که ممکن است در حین خراشیدن با آنها مواجه شوید را بررسی کرده و راه هایی برای دور زدن یا مقابله با آن مشکلات به شما ارائه خواهیم کرد. اینها شامل سرصفحه‌ها و کوکی‌های درخواست، سیستم‌های ورود به سیستم و محتوای تولید شده جاوا اسکریپت است.

اگر با چند مورد یا هیچ یک از این اصطلاحات آشنا نیستید نگران نباشید... ما از اصول اولیه شروع خواهیم کرد و راه خود را به سمت مهارت خواهیم ساخت. علاوه بر این، ما معتقدیم که تمرین باعث کامل‌تر شدن می‌شود، بنابراین این دوره چندان در جنبه تئوری چیزها نیست، زیرا بیشتر یک رویکرد عملی را اتخاذ می‌کند. علاوه بر این، شامل تمرین‌های مشق شب فراوان، فایل‌ها و دفترچه‌های قابل دانلود، و همچنین سوالات مسابقه و یادداشت‌های دوره است.

ما، تیم 365 Data Science متعهد هستیم که فقط محتوای با بالاترین کیفیت را برای شما - دانشجویان خود ارائه دهیم. و در حالی که ما عاشق تولید محتوای خود در داخل هستیم، این بار تصمیم گرفتیم با یک متخصص واقعی صنعت - اندرو تردوی همکاری کنیم. اندرو یک دانشمند ارشد داده در شرکت بیمه زندگی نیویورک است. او دارای مدرک کارشناسی ارشد در علوم کامپیوتر با یادگیری ماشین از موسسه فناوری جورجیا است و یک متخصص برجسته با بیش از ۷ سال تجربه در برنامه نویسی پایتون مرتبط با داده است. او همچنین نویسنده بسته "yahoo_fin" است که به طور گسترده برای جمع آوری داده های تاریخی قیمت سهام از یاهو استفاده می شود.

همانند همه دوره‌های ما، اگر در مقطعی تصمیم بگیرید که آموزش برای شما مناسب نیست، 30 روز ضمانت بازگشت وجه دارید. بنابراین... شما چیزی برای از دست دادن ندارید - و همه چیز برای به دست آوردن؟

پس منتظر چه چیزی هستید؟

روی دکمه "اکنون خرید" کلیک کنید و بیایید با هم شروع به جمع آوری داده ها کنیم!

سرفصل ها و درس ها

معرفی دوره Introduction to the course

دوره شامل چه مواردی می شود؟ What does the course cover?
Web Scraping چیست؟ What is Web Scraping?
Web Scraping چیست؟ What is Web Scraping?
اخلاق خراشیدن Ethics of Scraping
اخلاق خراشیدن Ethics of Scraping
دانلود تمامی منابع Download All Resources

راه اندازی محیط Setting up the environment

راه اندازی محیط - لطفا از دست ندهید! Setting up the environment - Do not skip, please!
چرا پایتون و چرا ژوپیتر؟ Why Python and why Jupyter?
نصب آناکوندا Installing Anaconda
داشبورد Jupyter - قسمت 1 Jupyter Dashboard - Part 1
داشبورد Jupyter - قسمت 2 Jupyter Dashboard - Part 2
نصب پکیج ها Installing the packages

کار با API ها Working with APIs

نمای کلی API API overview
نمای کلی API API overview
درخواست های HTTP: درخواست های GET و POST HTTP requests: GET and POST requests
درخواست های HTTP: درخواست های GET و POST HTTP requests: GET and POST requests
JSON: فرمت تبادل داده ترجیحی برای APIها JSON: preferred data exchange format for APIs
JSON: فرمت تبادل داده ترجیحی برای APIها JSON: preferred data exchange format for APIs
API نرخ ارز: دریافت پاسخ JSON Exchange rates API: GETting a JSON reply
API نرخ ارز: دریافت پاسخ JSON Exchange rates API: GETting a JSON reply
گنجاندن پارامترها در یک درخواست GET Incorporating parameters in a GET request
گنجاندن پارامترها در یک درخواست GET Incorporating parameters in a GET request
عملکردهای API اضافی Additional API functionalities
عملکردهای API اضافی Additional API functionalities
ایجاد یک مبدل ارز ساده Creating a simple currency converter
iTunes API iTunes API
iTunes API iTunes API
iTunes API: ورزش iTunes API: Exercise
iTunes API: ساختار و صادرات داده ها iTunes API: Structuring and exporting the data
iTunes API: ساختار و صادرات داده ها iTunes API: Structuring and exporting the data
API ها: ورزش APIs: Exercise
GitHub API: صفحه بندی GitHub API: Pagination
GitHub API: صفحه بندی GitHub API: Pagination
EDAMAM API: راه اندازی و ثبت اولیه EDAMAM API: Initial setup and registration
EDAMAM API: راه اندازی و ثبت اولیه EDAMAM API: Initial setup and registration
EDAMAM API: ارسال درخواست POST EDAMAM API: Sending a POST request
EDAMAM API: ارسال درخواست POST EDAMAM API: Sending a POST request
دانلود فایل های درخواستی Downloading files with requests

نمای کلی HTML HTML overview

HTML چیست؟ What is HTML?
HTML چیست؟ What is HTML?
ساختار HTML Structure of HTML
ساختار HTML Structure of HTML
نحو HTML. برچسب ها Syntax of HTML. Tags
نحو HTML. برچسب ها Syntax of HTML. Tags
ویژگی های برچسب Tag attributes
ویژگی های برچسب Tag attributes
برچسب های محبوب Popular tags
برچسب های محبوب Popular tags
CSS و جاوا اسکریپت CSS and JavaScript
CSS و جاوا اسکریپت CSS and JavaScript
رمزگذاری کاراکتر Character encoding
رمزگذاری کاراکتر Character encoding
XHTML و سبک کد XHTML and code style
XHTML و سبک کد XHTML and code style

خراش دادن وب با سوپ زیبا Web Scraping with Beautiful Soup

آشنایی با بسته بندی سوپ زیبا Introduction to the Beautiful Soup package
گردش کار Web Scraping Workflow of Web Scraping
گردش کار Web Scraping Workflow of Web Scraping
راه اندازی اولین اسکراپر خود Setting up your first scraper
جستجو و پیمایش درخت HTML Searching and navigating the HTML tree
جستجو و پیمایش درخت HTML Searching and navigating the HTML tree
جستجوی درخت HTML بر اساس ویژگی ها Searching the HTML tree by attributes
جستجوی درخت HTML بر اساس ویژگی ها Searching the HTML tree by attributes
استخراج داده ها از درخت HTML Extracting data from the HTML tree
استخراج متن از یک تگ HTML Extracting text from an HTML tag
استخراج متن از یک تگ HTML Extracting text from an HTML tag
مثال عملی: برخورد با پیوندها Practical example: dealing with links
مثال عملی: ورزش کنید Practical example: Exercise
استخراج داده ها از تگ های HTML تو در تو Extracting data from nested HTML tags
خراش دادن چندین صفحه به صورت خودکار Scraping multiple pages automatically

پروژه عملی: خراشیدن گوجه فرنگی پوسیده Practical project: Scraping Rotten Tomatoes

راه اندازی اسکراپر خود Setting up your scraper
استخراج عنوان و سال هر فیلم Extracting the title and year of each movie
استخراج امتیاز هر فیلم: تمرین Extracting the score of each movie: Exercise
استخراج بقیه اطلاعات Extracting the rest of the information
برخورد با بازیگران فیلم ها Dealing with the cast of the movies
استخراج بقیه اطلاعات: ورزش Extracting the rest of the information: Exercise
ذخیره و صادرات داده ها به شکل ساختار یافته Storing and exporting the data in a structured form

خراش دادن جداول HTML Scraping HTML tables

خراش دادن جداول HTML با کمک پانداها Scraping HTML tables with the help of Pandas

پروژه های عملی Practical projects

خراش دادن بخار Scraping Steam
خراش دادن یوتیوب Scraping YouTube

موانع رایج در هنگام تراشیدن Common roadblocks when scraping

موانع متداول هنگام Web Scraping. Common roadblocks when Web Scraping.
موانع متداول هنگام Web Scraping Common roadblocks when Web Scraping

بسته درخواست ها-html The requests-html package

مقدمه ای بر پکیج requests-html Introduction to the requests-html package
بررسی قابلیت‌های requests-html برای Web Scraping Exploring the capabilities of requests-html for Web Scraping
جستجوی متن Searching for text
انتخابگرهای CSS CSS selectors
انتخابگرهای CSS CSS selectors
خراش دادن جاوا اسکریپت Scraping JavaScript
Scraping JavaScript: تمرین Scraping JavaScript: Exercise
تکمیل 100% Completing 100%

برای ارسال نظر ثبت نام کنید.

نمایش نظرات

جزییات دوره

زمان دوره: 4 hours

تعداد ویدیو ها: 62

شرکت: Udemy (یودمی)

تاریخ انتشار مرجع: (آخرین آپدیت)

ثبت نام مرجع : 8,814

امتیاز مرجع: 4.1 از 5

فایل تمرین: دارد

زیرنویس زبان اصلی: دارد

زیرنویس فارسی: (توسط هوش مصنوعی) دارد

مدرس: 365 Careers

لینک کوتاه این دوره

https://donyad.com/d/f9bac2

جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

نرم افزارهای مورد نیاز

دنیاد

آموزش Web Scraping و اصول API در پایتون

Web Scraping and API Fundamentals in Python

معرفی دوره Introduction to the course

دوره شامل چه مواردی می شود؟ What does the course cover?

Web Scraping چیست؟ What is Web Scraping?

Web Scraping چیست؟ What is Web Scraping?

اخلاق خراشیدن Ethics of Scraping

اخلاق خراشیدن Ethics of Scraping

دانلود تمامی منابع Download All Resources

راه اندازی محیط Setting up the environment

راه اندازی محیط - لطفا از دست ندهید! Setting up the environment - Do not skip, please!

چرا پایتون و چرا ژوپیتر؟ Why Python and why Jupyter?

نصب آناکوندا Installing Anaconda

داشبورد Jupyter - قسمت 1 Jupyter Dashboard - Part 1

داشبورد Jupyter - قسمت 2 Jupyter Dashboard - Part 2

نصب پکیج ها Installing the packages

کار با API ها Working with APIs

نمای کلی API API overview

نمای کلی API API overview

درخواست های HTTP: درخواست های GET و POST HTTP requests: GET and POST requests

درخواست های HTTP: درخواست های GET و POST HTTP requests: GET and POST requests

JSON: فرمت تبادل داده ترجیحی برای APIها JSON: preferred data exchange format for APIs

JSON: فرمت تبادل داده ترجیحی برای APIها JSON: preferred data exchange format for APIs

API نرخ ارز: دریافت پاسخ JSON Exchange rates API: GETting a JSON reply

API نرخ ارز: دریافت پاسخ JSON Exchange rates API: GETting a JSON reply

گنجاندن پارامترها در یک درخواست GET Incorporating parameters in a GET request

گنجاندن پارامترها در یک درخواست GET Incorporating parameters in a GET request

عملکردهای API اضافی Additional API functionalities

عملکردهای API اضافی Additional API functionalities

ایجاد یک مبدل ارز ساده Creating a simple currency converter

iTunes API iTunes API

iTunes API iTunes API

iTunes API: ورزش iTunes API: Exercise

iTunes API: ساختار و صادرات داده ها iTunes API: Structuring and exporting the data

iTunes API: ساختار و صادرات داده ها iTunes API: Structuring and exporting the data

API ها: ورزش APIs: Exercise

GitHub API: صفحه بندی GitHub API: Pagination

GitHub API: صفحه بندی GitHub API: Pagination

EDAMAM API: راه اندازی و ثبت اولیه EDAMAM API: Initial setup and registration

EDAMAM API: راه اندازی و ثبت اولیه EDAMAM API: Initial setup and registration

EDAMAM API: ارسال درخواست POST EDAMAM API: Sending a POST request

EDAMAM API: ارسال درخواست POST EDAMAM API: Sending a POST request

دانلود فایل های درخواستی Downloading files with requests

نمای کلی HTML HTML overview

HTML چیست؟ What is HTML?

HTML چیست؟ What is HTML?

ساختار HTML Structure of HTML

ساختار HTML Structure of HTML

نحو HTML. برچسب ها Syntax of HTML. Tags

نحو HTML. برچسب ها Syntax of HTML. Tags

ویژگی های برچسب Tag attributes

ویژگی های برچسب Tag attributes

برچسب های محبوب Popular tags

برچسب های محبوب Popular tags

CSS و جاوا اسکریپت CSS and JavaScript

CSS و جاوا اسکریپت CSS and JavaScript

رمزگذاری کاراکتر Character encoding

رمزگذاری کاراکتر Character encoding

XHTML و سبک کد XHTML and code style

XHTML و سبک کد XHTML and code style

خراش دادن وب با سوپ زیبا Web Scraping with Beautiful Soup

آشنایی با بسته بندی سوپ زیبا Introduction to the Beautiful Soup package

گردش کار Web Scraping Workflow of Web Scraping

گردش کار Web Scraping Workflow of Web Scraping

راه اندازی اولین اسکراپر خود Setting up your first scraper

جستجو و پیمایش درخت HTML Searching and navigating the HTML tree

جستجو و پیمایش درخت HTML Searching and navigating the HTML tree

جستجوی درخت HTML بر اساس ویژگی ها Searching the HTML tree by attributes

جستجوی درخت HTML بر اساس ویژگی ها Searching the HTML tree by attributes

استخراج داده ها از درخت HTML Extracting data from the HTML tree

استخراج متن از یک تگ HTML Extracting text from an HTML tag

استخراج متن از یک تگ HTML Extracting text from an HTML tag

مثال عملی: برخورد با پیوندها Practical example: dealing with links

مثال عملی: ورزش کنید Practical example: Exercise

استخراج داده ها از تگ های HTML تو در تو Extracting data from nested HTML tags

خراش دادن چندین صفحه به صورت خودکار Scraping multiple pages automatically

پروژه عملی: خراشیدن گوجه فرنگی پوسیده Practical project: Scraping Rotten Tomatoes

راه اندازی اسکراپر خود Setting up your scraper

استخراج عنوان و سال هر فیلم Extracting the title and year of each movie

استخراج امتیاز هر فیلم: تمرین Extracting the score of each movie: Exercise