آموزش Web Scraping: Python Data Playbook

Web Scraping: Python Data Playbook

نکته: آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیویی برای نمایش وجود ندارد.
توضیحات دوره: بیاموزید که چگونه یک داستان داده گرافیکی جذاب را در یک نوت بوک Jupyter با Seaborn با خراش اطلاعات از یک صفحه وب ثابت با BeautifulSoup4 در صورت عدم دسترسی به API در اختیار شما قرار دهید. یک دفترچه مشتری. در این دوره ، Web Scraping: The Python Data Playbook ، توانایی خراشیدن داده ها و ارائه آنها را به صورت گرافیکی خواهید داشت. ابتدا ، شما می توانید با استفاده از ماژول درخواست ها و BeautifulSoup4 تراشیدن را یاد بگیرید. در مرحله بعدی ، خواهید فهمید که چگونه یک ماژول خراشنده قابل اعتماد با پشتوانه یک تست واحد بنویسید. سرانجام ، شما نحوه تبدیل ستون های داده را در یک داستان گرافیکی بررسی خواهید کرد که نظرات همکاران شما را تغییر می دهد. پس از اتمام این دوره ، مهارت و دانش وب تراش مورد نیاز برای ایجاد یک دفترچه یادداشت جذاب Jupyter بدون استفاده از API را خواهید داشت.

سرفصل ها و درس ها

بررسی اجمالی دوره Course Overview

  • بررسی اجمالی دوره Course Overview

تنظیم BeautifulSoup Setting Up BeautifulSoup

  • استراتژی های کلی برای تراشیدن صفحات وب General Strategies for Scraping Web Pages

  • مرور صفحه هدف خودکار MPG ما Reviewing Our Target Auto-MPG Web Page

  • تفاوت پیچیده بین صفحات وب پویا و استاتیک The Complicated Difference between Dynamic and Static Web Pages

درک اطلاعات خراشیده شده شما Understanding Your Scraped Data

  • مقدماتی در HTML و CSS A Primer on HTML and CSS

  • درک HTML ، CSS و ساختار صفحه هدف ما Understanding the HTML, CSS and Structure of Our Target Page

  • ارائه یک استراتژی برای یک صفحه وب پیچیده تر Coming up with a Strategy for a More Complicated Web Page

  • استفاده از BeautifulSoup4 برای پیمایش در داده های خراشیده شده ما Using BeautifulSoup4 to Navigate Our Scraped Data

  • استخراج اطلاعات از یک بخش خراشیده Extracting Information from a Scraped Division

  • استفاده از Selectors به عنوان جایگزین روش Find Using Selectors as an Alternative to the Find Method

  • مشاوره و استراتژی برای تراشیدن Advice and Strategy for Scraping

  • ساخت ماژول Scraper با استفاده از PyCharm Building the Scraper Module Using PyCharm

  • مقابله با داده های از دست رفته در طول خراش Dealing with Missing Data during the Scrape

  • Refactoring کد ما و ذخیره داده های Scraped ما Refactoring Our Code and Caching Our Scraped Data

  • افزودن آزمایشی برای تأیید پردازش منظم بیان ما Adding a Test to Verify Our Regular Expression Processing

استفاده از داده های خراشیده Making Scraped Data Usable

  • صادر کردن داده های خراشیده شده به یک پرونده CSV Exporting Scraped Data to a CSV File

  • دریافت نمای کلی اطلاعات با Pandas Getting a Data Overview with Pandas

  • استراتژی تحلیل داده اکتشافی Exploratory Data Analysis Strategy

  • بررسی فرضیه ما Reviewing Our Hypothesis

  • بررسی روابط بین MPG و وزن Investigating Relationships between MPG and Weight

  • درک نحوه ارتباط سیلندرها و جابجایی Understanding How Cylinders and Displacement Are Related

  • نگاه به MPG در طول سالها Looking at MPG over the Years

  • درک مارک ها و سرزمین ها با پردازش متن Understanding Brands and Territories with Text Processing

  • گفتن یک داستان داده برای توضیح اکتشافات ما Telling a Data Story to Explain Our Discoveries

نمایش نظرات

Pluralsight (پلورال سایت)

Pluralsight یکی از پرطرفدارترین پلتفرم‌های آموزش آنلاین است که به میلیون‌ها کاربر در سراسر جهان کمک می‌کند تا مهارت‌های خود را توسعه دهند و به روز رسانی کنند. این پلتفرم دوره‌های آموزشی در زمینه‌های فناوری اطلاعات، توسعه نرم‌افزار، طراحی وب، مدیریت پروژه، و موضوعات مختلف دیگر را ارائه می‌دهد.

یکی از ویژگی‌های برجسته Pluralsight، محتوای بروز و با کیفیت آموزشی آن است. این پلتفرم با همکاری با توسعه‌دهندگان و کارشناسان معتبر، دوره‌هایی را ارائه می‌دهد که با توجه به تغییرات روزافزون در صنعت فناوری، کاربران را در جریان آخرین مفاهیم و تکنولوژی‌ها نگه می‌دارد. این امر به کاربران این اطمینان را می‌دهد که دوره‌هایی که در Pluralsight می‌پذیرند، با جدیدترین دانش‌ها و تجارب به روز شده‌اند.

آموزش Web Scraping: Python Data Playbook
جزییات دوره
1h 17m
24
Pluralsight (پلورال سایت) Pluralsight (پلورال سایت)
(آخرین آپدیت)
30
4.6 از 5
دارد
دارد
دارد
Ian Ozsvald
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Ian Ozsvald Ian Ozsvald

ایان یک دانشمند و مربی ارشد داده موقت است ، او به طور مشترک کنفرانس سالانه PyDataLondon را با حضور بیش از 700 نفر و نشست ماهیانه بیش از 9،500+ عضو برگزار می کند. وی با 16 سال سابقه کار ، مشاور مور را در لندن اداره می کند ، در سطح بین المللی اغلب به عنوان سخنران اصلی صحبت می کند و نویسنده کتاب پرفروش پایتون با عملکرد عالی O'Reilly است. برای سرگرمی او در کنار Springer Spaniel پر انرژی خود قدم زده ، در سواحل کورنیش گشت و گذار کرده و قهوه خوب می نوشد.