لطفا جهت اطلاع از آخرین دوره ها و اخبار سایت در
کانال تلگرام
عضو شوید.
آموزش پاکسازی وب پایتون: استخراج داده با سوپ زیبا
Python Web Scraping: Data Extraction with Beautiful Soup
نکته:
آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیوها:
توضیحات دوره:
کاوش در اسکراپینگ وب با پایتون: سوپ زیبا، تجزیه HTML، انتخابگرهای CSS و پروژههای عملی اصول اولیه HTML و CSS: ساختارهای صفحه وب را برای خراش دادن مؤثر درک و پیمایش کنید. تسلط بر سوپ زیبا: از قدرت کامل Beautiful Soup برای استخراج پیشرفته داده ها استفاده کنید. مدیریت درخواستهای HTTP: درخواستهای وب را با استفاده از کتابخانه درخواستهای پایتون ارسال، رسیدگی و تفسیر کنید. تفسیر کد پاسخ: کدهای پاسخ HTTP مختلف و پیامدهای آنها را رمزگشایی کنید. پروژه های خراش دادن در دنیای واقعی: خراش های عملی برای کارهایی مانند ردیابی قیمت و واکشی محتوا بسازید. انتخابگرهای CSS: از انتخابگرها برای هدف قرار دادن عناصر و نقاط داده خاص در یک صفحه وب استفاده کنید. تبدیل داده ها: داده های خراشیده شده خام را به فرمت های قابل استفاده و عملی تبدیل کنید. پاکسازی وب اخلاقی: ملاحظات قانونی و اخلاقی استخراج داده ها از وب سایت ها را درک کنید. پیش نیازها:رایانه با دسترسی به اینترنت: از آنجایی که این یک دوره آموزشی اسکریپ وب است، اتصال به اینترنت پایدار برای دسترسی و خراش داده های وب ضروری است. آشنایی با مرورگرهای وب: درک نحوه پیمایش مرورگرهای وب و استفاده از ابزارهای توسعه دهنده آنها می تواند برای بررسی عناصر وب سایت مفید باشد. کنجکاوی و ذهنیت حل مسئله: اگرچه پیش نیاز ملموسی نیست، ورود به دوره با علاقه واقعی به داده ها و اشتیاق به حل مسائل، مطمئناً به درک سریعتر مفاهیم کمک می کند. دانش پایه پایتون: درک پایه ای از برنامه نویسی پایتون مفید خواهد بود زیرا این دوره بر اساس ابزارها و کتابخانه های مبتنی بر پایتون تنظیم شده است.
از پتانسیل استخراج داده های وب با دوره مفصل ما در مورد Web Scraping با استفاده از Beautiful Soup در پایتون استفاده کنید. در عصری که دادهها معادل داراییهای ارزشمند است، تسلط بر هنر استخراج دادهها میتواند به امکانات بیشماری منجر شود. این دوره برای کسانی که قصد جمع آوری داده ها برای تحقیق، تجزیه و تحلیل کسب و کار، یا نظارت بر محتوای وب را دارند عالی است.
سفر خود را با مقدمه ای بر اصول اولیه خراش دادن وب آغاز کنید. بیاموزید که چرا پایتون و کتابخانه قوی آن، سوپ زیبا، مورد علاقه توسعه دهندگان و علاقه مندان به داده است. خود را در جزئیات ساختارهای HTML غوطه ور کنید، یاد بگیرید که چگونه تگ های HTML مختلف را شناسایی کرده و در میان آنها پیمایش کنید و بر انتخابگرهای CSS تسلط پیدا کنید تا داده های مورد نیاز خود را دقیقا استخراج کنید.
از کتابخانه Requests برای مدیریت آسان و مؤثر درخواستهای HTTP استفاده کنید و فرآیند بازیابی محتوای وب را ساده کنید. مهارت های خود را با تجربه عملی در Beautiful Soup که همه چیز را از تجزیه اساسی گرفته تا روش های پیچیده استخراج داده را پوشش می دهد، ارتقا دهید.
کاربرد عملی کلیدی است. دوره ما پروژه های دنیای واقعی متعددی را ارائه می دهد که به شما این شانس را می دهد که مهارت های خود را در تنظیمات مختلف، از جمله ردیابی قیمت eBay، استخراج بازدیدهای برتر از بیلبورد، دریافت توصیه های فیلم از IMDB، و توجه به قیمت بیت کوین به کار ببرید.
این دوره را با توانایی خراش دادن بدون زحمت داده های وب و تبدیل آن به بینش های ارزشمند تکمیل کنید. اکنون ثبت نام کنید و اولین قدم را برای تبدیل شدن به یک متخصص خراش دادن وب بردارید!
سرفصل ها و درس ها
معرفی
Introduction
معرفی
Introduction
Web Scraping چیست؟
What is Web Scraping?
چرا از Python برای Web Scraping استفاده کنیم؟
Why use Python for Web Scraping?
کاربردهای Web Scraping
Applications of Web Scraping
آیا Web Scraping قانونی است؟
Is Web Scraping legal?
الزامات و نصب ابزار
Requirements and Installation of Tools
نصب آناکوندا: مک و لینوکس
Anaconda Installation: Mac and Linux
نصب آناکوندا: ویندوز
Anaconda Installation: Windows
ساختار و بخش هایی از یک سند HTML
Structure and parts of an HTML Document
Doctype
Doctype
تگ سر
Head Tag
برچسب بدن
Body Tag
شناسایی عناصر یک سند HTML
Identifying elements of an HTML Document
برچسبهای سر و پاراگراف
Head and Paragraph tags
برچسب ها را فهرست کنید
List tags
برچسب های جدول
Table tags
تگ های لنگر
Anchor tags
گروه بندی برچسب ها
Grouping tags
انتخابگرهای CSS
CSS Selectors
کلاس
Class
انتخابگر شناسه
Id selector
برچسب یا عنصر
Tag or element
انتخابگرهای صفت
Attribute selectors
انتخابگرهای شبه کلاس
Pseudo class selectors
درخواست با استفاده از کتابخانه درخواست ها
Making Requests using the Requests Library
درخواست چیست؟
What is a request?
درخواست دریافت کنید
GET request
درخواست POST
POST request
درخواست PUT
PUT request
درخواست حذف
DELETE request
چگونه در پایتون درخواست کنیم؟
How to make requests in Python?
کدهای پاسخ HTTP
HTTP Response codes
آشنایی با سوپ زیبا
Introduction to Beautiful Soup
سوپ زیبا چیست؟
What is Beautiful Soup?
بررسی یک وب سایت در مرورگر
Inspecting a website on the browser
نحوه دریافت کد HTML از یک وب سایت
How to get the HTML code from a website
استخراج محتوا با استفاده از سوپ زیبا
Extracting content using Beautiful Soup
با نام عنصر
By element name
با استفاده از متدهای find و find_all
Using find and find_all methods
استفاده از انتخابگرهای CSS: نام عنصر یا برچسب
Using CSS selectors: Element or tag name
با استفاده از انتخابگرهای CSS: شناسه و نام کلاس
Using CSS selectors: ID and Class names
استفاده از انتخابگرهای CSS: انتخابگر کلاس شبه
Using CSS selectors: Pseudo class selector
استفاده از انتخابگرهای CSS: نام ویژگی
Using CSS selectors: Attribute name
پروژه اول: ایجاد ردیاب قیمت ebay
Project One: Creating an ebay Price Tracker
شرح پروژه
Project Description
بازرسی وب سایت و شناسایی عناصر کلیدی
Inspecting the website and identifying the key elements
خراش دادن وب سایت
Scraping the website
پروژه دوم: به دست آوردن 20 بازدید برتر از یک وب سایت بیلبورد
Project Two: Obtaining the top 20 hits from a Billboard website
شرح پروژه
Project Description
بازرسی وب سایت
Inspecting the website
خراش دادن وب سایت
Scraping the website
پروژه سوم: خراش دادن وب سایت IMDB برای توصیه های فیلم
Project Three: Scraping the IMDB website for movie recommendations
شرح پروژه
Project Description
بازرسی وب سایت
Inspecting the website
خراش دادن وب سایت
Scraping the website
پروژه چهارم: ایجاد یک ردیاب قیمت بیت کوین
Project Four: Creating a Bitcoin Price Tracker
بیایید با هم ابر جهان را کدنویسی و بسازیم! Meta Brains یک برند آموزشی حرفه ای است که توسط تیمی از توسعه دهندگان نرم افزار و متخصصان امور مالی که به امور مالی، کدنویسی و اکسل علاقه دارند، توسعه یافته است. ما تجارب حرفهای و آموزشی را برای ایجاد برنامههای آموزشی در سطح جهانی که برای همه قابل دسترسی است، گرد هم میآوریم. در حال حاضر، ما بر انقلاب بزرگ بعدی در محاسبات متمرکز هستیم: متاورس. هدف نهایی ما این است که نسل بعدی استعدادها را آموزش دهیم تا بتوانیم با هم متاورز را کدنویسی و بسازیم!
نمایش نظرات