آموزش پیش پردازش داده ها با NumPy

Preprocessing Data with NumPy

نکته: آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیوها:
توضیحات دوره: NumPy، ndarrays، Slicing، ژنراتورهای تصادفی، وارد کردن و ذخیره داده ها، آمار، دستکاری داده ها، آرایه های پیش پردازش. تعریف بسته/کتابخانه. نصب و ارتقاء یک بسته پیمایش در اسناد تاریخچه NumPy. رابطه بین آرایه ها و بردارها. آرایه ها در مقابل لیست ها نمایه سازی تخصیص مقادیر به آرایه ها خواص و عملیات عنصری انواع داده های پشتیبانی شده توسط ndarrays. پخش و نوع ریخته گری. اجرای یک تابع یا روش بر روی یک محور معین. برش، برش گام به گام، برش شرطی کاهش ابعاد در آرایه ها. تولید آرایه های پر از مقادیر یکسان. تولید توالی های غیر تصادفی از داده ها. تولید داده های تصادفی با Random Generators. تولید نمونه های تصادفی از توزیع احتمال تصادفی. واردات و صادرات داده با و از NumPy. فایل های NPY و NPZ. حداکثر و حداقل. درصد و چندت. میانگین و واریانس. کوواریانس و همبستگی. محاسبه هیستوگرام هیستوگرام با ابعاد بالاتر یافتن و پر کردن مقادیر از دست رفته جایگزینی مقادیر "پرکننده". تغییر شکل آرایه ها حذف بخش هایی از آرایه ها حذف بخش هایی از عناصر منفرد در آرایه ها. (برهنه کردن) مرتب سازی و درهم ریختن. توابع استدلال انباشتن و الحاق. یافتن مقادیر منحصر به فرد در یک آرایه یک مثال عملی جامع از پاکسازی و پیش پردازش داده ها. پیش نیازها: باید پایتون را نصب کنید. هیچ تجربه قبلی با NumPy لازم نیست. درک کلی از زبان های کدنویسی ترجیح داده می شود، اما لازم نیست.

مشکل

اکثر دوره های تحلیل داده، علوم داده و کدنویسی یک مرحله عملی مهم را از دست می دهند. آن‌ها به شما یاد نمی‌دهند که چگونه با داده‌های خام کار کنید، چگونه آن‌ها را تمیز و پیش پردازش کنید. این باعث ایجاد شکاف قابل توجهی بین مهارت های مورد نیاز شما در کار و توانایی هایی که در آموزش به دست آورده اید، می شود. حقیقت را بگوییم، داده های دنیای واقعی نامرتب هستند، بنابراین باید بدانید که چگونه بر این مانع غلبه کنید تا به یک متخصص داده مستقل تبدیل شوید.

بوت‌کمپ‌هایی که به‌صورت آنلاین دیده‌ایم، و حتی کلاس‌های زنده این جنبه را نادیده می‌گیرند و به شما نشان می‌دهند که چگونه با داده‌های «پاک» کار کنید. اما این به شما لطفی نمی کند. در واقع، هم زمانی که برای شغل درخواست می دهید و هم زمانی که مشغول به کار هستید، شما را عقب می اندازد.


راه حل

هدف ما این است که با استفاده از بسته NumPy آماده سازی کامل را برای شما فراهم کنیم. این دوره شما را به یک تحلیلگر داده توانا با درک فوق العاده از یکی از برجسته ترین بسته های محاسباتی در جهان تبدیل می کند. برای اینکه شما را به آنجا ببریم، موضوعات زیر را به طور گسترده پوشش خواهیم داد.


· کلاس ndarray و چرایی استفاده از آن

· نوع آرایه های داده معمولاً حاوی

است

· برش و فشرده کردن مجموعه داده ها

· ابعاد آرایه ها و نحوه کاهش آنها

· تولید داده های شبه تصادفی

· وارد کردن داده از فایل های متنی خارجی

· ذخیره/صادرات داده ها به فایل های خارجی

· محاسبه آمار مجموعه داده (حداکثر، حداقل، میانگین، واریانس، و غیره)

· پاکسازی داده ها

· پیش پردازش داده

· مثال عملی نهایی


هر یک از این موضوعات بر اساس موارد قبلی است. و این دقیقاً همان چیزی است که برنامه درسی ما را بسیار ارزشمند می کند. همه چیز به ترتیب درست نشان داده می شود و ما تضمین می کنیم که در طول مسیر گم نخواهید شد، زیرا ما تمام مراحل لازم را در ویدیو ارائه کرده ایم (هیچ یک از آنها رد نشده است). به عبارت دیگر، ما به شما آموزش نمی دهیم که چگونه مجموعه داده ها را قبل از اینکه بدانید چگونه آنها را فهرست بندی یا برش دهید، به هم متصل کنید.

بنابراین، برای اینکه شما را برای سفر طولانی به سمت جایگاه علم داده آماده کنیم، دوره‌ای ایجاد کردیم که همه ابزارهای این کار را به شما نشان می‌دهد: دوره پیش پردازش داده با NumPy [MG1].

ما معتقدیم که این منبع به طور قابل توجهی شانس شما را برای یافتن شغل افزایش می دهد، زیرا شما را برای کارهای عملی و مفاهیمی که اغلب در مصاحبه ها گنجانده می شود، آماده می کند.


NumPy بسته اساسی پایتون برای محاسبات علمی است. هنگامی که شما نیاز به محاسبه عملیات ریاضی و استاتیکی دارید، خود را به عنوان ابزاری مناسب معرفی کرده است.

چرا آن را یاد بگیریم؟

بخش بزرگی از کار یک تحلیلگر داده به پیش پردازش مجموعه داده ها اختصاص دارد. بدون شک، این شامل هزاران تکنیک ریاضی و آماری است که NumPy به آنها مشهور است. علاوه بر این، این بسته ساختارهای آرایه‌ای چند بعدی را معرفی می‌کند و مجموعه‌ای از توابع و روش‌های داخلی را برای استفاده در حین کار با آنها ارائه می‌کند. به عبارت دیگر، NumPy را می توان به عنوان یک ابزار پیشرفته پایتون با ثبات محاسباتی توصیف کرد که انعطاف پذیری زیادی را ارائه می دهد و می تواند تجزیه و تحلیل شما را به سطح بعدی برساند.


برخی از موضوعاتی که پوشش خواهیم داد:


1. مبانی NumPy

2. ژنراتورهای تصادفی

3. کار با فایل های متنی

4. آمار با NumPy

5. پیش پردازش داده

6. مثال عملی نهایی



1. مبانی NumPy

برای درک کامل قابلیت‌های NumPy، باید از اصول اولیه شروع کنیم. در این قسمت از دوره، کلاس ndarray را بررسی می‌کنیم، در مورد اینکه چرا اینقدر محبوب است بحث می‌کنیم و با اصطلاحاتی مانند «نمایه‌سازی»، «برش»، «ابعاد» و «کاهش» آشنا می‌شویم.

چرا آن را یاد بگیریم؟

همانطور که در بالا گفته شد، NumPy یک بسته اساسی برای محاسبات علمی است و برای درک ارزش واقعی آن، باید از هسته اصلی آن - کلاس ndarray - شروع کنیم. هرچه اصول اولیه را بهتر درک کنیم، درک مفاهیم دشوارتر آسان تر خواهد بود. به همین دلیل ضروری است که پایه و اساس خوبی برای ایجاد مهارت های NumPy خود ایجاد کنیم.


2. ژنراتورهای تصادفی

بعد از اینکه اصول اولیه را یاد گرفتیم، به سراغ داده های شبه تصادفی و تولیدکنندگان تصادفی می رویم. این مولدها به ساخت مجموعه ای از متغیرهای دلخواه از یک توزیع احتمال معین یا مجموعه ای ثابت از گزینه های قابل دوام کمک می کنند.

چرا آن را یاد بگیریم؟

وقتی در یک فیلد مبتنی بر داده کار می‌کنیم، گاهی اوقات نیاز داریم تا آزمایش‌های نیمه دلخواه بسازیم تا ببینیم آیا کد ما همانطور که در نظر گرفته شده کار می‌کند یا خیر. و در اینجا ارزش مولدهای تصادفی نهفته است، زیرا آنها به ما اجازه می دهند مجموعه داده هایی از داده های شبه تصادفی بسازیم. مزیت اضافی مولدهای تصادفی این است که اگر بخواهیم یک تصادفی سازی خاص را تکرار کنیم، می توانیم یک دانه تنظیم کنیم، اما ما به تمام جزئیات در خود دوره خواهیم پرداخت.


3. کار با فایل های متنی

تبادل اطلاعات با فایل های متنی عملاً روشی است که امروزه ما به تبادل اطلاعات می پردازیم. در این قسمت از دوره، از ابزارهای پایتون، پانداها و NumPy که قبلاً توضیح داده شد استفاده خواهیم کرد تا موارد ضروری را در هنگام وارد کردن یا ذخیره داده ها به شما ارائه دهیم.

چرا آن را یاد بگیریم؟

در بسیاری از دوره ها، فقط به شما یک مجموعه داده داده می شود تا مهارت های تحلیلی و برنامه نویسی خود را تمرین کنید. با این حال، ما نمی‌خواهیم چشمان خود را روی واقعیت ببندیم، زیرا تبدیل یک مجموعه داده خام از یک فایل خارجی به یک قالب Python قابل اجرا می‌تواند یک چالش بزرگ باشد.


4. آمار با NumPy

هنگامی که یاد گرفتیم چگونه مجموعه‌های بزرگی از اطلاعات را از فایل‌های متنی خارجی وارد کنیم، در نهایت آماده خواهیم بود تا یکی از نقاط قوت NumPy - آمار را بررسی کنیم. از آنجایی که بسته از نظر محاسباتی بسیار بادوام است، ما اغلب به توابع و روش‌های آن برای محاسبه آمار یک مجموعه داده نمونه تکیه می‌کنیم. این موارد شامل مواردی مانند میانگین، انحراف معیار، و موارد دیگر است.

چرا آن را یاد بگیریم؟

برای تبدیل شدن به یک دانشمند داده، نه تنها باید بتوانید یک مجموعه داده را از قبل پردازش کنید، بلکه باید بینش های ارزشمندی را نیز استخراج کنید. یکی از راه های کسب اطلاعات بیشتر در مورد یک مجموعه داده، بررسی آمار آن است. بنابراین، ما از این بسته برای درک بیشتر در مورد داده ها و نحوه تبدیل این دانش به اطلاعات مهمی که می توانیم برای پیش بینی استفاده کنیم، استفاده خواهیم کرد.


5. پیش پردازش داده

حتی زمانی که مجموعه داده شما به شکل تمیز و قابل درک است، هنوز کاملاً آماده پردازش برای تجسم و تجزیه و تحلیل نیست. یک مرحله مهم در این بین وجود دارد و آن پیش پردازش داده است.

چرا آن را یاد بگیریم؟

پیش پردازش داده جایی است که یک تحلیلگر داده می تواند نشان دهد که چقدر در کار خود خوب یا عالی هستند. این مرحله از کار مستلزم توانایی انتخاب ابزار آماری مناسب است که کیفیت مجموعه داده های شما و دانش پیاده سازی آن را با پانداهای پیشرفته و تکنیک های NumPy بهبود می بخشد. فقط زمانی که این مرحله را کامل کردید، می‌توانید بگویید که مجموعه داده شما از قبل پردازش شده و برای قسمت بعدی، که تجسم داده‌ها است، آماده است.


6. مثال عملی

این دوره شامل تمرینات و موارد عملی فراوانی است. علاوه بر این، در پایان، ما یک مثال کاربردی جامع قرار داده‌ایم که به شما نشان می‌دهد چگونه همه چیزهایی که در طول مسیر یاد گرفته‌اید به خوبی با هم ترکیب می‌شوند. اینجاست که می‌توانید درک کنید که چقدر در مسیر تسلط بر NumPy در پیگیری شغل داده‌ها پیشرفت کرده‌اید.


آنچه دریافت می کنید

· پشتیبانی فعال Q A

· تمام دانش NumPy برای تبدیل شدن به یک تحلیلگر داده

· جامعه ای از تحلیلگران مشتاق داده

· گواهی پایان کار

· دسترسی به به روز رسانی های مکرر آینده

· آموزش در دنیای واقعی


برای تبدیل شدن به یک تحلیلگر داده NumPy از ابتدا آماده شوید

چرا صبر کنید؟ هر روز یک فرصت از دست رفته است.

روی دکمه "اکنون خرید" کلیک کنید و امروز بخشی از برنامه تحلیلگر داده ما شوید.


سرفصل ها و درس ها

مقدمه ای بر NumPy Introduction to NumPy

  • دوره شامل چه مواردی است؟ What Does the Course Cover?

  • دانلود تمامی منابع Download All Resources

  • سوالات متداول FAQ

  • بسته NumPy و برنامه های کاربردی آن The NumPy Package and Its Applications

  • بسته NumPy و برنامه های کاربردی آن The NumPy Package and Its Applications

  • نصب و ارتقا NumPy Installing and Upgrading NumPy

  • آرایه چیست؟ What is an array?

  • با استفاده از اسناد NumPy Using the NumPy Documentation

  • مقدمه ای بر NumPy - ورزش Introduction to NumPy - Exercise

چرا از NumPy استفاده می کنیم؟ Why Do We Use NumPy?

  • تاریخچه مختصری از NumPy A Brief History of NumPy

  • تاریخچه مختصری از NumPy A Brief History of NumPy

  • دارای ها ndarrays

  • آرایه ها در مقابل لیست ها Arrays vs Lists

  • چرا از NumPy استفاده می کنیم - ورزش Why Do We Use NumPy - Exercise

NumPy Fundamentals NumPy Fundamentals

  • نمایه سازی Indexing

  • تخصیص ارزش ها Assigning Values

  • ویژگی های Elementwise Elementwise Properties

  • انواع داده NumPy NumPy Datatypes

  • ویژگی های توابع NumPy - قسمت 1 Characteristics of NumPy Functions - Part 1

  • ویژگی های توابع NumPy - قسمت 2 Characteristics of NumPy Functions - Part 2

  • NumPy Fundamentals - ورزش NumPy Fundamentals - Exercise

کار با آرایه ها Working with Arrays

  • برش اساسی Basic Slicing

  • برش گام به گام Stepwise Slicing

  • برش شرطی Conditional Slicing

  • ابعاد و تابع فشار Dimensions and the Squeeze Function

  • کار با آرایه ها - تمرین Working with Arrays - Exercise

تولید داده با NumPy Generating Data with NumPy

  • آرایه های خالی، آرایه هایی از مقادیر یکسان Empty Arrays, Arrays of Identical Values

  • _like توابع _like Functions

  • دنباله ای از اعداد - np.arange() A Sequence of Numbers - np.arange()

  • ژنراتورها و بذرهای تصادفی Random Generators and Seeds

  • اعداد صحیح تصادفی، احتمالات و گزینه ها Random Integers, Probabilities and Choices

  • توزیع های احتمال تصادفی Random Probability Distributions

  • کاربردهای ژنراتورهای تصادفی Applications of Random Generators

  • تولید داده با NumPy - تمرین Generating Data with NumPy - Exercise

وارد کردن و ذخیره داده ها Importing and Saving Data

  • وارد کردن داده با Numpy - np.loadtxtx() در مقابل np.genfromtxt() Importing Data with Numpy - np.loadtxtx() vs np.genfromtxt()

  • وارد کردن داده با NumPy - تمیز کردن ساده هنگام وارد کردن Importing Data with NumPy - Simple Cleaning when Importing

  • وارد کردن داده با NumPy - رشته در مقابل شی در مقابل اعداد Importing Data with NumPy - String vs Object vs Numbers

  • وارد کردن داده با NumPy - تمرین Importing Data with NumPy - Exercise

  • ذخیره داده ها با NumPy - NPY Saving Data with NumPy - NPY

  • ذخیره داده ها با NumPy - NPZ Saving Data with NumPy - NPZ

  • ذخیره داده با NumPy - CSV Saving Data with NumPy - CSV

  • وارد کردن و ذخیره داده ها - تمرین Importing and Saving Data - Exercise

آمار با NumPy Statistics with NumPy

  • استفاده از توابع آماری NumPy Using NumPy Statistical Functions

  • مقادیر حداقل و حداکثر Minimal and Maximal Values

  • درصد و چندت Percentiles and Quantiles

  • میانگین و واریانس Averages and Variance

  • کوواریانس و همبستگی Covariance and Correlation

  • هیستوگرام - قسمت 1: هیستوگرام های 1-D Histogram - Part 1: 1-D Histograms

  • هیستوگرام - قسمت 2: هیستوگرام های با ابعاد بالاتر Histogram - Part 2: Higher Dimension Histograms

  • توابع معادل N-A-N N-A-N Equivalent Functions

  • آمار با NumPy - ورزش Statistics with NumPy - Exercise

دستکاری داده ها با NumPy Manipulation Data with NumPy

  • بررسی مقادیر از دست رفته Checking for Missing Values

  • جایگزینی مقادیر پرکننده Substituting Filler Values

  • تغییر شکل آرایه ها Reshaping Arrays

  • حذف ارزش ها Removing Values

  • مرتب سازی آرایه ها Sorting Arrays

  • توابع استدلال - قسمت 1: مرتب سازی برهان Argument Functions - Part 1: Argument Sort

  • توابع استدلال - قسمت 1: استدلال کجا Argument Functions - Part 1: Argument Where

  • درهم ریختن داده ها Shuffling Data

  • ریخته گری آرایه ها Casting Arrays

  • حذف نمادها از آرایه ها Stripping Symbols from Arrays

  • انباشتن آرایه ها Stacking Arrays

  • آرایه های پیوسته Concatenating Arrays

  • یافتن مقادیر منحصر به فرد در آرایه ها Finding Unique Values in Arrays

یک مثال کاربردی NumPy A NumPy Practical Example

  • راه اندازی: مقدمه ای بر مثال عملی Setting Up: Introduction to the Practical Example

  • تنظیم: وارد کردن مجموعه داده Setting Up: Importing the Data Set

  • راه‌اندازی: بررسی داده‌های ناقص Setting Up: Checking for Incomplete Data

  • تنظیم: تقسیم مجموعه داده Setting Up: Splitting the Dataset

  • راه اندازی: ایجاد نقاط بازرسی Setting Up: Creating Checkpoints

  • دستکاری داده های متنی: تاریخ صدور Manipulating Text Data: Issue Date

  • دستکاری داده های متنی: وضعیت و مدت وام Manipulating Text Data: Loan Status and Term

  • دستکاری داده های متنی: درجه و درجه فرعی Manipulating Text Data: Grade and Sub Grade

  • دستکاری داده های متنی: وضعیت تأیید و URL Manipulating Text Data: Verification Status & URL

  • دستکاری داده های متنی: آدرس ایالت Manipulating Text Data: State Address

  • دستکاری داده های متنی: تبدیل رشته ها و ایجاد یک چک پوینت Manipulating Text Data: Converting Strings and Creating a Checkpoint

  • دستکاری داده های عددی: جایگزین مقادیر پرکننده Manipulating Numeric Data: Substitute Filler Values

  • دستکاری داده های عددی: تغییر ارز - نرخ مبادله Manipulating Numeric Data: Currency Change – The Exchange Rate

  • دستکاری داده های عددی: تغییر ارز - از USD به EUR Manipulating Numeric Data: Currency Change - From USD to EUR

  • تکمیل مجموعه داده Completing the Dataset

نمایش نظرات

آموزش پیش پردازش داده ها با NumPy
جزییات دوره
6.5 hours
77
Udemy (یودمی) Udemy (یودمی)
(آخرین آپدیت)
449
4.2 از 5
دارد
دارد
دارد
365 Careers
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

365 Careers 365 Careers

ایجاد فرصت برای دانشجویان علوم داده و مالی