آموزش استفاده از مجموعه داده های بزرگ با پانداها

Using Large Datasets with pandas

نکته: آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیوها:
توضیحات دوره:

با افزایش حجم و پیچیدگی داده‌ها، بیشتر شرکت‌ها شروع به فکر کردن درباره نحوه مهاجرت به یک سیستم داده با فرمت بزرگ‌تر مانند Spark می‌کنند. با این حال، این حرکت می‌تواند بسیار دردناک باشد و به احتمال زیاد باید مجموعه‌ای کاملاً جدید از ابزارها را یاد بگیرید. در این دوره آموزشی، به مربی Miki Tebeka بپیوندید تا یاد بگیرید که چگونه با استفاده از پانداها، ابزار سریع، قدرتمند، منعطف و آسان برای تجزیه و تحلیل داده که بر روی زبان برنامه نویسی پایتون ساخته شده است، کار با مجموعه داده های بزرگ را شروع کنید. نحوه پیمایش فرمت های ذخیره سازی، نکاتی برای صرفه جویی در حافظه، استراتژی های محاسباتی کارآمد حافظه و موارد دیگر را بیابید. در طول راه، Miki همچنین نشان می‌دهد که چگونه می‌توان از تعداد انگشت شماری جایگزین برای پانداهایی استفاده کرد که هنوز از همان API استفاده می‌کنند، مانند Dask، Polars، و Beefy VM.

این دوره با GitHub Codespaces یکپارچه شده است، یک محیط توسعه دهنده ابر فوری که تمام عملکردهای IDE مورد علاقه شما را بدون نیاز به هیچ گونه راه اندازی ماشین محلی ارائه می دهد. با Codespaces، می‌توانید در هر زمان و در هر زمانی از هر ماشینی تمرین عملی داشته باشید، در حالی که از ابزاری استفاده می‌کنید که احتمالاً در محل کار با آن مواجه خواهید شد. برای یادگیری نحوه شروع، ویدیوی «استفاده از فضاهای کد GitHub با این دوره» را بررسی کنید.


سرفصل ها و درس ها

معرفی Introduction

  • آنچه شما باید بدانید What you should know

  • راه اندازی Setting up

  • مجموعه داده های بزرگ با پانداها Larget datasets with pandas

1. داده های بزرگ 1. Big Data

  • کلان داده مرده است Big data is dead

  • مشکل کلان داده The problem with big data

  • سیستم های داده های بزرگ Big data systems

2. استفاده از حافظه کمتر 2. Using Less Memory

  • فلش Arrow

  • داده های طبقه بندی شده Categorical data

  • چالش: مسافران روزانه Challenge: Daily passengers

  • انواع Types

  • راه حل: مسافران روزانه Solution: Daily passengers

  • فقط آنچه را که نیاز دارید بارگیری کنید Load only what you need

3. محاسبات کارآمد حافظه 3. Memory Efficient Computation

  • محاسبات تکراری Iterative computation

  • چالش: حداکثر مسافر Challenge: Maximum passengers

  • راه حل: حداکثر مسافر Solution: Maximum passengers

  • SQL SQL

  • محاسبات سریعتر Faster calculations

4. گزینه های دیگر 4. Other Options

  • راه حل: میانه مسافت سواری Solution: Median ride distance

  • میز dask

  • قطبی ها polars

  • چالش: میانه مسافت سواری Challenge: Median ride distance

  • بیفی VM Beefy VM

نتیجه Conclusion

  • مراحل بعدی Next steps

نمایش نظرات

آموزش استفاده از مجموعه داده های بزرگ با پانداها
جزییات دوره
0h 36m
23
Linkedin (لینکدین) Linkedin (لینکدین)
(آخرین آپدیت)
18
- از 5
ندارد
دارد
دارد
Miki Tebeka
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Miki Tebeka Miki Tebeka

مدیر عامل در 353Solutions

Miki Tebeka مدیرعامل 353Solutions است.

در کار خود در 353Solutions، Miki کارگاه های عملی ارائه می دهد که به متخصصان کمک می کند درک خود را از Python تقویت کنند. و برو. علاوه بر این، او خدمات مشاوره ای متناسب با تخصص در ساخت زیرساخت های کلان داده را ارائه می دهد. همانطور که کار او در 353Solutions نشان می دهد، او در Python and Go و همچنین C++، JavaScript، Clojure و موارد دیگر مهارت بالایی دارد.