با افزایش حجم و پیچیدگی دادهها، بیشتر شرکتها شروع به فکر کردن درباره نحوه مهاجرت به یک سیستم داده با فرمت بزرگتر مانند Spark میکنند. با این حال، این حرکت میتواند بسیار دردناک باشد و به احتمال زیاد باید مجموعهای کاملاً جدید از ابزارها را یاد بگیرید. در این دوره آموزشی، به مربی Miki Tebeka بپیوندید تا یاد بگیرید که چگونه با استفاده از پانداها، ابزار سریع، قدرتمند، منعطف و آسان برای تجزیه و تحلیل داده که بر روی زبان برنامه نویسی پایتون ساخته شده است، کار با مجموعه داده های بزرگ را شروع کنید. نحوه پیمایش فرمت های ذخیره سازی، نکاتی برای صرفه جویی در حافظه، استراتژی های محاسباتی کارآمد حافظه و موارد دیگر را بیابید. در طول راه، Miki همچنین نشان میدهد که چگونه میتوان از تعداد انگشت شماری جایگزین برای پانداهایی استفاده کرد که هنوز از همان API استفاده میکنند، مانند Dask، Polars، و Beefy VM.
این دوره با GitHub Codespaces یکپارچه شده است، یک محیط توسعه دهنده ابر فوری که تمام عملکردهای IDE مورد علاقه شما را بدون نیاز به هیچ گونه راه اندازی ماشین محلی ارائه می دهد. با Codespaces، میتوانید در هر زمان و در هر زمانی از هر ماشینی تمرین عملی داشته باشید، در حالی که از ابزاری استفاده میکنید که احتمالاً در محل کار با آن مواجه خواهید شد. برای یادگیری نحوه شروع، ویدیوی «استفاده از فضاهای کد GitHub با این دوره» را بررسی کنید.
مدیر عامل در 353Solutions
نمایش نظرات