آموزش Hadoop برای نکات ، ترفندها و روشهای علوم داده

Hadoop for Data Science Tips, Tricks, & Techniques

نکته: آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیوها:
توضیحات دوره: Hadoop - پلتفرم بسیار محبوب داده های بزرگ - مجموعه گسترده ای از قابلیت ها را برای کمک به دانشمندان داده ارائه می دهد. در این دوره ، بن سالینز با به اشتراک گذاشتن یک سری نکات و ترفندها برای انجام کارهای علم داده در این بستر قدرتمند ، به شما کمک می کند تا با Hadoop سرعت بیشتری کسب کنید. او ابتدا با بررسی نحوه کار با داده های Hadoop در HDFS شروع می کند و سپس با استفاده از Hive - موتور Hadoop SQL - که در آنجا کارهای علمی زیادی انجام می شود ، کاوش می کند. برای جمع بندی دوره ، بن روشهای اجرای سریع پرس و جوها را در موتور Hive پوشش می دهد.
موضوعات شامل:
  • توضیح دهید که از دستوراتی برای ایجاد تغییر در HDFS استفاده می شود.
  • دستوراتی را که برای بارگذاری داده ها از خط فرمان به HDFS استفاده می شود ، شناسایی کنید.
  • دو عملیاتی که HDFS هنگام انتقال کاربر توسط کاربر انجام می دهد را تشخیص دهید.
  • خلاصه نحوه حذف پرونده ها به صورت بازگشتی به صورت HDFS.
  • نحوه انتخاب و اجرای پارتیشن ها را بخاطر بسپارید.
  • نحوه صاف کردن نوع داده Strukt در HiveQL را توضیح دهید.

سرفصل ها و درس ها

مقدمه Introduction

  • خوش آمدی Welcome

  • آنچه باید بدانید What you should know

  • فایل های تمرینی Exercise files

  • تنظیم محیط Environment setup

1. کار با پرونده ها 1. Working with Files

  • فایل ها را با HDFS سازماندهی کنید Organize files in HDFS

  • پرونده ها را در HDFS بارگذاری کنید Upload files to HDFS

  • انتقال پرونده ها در HDFS Move files in HDFS

  • پرونده ها را با HDFS حذف کنید Remove files in HDFS

2. اتصال به Hadoop 2. Connecting to Hadoop

  • Hive را از طریق Beeline کاوش کنید Explore Hive through Beeline

  • دسترسی به کندو از پایتون Access Hive from Python

  • در Hive مصالح ایجاد کنید Create aggregates in Hive

  • پارتیشن ها را در Hive انتخاب کنید Select partitions in Hive

3. ساختار داده های پیچیده در کندو 3. Complex Data Structures in Hive

  • داده های نقشه در Hive Map data in Hive

  • آرایه ها در کندو Arrays in Hive

  • سازه در کندو Structs in Hive

  • جداول مسطح برای Impala ایجاد کنید Create flat tables for Impala

  • ساختار نمایش داده شد Deconstruct Impala queries

نتیجه Conclusion

  • مراحل بعدی Next steps

نمایش نظرات

آموزش Hadoop برای نکات ، ترفندها و روشهای علوم داده
جزییات دوره
1h 12m
18
Linkedin (لینکدین) Linkedin (لینکدین)
(آخرین آپدیت)
35,455
- از 5
ندارد
دارد
دارد
Ben Sullins
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Ben Sullins Ben Sullins

کمک به پیشرفت شغلی خود در داده ها