آموزش Hadoop برای نکات ، ترفندها و روشهای علوم داده

Hadoop for Data Science Tips, Tricks, & Techniques

نکته: آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
توضیحات دوره: Hadoop - پلتفرم بسیار محبوب داده های بزرگ - مجموعه گسترده ای از قابلیت ها را برای کمک به دانشمندان داده ارائه می دهد. در این دوره ، بن سالینز با به اشتراک گذاشتن یک سری نکات و ترفندها برای انجام کارهای علم داده در این بستر قدرتمند ، به شما کمک می کند تا با Hadoop سرعت بیشتری کسب کنید. او ابتدا با بررسی نحوه کار با داده های Hadoop در HDFS شروع می کند و سپس با استفاده از Hive - موتور Hadoop SQL - که در آنجا کارهای علمی زیادی انجام می شود ، کاوش می کند. برای جمع بندی دوره ، بن روشهای اجرای سریع پرس و جوها را در موتور Hive پوشش می دهد.
موضوعات شامل:
  • توضیح دهید که از دستوراتی برای ایجاد تغییر در HDFS استفاده می شود.
  • دستوراتی را که برای بارگذاری داده ها از خط فرمان به HDFS استفاده می شود ، شناسایی کنید.
  • دو عملیاتی که HDFS هنگام انتقال کاربر توسط کاربر انجام می دهد را تشخیص دهید.
  • خلاصه نحوه حذف پرونده ها به صورت بازگشتی به صورت HDFS.
  • نحوه انتخاب و اجرای پارتیشن ها را بخاطر بسپارید.
  • نحوه صاف کردن نوع داده Strukt در HiveQL را توضیح دهید.

سرفصل ها و درس ها

مقدمه Introduction

  • خوش آمدی Welcome

  • آنچه باید بدانید What you should know

  • فایل های تمرینی Exercise files

  • تنظیم محیط Environment setup

1. کار با پرونده ها 1. Working with Files

  • فایل ها را با HDFS سازماندهی کنید Organize files in HDFS

  • پرونده ها را در HDFS بارگذاری کنید Upload files to HDFS

  • انتقال پرونده ها در HDFS Move files in HDFS

  • پرونده ها را با HDFS حذف کنید Remove files in HDFS

2. اتصال به Hadoop 2. Connecting to Hadoop

  • Hive را از طریق Beeline کاوش کنید Explore Hive through Beeline

  • دسترسی به کندو از پایتون Access Hive from Python

  • در Hive مصالح ایجاد کنید Create aggregates in Hive

  • پارتیشن ها را در Hive انتخاب کنید Select partitions in Hive

3. ساختار داده های پیچیده در کندو 3. Complex Data Structures in Hive

  • داده های نقشه در Hive Map data in Hive

  • آرایه ها در کندو Arrays in Hive

  • سازه در کندو Structs in Hive

  • جداول مسطح برای Impala ایجاد کنید Create flat tables for Impala

  • ساختار نمایش داده شد Deconstruct Impala queries

نتیجه Conclusion

  • مراحل بعدی Next steps

نمایش نظرات

نظری ارسال نشده است.

آموزش Hadoop برای نکات ، ترفندها و روشهای علوم داده
خرید اشتراک و دانلود خرید تکی و دانلود | 160,000 تومان (5 روز مهلت دانلود) زمان تقریبی آماده سازی لینک دانلود این دوره آموزشی حدود 5 تا 24 ساعت می باشد.
جزییات دوره
1h 12m
18
Linkedin (لینکدین) lynda-small
27 تیر 1396 (آخرین آپدیت رو دریافت می‌کنید، حتی اگر این تاریخ بروز نباشد.)
35,455
- از 5
ندارد
دارد
دارد
Ben Sullins

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Ben Sullins Ben Sullins

کمک به پیشرفت شغلی خود در داده ها

Linkedin (لینکدین)

لینکدین: شبکه اجتماعی حرفه‌ای برای ارتباط و کارآفرینی

لینکدین به عنوان یکی از بزرگترین شبکه‌های اجتماعی حرفه‌ای، به میلیون‌ها افراد در سراسر جهان این امکان را می‌دهد تا ارتباط برقرار کنند، اطلاعات حرفه‌ای خود را به اشتراک بگذارند و فرصت‌های شغلی را کشف کنند. این شبکه اجتماعی به کاربران امکان می‌دهد تا رزومه حرفه‌ای خود را آپدیت کنند، با همکاران، دوستان و همکاران آینده ارتباط برقرار کنند، به انجمن‌ها و گروه‌های حرفه‌ای ملحق شوند و از مقالات و مطالب مرتبط با حوزه کاری خود بهره‌مند شوند.

لینکدین همچنین به کارفرمایان امکان می‌دهد تا به دنبال نیروهای با تجربه و مهارت مورد نیاز خود بگردند و ارتباط برقرار کنند. این شبکه حرفه‌ای به عنوان یک پلتفرم کلیدی برای بهبود دسترسی به فرصت‌های شغلی و گسترش شبکه حرفه‌ای خود، نقش مهمی را ایفا می‌کند. از این رو، لینکدین به عنوان یکی از مهمترین ابزارهای کارآفرینی و توسعه حرفه‌ای در دنیای امروز مورد توجه قرار دارد.