"Hadoop یک چارچوب پردازش توزیع شده منبع باز است که پردازش و ذخیره سازی داده ها را برای برنامه های کاربردی کلان داده که در سیستم های خوشه ای اجرا می شوند، مدیریت می کند. این است ...."
پردازش میلیاردها رکورد به درک عمیقی از محاسبات توزیع شده نیاز دارد. در این دوره ، شما با Hadoop آشنا خواهید شد ، یک چارچوب محاسباتی توزیع شده منبع باز که می تواند به شما در انجام این کار کمک کند.
یادگیری کار با سیستم پرونده توزیع شده Hadoop (HDFS) یک مهارت پایه برای هر کسی است که اکوسیستم Hadoop را مدیریت یا توسعه می دهد. در این دوره نحوه کار با HDFS ، Hive ، Pig ، Sqoop و HBase را از خط فرمان فرا خواهید گرفت.