Cloudera یکی از فروشندگان پیشرو برای توزیع های مربوط به Hadoop و Spark است. به عنوان بخشی از این راهنمای عملی، مراحل راه اندازی Hadoop و Spark Cluster با استفاده از CDH را گام به گام یاد خواهید گرفت.
نصب - نشان دادن درک درستی از فرآیند نصب برای پروژههای Cloudera Manager، CDH و اکوسیستم.
یک مخزن CDH محلی راه اندازی کنید
پیکربندی در سطح سیستم عامل را برای نصب Hadoop انجام دهید
سرور و عوامل Cloudera Manager را نصب کنید
CDH را با استفاده از Cloudera Manager نصب کنید
یک گره جدید به یک خوشه موجود اضافه کنید
یک سرویس با استفاده از مدیر کلودرا اضافه کنید
پیکربندی - انجام پیکربندی اولیه و پیشرفته مورد نیاز برای مدیریت موثر خوشه Hadoop
یک سرویس را با استفاده از Cloudera Manager پیکربندی کنید
یک فهرست راهنمای کاربر HDFS ایجاد کنید
NameNode HA را پیکربندی کنید
ResourceManager HA
را پیکربندی کنیدپراکسی را برای Hiveserver2/Impala پیکربندی کنید
مدیریت - نگهداری و اصلاح خوشه برای پشتیبانی از عملیات روزانه در شرکت
تعادل مجدد خوشه
هشدار برای پر شدن بیش از حد دیسک تنظیم کنید
یک اسکریپت توپولوژی رک را تعریف و نصب کنید
نوع جدیدی از کتابخانه فشرده سازی ورودی/خروجی را در کلاستر نصب کنید
تخصیص منابع YARN را بر اساس بازخورد کاربر اصلاح کنید
یک گره را راه اندازی/از رده خارج کنید
امن - خدمات مربوطه را فعال کنید و خوشه را برای دستیابی به اهداف تعریف شده توسط خط مشی امنیتی پیکربندی کنید. دانش شیوه های امنیتی اولیه
را نشان دهیدپیکربندی HDFS ACL
Sentry را نصب و پیکربندی کنید
مجوز و احراز هویت کاربر Hue را پیکربندی کنید
فعال کردن/پیکربندی ویرایش گزارش و پرس و جو
مناطق رمزگذاری شده در HDFS ایجاد کنید
تست - معیارهای سنجش عملیاتی خوشه، آزمایش پیکربندی سیستم برای عملکرد و کارایی
دستورات سیستم فایل را از طریق HTTPFS اجرا کنید
کپی کارآمد داده ها در یک خوشه/بین خوشه ها
یک عکس فوری از یک فهرست HDFS ایجاد/بازیابی کنید
دریافت/تنظیم ACLها برای ساختار فایل یا دایرکتوری
خوشه را محک بزنید (I/O، CPU، شبکه)
عیبیابی - نشان دادن توانایی یافتن علت اصلی یک مشکل، بهینهسازی اجرای ناکارآمد، و حل سناریوهای اختلاف منابع
خطاها/هشدارها را در Cloudera Manager حل کنید
مشکلات/خطاهای عملکرد در عملکرد خوشه را حل کنید
دلیل شکست برنامه را مشخص کنید
Fair Scheduler را برای رفع تأخیرهای برنامه پیکربندی کنید
رویکرد ما
شما با ایجاد Cloudera QuickStart VM شروع خواهید کرد (در صورتی که لپ تاپ با 16 گیگابایت رم با چهار هسته دارید). این به شما کمک میکند تا با Cloudera Manager راحت باشید.
تا زمانی که پیشنهاد ادامه دارد، میتوانید برای GCP ثبتنام کنید و اعتباری تا سقف 300 دلار دریافت کنید. اعتبارات تا سال اعتبار دارند.
سپس مروری مختصر درباره GCP و ارائه 7 تا 8 ماشین مجازی با استفاده از الگوها را خواهید فهمید. همچنین هارد اکسترنال را برای پیکربندی HDFS بعداً وصل خواهید کرد.
هنگامی که سرورها تهیه شدند، پیش بروید و Ansible را برای اتوماسیون سرور راه اندازی کنید.
شما از مخزن محلی Cloudera Manager و Cloudera Distribution Hadoop با استفاده از بسته ها مراقبت خواهید کرد.
سپس مدیر کلودرا را با پایگاه داده سفارشی و سپس با استفاده از Wizard که به عنوان بخشی از مدیر کلودرا ارائه می شود، Cloudera Distribution of Hadoop را راه اندازی می کنید.
به عنوان بخشی از راهاندازی Cloudera Distribution Hadoop، HDFS را راهاندازی میکنید، فرمانهای HDFS، Setup YARN، پیکربندی HDFS و YARN در دسترس بودن بالا، آشنایی با Schedulers، Setup Spark، Transition to Parcels، Setup Hive and Impala، Setup HBase و کافکا و غیره.
مشاور فناوری و Evangelist 13 سال تجربه در اجرای پروژه های پیچیده با استفاده از مجموعه گسترده ای از فناوری ها از جمله Big Data و Cloud. Iversity، llc - یک شرکت مستقر در ایالات متحده برای ارائه آموزش با کیفیت برای متخصصان فناوری اطلاعات و کارکنان و همچنین راه حل های مشاوره ای برای مشتریان سازمانی ، پیدا کردم. من هزاران نفر از متخصصان فناوری اطلاعات را در زمینه فن آوری های زیادی از جمله Big Data و Cloud آموزش داده ام. ایجاد حرفه ای فناوری اطلاعات برای افراد و ارائه خدمات با کیفیت به مشتریان از اهمیت بالاتری در سازمان ما برخوردار است. به عنوان یک استراتژی ورود ، ارائه آموزش با کیفیت در زمینه های ABCD خواهد بود * توسعه برنامه * داده های بزرگ و هوش تجاری * ابر * پایگاه داده ، پایگاه داده
Asasri ManthenaSathvika Dandu
Pratik Kumar
Madhuri Gadiraju
Sai Varma
Phani Bhushan Bozzam
نمایش نظرات