آموزش مبانی کلان‌داده: موتورهای پرس‌وجو و تحلیل داده‌ها - آخرین آپدیت

دانلود Big Data Foundations: Query Engines and Analytics

نکته: ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.
نمونه ویدیوها:
توضیحات دوره: پلتفرم‌های داده مدرن برای پردازش بهینه مجموعه‌داده‌های عظیم به موتورهای پرس‌وجوی توزیع‌شده متکی هستند. درک نحوه خواندن داده‌ها، برنامه‌ریزی پرس‌وجوها و اجرای موازی وظایف توسط این موتورها، برای طراحی تحلیل‌های سریع و مقرون‌به‌صرفه ضروری است. در دوره «مبانی کلان‌داده: موتورهای پرس‌وجو و تحلیل داده‌ها»، شما توانایی تحلیل و تبیین نحوه عملکرد داخلی موتورهای پرس‌وجوی مدرن را کسب خواهید کرد. در ابتدا، نحوه دسترسی موتورهای پرس‌وجوی توزیع‌شده به داده‌های ذخیره شده در Object Storage، فرمت‌های جدول و سیستم‌های فایل توزیع‌شده را بررسی می‌کنید و می‌آموزید که چگونه طرح‌های منطقی و فیزیکی برای اجرای SQL در مقیاس بالا ساخته می‌شوند. سپس، با مدل‌های اصلی اجرا و تکنیک‌های بهینه‌سازی مانند Predicate Pushdown، حذف پارتیشن‌ها (Partition Pruning)، حذف ستون‌ها (Column Pruning)، کشینگ و اجرای تطبیقی (Adaptive Execution) همراه با دموهای عملی Spark SQL آشنا خواهید شد. در نهایت، یاد می‌گیرید که تحلیلگران چگونه با استفاده از رابط‌های SQL، نوت‌بوک‌ها، ابزارهای BI، لایه‌های معنایی (Semantic Layers) و کاتالوگ‌های متاداده به داده‌های حجیم دسترسی پیدا کرده و آن‌ها را تحلیل می‌کنند و توازن بین عملکرد، هزینه و هم‌روندی (Concurrency) را درک خواهید کرد. پس از اتمام این دوره، دانش بنیادی مورد نیاز برای کار با موتورهای پرس‌وجوی کلان‌داده و تحلیل‌ها را خواهید داشت تا بتوانید با اعتمادبه‌نفس در محیط‌های مدرن Data Lake، Data Warehouse و Lakehouse فعالیت کنید.

سرفصل ها و درس ها

درک نحوه فعال‌سازی تحلیل‌ها در کلان‌داده توسط موتورهای پرس‌وجوی توزیع‌شده Understand How Distributed Query Engines Enable Analytics with Big Data

  • چرا موتورهای پرس‌وجوی توزیع‌شده وجود دارند؟ Why Distributed Query Engines Exist

  • نحوه دسترسی موتورهای پرس‌وجو به داده‌ها در دریاچه‌ها و سیستم‌های ذخیره‌سازی How Query Engines Access Data in Lakes and Storage Systems

  • کالبدشکافی یک پرس‌وجو: طرح‌های منطقی، طرح‌های فیزیکی و بهینه‌سازی Inside a Query: Logical Plans, Physical Plans, and Optimization

  • اجرای موازی و هماهنگی Workerها Parallel Execution and Worker Coordination

مقایسه مدل‌های اصلی اجرا و استراتژی‌های بهینه‌سازی در تحلیل کلان‌داده Compare Major Execution Models and Optimization Strategies Used in Big Data Analytics

  • الگوهای پرس‌وجوی تعاملی، دسته‌ای (Batch) و فدراسیون Interactive, Batch, and Federated Query Patterns

  • تکنیک‌های بهینه‌ساز: Predicate Pushdown، حذف ستون‌ها و پرش از داده‌ها Optimizer Techniques: Predicate Pushdown, Column Pruning, and Data Skipping

  • چیدمان داده‌ها: پارتیشن‌بندی، ذخیره‌سازی ستونی و سازماندهی فایل‌ها Data Layout: Partitioning, Columnar Storage, and File Organization

  • اجرای تطبیقی، کشینگ و بهره‌وری منابع Adaptive Execution, Caching, and Resource Efficiency

درک نحوه دسترسی، تحلیل و بصری‌سازی کلان‌داده‌ها از طریق ابزارهای تحلیلی مدرن Understand How Users Access, Analyze, and Visualize Big Data through Modern Analytical Tools

  • رابط‌های SQL، نوت‌بوک‌ها و ابزارهای BI: کاربران چگونه پرس‌وجو می‌کنند؟ SQL Interfaces, Notebooks, and BI Tools: How Users Run Queries

  • پرس‌وجوی داده‌ها در Lakeها، Warehouseها و Lakehouseها Querying Data in Lakes, Warehouses, and Lakehouses

  • لایه‌های معنایی، کاتالوگ‌های متاداده و حاکمیت داده‌ها Semantic Layers, Metadata Catalogs, and Governance

  • ملاحظات عملکرد، هزینه و هم‌روندی در مقیاس بالا Performance, Cost, and Concurrency Considerations at Scale

نمایش نظرات

آموزش مبانی کلان‌داده: موتورهای پرس‌وجو و تحلیل داده‌ها
جزییات دوره
46m
12
(آخرین آپدیت)
1
از 5
دارد
دارد
دارد
Harsh Karna
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Harsh Karna Harsh Karna

Harsh یک مهندس نرم افزار ماهر با بیش از 4 سال تجربه در مهندسی داده ها و توسعه نرم افزار است. او در فن آوری های داده های بزرگ مانند Hadoop ، Spark و SQL به همراه سیستم عامل های ابری مانند AWS و Azure تخصص زیادی دارد ، جایی که او ETL قوی و چارچوب های داده را بر روی سیستم عامل هایی مانند Snowflake و Databricks ساخته است. در زبانهای برنامه نویسی مانند پایتون ، SQL و جاوا مهارت دارد ، Harsh همچنین در چارچوب های Django و Flask تجربه دارد. کار وی شامل طراحی و اجرای خطوط لوله داده ، دریاچه های داده و انبارهای داده است. HARSH با سابقه ای در علوم داده ، یادگیری ماشین و آمار ، به پروژه های متنوعی از جمله پردازش زبان طبیعی و دید رایانه کمک کرده است. او به عنوان یک فریلنسر ، پروژه هایی را در مهندسی داده ها ، داده های بزرگ ، محاسبات ابری ، تجزیه و تحلیل داده ها و ژنرال هوش مصنوعی مقابله می کند. در خارج از کار ، سخت عاشق مسافرت ، یادگیری در مورد فرهنگ های جدید و ملاقات با مردم از سراسر جهان است. او مربیگری رایگان را به دانشجویان و افراد متقاضی شغل ارائه می دهد و به آنها کمک می کند تا در صنعت فناوری حرکت کنند.