آموزش مبانی 빅 دیتا: موتورهای پرس‌وجو و تحلیل داده‌ها - آخرین آپدیت

دانلود Big Data Foundations: Query Engines and Analytics

نکته: ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.
نمونه ویدیوها:
توضیحات دوره: پلتفرم‌های داده مدرن برای پردازش بهینه مجموعه‌داده‌های عظیم، به موتورهای پرس‌وجوی توزیع‌شده متکی هستند. درک نحوه خواندن داده‌ها، برنامه‌ریزی پرس‌وجوها و اجرای موازی وظایف توسط این موتورها، برای طراحی تحلیل‌های سریع و مقرون‌به‌صرفه ضروری است. در دوره «مبانی 빅 دیتا: موتورهای پرس‌وجو و تحلیل داده‌ها»، شما توانایی تحلیل و استدلال درباره نحوه عملکرد داخلی موتورهای پرس‌وجوی مدرن را کسب خواهید کرد. در ابتدا، نحوه دسترسی موتورهای پرس‌وجوی توزیع‌شده به داده‌های ذخیره‌شده در Object Storage، فرمت‌های جدول و سیستم‌های فایل توزیع‌شده را بررسی می‌کنید و می‌آموزید که چگونه طرح‌های منطقی (Logical Plans) و فیزیکی (Physical Plans) برای اجرای SQL در مقیاس بزرگ ساخته می‌شوند. سپس، مدل‌های اصلی اجرا و تکنیک‌های بهینه‌سازی مانند Predicate Pushdown، حذف پارتیشن (Partition Pruning)، حذف ستون (Column Pruning)، کشینگ (Caching) و اجرای تطبیقی را همراه با دموهای عملی Spark SQL خواهید شناخت. در نهایت، می‌آموزید که تحلیل‌گران چگونه از طریق رابط‌های SQL، نوت‌بوک‌ها، ابزارهای BI، لایه‌های معنایی (Semantic Layers) و کاتالوگ‌های متادیتا به داده‌های حجیم دسترسی پیدا کرده و آن‌ها را تحلیل می‌کنند و توازن بین عملکرد، هزینه و همزمانی (Concurrency) را درک خواهید کرد. پس از اتمام این دوره، دانش بنیادی لازم در زمینه موتورهای پرس‌وجوی 빅 دیتا و تحلیل داده‌ها را خواهید داشت تا بتوانید با اطمینان در محیط‌های مدرن Data Lake، Data Warehouse و Lakehouse فعالیت کنید.

سرفصل ها و درس ها

درک نحوه فعال‌سازی تحلیل داده‌ها با موتورهای پرس‌وجوی توزیع‌شده در 빅 دیتا Understand How Distributed Query Engines Enable Analytics with Big Data

  • چرا موتورهای پرس‌وجوی توزیع‌شده وجود دارند؟ Why Distributed Query Engines Exist

  • نحوه دسترسی موتورهای پرس‌وجو به داده‌ها در Lakeها و سیستم‌های ذخیره‌سازی How Query Engines Access Data in Lakes and Storage Systems

  • کالبدشکافی یک پرس‌وجو: طرح‌های منطقی، طرح‌های فیزیکی و بهینه‌سازی Inside a Query: Logical Plans, Physical Plans, and Optimization

  • اجرای موازی و هماهنگی Workerها Parallel Execution and Worker Coordination

مقایسه مدل‌های اصلی اجرا و استراتژی‌های بهینه‌سازی در تحلیل 빅 دیتا Compare Major Execution Models and Optimization Strategies Used in Big Data Analytics

  • الگوهای پرس‌وجوی تعاملی، دسته‌ای (Batch) و فدرال Interactive, Batch, and Federated Query Patterns

  • تکنیک‌های بهینه‌ساز: Predicate Pushdown، حذف ستون و پرش از داده‌ها Optimizer Techniques: Predicate Pushdown, Column Pruning, and Data Skipping

  • چیدمان داده‌ها: پارتیشن‌بندی، ذخیره‌سازی ستونی و سازماندهی فایل‌ها Data Layout: Partitioning, Columnar Storage, and File Organization

  • اجرای تطبیقی، کشینگ و بهره‌وری منابع Adaptive Execution, Caching, and Resource Efficiency

درک نحوه دسترسی، تحلیل و بصری‌سازی 빅 دیتا از طریق ابزارهای تحلیلی مدرن Understand How Users Access, Analyze, and Visualize Big Data through Modern Analytical Tools

  • رابط‌های SQL، نوت‌بوک‌ها و ابزارهای BI: کاربران چگونه پرس‌وجو می‌کنند؟ SQL Interfaces, Notebooks, and BI Tools: How Users Run Queries

  • پرس‌وجوی داده‌ها در Lakeها، Warehouseها و Lakehouseها Querying Data in Lakes, Warehouses, and Lakehouses

  • لایه‌های معنایی، کاتالوگ‌های متادیتا و حاکمیت داده‌ها Semantic Layers, Metadata Catalogs, and Governance

  • ملاحظات مربوط به عملکرد، هزینه و همزمانی در مقیاس بزرگ Performance, Cost, and Concurrency Considerations at Scale

نمایش نظرات

آموزش مبانی 빅 دیتا: موتورهای پرس‌وجو و تحلیل داده‌ها
جزییات دوره
46m
12
(آخرین آپدیت)
1
از 5
دارد
دارد
دارد
Harsh Karna
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Harsh Karna Harsh Karna

Harsh یک مهندس نرم افزار ماهر با بیش از 4 سال تجربه در مهندسی داده ها و توسعه نرم افزار است. او در فن آوری های داده های بزرگ مانند Hadoop ، Spark و SQL به همراه سیستم عامل های ابری مانند AWS و Azure تخصص زیادی دارد ، جایی که او ETL قوی و چارچوب های داده را بر روی سیستم عامل هایی مانند Snowflake و Databricks ساخته است. در زبانهای برنامه نویسی مانند پایتون ، SQL و جاوا مهارت دارد ، Harsh همچنین در چارچوب های Django و Flask تجربه دارد. کار وی شامل طراحی و اجرای خطوط لوله داده ، دریاچه های داده و انبارهای داده است. HARSH با سابقه ای در علوم داده ، یادگیری ماشین و آمار ، به پروژه های متنوعی از جمله پردازش زبان طبیعی و دید رایانه کمک کرده است. او به عنوان یک فریلنسر ، پروژه هایی را در مهندسی داده ها ، داده های بزرگ ، محاسبات ابری ، تجزیه و تحلیل داده ها و ژنرال هوش مصنوعی مقابله می کند. در خارج از کار ، سخت عاشق مسافرت ، یادگیری در مورد فرهنگ های جدید و ملاقات با مردم از سراسر جهان است. او مربیگری رایگان را به دانشجویان و افراد متقاضی شغل ارائه می دهد و به آنها کمک می کند تا در صنعت فناوری حرکت کنند.