دسترسی سریع:

مسیر:

صفحه اصلی

لطفا جهت اطلاع از آخرین دوره ها و اخبار سایت در کانال تلگرام عضو شوید.

آموزش مبانی کلان‌داده: موتورهای پرس‌وجو و تحلیل داده‌ها - آخرین آپدیت

دانلود Big Data Foundations: Query Engines and Analytics

نکته: ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.

نمونه ویدیوها: (صرفا برای مشاهده نمونه ویدیو، ممکن هست نیاز به شکن داشته باشید.)

توضیحات دوره: پلتفرم‌های داده مدرن برای پردازش بهینه مجموعه‌داده‌های عظیم به موتورهای پرس‌وجوی توزیع‌شده متکی هستند. درک نحوه خواندن داده‌ها، برنامه‌ریزی پرس‌وجوها و اجرای موازی وظایف توسط این موتورها، برای طراحی تحلیل‌های سریع و مقرون‌به‌صرفه ضروری است. در دوره «مبانی کلان‌داده: موتورهای پرس‌وجو و تحلیل داده‌ها»، شما توانایی تحلیل و تبیین نحوه عملکرد داخلی موتورهای پرس‌وجوی مدرن را کسب خواهید کرد. در ابتدا، نحوه دسترسی موتورهای پرس‌وجوی توزیع‌شده به داده‌های ذخیره شده در Object Storage، فرمت‌های جدول و سیستم‌های فایل توزیع‌شده را بررسی می‌کنید و می‌آموزید که چگونه طرح‌های منطقی و فیزیکی برای اجرای SQL در مقیاس بالا ساخته می‌شوند. سپس، با مدل‌های اصلی اجرا و تکنیک‌های بهینه‌سازی مانند Predicate Pushdown، حذف پارتیشن‌ها (Partition Pruning)، حذف ستون‌ها (Column Pruning)، کشینگ و اجرای تطبیقی (Adaptive Execution) همراه با دموهای عملی Spark SQL آشنا خواهید شد. در نهایت، یاد می‌گیرید که تحلیلگران چگونه با استفاده از رابط‌های SQL، نوت‌بوک‌ها، ابزارهای BI، لایه‌های معنایی (Semantic Layers) و کاتالوگ‌های متاداده به داده‌های حجیم دسترسی پیدا کرده و آن‌ها را تحلیل می‌کنند و توازن بین عملکرد، هزینه و هم‌روندی (Concurrency) را درک خواهید کرد. پس از اتمام این دوره، دانش بنیادی مورد نیاز برای کار با موتورهای پرس‌وجوی کلان‌داده و تحلیل‌ها را خواهید داشت تا بتوانید با اعتمادبه‌نفس در محیط‌های مدرن Data Lake، Data Warehouse و Lakehouse فعالیت کنید.

سرفصل ها و درس ها

درک نحوه فعال‌سازی تحلیل‌ها در کلان‌داده توسط موتورهای پرس‌وجوی توزیع‌شده Understand How Distributed Query Engines Enable Analytics with Big Data

چرا موتورهای پرس‌وجوی توزیع‌شده وجود دارند؟ Why Distributed Query Engines Exist
نحوه دسترسی موتورهای پرس‌وجو به داده‌ها در دریاچه‌ها و سیستم‌های ذخیره‌سازی How Query Engines Access Data in Lakes and Storage Systems
کالبدشکافی یک پرس‌وجو: طرح‌های منطقی، طرح‌های فیزیکی و بهینه‌سازی Inside a Query: Logical Plans, Physical Plans, and Optimization
اجرای موازی و هماهنگی Workerها Parallel Execution and Worker Coordination

مقایسه مدل‌های اصلی اجرا و استراتژی‌های بهینه‌سازی در تحلیل کلان‌داده Compare Major Execution Models and Optimization Strategies Used in Big Data Analytics

الگوهای پرس‌وجوی تعاملی، دسته‌ای (Batch) و فدراسیون Interactive, Batch, and Federated Query Patterns
تکنیک‌های بهینه‌ساز: Predicate Pushdown، حذف ستون‌ها و پرش از داده‌ها Optimizer Techniques: Predicate Pushdown, Column Pruning, and Data Skipping
چیدمان داده‌ها: پارتیشن‌بندی، ذخیره‌سازی ستونی و سازماندهی فایل‌ها Data Layout: Partitioning, Columnar Storage, and File Organization
اجرای تطبیقی، کشینگ و بهره‌وری منابع Adaptive Execution, Caching, and Resource Efficiency

درک نحوه دسترسی، تحلیل و بصری‌سازی کلان‌داده‌ها از طریق ابزارهای تحلیلی مدرن Understand How Users Access, Analyze, and Visualize Big Data through Modern Analytical Tools

رابط‌های SQL، نوت‌بوک‌ها و ابزارهای BI: کاربران چگونه پرس‌وجو می‌کنند؟ SQL Interfaces, Notebooks, and BI Tools: How Users Run Queries
پرس‌وجوی داده‌ها در Lakeها، Warehouseها و Lakehouseها Querying Data in Lakes, Warehouses, and Lakehouses
لایه‌های معنایی، کاتالوگ‌های متاداده و حاکمیت داده‌ها Semantic Layers, Metadata Catalogs, and Governance
ملاحظات عملکرد، هزینه و هم‌روندی در مقیاس بالا Performance, Cost, and Concurrency Considerations at Scale

برای ارسال نظر ثبت نام کنید.

نمایش نظرات

آموزش مبانی کلان‌داده: موتورهای پرس‌وجو و تحلیل داده‌ها

جزییات دوره

زمان دوره: 46m

تعداد ویدیو ها: 12

شرکت: Pluralsight (پلورال سایت)

تاریخ انتشار مرجع: (آخرین آپدیت)

بازدید مرجع : 1

امتیاز مرجع: از 5

فایل تمرین: دارد

زیرنویس زبان اصلی: دارد

زیرنویس فارسی: (توسط هوش مصنوعی) دارد

مدرس: Harsh Karna

لینک کوتاه این دوره

https://donyad.com/d/c1bb4b

جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

نرم افزارهای مورد نیاز

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Harsh Karna

Harsh یک مهندس نرم افزار ماهر با بیش از 4 سال تجربه در مهندسی داده ها و توسعه نرم افزار است. او در فن آوری های داده های بزرگ مانند Hadoop ، Spark و SQL به همراه سیستم عامل های ابری مانند AWS و Azure تخصص زیادی دارد ، جایی که او ETL قوی و چارچوب های داده را بر روی سیستم عامل هایی مانند Snowflake و Databricks ساخته است. در زبانهای برنامه نویسی مانند پایتون ، SQL و جاوا مهارت دارد ، Harsh همچنین در چارچوب های Django و Flask تجربه دارد. کار وی شامل طراحی و اجرای خطوط لوله داده ، دریاچه های داده و انبارهای داده است. HARSH با سابقه ای در علوم داده ، یادگیری ماشین و آمار ، به پروژه های متنوعی از جمله پردازش زبان طبیعی و دید رایانه کمک کرده است. او به عنوان یک فریلنسر ، پروژه هایی را در مهندسی داده ها ، داده های بزرگ ، محاسبات ابری ، تجزیه و تحلیل داده ها و ژنرال هوش مصنوعی مقابله می کند. در خارج از کار ، سخت عاشق مسافرت ، یادگیری در مورد فرهنگ های جدید و ملاقات با مردم از سراسر جهان است. او مربیگری رایگان را به دانشجویان و افراد متقاضی شغل ارائه می دهد و به آنها کمک می کند تا در صنعت فناوری حرکت کنند.

Big data کلان‌داده (Big Data)

آموزش مبانی کلان‌داده: موتورهای پرس‌وجو و تحلیل داده‌ها - آخرین آپدیت

دانلود Big Data Foundations: Query Engines and Analytics

درک نحوه فعال‌سازی تحلیل‌ها در کلان‌داده توسط موتورهای پرس‌وجوی توزیع‌شده Understand How Distributed Query Engines Enable Analytics with Big Data

چرا موتورهای پرس‌وجوی توزیع‌شده وجود دارند؟ Why Distributed Query Engines Exist

نحوه دسترسی موتورهای پرس‌وجو به داده‌ها در دریاچه‌ها و سیستم‌های ذخیره‌سازی How Query Engines Access Data in Lakes and Storage Systems

کالبدشکافی یک پرس‌وجو: طرح‌های منطقی، طرح‌های فیزیکی و بهینه‌سازی Inside a Query: Logical Plans, Physical Plans, and Optimization

اجرای موازی و هماهنگی Workerها Parallel Execution and Worker Coordination

مقایسه مدل‌های اصلی اجرا و استراتژی‌های بهینه‌سازی در تحلیل کلان‌داده Compare Major Execution Models and Optimization Strategies Used in Big Data Analytics

الگوهای پرس‌وجوی تعاملی، دسته‌ای (Batch) و فدراسیون Interactive, Batch, and Federated Query Patterns

تکنیک‌های بهینه‌ساز: Predicate Pushdown، حذف ستون‌ها و پرش از داده‌ها Optimizer Techniques: Predicate Pushdown, Column Pruning, and Data Skipping

چیدمان داده‌ها: پارتیشن‌بندی، ذخیره‌سازی ستونی و سازماندهی فایل‌ها Data Layout: Partitioning, Columnar Storage, and File Organization

اجرای تطبیقی، کشینگ و بهره‌وری منابع Adaptive Execution, Caching, and Resource Efficiency

درک نحوه دسترسی، تحلیل و بصری‌سازی کلان‌داده‌ها از طریق ابزارهای تحلیلی مدرن Understand How Users Access, Analyze, and Visualize Big Data through Modern Analytical Tools

رابط‌های SQL، نوت‌بوک‌ها و ابزارهای BI: کاربران چگونه پرس‌وجو می‌کنند؟ SQL Interfaces, Notebooks, and BI Tools: How Users Run Queries

پرس‌وجوی داده‌ها در Lakeها، Warehouseها و Lakehouseها Querying Data in Lakes, Warehouses, and Lakehouses

لایه‌های معنایی، کاتالوگ‌های متاداده و حاکمیت داده‌ها Semantic Layers, Metadata Catalogs, and Governance

ملاحظات عملکرد، هزینه و هم‌روندی در مقیاس بالا Performance, Cost, and Concurrency Considerations at Scale

نمایش نظرات

https://donyad.com/d/c1bb4b