لطفا جهت اطلاع از آخرین دوره ها و اخبار سایت در
کانال تلگرام
عضو شوید.
آموزش دستکاری دادهها در مقیاس بزرگ: سیستمها و الگوریتمها
- آخرین آپدیت
دانلود Data Manipulation at Scale: Systems and Algorithms
نکته:
ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.
نمونه ویدیوها:
توضیحات دوره:
تحلیل دادهها جایگزین جمعآوری دادهها به عنوان گلوگاه تصمیمگیری مبتنی بر شواهد شده است؛ ما در میان حجم عظیمی از دادهها غرق شدهایم. استخراج دانش از مجموعهدادههای بزرگ، ناهمگون و نویزدار، نه تنها به منابع محاسباتی قدرتمند، بلکه به انتزاعهای برنامهنویسی برای استفاده موثر از آنها نیاز دارد. انتزاعهایی که در دهه گذشته ظهور کردند، ایدههایی از پایگاههای داده موازی، سیستمهای توزیعشده و زبانهای برنامهنویسی را ترکیب کردهاند تا کلاس جدیدی از پلتفرمهای تحلیل دادههای مقیاسپذیر ایجاد کنند که زیربنای علم داده در مقیاسهای واقعی را تشکیل میدهند.
در این دوره، شما با چشمانداز سیستمهای مرتبط، اصولی که بر آنها استوار هستند، نقاط قوت و ضعف آنها و نحوه ارزیابی کاربردشان در برابر نیازهای خود آشنا خواهید شد. خواهید آموخت که چگونه سیستمهای کاربردی از مرزهای تحقیقات علوم کامپیوتر مشتق شدهاند و چه سیستمهایی در افق پیش رو هستند. مباحثی چون رایانش ابری، پایگاههای داده SQL و NoSQL، MapReduce و اکوسیستم ایجاد شده توسط آن، Spark و همترازان آن، و سیستمهای تخصصی برای گرافها و آرایهها پوشش داده خواهند شد.
همچنین تاریخچه و زمینه علم داده، مهارتها، چالشها و متدولوژیهایی که این اصطلاح به آنها اشاره دارد و نحوه ساختاردهی به یک پروژه علم داده را خواهید آموخت. در پایان این دوره، شما قادر خواهید بود:
اهداف یادگیری:
1. توصیف الگوهای رایج، چالشها و رویکردهای مرتبط با پروژههای علم داده و تفاوت آنها با پروژههای حوزههای مرتبط.
2. شناسایی و استفاده از مدلهای برنامهنویسی مرتبط با دستکاری مقیاسپذیر دادهها، شامل جبر رابطهای، MapReduce و سایر مدلهای جریان داده.
3. استفاده از فناوریهای پایگاه داده تطبیقیافته برای تحلیلهای مقیاس بزرگ، شامل مفاهیم پیشران پایگاههای داده موازی، پردازش موازی پرسوجوها و تحلیلهای درون-پایگاهداده.
4. ارزیابی ذخیرهسازهای کلید-مقدار (Key-Value) و سیستمهای NoSQL، توصیف نقاط قوت و ضعف آنها در مقایسه با سیستمهای مشابه و بررسی روندهای آینده.
5. تفکر به سبک MapReduce برای نوشتن موثر الگوریتمها در سیستمهایی مانند Hadoop و Spark؛ درک محدودیتها، جزئیات طراحی، رابطه آنها با پایگاههای داده و اکوسیستم الگوریتمها، افزونهها و زبانهای مرتبط و نوشتن برنامهها در Spark.
6. توصیف چشمانداز سیستمهای تخصصی دادههای بزرگ (Big Data) برای گرافها، آرایهها و جریانها.
سرفصل ها و درس ها
زمینه و مفاهیم علم داده
Data Science Context and Concepts
ایجاد انگیزه: سیاست
Appetite Whetting: Politics
ایجاد انگیزه: آب و هوای شدید
Appetite Whetting: Extreme Weather
ایجاد انگیزه: علوم انسانی دیجیتال
Appetite Whetting: Digital Humanities
ایجاد انگیزه: کتابسنجی
Appetite Whetting: Bibliometrics
ایجاد انگیزه: غذا، موسیقی، بهداشت عمومی
Appetite Whetting: Food, Music, Public Health
ایجاد انگیزه: ادامه بهداشت عمومی، زلزلهها، حقوقی
Appetite Whetting: Public Health cont'd, Earthquakes, Legal
ویژگیهای علم داده
Characterizing Data Science
ویژگیهای علم داده (ادامه)
Characterizing Data Science, cont'd
تمایز علم داده از موضوعات مرتبط
Distinguishing Data Science from Related Topics
چهار بعد علم داده
Four Dimensions of Data Science
ابزارها در مقابل انتزاعها
Tools vs. Abstractions
مقیاس دسکتاپ در مقابل مقیاس ابری
Desktop Scale vs. Cloud Scale
هکرها در مقابل تحلیلگران
Hackers vs. Analysts
ساختارها در مقابل آمار
Structs vs. Stats
ساختارها در مقابل آمار (ادامه)
Structs vs. Stats cont'd
پارادایم چهارم علم
A Fourth Paradigm of Science
مثالهای علم دادهمحور
Data-Intensive Science Examples
دادههای بزرگ و 3V
Big Data and the 3 Vs
تعاریف دادههای بزرگ
Big Data Definitions
منابع دادههای بزرگ
Big Data Sources
تدارکات دوره
Course Logistics
تمرین توییتر: شروع به کار
Twitter Assignment: Getting Started
پایگاههای داده رابطهای و جبر رابطهای
Relational Databases and the Relational Algebra
مدلهای داده و اصطلاحات
Data Models, Terminology
از مدلهای داده به پایگاههای داده
From Data Models to Databases
پایگاههای داده پیش از رابطهای
Pre-Relational Databases
ضرورت پایگاههای داده رابطهای
Motivating Relational Databases
پایگاههای داده رابطهای: ایدههای کلیدی
Relational Databases: Key Ideas
مروری بر بهینهسازی جبری
Algebraic Optimization Overview
نمایش نظرات