لطفا جهت اطلاع از آخرین دوره ها و اخبار سایت در
کانال تلگرام
عضو شوید.
آموزش تسلط بر یکپارچه سازی داده ها (ETL) با IBM DataStage
Mastering Data Integration (ETL) with IBM DataStage
نکته:
آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیوها:
توضیحات دوره:
قفل قدرت یکپارچه سازی داده ها (ETL): آموزش عملی با IBM DataStage (ETL) مبانی یکپارچه سازی داده ها: مفاهیم اصلی و انواع یکپارچه سازی داده ها را درک کنید و نمونه های واقعی را کشف کنید. پیمایش IBM Information Server: با اجزای IBM Information Server و نقش آن در یکپارچه سازی داده ها آشنا شوید. مدیریت سرور اطلاعات IBM: نحوه پیمایش در کنسول مدیریت سرور اطلاعات IBM و انجام وظایف ضروری اداری را یاد بگیرید. کاوش در IBM DataStage: در معماری IBM DataStage، اجزای کلیدی و کاربردهای عملی آن غوطه ور شوید. توسعه در IBM DataStage: به صورت عملی در DataStage کار کنید، پروژه ها را ایجاد کنید، انواع کارها را بررسی کنید، و از عناصر طراحی برای پردازش موازی استفاده کنید. مدیریت DataStage: مهارت های عملی در مدیریت DataStage، از جمله مدیریت کاربر، مجوزها و متغیرهای محیطی به دست آورید. مدیریت ابرداده: مدیریت ابرداده را با استفاده از DataStage Designer، وارد کردن و صادر کردن کامپوننتها تمرین کنید. ایجاد مشاغل موازی: در جلسات عملی شرکت کنید تا مشاغل موازی ایجاد کنید، پارامترها را تعریف کنید و مشاغل خود را به طور مؤثر مستند کنید. دسترسی به داده های متوالی: تجربه عملی در مدیریت داده های متوالی، استفاده از مرحله فایل متوالی و مدیریت لینک های رد. پیاده سازی الگوریتم های پارتیشن بندی و جمع آوری: بینش عملی در مورد موازی سازی پارتیشن ها، الگوریتم های پارتیشن بندی و استراتژی های جمع آوری به دست آورید. ترکیب داده ها با مراحل: با مراحل جستجو، پیوستن، ادغام و قیف کار کنید و برنامه های کاربردی آنها را در سناریوهای دنیای واقعی تمرین کنید. مراحل پردازش گروهی: یاد بگیرید که داده ها را به طور موثر مرتب کنید، موارد تکراری را حذف کنید و از مراحل Aggregator در تمرین های عملی استفاده کنید. تبدیل داده ها: استفاده از مرحله Transformer، محدودیت ها و تکنیک های اشکال زدایی برای تبدیل داده ها را تمرین کنید. توابع مخزن: جنبه های عملی استفاده از مخزن، یافتن تفاوت بین مشاغل و انجام تجزیه و تحلیل تاثیر را بررسی کنید. کار با دادههای رابطهای: درگیر شدن در فعالیتهای عملی شامل مراحل اتصال، خواندن و نوشتن در جداول پایگاه داده، و استفاده از اتصال داده برای کنترل توالی شغل: تجربه عملی در ایجاد توالی شغل، تعریف محرکها و مدیریت فعالیتهای شغلی از طریق مراحل مختلف کسب کنید. تمرین واقعی: ادغام AWS Cloud: مهارت های خود را برای ادغام داده ها با خدمات AWS Cloud در سناریوهای دنیای واقعی به کار بگیرید. تمرین واقعی: یکپارچه سازی Data Vault 1.0 & 2.0: تمرین های عملی در ادغام مفاهیم Data Vault در پروژه های یکپارچه سازی داده شما. پیش نیازها: درک اساسی مفاهیم داده: درک اساسی از مفاهیم داده توصیه می شود. دانش آموزان باید اصطلاحاتی مانند منابع داده، تبدیل داده ها و بارگذاری داده ها را درک کنند. دانش SQL (اختیاری): اگرچه اجباری نیست، اما آشنایی با SQL (زبان پرس و جوی ساختاریافته) می تواند مفید باشد، به خصوص هنگام کار با پایگاه داده های رابطه ای. دسترسی به IBM DataStage: در حالت ایدهآل، دانشآموزان باید به نرمافزار IBM DataStage برای تمرین و پیگیری دوره دسترسی داشته باشند. نرم افزار IBM DataStage (اختیاری): اگر دانش آموزان می خواهند مهارت های آموخته شده در دوره را تمرین کنند، دسترسی به نرم افزار IBM DataStage سودمند است. ضروری هستند.
قفل یکپارچهسازی دادهها را با IBM DataStage، ابزار پیشرو در صنعت ETL (Extract, Transform, Load) باز کنید. در این دوره جامع، شما سفری را از مبانی یکپارچه سازی داده ها تا تکنیک های پیشرفته آغاز خواهید کرد و به شما این امکان را می دهد که از پتانسیل کامل داده های خود استفاده کنید.
آنچه خواهید آموخت:
مبانی یکپارچهسازی دادهها: با درک مفاهیم اصلی و انواع یکپارچهسازی دادهها شروع کنید، و پایهای قوی برای سفر خود ایجاد کنید.
IBM Information Server: اکوسیستم IBM Information Server و اجزای حیاتی آن را کاوش کنید تا بفهمید DataStage در کجا قرار می گیرد.
مدیریت عملی: وظایف مدیریت DataStage، مدیریت کاربران، نقشها و مجوزها را به آسانی انجام دهید.
تسلط بر فراداده: یاد بگیرید که به طور مؤثر با ابرداده، یکی از جنبه های مهم یکپارچه سازی داده ها، کار کنید تا فرآیندهای خود را ساده کنید.
ایجاد مشاغل موازی: در ایجاد مشاغل موازی غوطه ور شوید، پیچیدگی های آن را درک کنید و مشاغل موازی کارآمد طراحی کنید.
دسترسی به دادههای متوالی: در هنر دسترسی به دادههای متوالی، مهارتی حیاتی در یکپارچهسازی دادهها، مسلط شوید.
الگوریتمهای پیشرفته: الگوریتمهای پارتیشنبندی و جمعآوری را کاوش کنید، که برای پردازش کارآمد دادهها حیاتی است.
ترکیب موثر داده ها: با مراحلی مانند جستجو، پیوستن، ادغام و قیف برای ترکیب یکپارچه داده ها راحت باشید.
مراحل پردازش گروهی: یاد بگیرید که داده ها را گروه بندی کنید، آنها را مرتب کنید و به طور موثر آنها را جمع آوری کنید.
مرحله ترانسفورماتور: در مرحله ترانسفورماتور و قابلیت های آن برای تبدیل داده ها غوطه ور شوید.
توابع مخزن: درک عملکردهای مخزن، تجزیه و تحلیل تأثیر، و نحوه مقایسه مشاغل مختلف.
یکپارچهسازی دادههای رابطهای: با دادههای رابطهای با استفاده از مراحل اتصال، خواندن و نوشتن در جداول پایگاه داده کار کنید.
کنترل ترتیب کارها: در توالی کار مسلط شوید، جریان کارها را کنترل کنید و گردش کار پیچیده ایجاد کنید.
تمرین در دنیای واقعی: با جلسات عملی AWS Cloud و Data Vault، دانش خود را در سناریوهای دنیای واقعی به کار ببرید.
سرفصل ها و درس ها
مقدمه ای بر یکپارچه سازی داده ها
Introduction to Data Integration
معرفی
Introduction
طرح کلی دوره
Outline of the course
مسائل را دریافت کنید
Get the matterials
یکپارچه سازی داده ها در مدیریت داده ها
Data Integration in Data management
دستور جلسه
The agenda of the session
یکپارچه سازی داده ها در مدیریت داده ها
Data Integration in Data management
برخی از مفاهیم و انواع یکپارچه سازی داده ها
Some concepts and kinds of Data Integration
یکپارچه سازی داده ها چگونه به نظر می رسد؟
What does data integration look like?
مقدمه ای بر IBM Information Server
Introduction to IBM Information Server
دستور کار این جلسه
The agenda of this session
مقدمه ای بر IBM Information Server
Introduction to IBM Information Server
مقدمه ای بر IBM Information Server (ادامه)
Introduction to IBM Information Server (cont.)
اجزای کلیدی سرور اطلاعات IBM
Key IBM Information Server Components
توپولوژی سرور اطلاعات آی بی ام
IBM Information Server topology
توپولوژی سرور اطلاعات IBM (ادامه)
IBM Information Server topology (Cont.)
کنسول مدیریت سرور اطلاعات آی بی ام
IBM Information Server Administration Console
دستور کار این جلسه
The agenda of this session
کنسول مدیریت سرور اطلاعات آی بی ام
IBM Information Server Administration Console
کنسول مدیریت سرور اطلاعات IBM (ادامه)
IBM Information Server Administration Console (Cont.)
تمرین واقعی 1 - کنسول مدیریت سرور اطلاعات IBM
Real Practice 1 – IBM Information Server Administration Console
مقدمه ای بر IBM DataStage
Introduction to IBM DataStage
دستور کار این جلسه
The agenda of this session
معماری DataStage
DataStage Architecture
مدیر DataStage
DataStage Administrator
طراح DataStage
DataStage Designer
مدیر DataStage
DataStage Director
در حال توسعه در DataStage و ویژگی ها
Developing in DataStage and Features
دستور کار این جلسه
The agenda of this session
در حال توسعه در DataStage
Developing in DataStage
مخزن پروژه DataStage
DataStage project repository
انواع مشاغل DataStage
Types of DataStage Jobs
عناصر طراحی مشاغل موازی
Design Elements of Parallel Jobs
موازی سازی پارتیشن
Partition Parallelism
پارتیشن بندی چند گره
Multi-Node Partitioning
طراحی کار در مقابل اجرا
Job design versus execution
فایل پیکربندی
Configuration File
فایل پیکربندی (ادامه)
Configuration File (Cont.)
Checkpoint - در حال توسعه در IBM DataStage و ویژگی ها
Checkpoint - Developing in IBM DataStage and Features
خلاصه - در حال توسعه در IBM DataStage و ویژگی ها
Summary - Developing in IBM DataStage and Features
مدیریت DataStage
DataStage Administration
دستور کار این جلسه
The agenda of this session
اهداف واحد - مدیریت DataStage
Unit Objectives - DataStage Administration
کنسول وب سرور اطلاعات - مدیریت
Information Server Web Console - Administration
پنجره ورود به کنسول وب
Web Console Login Window
مدیریت کاربر و گروه
User and Group Management
ایجاد شناسه کاربری DataStage
Creating a DataStage User ID
نقش های DataStage را تعیین کنید
Assign DataStage Roles
یک کار را کامپایل و اجرا کنید
Compile and run a job
پیام کامپایل، خطا یا موفقیت آمیز
Compile, Errors or Successful message
مدیر DataStage
DataStage Director
گزینه ها را اجرا کنید
Run options
آمار عملکرد
Performance statistics
نمای وضعیت کارگردان
Director Status View
گزارش کار، مشاهده شده از طراح
Job log, viewed from designer
سایر توابع گزارش کار
Other job log functions
مانیتور مدیر
Director monitor
کارها را از خط فرمان اجرا کنید
Run jobs from the command line
مجموعه پارامترها
Parameter sets
یک مجموعه پارامتر ایجاد کنید
Create a parameter set
تعریف پارامترها
Defining the parameters
تعریف فایل های مقادیر
Defining values files
یک مجموعه پارامتر را در یک کار بارگیری کنید
Load a parameter set into a job
از پارامترهای مجموعه پارامتر استفاده کنید
Use parameter set parameters
کارها را با پارامترهای مجموعه پارامتر اجرا کنید
Run jobs with parameter set parameters
ایست بازرسی - کارهای موازی ایجاد کنید
Checkpoint - Create parallel jobs
تمرین واقعی 4 - وظیفه 1 - پایگاه داده --> ترانسفورماتور --> پایگاه داده
Real Practice 4 - Task 1 - Database --> Transformer --> Database
تمرین واقعی 4 - وظیفه 2 - پایگاه داده --> ترانسفورماتور --> پایگاه داده با پارامتر
Real Practice 4 - Task 2 - Database --> Transformer --> Database with Parameter
خلاصه - ایجاد مشاغل موازی
Summary - Create parallel jobs
ایجاد مشاغل موازی - دسترسی به داده های متوالی
Create parallel jobs - Access sequential data
دستور کار این جلسه
The agenda of this session
اهداف واحد - به داده های متوالی دسترسی داشته باشید
Unit objectives - Access sequential data
نحوه مدیریت داده های متوالی
How sequential data is handled
ویژگی های مرحله Sequential File
Features of the Sequential File stage
طراحی کار با مراحل فایل متوالی
Job design with Sequential File Stages
چنگال - به طراحی شغل بپیوندید
Fork - Join Job Design
ایست بازرسی - مراحل پردازش گروهی
Checkpoint - Group processing stages
تمرین واقعی 8 - فایل --> ترانسفورماتور --> مجموعه داده --> جمع کننده --> فایل
Real Practice 8 - File --> Transformer --> DataSet --> Aggregator --> File
خلاصه - مراحل پردازش گروهی
Summary - Group processing stages
مرحله ترانسفورماتور
Transfromer Stage
دستور کار این جلسه
The agenda of this session
اهداف واحد - مرحله ترانسفورماتور
Unit Objectives - Transformer stage
مرحله ترانسفورماتور
Transformer stage
کار با مرحله ترانسفورماتور
Job with a Transformer stage
داخل مرحله ترانسفورماتور
Inside the Transformer stage
عناصر مرحله ترانسفورماتور
Transformer stage elements
عناصر مرحله ترانسفورماتور
Transformer stage elements
محدودیت ها
Constraints
مثال محدودیت ها
Constraints example
یک محدودیت را تعریف کنید
Define a constraint
از ویرایشگر بیان استفاده کنید
Use the expression editor
در غیر این صورت پیوندهایی برای یکپارچگی داده ها
Otherwise links for data integrity
تمرین واقعی 9 - فایل --> ترانسفورماتور --> فایل
Real Practice 9 - File --> Transformer --> File
اشکال زدای کار موازی
Parallel job debugger
نقاط شکست را تنظیم کنید
Set breakpoints
نقاط شکست را ویرایش کنید
Edit breakpoints
اجرای یک کار موازی در دیباگر
Running a parallel job in the debugger
ستون ها را به لیست تماشا اضافه کنید
Add columns to the watch list
نمایش نظرات