آیا آماده هستید تا برای آزمون Google Cloud Certified Professional Data Engineer آماده شوید؟
دریافت پرسشها و پاسخهای تأیید شده آزمونهای تمرینی 2025
یک مهندس داده حرفه ای با جمع آوری، تبدیل و انتشار داده ها، داده ها را برای دیگران قابل استفاده و ارزشمند می کند. این فرد محصولات و خدمات را برای برآوردن الزامات تجاری و نظارتی ارزیابی و انتخاب می کند. یک مهندس داده حرفه ای سیستم های پردازش داده قوی را ایجاد و مدیریت می کند. این شامل توانایی طراحی، ساخت، استقرار، نظارت، نگهداری و ایمن کردن حجم کاری پردازش داده است.
آزمون مهندس داده حرفه ای توانایی شما را در موارد زیر ارزیابی می کند:
بخش 1: طراحی سیستم های پردازش داده
1.1 طراحی برای امنیت و انطباق. ملاحظات عبارتند از:
● مدیریت هویت و دسترسی (به عنوان مثال، Cloud IAM و خطمشیهای سازمان)
● امنیت داده (رمزگذاری و مدیریت کلید)
● حریم خصوصی (به عنوان مثال، اطلاعات قابل شناسایی شخصی، و Cloud Loss Prevention API)
● ملاحظات منطقه ای (حاکمیت داده ها) برای دسترسی و ذخیره سازی داده ها
● مطابقت با قوانین و مقررات
1.2 طراحی برای قابلیت اطمینان و وفاداری. ملاحظات عبارتند از:
● آمادهسازی و تمیز کردن دادهها (مانند Dataprep، Dataflow، و Cloud Data Fusion)
● نظارت و هماهنگی خطوط لوله داده
● بازیابی بلایا و تحمل خطا
● اتخاذ تصمیمات مربوط به انطباق و در دسترس بودن ACID (اتمی، سازگاری، جداسازی، و دوام)
● اعتبارسنجی دادهها
1.3 طراحی برای انعطاف پذیری و قابلیت حمل. ملاحظات عبارتند از:
● نگاشت نیازهای فعلی و آتی کسب و کار به معماری
● طراحی برای قابلیت حمل داده و برنامه (مانند الزامات اقامت چند ابری و داده)
● مرحله بندی داده، فهرست نویسی، و کشف (حاکمیت داده)
1.4 طراحی انتقال داده ها. ملاحظات عبارتند از:
● تجزیه و تحلیل نیازهای ذینفعان فعلی، کاربران، فرآیندها و فناوری ها و ایجاد برنامه ای برای رسیدن به وضعیت مطلوب
● برنامه ریزی انتقال به Google Cloud (به عنوان مثال، سرویس انتقال داده BigQuery، سرویس انتقال پایگاه داده، ابزار انتقال، شبکه Google Cloud، جریان داده)
● طراحی استراتژی اعتبارسنجی مهاجرت
● طراحی پروژه، مجموعه داده و معماری جدول برای اطمینان از مدیریت صحیح داده
بخش 2: مصرف و پردازش داده ها
2.1 برنامه ریزی خطوط لوله داده. ملاحظات عبارتند از:
● تعریف منابع داده و مخازن
● تعریف منطق تبدیل داده
● اصول شبکه
● رمزگذاری داده ها
2.2 ساخت خطوط لوله. ملاحظات عبارتند از:
● پاکسازی داده ها
● شناسایی سرویسها (به عنوان مثال، Dataflow، Apache Beam، Dataproc، Cloud Data Fusion، BigQuery، Pub/Sub، Apache Spark، اکوسیستم Hadoop، و Apache Kafka)
● تحولات
○ دسته ای
○ پخش جریانی (به عنوان مثال، پنجره، دیر رسیدن داده)
○ زبان
○ مصرف موقت داده (یک بار یا خودکار)
● جمعآوری و وارد کردن دادهها
● ادغام با منابع داده جدید
2.3 استقرار و عملیاتی کردن خطوط لوله. ملاحظات عبارتند از:
● اتوماسیون و هماهنگسازی شغل (به عنوان مثال، Cloud Composer و Workflows)
● CI/CD (ادغام مداوم و استقرار مداوم)
بخش 3: ذخیره سازی داده ها
3.1 انتخاب سیستم های ذخیره سازی. ملاحظات عبارتند از:
● تجزیه و تحلیل الگوهای دسترسی به داده
● انتخاب سرویسهای مدیریتشده (مانند Bigtable، Cloud Spanner، Cloud SQL، Cloud Storage، Firestore، Memorystore)
● برنامه ریزی برای هزینه های ذخیره سازی و عملکرد
● مدیریت چرخه حیات داده ها
3.2 برنامه ریزی برای استفاده از انبار داده. ملاحظات عبارتند از:
● طراحی مدل داده
● تصمیم گیری در مورد میزان عادی سازی داده ها
● نقشه برداری الزامات کسب و کار
● تعریف معماری برای پشتیبانی از الگوهای دسترسی به داده
3.3 استفاده از دریاچه داده. ملاحظات عبارتند از:
● مدیریت دریاچه (پیکربندی کشف داده، دسترسی و کنترل هزینه)
● در حال پردازش داده ها
● نظارت بر دریاچه داده
3.4 طراحی برای مش داده. ملاحظات عبارتند از:
● ساخت شبکه داده بر اساس الزامات با استفاده از ابزارهای Google Cloud (مانند Dataplex، Data Catalog، BigQuery، Cloud Storage)
● بخشبندی دادهها برای استفاده تیم توزیع شده
● ایجاد یک مدل حاکمیت فدرال برای سیستم های داده توزیع شده
بخش 4: آماده سازی و استفاده از داده ها برای تجزیه و تحلیل
4.1 آماده سازی داده ها برای تجسم. ملاحظات عبارتند از:
● اتصال به ابزارها
● پیش محاسبه فیلدها
● نماهای تحقق یافته BigQuery (معنای مشاهده)
● تعیین جزئیات داده های زمانی
● عیب یابی پرس و جوهایی با عملکرد ضعیف
● مدیریت هویت و دسترسی (IAM) و پیشگیری از از دست دادن دادههای ابری (Cloud DLP)
4.2 اشتراک گذاری داده ها. ملاحظات عبارتند از:
● تعریف قوانین برای اشتراکگذاری دادهها
● انتشار مجموعه دادهها
● انتشار گزارشها و تجسمها
● مرکز تجزیه و تحلیل
4.3 کاوش و تجزیه و تحلیل داده ها. ملاحظات عبارتند از:
● آمادهسازی دادهها برای مهندسی ویژگی (آموزش و ارائه مدلهای یادگیری ماشین)
● انجام کشف داده ها
بخش 5: نگهداری و خودکارسازی حجم کاری داده ها
5.1 بهینه سازی منابع. ملاحظات عبارتند از:
● به حداقل رساندن هزینه ها به ازای نیاز کسب و کار مورد نیاز به داده
● اطمینان از در دسترس بودن منابع کافی برای فرآیندهای دادههای حیاتی تجاری
● تصمیمگیری بین خوشههای داده پایدار یا مبتنی بر شغل (مانند Dataproc)
5.2 طراحی اتوماسیون و تکرارپذیری. ملاحظات عبارتند از:
● ایجاد نمودارهای غیر چرخه ای جهت دار (DAG) برای Cloud Composer
● زمانبندی کارها به روشی قابل تکرار
5.3 سازماندهی بارهای کاری بر اساس نیازهای تجاری. ملاحظات عبارتند از:
● قیمتگذاری اسلات انعطافپذیر، بر اساس تقاضا و نرخ ثابت (شاخص انعطافپذیری یا ظرفیت ثابت)
● کارهای پرس و جو تعاملی یا دسته ای
5.4 فرآیندهای نظارت و عیب یابی. ملاحظات عبارتند از:
● قابلیت مشاهده فرآیندهای داده (به عنوان مثال، Cloud Monitoring، Cloud Logging، پنل مدیریت BigQuery)
● نظارت بر استفاده برنامه ریزی شده
● عیبیابی پیامهای خطا، مشکلات صورتحساب، و سهمیهها
● مدیریت بارهای کاری، مانند مشاغل، پرس و جوها، و ظرفیت محاسبه (رزروها)
5.5 حفظ آگاهی از شکستها و کاهش تأثیر. ملاحظات عبارتند از:
● طراحی سیستم برای تحمل خطا و مدیریت راه اندازی مجدد
● اجرای مشاغل در چندین منطقه یا منطقه
● آماده شدن برای خرابی داده ها و داده های از دست رفته
● تکثیر دادهها و خطاها (به عنوان مثال، Cloud SQL، کلاسترهای Redis)
مدرس IT
نمایش نظرات