این دوره به معرفی قابلیت های Snowflake برای کار با داده های نیمه ساختاریافته می پردازد. اینها برای انجام وظایف تجزیه و تحلیل داده هنگام کار با فرمت های نیمه ساختار یافته محبوب مانند JSON بسیار مهم هستند.
این دوره به معرفی قابلیت های Snowflake برای کار با داده های نیمه ساختاریافته می پردازد. اینها برای انجام وظایف تجزیه و تحلیل داده هنگام کار با فرمت های نیمه ساختار یافته محبوب مانند JSON بسیار مهم هستند.
دوره جامع مهندسی داده در ساخت خطوط لوله جریان با استفاده از جریان ساختاری کافکا و اسپارک
"در این کلاس شما یاد خواهید گرفت که چگونه با استفاده از جداول و قالب بندی شرطی، داده ها را به روشی ساده اما کارآمد ساختار، آماده و تجزیه و تحلیل کنید. . .."
"این دوره مقدمه ای بر طراحی و استفاده از سیستم های پایگاه داده است - سیستم هایی که هر حجم زیادی از داده ها را مدیریت می کنند. این دوره مقدمه ای است بر ...."
SQL برای مبتدیان - SQL را به روشی عملی بیاموزید در این دوره آموزشی SQL، زبان برنامه نویسی SQL، مبانی SQL و مبانی SQL را در یک صفحه یاد خواهید گرفت. ..
Snowflake از داده های نیمه ساختاریافته پشتیبانی کامل می کند. این دوره به شما می آموزد که چگونه طرحواره را در خواندن، بارگذاری و نوشتن در قالب های فایل نیمه ساختاریافته، کار با انواع داده ها برای تفسیر فیلدهای نیمه ساختاریافته و موارد دیگر، اعمال کنید.
مبتدیان به قطعات غنی، داده های ساختاریافته و افزایش نرخ کلیک از موتورهای جستجوی اصلی راهنمایی می کنند.
در این دوره ، شما به جریانی Spark Structured Streaming فرو می روید ، ویژگی های آن را در عمل مشاهده می کنید و از آن برای ساخت خطوط لوله جریان به پایان ، پیچیده و قابل اعتماد با استفاده از PySpark استفاده می کنید. و شما از پلت فرم Azure Databricks برای ساخت و اجرای آنها استفاده خواهید کرد.
جریان ساختاری موتور پردازش جریان مقیاس پذیر و متحمل خطا در Apache Spark 2 است که می تواند برای پردازش جریان های با سرعت بالا مورد استفاده قرار گیرد.
بیاموزید که چگونه کشف داده های مبتنی بر ML کیفیت داده ها ، انطباق و اقدامات حریم خصوصی داده ها را تغییر می دهد - اضافه کردن زمینه ، افزایش یکپارچگی و سازمان های مدیریت داده را قادر می سازد تا پوشش داده های خود را بهبود بخشند.
جریان ساختاری موتور پردازش جریان مقیاس پذیر و متحمل خطا در Apache Spark 2 است. فریم داده ها در Spark 2.x از داده های بی نهایت پشتیبانی می کنند ، بنابراین به طور موثر برنامه های دسته ای و جریان را متحد می کند.