سفری را برای تبدیل شدن به یک نگهبان هوشیار یکپارچگی داده ها آغاز کنید. این دوره شما را به مهارت های ضروری برای شناسایی، پیشگیری و کاهش تهدیدات استخراج داده ها مجهز می کند.
این دوره به شما می آموزد که استخراج داده ها از اسناد را با NLP به صورت خودکار انجام دهید. در تکنیکهای NLP مختصر، مبتنی بر قانون، که برای تبدیل دادههای بدون ساختار به بینشهای عملی، افزایش کارایی و تصمیمگیری در تجزیه و تحلیل دادهها استفاده میشوند، استفاده کنید.
کاوش در اسکراپینگ وب با پایتون: سوپ زیبا، تجزیه HTML، انتخابگرهای CSS و پروژه های عملی
پروژه برنامه اسکنر اسناد را توسعه دهید که به نام استخراج موجودیت از اسکن اسناد با OpenCV، Pytesseract، Spacy است.
Databricks SQL یک رابط یکپارچه برای ایجاد و اجرای پرس و جوهای SQL و سپس تجسم نتایج با استفاده از انواع نمودارهای داخلی فراهم می کند. این دوره به بررسی چگونگی ترکیب اینها با داشبوردها برای استخراج بینش مفید از داده ها می پردازد.
از تکنیک های علم داده و هوش مصنوعی برای استخراج و تجزیه و تحلیل شبکه لینکدین خود استفاده کنید
اسکراپینگ وب و داده کاوی را از ابتدا با استفاده از پایتون بیاموزید
این دوره چندین مدل مانند Bayesian Networks ، LBP ، Variable Elimination و غیره را به شما می آموزد که با کمک آنها می توانید روابط پیچیده ای را از طریق چندین متغیر ورودی یا ویژگی استخراج کنید.
در این دوره ، شما می آموزید که چگونه به Twitter API متصل شوید و داده ها را با استفاده از API جستجوی استاندارد استخراج کنید.
این دوره نحوه استفاده و کار با Amazon Textract را که به استخراج متن و داده ها از اسناد اسکن شده می پردازد ، فراتر از OCR سنتی می آموزد.
بیاموزید که چگونه از rvest و سایر ابزارهای R برای ایجاد مجموعه داده های اصلی خود از محتوای وب موجود در دسترس استفاده کنید.
این دوره جنبه های مهم خراش دادن وب سایت ها با استفاده از سوپ زیبا را پوشش می دهد. شما می توانید ساخت ، دستکاری و عبور از درخت تجزیه و همچنین استفاده از ویژگی های پیشرفته مانند کار با فیلترها ، CSS و XPath را بیاموزید.