توکنسازی یک سند را به بخشهای مجزا، معمولاً کلمات مجزا، تبدیل میکند. این اغلب به عنوان کیسه ای از کلمات نامیده می شود و امکان تحلیل فراوانی کلمات را فراهم می کند، اما زمینه آن کلمات را قربانی می کند. توکن سازی پیچیده تر، مانند تشخیص عبارت، تفاوت بین مفید و غیر مفید را تشخیص می دهد.
پس از تماشای این ویدئو، اهداف و اهداف این دوره را درک خواهید کرد.
پیش نیازهای دوره را بدانید و نحوه دریافت آنها را پیشنهاد دهید.
در این ویدیو با اصول اولیه SpaCy و ویژگی های کلیدی آن آشنا شوید. spaCy مهم است زیرا یک کتابخانه پردازش زبان طبیعی قدرتمند است که برای کارهای مختلف تجزیه و تحلیل متن استفاده می شود.
در تجزیه و تحلیل داده های متن، پیش پردازش، جاسازی کلمات، مدل های توالی و ترانسفورماتورها غوطه ور شوید. این دوره به شما یاد می دهد که چگونه از قدرت NLP با تکنیک های یادگیری عمیق استفاده کنید.
پایه های هوش مصنوعی را از محصولات متصل به اینترنت اشیا با استفاده از هوش مصنوعی بدون کد بیاموزید و دانش مورد نیاز برای ارتقای شغل خود و هدایت نوآوری در کسب و کار را به دست آورید.
با استفاده از R، زبان برنامه نویسی محبوب برای محاسبات آماری و گرافیک، پردازش زبان طبیعی (NLP) را راه اندازی و اجرا کنید.
یاد بگیرید که چگونه الگوریتم های پردازش زبان طبیعی (NLP) را با tidytext، بسته ابزار متن کاوی محبوب که به طور منحصر به فرد برای زبان برنامه نویسی R طراحی شده است، پیاده سازی کنید.
<p>با نحوه استفاده از زبان برنامه نویسی R برای پیاده سازی الگوریتم های پردازش زبان طبیعی (NLP) آشنا شوید.</p>