شما همین الان مجموعه داده ها را به صورت آنلاین دانلود کردید. آنها در یک فایل فشرده آمده بودند. اولین کاری که پس از دانلود انجام می دهید، داده ها را با نرم افزارهای unzipping مورد علاقه خود مانند WinZip یا WinRar استخراج می کنید. سپس به خواندن داده ها با نرم افزار تجزیه و تحلیل خود (امیدوارم R) ادامه دهید. خوب! ممکن است تعجب کنید که او با این به کجا می رود.
شما در حال شروع یک پروژه در R هستید و متوجه می شوید که فایل های شما در مسیرهای مختلف در رایانه شما پراکنده شده اند. بازتاب فوری شما این است که پوشه های درگیر را باز کنید (مثلاً با ویندوز اکسپلورر) و قبل از شروع R به جمع آوری آن فایل ها در یک مکان ادامه دهید. صبر کنید، چه اشکالی دارد؟ این فکر را نگه دارید.
شما اغلب از یک وب سایت بازدید می کنید. این وبسایت پر از دادهها، اعداد، اسناد قابل دانلود و تصاویر است. ممکن است به ذهن شما خطور نکرده باشد که می توانید به صورت برنامه ریزی شده به داده ها دسترسی داشته باشید و آنها را به گونه ای دیگر تجسم کنید. شاید شما ایده هایی در مورد آن داشتید اما نمی دانستید چگونه آن را انجام دهید. این فکر را نیز نگه دارید.
باز کردن فایلها با WinZip یا WinRar مشکلی ندارد. با این حال، باز کردن فایلهای فشرده در R میتواند مفید باشد. پس از دانلود مجموعه داده یا هر فایل فشرده. می توانید مستقیماً به R بروید و فایل های خود را قبل از تجزیه و تحلیل در آنجا مدیریت کنید. آیا تا به حال به زیپ کردن، کپی و چسباندن، حذف فایل ها در R فکر کرده اید؟ این دوره نمونه هایی از آن را به شما نشان می دهد.
یکی از اهداف این دوره این است که فکر خراش دادن داده ها را به راحتی در شما کاشته کند. میخواهم فکر کنید میتوانید دادهها را خراش دهید و آنها را به شکلی متفاوت تجسم کنید و این کار را به سرعت انجام دهید. من تکنیک های متداول خراش دادن وب در R.
را به شما نشان خواهم دادبا API ها، یک گام فراتر از خراش دادن پیش می روید. در این دوره به شما یاد می دهم که چگونه با استفاده از بسته های HTTR و jsonlite اطلاعات را بازیابی کنید. به طور خاص، از تابع GET برای بازیابی داده ها و از تابع POST برای به روز رسانی حساب خود استفاده کنید. همه اینها بدون ورود به حساب کاربری شما. من از پلتفرم وام دهی همتا به همتا Lending Club برای نمایش استفاده از یک API استفاده می کنم. بنابراین، API به شما اجازه می دهد تا با حساب خود به صورت برنامه نویسی تعامل داشته باشید. ترکیب این با یک زمانبندی می تواند بسیار کارآمد باشد. یک الگوریتم سنجیده می تواند خودکار باشد و کارهای تکراری را انجام دهد که در غیر این صورت عادی خواهند بود.
این دوره همچنین شما را با سیستم کنترل نسخه Git آشنا می کند. قدرت R Studio را در ترکیب با Git و GitHub خواهید آموخت. من به شما آموزش میدهم که چگونه نسخههای مختلف اسکریپت خود را با فایلهای Git و Push، از جمله اسکریپتهای R، مجموعه دادهها و سایر فایلها در پلتفرم GitHub نگه دارید. همچنین یاد خواهید گرفت که اگر در نسخه های بعدی اشتباه کردید چگونه به نسخه های قبلی کد خود برگردید. وقتی به این مسلط شدید، دیگر لازم نیست نسخههای مختلف اسکریپتهای خود را در فهرست راهنمای خود ذخیره کنید.
برای تبدیل شدن به یک تحلیلگر داده کارآمد، باید در یک یا چند زبان برنامه نویسی مهارت داشته باشید. چرا R نه؟ این دوره همچنین باید به عنوان فشارسنج عمل کند. اگر با مطالب این دوره احساس راحتی می کنید، باید اکثر اسکریپت های R را که با آنها روبرو می شوید، درک کنید.
این دوره به شما نحوه هک کردن سرورها را آموزش نمی دهد. هدف در اینجا سوق دادن شما به سمت فعالیت های مجرمانه نیست.
آمارشناس
نمایش نظرات