لطفا جهت اطلاع از آخرین دوره ها و اخبار سایت در
کانال تلگرام
عضو شوید.
آموزش راهنمای آماده سازی مصاحبه علوم داده 2023
2023 Data Science Interview Preparation Guide
نکته:
آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیوها:
توضیحات دوره:
پرسشها و پاسخهای مصاحبه در علم داده، آمار، یادگیری ماشین، یادگیری عمیق، تناسب فرهنگ و SQL. چگونه در مصاحبه علم داده در سال 2021 با بیش از 150 پرسش و پاسخ مصاحبه علوم داده مسلط شویم رایج ترین سؤالات و پاسخ های مصاحبه در مورد یادگیری ماشینی رایج ترین سؤالات مصاحبه و پاسخ های مربوط به یادگیری عمیق رایج ترین سؤالات و پاسخ های مصاحبه در مورد آمار رایج ترین سوالات مصاحبه در فرهنگ تناسب و نحوه پاسخگویی با استفاده از تکنیک مصاحبه STAR رایج ترین سوالات و پاسخ های مصاحبه در علوم کامپیوتر برای مصاحبه های دانشمند داده بهترین سوالاتی که می توانید از مصاحبه کننده خود بپرسید و دلیل تاثیرگذاری این سوالات پیش نیازها:دانش کلید اصطلاحات علم داده و آمار تمایل به صرف زمان برای تمرین سوالات مصاحبه
دانشمند داده بودن یکی از پرسودترین و اثباتکنندهترین شغلها است که Glassdoor برای سومین سال متوالی آن را بهترین شغل در آمریکا با چشمانداز رشد عالی و متوسط حقوق پایه ۱۱۰,۰۰۰ دلاری نامیده است. من اخیراً از یک دانشجوی دکترا در علوم کامپیوتر به یک دانشمند ارشد داده در یک شرکت فناوری بزرگ تبدیل شده ام. در این دوره من تمام سوالات و پاسخ هایی را که قبلا برای مصاحبه های علوم داده آماده می کردم و همچنین سوالات و پاسخ هایی که اکنون در هنگام مصاحبه با داوطلبان بالقوه علوم داده انتظار دارم را به شما ارائه می دهم. این دوره فهرست کاملی از بیش از 150 سوال و پاسخ را ارائه میکند که میتوانید در یک مصاحبه معمولی علوم داده انتظار داشته باشید، از جمله سوالاتی در مورد یادگیری ماشین، شبکههای عصبی و یادگیری عمیق، آمار، تجربه عملی، فناوریهای کلان داده، SQL، علوم کامپیوتر، تناسب فرهنگ. ، سوالاتی برای مصاحبه کننده و متفکران.
پاسخ چه سوالاتی را خواهید آموخت؟
معادل سوگیری-واریانس چیست؟
یک الگوریتم را روی داده های نامتعادل چگونه ارزیابی می کنید؟
چه زمانی از شیب نزولی (GD) نسبت به شیب نزولی تصادفی (SDG) و بالعکس استفاده می کنید؟
چرا CNN های تقسیم بندی معمولاً دارای سبک/ساختار رمزگذار-رمزگشا هستند؟
چرا ما معمولاً از تابع غیر خطی Softmax به عنوان آخرین عملیات در شبکه استفاده می کنیم؟
شما بهطور تصادفی از 100 سکه یک سکه میکشید - 1 سکه ناعادلانه (سر سر)، 99 سکه منصفانه (سر-دم) و آن را 10 بار بغلتانید. اگر نتیجه 10 سر باشد، احتمال ناعادلانه بودن سکه چقدر است؟
با توجه به آمار زیر، در صورت مثبت بودن نتیجه ماموگرافی، احتمال ابتلای خانمی به سرطان چقدر است؟ 1% از زنان مبتلا به سرطان سینه، 90% از زنان دارای سرطان سینه تست ماموگرافی مثبت و 8% از زنان مثبت کاذب خواهند داشت.
یک پرس و جوی SQL بنویسید تا دومین دستمزد را از جدول کارمند دریافت کنید. اگر دومین دستمزد وجود نداشته باشد، درخواست باید باطل شود.
متوسط پیچیدگی زمانی برای جستجوی آرایه مرتب نشده چقدر است؟
چرا میخواهید اینجا کار کنید؟
چگونه می توانید یک عدد تصادفی بین 1 تا 7 تنها با یک قالب تولید کنید؟
درباره مربی:
دانشمند ارشد داده در یک شرکت بزرگ فناوری
اخیراً دکترای علوم کامپیوتر را به پایان رساند و به صنعت نقل مکان کرد
بیش از 5 سال سابقه تدریس در سطح دانشگاه
سرفصل ها و درس ها
معرفی
Introduction
لیست سوالات
List of questions
معرفی دوره
Course Introduction
فراگیری ماشین
Machine Learning
معاوضه بایاس واریانس چیست؟
What is the bias-variance tradeoff?
KNN چه تفاوتی با k-means دارد؟
How is KNN different from k-means?
چگونه الگوریتم k-means را پیاده سازی می کنید؟
How would you implement the k-means algorithm?
چگونه k را در خوشه بندی k-means انتخاب می کنید؟
How do you choose the k in k-means clustering?
مزایا و معایب الگوریتم k-means چیست؟
What are the pros and cons of the k-means algorithm?
منحنی ROC چه چیزی را نشان می دهد؟
What does an ROC curve show?
تفاوت بین خطای نوع 1 و نوع 2 چیست؟
What is the difference between a type 1 and type 2 error?
دقت و یادآوری را تعریف کنید.
Define precision and recall.
اعتبار سنجی متقاطع k-fold چیست؟
What is k-fold cross validation?
توضیح دهید که مثبت کاذب و منفی کاذب چیست؟
Explain what a false positive and a false negative are.
چه زمانی از جنگل های تصادفی در مقابل SVM استفاده می کنید و چرا؟
When would you use random forests Vs SVM and why?
چرا کاهش ابعاد مهم است؟
Why is dimension reduction important?
تحلیل مؤلفه اصلی چیست؟ نوع مشکلاتی که استفاده می شود را توضیح دهید 4؟
What is principal component analysis? Explain the sort of problems is it used 4?
مفروضات مورد نیاز برای رگرسیون خطی چیست؟
What are the assumptions required for linear regression?
برخی از مراحل جدال داده ها و پاکسازی داده ها چیست؟
What are some of the steps for data wrangling and data cleaning?
چند خطی چیست و چگونه با آن مقابله کنیم؟
What is multicollinearity and how do we deal with it?
مجموعه داده ای در مورد تشخیص سرطان به شما داده می شود. شما یک مد طبقه بندی ساخته اید
You are given a dataset on cancer detection. You have built a classification mod
چگونه یک الگوریتم را روی داده های نامتعادل ارزیابی می کنید؟
How would you evaluate an algorithm on unbalanced data?
شما صدک 95 زمان پاسخ سرور وب را دارید که هر 2 ثانیه تولید می شود
You have the 95th percentile of web server response times generated every 2 seco
قضیه بیز چیست؟ چگونه در زمینه یادگیری ماشین مفید است؟
What is Bayes’ Theorem? How is it useful in a machine learning context?
"ساده لوح" در یک بیز ساده چیست؟
What is ‘Naive’ in a Naive Bayes?
تفاوت بین منظم سازی L1 و L2 را توضیح دهید.
Explain the difference between L1 and L2 regularization.
از چه تکنیک اعتبارسنجی متقابل در مجموعه داده های سری زمانی استفاده می کنید؟
What cross-validation technique would you use on a time series dataset?
چگونه می توان داده های سری زمانی را به عنوان نوشت افزار اعلام کرد؟ چه آزمون آماری
How can a time-series data be declared as stationery? What statistical test woul
اجزای اصلی یک مدل پیشبینی سری زمانی ARIMA چیست؟
What are the main components of an ARIMA time series forecasting model?
چگونه مطمئن می شوید که بیش از حد با یک مدل تناسب ندارید؟
How do you ensure you’re not overfitting with a model?
مجموعه داده ای به شما داده می شود که متشکل از متغیرهایی با مقادیر زیادی از دست رفته است. اچ
You are given a data set consisting of variables with a lot of missing values. H
"ترفند هسته" چیست و چگونه مفید است؟
What’s the “kernel trick” and how is it useful?
چه زمانی از شیب نزول (GD) نسبت به شیب نزولی تصادفی (SDG) استفاده می کنید،
When would you use gradient descent (GD) over stochastic gradient descent (SDG),
سازمان شما یک وب سایت دارد که بازدیدکنندگان به طور تصادفی یکی از دو کوپن را دریافت می کنند
Your organization has a website where visitors randomly receive one of two coupo
تفاوت بین تحلیل تک متغیره، دو متغیره و چند متغیره چیست؟
What is the differentiate between univariate, bivariate and multivariate analysi
الگوریتم SVM را توضیح دهید.
Explain SVM algorithm.
هر نوع آموزش گروهی را به طور خلاصه شرح دهید.
Describe in brief any type of Ensemble Learning.
تبدیل باکس-کاکس چیست؟
What is a Box-Cox Transformation?
قضیه حد مرکزی چیست؟
What is the Central Limit Theorem?
نمونه برداری چیست؟
What is sampling?
4 مثال از روش های نمونه گیری مبتنی بر احتمال و نحوه کار آنها را ذکر کنید
Give 4 examples of probability-based sampling methods and how they work
4 مثال از روشهای نمونهگیری غیر احتمالی و نحوه کار آنها را ذکر کنید
Give 4 examples of non probability-based sampling methods and how they work
شبکه های عصبی و یادگیری عمیق
Neural Networks and Deep Learning
مزایا و معایب شبکه های عصبی چیست؟
What are the advantages and disadvantages of neural networks?
به نظر شما دلیل محبوبیت Deep Learning در اخیر چیست
What in your opinion is the reason for the popularity of Deep Learning in recent
چرا ما از کانولوشن برای تصاویر به جای لایه های FC استفاده می کنیم؟
Why do we use convolutions for images rather than just FC layers?
تفاوت بین دوره، اندازه دسته و تعداد تکرار چیست؟
What Is the Difference Between Epoch, Batch size, and Number of iterations?
چه چیزی باعث می شود که ترجمه CNN تغییرناپذیر باشد؟
What makes CNNs translation invariant?
4 نوع لایه اصلی مورد استفاده برای ساخت یک CNN چیست؟
What are the 4 main types of layers used to build a CNN?
3 نوع ادغام فضایی قابل استفاده چیست؟
What are 3 types of spatial pooling that can be used?
گام در لایه های کانولوشن چیست؟
What is the stride in convolutional layers?
شیب های در حال ناپدید شدن و انفجار چیست؟
What are vanishing and exploding gradients?
4 راه حل ممکن برای ناپدید شدن و انفجار شیب چیست؟
What are 4 possible solutions to vanishing and exploding gradients?
ترک تحصیل برای شبکه های عصبی چیست؟ ترک تحصیل چه تاثیری دارد؟
What is dropout for neural networks? What effect does dropout have?
چرا CNN های تقسیم بندی معمولاً دارای سبک/ساختار رمزگذار-رمزگشا هستند؟
Why do segmentation CNNs typically have an encoder-decoder style / structure?
نرمال سازی دسته ای چیست و چرا کار می کند؟
What is batch normalization and why does it work?
چرا از بسیاری از هسته های کانولوشنال کوچک مانند 3x3 به جای تعداد کمی استفاده می کنید
Why would you use many small convolutional kernels such as 3x3 rather than a few
ایده پشت GAN ها چیست؟
What is the idea behind GANs?
چرا ما معمولاً از تابع غیر خطی Softmax به عنوان آخرین عملیات در شبکه استفاده می کنیم
Why we generally use Softmax non-linearity function as last operation in-network
تابع فعال سازی 1
Activation function 1
تابع فعال سازی 2
Activation function 2
تابع فعال سازی 3
Activation function 3
پس انتشار چیست و چگونه کار می کند؟
What is backpropagation and how does it work?
فراپارامترهای رایج مربوط به ساختار شبکه عصبی چیست؟
What are the common hyperparameters related to neural network structure?
4 روش تنظیم هایپرپارامتر چیست؟
What are 4 methods of hyperparameter tuning?
معماری شبکه 1
Network architecture 1
معماری شبکه 2
Network architecture 2
معماری شبکه 3
Network architecture 3
معماری شبکه 4
Network architecture 4
معماری شبکه 5
Network architecture 5
معماری شبکه 6
Network architecture 6
معماری شبکه 7
Network architecture 7
معماری شبکه 8
Network architecture 8
معماری شبکه 9
Network architecture 9
معماری شبکه 10
Network architecture 10
معماری شبکه 11
Network architecture 11
معماری شبکه 12
Network architecture 12
آمار
Statistics
مورد فروخته شده توسط فروشنده آمازون
Item sold by Amazon seller
سکه تصادفی
Random Coin
تعداد کل روش هایی را که 5 نفر می توانند در 5 صندلی خالی بنشینند را بیابید.
Find the total number of ways 5 people can sit in 5 empty seats.
کد به ترتیب خاص
Code in a particular order
برای برنده شدن در قرعه کشی، باید 5 عدد صحیح را به ترتیب از 1 تا انتخاب کنید
To win the lottery, you must select the 5 correct numbers in any order from 1 to
کارت ها
Cards
شما در یک کازینو هستید و دو تاس برای بازی دارید.
You are at a Casino and have two dices to play with.
هواپیما به لندن
Plane to London
40 کارت
40 Cards
اهمیت آماری یک بینش را چگونه ارزیابی می کنید؟
How do you assess the statistical significance of an insight?
سوگیری انتخاب را توضیح دهید (با توجه به مجموعه داده، نه انتخاب متغیر)
Explain selection bias (with regard to a dataset, not variable selection)
پرت چیست؟
What is an outlier?
چگونه داده های از دست رفته را مدیریت می کنید؟ چه تکنیکهای انتساب را توصیه میکنید؟
How do you handle missing data? What imputation techniques do you recommend?
مثالی بزنید که در آن میانه معیار بهتری نسبت به میانگین است
Give an example where the median is a better measure than the mean
با توجه به دو تاس منصفانه، احتمال به دست آوردن نمرات با مجموع 4؟8 چقدر است؟
Given two fair dices, what is the probability of getting scores that sum to 4?8?
قانون اعداد بزرگ چیست؟
What is the Law of Large Numbers?
چگونه حجم نمونه مورد نیاز را محاسبه می کنید؟
How do you calculate the needed sample size?
تست A/B چیست؟
What is A/B testing?
p-value چیست؟
What is p-value?
چگونه ثابت می کنید که مردان به طور متوسط از زنان بلندتر هستند؟
How do you prove that males are on average taller than females?
میزان عفونت در بیمارستان
Infection rates at a hospital
شما یک سکه بایاس (p(head)=0.8) را پنج بار میچرخانید. احتمال گتی چقدر است
You roll a biased coin (p(head)=0.8) five times. What’s the probability of getti
تست HIV دارای حساسیت 99.7 درصد و ویژگی 98.5 درصد است. موضوعی از
An HIV test has a sensitivity of 99.7% and a specificity of 98.5%. A subject fro
شما در حال کاندیداتوری هستید و نظرسنجی شما از صدها نفر نظرسنجی کرده است. شصت از
You are running for office and your pollster polled hundred people. Sixty of the
شمارنده گایگر 100 واپاشی رادیواکتیو را در 5 دقیقه ثبت می کند. یک عدد تقریبی پیدا کنید
Geiger counter records 100 radioactive decays in 5 minutes. Find an approximate
میزان قتل در اسکاتلند در سال گذشته از 115 نفر در سال گذشته به 99 کاهش یافت. است
The homicide rate in Scotland fell last year to 99 from 115 the year before. Is
اپیدمی های آنفولانزا را برای خانواده های دگرجنسگرای دو والد در نظر بگیرید. فرض کنید که
Consider influenza epidemics for two-parent heterosexual families. Suppose that
فرض کنید فشار خون دیاستولیک (DBPs) برای مردان 35 تا 44 ساله به طور معمول پایین است.
Suppose that diastolic blood pressures (DBPs) for men aged 35–44 are normally di
در یک جمعیت مورد علاقه، یک نمونه 9 مردی یک نمونه متوسط حجم مغز را به دست آورد
In a population of interest, a sample of 9 men yielded a sample average brain vo
یک قرص لاغری به 9 نفر در مدت شش هفته داده می شود. میانگین تفاوت در وی
A diet pill is given to 9 subjects over six weeks. The average difference in wei
با توجه به آمار زیر، احتمال ابتلای یک زن به سرطان چقدر است
Given the following statistic, what is the probability that a woman has cancer i
یک شیشه شامل 21 شیرینی است که 12 عدد سبز و 9 عدد به رنگ آبی است. ویلیام دو سوئی را انتخاب کرد
A jar consists of 21 sweets, 12 are green and 9 are blue. William picked two swe
تجربه عملی
Practical Experience
با چه زبان هایی برای توسعه الگوریتم های هوش مصنوعی راحت تر هستید؟
What languages you are most comfortable with for developing AI algorithms?
از چه کتابخانه هایی برای یادگیری عمیق استفاده کرده اید؟
What libraries have you used for Deep Learning?
آیا مستقیماً با CUDA کار کرده اید؟
Have you worked with CUDA directly?
بهترین مقاله دانشگاهی که در سال گذشته خوانده اید چیست؟
What is the best academic paper you read in the last year?
کتابخانه یادگیری ماشینی مورد علاقه شما چیست؟
What is your favorite machine learning library?
چه مدت است که روی مشکلات یادگیری ماشین کار می کنید؟
How long have you been working on machine learning problems?
چند مقاله دانشگاهی منتشر کرده اید؟
How many academic papers have you had published?
از کدام محقق دانشگاهی مقالات زیادی می خوانید؟
What academic researcher do you read a lot of papers from?
چقدر تجربه کدنویسی دارید؟
How much experience do you have writing code?
روند خود را برای نوشتن یک برنامه نرم افزاری از ابتدا تا انتها شرح دهید.
Describe your process for writing a software program from start to finish.
فناوری های کلان داده
Big Data Technologies
Hadoop چه تفاوتی با سایر سیستم های محاسباتی موازی دارد؟
How is Hadoop different from other parallel computing systems?
Hadoop در چه حالت هایی قابل اجرا است؟
What modes can Hadoop be run in?
تفاوت عمده بین بلوک HDFS و InputSplit را توضیح دهید
Explain the major difference between HDFS block and InputSplit
رایج ترین فرمت های ورودی در Hadoop کدامند؟
What are the most common Input Formats in Hadoop?
روش های اصلی کاهش دهنده چیست؟
What are the core methods of a Reducer?
SQL
SQL
یک پرس و جوی SQL بنویسید تا از جدول Employee دومین حقوق را دریافت کنید. اگر تی
Write a SQL query to get the second highest salary from the Employee table. If t
یک پرس و جوی SQL بنویسید تا همه ایمیل های تکراری را در جدولی به نام Person پیدا کنید
Write a SQL query to find all duplicate emails in a table named Person
با توجه به جدول آب و هوا، یک پرس و جوی SQL بنویسید تا شناسه تمام تاریخ ها را با دمای بالاتر پیدا کنید
Given a Weather table, write a SQL query to find all dates' Ids with higher temp
میز کارمند همه کارمندان را در خود جای میدهد. هر کارمند دارای شناسه، حقوق و
The Employee table holds all employees. Every employee has an Id, a salary, and
مری معلم یک مدرسه راهنمایی است و یک صندلی میزی دارد که دانش آموزان را ذخیره می کند.
Mary is a teacher in a middle school and she has a table seat storing students'
علوم کامپیوتر
Computer Science
تابع بازگشتی چیست؟
What is a recursive function?
چند مثال از الگوریتم های حریصانه بزنید
Give some examples of greedy algorithms
جستجوی باینری چیست و چگونه آن را پیاده سازی می کنید؟
What is binary search and how do you implement it?
جستجوی خطی چیست؟
What is linear searching?
چه عملیاتی را می توان روی پشته ها انجام داد؟
What operations can be performed on stacks?
پشته چیست و چه زمانی از آن استفاده می کنیم؟
What is a stack and when do we use it?
لیست پیوندی چیست و چه زمانی از آن استفاده می کنیم؟
What is a linked-list and when do we use it?
تفاوت ساختار داده Stack و Queue چیست؟
What is the difference between Stack and Queue data structure?
تفاوت بین ساختار داده لیست پیوند منفرد و ساختار داده لیست پیوند دوگانه چیست
What is difference between Singly Linked List and Doubly Linked List data struct
میانگین پیچیدگی زمانی برای جستجوی یک آرایه مرتب نشده چقدر است؟
What is the average time complexity to search an unsorted array?
میانگین پیچیدگی زمانی Quicksort چقدر است؟
What is the average time complexity of Quicksort?
فرهنگ مناسب
Culture Fit
چرا میخواهید اینجا کار کنید؟
Why do you want to work here?
چه چیزی در این موقعیت برای شما جذابیت بیشتری دارد؟
What appeals to you most about this position?
ترجیح می دهید به تنهایی کار کنید یا گروهی؟
Do you rather work alone or in a team?
هنگام پاسخ دادن به این سوال، باید موقعیتی را که برای i درخواست می کنید انتخاب کنید
When answering this question, you should take the position you’re applying for i
چگونه درگیری ها را در محل کار مدیریت می کنید؟
How do you handle conflicts in the workplace?
سوالات برای مصاحبه کننده
Questions for the Interviewer
آیا می توانید در مورد مسئولیت های روزمره نقش بیشتر توضیح دهید؟
Can you tell me more about the day-to-day responsibilities of the role?
چگونه می توانم شما را در سه ماه اول تحت تاثیر قرار دهم؟
How could I impress you in the first three months?
آیا فرصت هایی برای آموزش و پیشرفت در نقش/شرکت وجود دارد؟
Are there opportunities for training and progression within the role/company?
فکر می کنید شرکت در پنج سال آینده به کجا خواهد رفت؟
Where do you think the company is headed in the next five years?
آیا می توانید فرهنگ کاری سازمان را توضیح دهید؟
Can you describe the working culture of the organization?
از چه چیزی در شغل خود لذت می برید؟
What do you enjoy about your job?
آیا می توانید در مورد تیمی که قرار است در آن کار کنم بیشتر بگویید؟
Can you tell me more about the team I would be working in?
موفقیت در این موقعیت چگونه به نظر می رسد و چگونه آن را اندازه گیری می کنید؟
What does success look like in this position, and how do you measure it?
این شرکت در چند سال اخیر با چه چالش هایی روبرو بوده است؟ چالش ها چه می کنند
What challenges has this company faced in the last few years? What challenges do
در مورد چه تغییرات یا نوآوری هایی در صنعت بیشتر هیجان زده هستید؟
What changes or innovations in the industry are you most excited about?
نمایش نظرات