10 често задавани въпроса за интервю на учен с данни

Полето на науката за данни непрекъснато се развива, обхващайки няколко индустрии и изисква богат набор от умения, който включва математика, статистика, програмиране и маркетинг. Като такъв, да се превърне в учен с данни изисква впечатляваща комбинация от технически умения, креативност и комуникация.

Описанията на длъжността за учените с данни могат да варират значително, въпреки че всички търсят кандидати с дълъг списък от най-желаните работни умения като критично мислене, решаване на проблеми, анализиране на данни, емоционална интелигентност, внимание към детайлите и работа в екип. Това означава, че въпросите за интервю за учени с данни могат да обхващат няколко различни теми и варират от типични меки заявки за умения до изключително технически дискусии.

Интервютата за наука за данни изискват много подготовка. Независимо дали сте свеж от висше училище по компютърни науки или искате да се прехвърлите в друга компания или индустрия, трябва да отделите време, за да разгледате основните концепции на вашата работа. Точно както знаете как да шофирате, но може да имате проблеми с декларирането на конкретни правила на пътя, може да останете в интервю, опитвайки се да формулирате как точно работи определен алгоритъм.

За да ви помогнем да се подготвите, сме съставили 10 от най-често срещаните въпроси за интервю на учен с данни. От ранни прожекции до видео и интервюта на втори етап и интервюта на място, ще срещнете голямо разнообразие от изпити като тези на вашите технически умения, комуникационни способности и стил на работа.

1. „Разкажете ни повече за най-новия проект във вашето портфолио.“

Учените за данни са в търсенето в много различни индустрии, но компаниите често търсят човек с много специфични умения, както и с добра култура. Подробно онлайн портфолио, показващо вида работа, на която сте способни, както и силно присъствие в социалните медии и личната марка, ви помага да се откроите от другите кандидати, както и да ви свърже с наемането на мениджъри и наематели на работа, за които сте перфектно подходящ за.

Бъдете подготвени във всяко интервю за научни данни, за да говорите подробно за всички елементи на вашето CV, портфолио или уебсайт. Съобразете отговора си за проект, който да отговаря на вашата аудитория. Ако това е първоначален скрининг или панел с участници от различни отдели, фокусът ви трябва да е върху начините, по които вашата работа създава положителни резултати за клиента и техния бизнес.

Когато стигнете до частта от процеса на интервю, където се срещате с друг учен, инженер, анализатор или друго техническо лице, е необходимо по-подробно описание на данните и процесите, участващи във вашата работа.

2. "Защо искате да работите за тази компания?"

Дори и да сте се свързали директно чрез вашето онлайн портфолио или профила на LinkedIn и сте поканени за интервю за открита позиция, компанията все пак ще иска да знае защо сте приели и защо смятате, че ще бъдете подходящ за работата.

Освен че се запознаете с техническите си умения, подготовката ви за интервюто трябва да включва проучване на бизнеса, за който кандидатствате. Информацията за тяхната индустрия, мисия, персонал, какво точно правят и колко добре се справят ще ви помогне да създадете специално съобразен отговор на този въпрос.

Разберете как вашият набор от умения ще им помогне да постигнат целите си. Намерете начин да изразите страст към един или повече аспекти на вашата работна роля, включително мисията, философията, иновациите или продуктовата линия на компанията. Ако това е вашата мечтана работа, може да си струва времето да съставите проект за научни данни преди интервюто, което решава проблем за тях - като привличане на нови демографски или планиране на доставките по-ефективно.

3. „Назовете данните, които най-много се възхищавате, и обяснете защо.“

Въпреки че това е много личен въпрос, който технически няма правилен отговор, избраните от вас отговори са много важни. Вашето изследване за компанията, както и тези на панела за интервю, могат да ви помогнат да направите добро първо впечатление само с този въпрос.

Познаването на хората, които са видни в тази област, както и онези, които в момента правят вълни, ще покаже на интервюиращите, че сте едновременно знаещи и страстни в бранша. Полезно е да обсъдите учени с данни, които са оценени в конкретната арена за кариера, за която кандидатствате, като финанси, медицина или фондова борса.

Този въпрос е повече от впечатляващ списък с имена. Частта "защо" на уравнението също ще покаже на бъдещите ви работодатели какво ценяте във вашата област и как ще подходите към работата си. Ако вашето изследване е показало, че компанията цени иновациите, целостта или дори определен статистически метод, това е чудесна възможност да ги уведомите, че споделяте същите тези ценности.

4. „Как бихте обяснили двигателя на препоръките на някой от отдел„ Маркетинг “?“

Едно от важните качества, които отличават учените от данни освен другите технически гении, е способността да конвертират, показват и обясняват данни по начин, който нетехническите хора могат да разберат. Това прави запитване като този един от най-важните въпроси за интервю на учен с данни, които ще срещнете. Интервюиращите искат да видят колко добре можете да комуникирате понятия като моделиране на данни, дървета на решения и линейна регресия на всяка аудитория.

В този конкретен случай ще искате първо да обясните с прости думи как работи двигател с препоръки с примери както за филтриране въз основа на съдържанието, така и за съвместно филтриране. След това ще искате да обсъдите как можете да работите с маркетинговия отдел, за да комбинирате уменията им да се харесват на клиентите със силата на алгоритъма, който използва събраните данни, за да помогнете да определите какво искат потребителите.

5. „Какви са разликите между обучението под надзор и без надзор?“

Можете да започнете с обобщаването, че основната разлика между тези две е, че контролираното обучение има данни за обучение, от които алгоритъмът може да се научи и да даде отговори. Неуправляемото обучение изисква групиране на нещата заедно по прилики, общи аномалии и други процеси за търсене на модел, а не чрез твърди и бързи данни.

Интервюиращият ще иска да навлезете в повече подробности, така че е важно да изброите специфичните различия и да можете да говорите за различните използвани алгоритми.

Контролирано обучение

 • използва известни и етикетирани данни като входни данни
 • има механизъм за обратна връзка
 • използва се за прогнозиране
 • неговите общи алгоритми включват дърво за решения, логистична регресия, линейна регресия, машина за поддръжка на вектори и произволна гора

Неуправляемо обучение

 • използва незаместени данни като вход
 • няма механизъм за обратна връзка
 • използван за анализ
 • неговите общи алгоритми включват к-групиране на групи, йерархично клъстериране, автоенкодери и правила за асоцииране

Ще искате да имате някои примери, или общи, или от конкретен проект, над който сте работили, за да илюстрирате разликите между тези два типа машинно обучение и в какви случаи може да се използва всеки. Например, неподдържаното обучение може да се използва при пускането на нов продукт, където демографските данни на клиента, на които може да се хареса, са неизвестни.

Абонирай се

Регистрирайте се в нашия бюлетин за по-страхотно съдържание и вземете 20% ОТСТЪПКА на нашия тест за кариера!

Абонирай се

6. „Как да избегнете отклоненията в селекцията?“

Този въпрос може да приеме много форми в интервю за наука за данни. Може да бъдете помолени да определите пристрастията за подбор, как да го избегнете или да дадете конкретен пример за това как е изиграла роля в проект, върху който сте работили.

Основният проблем при отклоненията за подбор е, че изводите са направени от неслучайна извадка. Очевидно най-лесното решение е винаги да избирате от произволна извадка от ясно дефинирана популация. Ще трябва да разясните защо това не винаги е възможно.

Имайте предвид, че тъй като пристрастията за подбор могат да бъдат умишлени - с подбор на предмет или елиминиране на данни, предназначени специално за доказване на предварително създадена теория или прогноза - това би могло да бъде индиректен начин за наемащия панел да зададе един от тези трудни въпроси за интервю за етиката и почтеността в работата.,

В крайна сметка ще искате да подчертаете как пристрастията към селекцията са по-често случаите на неволни или неизбежно предубедени данни. Не забравяйте да разгледате някои от областите, в които може да възникне отклонение при подбор, включително вземане на проби, времеви интервал, данни и износване. След това дайте няколко примера за това как техники за използване като преустановяване и увеличаване могат да ви помогнат да заобиколите неслучайни проби.

Ако сте в частта от интервюто, когато разговаряте с представители от по-малко технически отдели, използвайте лесно смилаем пример, който ясно илюстрира пристрастията към селекцията. Ученият по данни Ерик Холингсуорт споменава урок, извлечен от огнището на птичия грип от 2011 г., където „само много болни индивиди бяха преброени“ в статистическа извадка от „потвърдени случаи“. Получените 80% отчитат смъртността, толкова ужасна поради отклоненията от селекцията, създава значителен широко разпространен страх.

7. „Как могат да бъдат третирани стойностите на външните стойности?“

Това е често срещан въпрос за интервю за учените по данни, тъй като той разкрива как използвате данните, които ви се предоставят, методите, които използвате за обработка на тези данни и дали сте готови да поставите време, за да оцените всяка част от тези данни.

Първо ще искате да поговорите за това какво представлява външен вид, като числа, които съществуват по начин извън клъстера от данни на графика, като 2–3 стандартни отклонения от средната стойност и т.н. Следващата стъпка към справянето с външните хора е оценка на причината за това.

Малко количество отшелници, които могат да бъдат приписани на обикновена човешка или машинна грешка, лесно се елиминират. Не забравяйте обаче да отбележите, че дори и един външен човек може да бъде ключова точка от данни, а не проблем, тъй като може да показва успеха на единна маркетингова тактика, нова лекарствена съставка или продуктова линия.

На следващо място, вие ще искате да обясните как да се справите с голям брой хора, които са извънредни, което изисква по-сложни решения. Например може да се наложи да промените модела, който използвате, да нормализирате данните до средния или да използвате произволен горски алгоритъм. Още веднъж, опитайте се да използвате случай от реалния живот от опита си като учен с данни, за да обясните правилните тактики.

8. „Защо е важно почистването на данни?“

Събирането и почистването на данни са доминираща част от работата ви като учен с данни, заемайки до 80% от времето ви. В каквато и индустрия да кандидатствате, въпросите за интервю винаги ще включват въпроса защо почистването на данните е важно. Интервюиращите също ще питат за предпочитаните от вас методи за почистване и програми.

Трябва да подчертаете колко чисти данни са необходими, за да направите правилните заключения, но не става въпрос само за числата. Обяснете как започването с пълни, точни, валидни и унифицирани данни влияе пряко върху бизнеса им. Основните ползи за обсъждане включват:

 • подобрено вземане на решения относно целите на компанията
 • по-бързо привличане на клиенти и пренасочване на предишни клиенти
 • спестяване на време и ресурси поради елиминиране на неточни или дублирани данни
 • подобрена производителност
 • засилен морал на екипа благодарение на многократните ефективни и точни резултати

9. „Каква е целта на A / B тестването?“

Въпросите относно A / B тестване по време на интервюто ви за позиция на учен за данни могат да започнат с по-обща справка за използването на експериментален дизайн, за да се отговори на една заявка за поведението или предпочитанията на потребителя. Целта на тестване на променлива за дизайн на уебсайт, приложение или бюлетин е просто да се прецени дали една промяна ще увеличи процента на интерес, ангажираност и конверсия.

Един от начините да се разграничите в отговорите на тези видове въпроси за интервю е да обсъдите как други учени с данни могат да направят грешни заключения от A / B тестване. Възможните клопки включват:

 • не събира достатъчно данни за достатъчно дълъг период от време
 • тестване на твърде много променливи наведнъж
 • не отчитане на външни фактори, които могат да повлияят на трафика през периода на тестване
 • игнориране на малки печалби, които могат да се изградят във времето и да се комбинират с други положителни промени за увеличаване на приходите
 • липсват интерпретации с голяма картина като нетни финансови печалби или загуби спрямо обменните курсове

Освен че посочвате тези проблеми, ще трябва да изразите как бихте ги решили - или още по-добре, как вече сте ги избегнали в предишните си проекти за научни данни.

10. „Имате 48 часа, за да решите това предизвикателство за кодиране.“

Предизвикателството за кодиране може да бъде първоначален начин за скрининг на потенциални учени за данни или може да бъде втора стъпка в процеса на интервю, след като сте изчистили първото препятствие с рекрутер или наемащ мениджър. Това може да бъде тест на място, който отнема 30 минути до 2 часа, където ще кодирате на бяла дъска или на клавиатура в рамките на гледката на интервюиращия. Често ви се предлага избор на език, но бъдете готови да кодирате в SQL или Python.

Някои компании възлагат по-дълги задачи със срокове до седмица. Предизвикателствата на бялата дъска може да изискват писане на доста прости SQL заявки, но по-дългите тестове са, разбира се, по-сложни. Обикновено ще ви бъдат предоставени данни и ще бъдете помолени да правите конкретни прогнози, като използвате тези данни и ще трябва да покажете работата си. Например, на скорошна тема за интервю на учен с данни бяха дадени данни на Airbnb и се поиска да прогнозира цените на жилищата въз основа на характеристиките на настаняването.

Интервюиращите ще искат да обсъдят избора ви с вас, предположенията, които сте направили, функциите, които сте избрали, защо сте използвали определени алгоритми и други. Често отговорът, до който стигате, е по-маловажен от вашия процес, креативност, четене на код и дизайн.

Това може да бъде преживяващо нервно интервю преживяване, затова се подгответе, като създавате и допълвате практически предизвикателства за кодиране с приятели или колеги в областта на научните данни. Можете също да посетите сайтове като Leetcode и SQLZOO за упражнения за кодиране. Действителните макетни интервюта, включващи алгоритмични и системни проблеми при проектирането, са достъпни безплатно чрез Interviewing.io.

Както можете да видите, въпросите за интервю за учените с данни могат да бъдат трудни, а цялостният процес може да бъде дълъг и изтощителен. Един от най-важните съвети за интервю е да останете позитивни, дори ако смятате, че част от процеса на интервюто е отишла зле. Често сме по-трудни към себе си от другите и все пак бихте могли да си свършите работата, въпреки че не получавате всеки отговор толкова съвършен, колкото бихте искали.

Ако пропуснете възможността, попитайте за обратна връзка и я използвайте, за да подобрите следващото си интервю. В крайна сметка много утвърдени данни учени бяха отхвърлени от няколко позиции и все пак продължиха да постигат успех в работата, която в крайна сметка беше по-подходяща!

С какви въпроси и кодиращи предизвикателства се сблъскахте, когато се опитвате да наемете работа за наука за данни? Присъединете се към дискусията в коментарите по-долу и помогнете на вашите колеги учени да се подготвят за следващото си интервю!

Оставете Коментар

Please enter your comment!
Please enter your name here