10 domande di intervista allo scienziato di dati comunemente poste

Il campo della scienza dei dati è in continua evoluzione, abbraccia diversi settori e richiede un ampio set di competenze che include matematica, statistica, programmazione e marketing. Come tale, diventare uno scienziato di dati richiede una miscela impressionante di abilità tecnica, creatività e comunicazione.

Le descrizioni delle mansioni per i data scientist possono variare notevolmente, anche se tutti sono alla ricerca di candidati con una lunga lista delle competenze lavorative più desiderabili come pensiero critico, risoluzione dei problemi, analisi dei dati, intelligenza emotiva, attenzione ai dettagli e lavoro di squadra. Ciò significa che le domande di intervista per i data scientist possono comprendere diversi argomenti e spaziare dalle tipiche domande sulle competenze trasversali a discussioni estremamente tecniche.

Le interviste sulla scienza dei dati richiedono molta preparazione. Se sei appena uscito da una delle migliori scuole di informatica o stai cercando di passare a una diversa azienda o settore, dovresti prenderti del tempo per esaminare i concetti principali del tuo lavoro. Proprio come sai guidare ma potresti avere difficoltà a recitare specifiche regole della strada, potresti rimanere bloccato in un'intervista cercando di articolare il funzionamento di un algoritmo specifico.

Per aiutarti a prepararti, abbiamo compilato 10 delle domande più frequenti sulle interviste ai data scientist. Dalle prime proiezioni ai video di seconda e terza fase e interviste in loco, incontrerai un'ampia varietà di esami come queste delle tue capacità tecniche, capacità di comunicazione e stile di lavoro.

1. "Raccontaci di più sul progetto più recente nel tuo portafoglio."

I data scientist sono richiesti in molti settori diversi, ma le aziende sono spesso alla ricerca di qualcuno con competenze molto specifiche e una buona cultura. Un portfolio online dettagliato che mostra il tipo di lavoro di cui sei capace, oltre a una forte presenza sui social media e un marchio personale, ti aiuta a distinguerti dagli altri candidati e a collegarti con i responsabili delle assunzioni e i recruiter per i lavori che sei perfettamente adatto per.

Preparati a qualsiasi colloquio di scienza dei dati per parlare ampiamente di tutti gli elementi del tuo CV, portfolio o sito Web. Adatta la tua risposta a un progetto in base al tuo pubblico. Se si tratta di una proiezione iniziale o di un panel con partecipanti di una varietà di dipartimenti, l'attenzione dovrebbe essere focalizzata sui modi in cui il tuo lavoro ha creato risultati positivi per il cliente e la sua attività.

Quando si arriva alla parte del processo di intervista in cui si incontra un altro scienziato di dati, ingegnere, analista o altra persona tecnica, è richiesta una descrizione più dettagliata dei dati e dei processi coinvolti nel proprio lavoro.

2. "Perché vuoi lavorare per questa azienda?"

Anche se sei stato contattato direttamente tramite il tuo portfolio online o il tuo profilo LinkedIn e invitato a intervistare una posizione aperta, la società vorrà comunque sapere perché hai accettato e perché pensi che sarai adatto per il lavoro.

Oltre a migliorare le tue capacità tecniche, la preparazione per il colloquio dovrebbe includere la ricerca sul business a cui ti stai candidando. Le informazioni sul loro settore, missione, personale, esattamente ciò che fanno e quanto bene lo stanno facendo ti aiuteranno a creare una risposta su misura per questa domanda.

Affronta come il tuo skillset li aiuterà a raggiungere i loro obiettivi. Trova un modo per esprimere la passione per uno o più aspetti del tuo ruolo professionale, tra cui la missione, la filosofia, l'innovazione o la linea di prodotti dell'azienda. Se questo è il lavoro dei tuoi sogni, può valere la pena mettere insieme un progetto di scienza dei dati prima dell'intervista che risolva un problema per loro, come fare appello a un nuovo gruppo demografico o pianificare le consegne in modo più efficiente.

3. "Nomina i data scientist che ammiri di più e spiega perché".

Mentre questa è una domanda molto personale che tecnicamente non ha una risposta giusta, le risposte che selezioni sono molto importanti. Le tue ricerche sull'azienda, così come quelle sul pannello delle interviste, possono aiutarti a fare una buona prima impressione solo con questa domanda.

Conoscere le persone di spicco nel settore e quelle che stanno attualmente facendo ondate mostrerà agli intervistatori che siete entrambi ben informati e appassionati del settore. È utile discutere i data scientist che sono apprezzati nell'arena professionale specifica per cui ti stai candidando, come finanza, medicina o borsa.

Questa domanda è più di un semplice elenco di nomi. La parte "perché" dell'equazione mostrerà anche ai tuoi potenziali datori di lavoro ciò che apprezzi nel tuo campo e come affronterai il tuo lavoro. Se la tua ricerca ha dimostrato che l'azienda apprezza l'innovazione, l'integrità o anche un determinato metodo statistico, questa è un'ottima opportunità per far loro sapere che condividi quegli stessi valori.

4. "Come spiegheresti un motore di raccomandazioni a qualcuno del dipartimento Marketing?"

Una delle qualità importanti che distingue i data scientist dagli altri geni tecnici è la capacità di convertire, visualizzare e spiegare i dati in un modo che le persone non tecniche possano comprendere. Ciò rende una domanda come questa una delle più importanti domande di intervista di data scientist che incontrerai. Gli intervistatori vogliono vedere come è possibile comunicare concetti come la modellazione dei dati, gli alberi delle decisioni e la regressione lineare a qualsiasi pubblico.

In questo caso specifico, ti consigliamo innanzitutto di spiegare in termini semplici come funziona un motore di raccomandazione, con esempi di filtro basato sul contenuto e filtro collaborativo. Quindi vorrai discutere su come lavorare con l'ufficio marketing per combinare le loro capacità di attrarre i clienti con la potenza dell'algoritmo che utilizza i dati raccolti per aiutare a individuare ciò che i consumatori desiderano.

5. "Quali sono le differenze tra apprendimento supervisionato e non supervisionato?"

Puoi iniziare riassumendo che la differenza principale tra questi due è che l'apprendimento supervisionato ha dati di addestramento che l'algoritmo può apprendere e fornire risposte. L'apprendimento non supervisionato richiede di raggruppare le cose in base a somiglianze, anomalie comuni e altri processi di ricerca di schemi piuttosto che mediante dati concreti e veloci.

L'intervistatore vorrà che tu approfondisca i dettagli, quindi è importante elencare le differenze specifiche ed essere in grado di parlare dei vari algoritmi utilizzati.

Apprendimento supervisionato

  • utilizza dati noti ed etichettati come input
  • ha un meccanismo di feedback
  • utilizzato per la previsione
  • i suoi algoritmi comuni includono albero decisionale, regressione logistica, regressione lineare, macchina vettoriale di supporto e foresta casuale

Apprendimento senza supervisione

  • utilizza dati senza etichetta come input
  • non ha alcun meccanismo di feedback
  • usato per analisi
  • i suoi algoritmi comuni includono il clustering dei mezzi K, il clustering gerarchico, i codificatori automatici e le regole di associazione

Ti consigliamo di avere alcuni esempi, generici o di un progetto specifico su cui hai lavorato, per illustrare le differenze tra questi due tipi di apprendimento automatico e in quali casi ciascuno potrebbe essere utilizzato. Ad esempio, l'apprendimento senza supervisione può essere utilizzato quando si lancia un nuovo prodotto in cui non sono noti i dati demografici del cliente a cui potrebbe rivolgersi.

sottoscrivi

Iscriviti alla nostra newsletter per altri fantastici contenuti e ricevi uno sconto del 20% sul nostro test di carriera!

sottoscrivi

6. "Come evitare la distorsione da selezione?"

Questa domanda può assumere molte forme in un'intervista di data science. È possibile che ti venga chiesto di definire un orientamento alla selezione, come evitarlo o di fornire un esempio specifico di come ha svolto un ruolo in un progetto su cui hai lavorato.

Il problema principale con la distorsione della selezione è che le conclusioni sono state tratte da un campione non casuale. Ovviamente, la soluzione più semplice è quella di selezionare sempre da un campione casuale di una popolazione chiaramente definita. Dovrai approfondire il motivo per cui non è sempre possibile.

Essere consapevoli del fatto che poiché la distorsione della selezione può essere intenzionale - con la selezione del soggetto o l'eliminazione dei dati intenzionalmente fatta per dimostrare una teoria o una proiezione preconcetta - questo potrebbe essere un modo indiretto per il panel di assunzioni di porre una di quelle difficili domande del colloquio sull'etica e l'integrità sul lavoro .

Alla fine vorrai sottolineare come il bias di selezione sia più spesso un caso di dati involontari o inevitabilmente distorti. Assicurati di elaborare alcune delle aree in cui possono verificarsi errori di selezione, inclusi campionamento, intervallo di tempo, dati e attrito. Quindi fornisci alcuni esempi di come sfruttare tecniche come il ricampionamento e il potenziamento possono aiutarti a aggirare campioni non casuali.

Se sei nella parte di un'intervista quando parli con rappresentanti di dipartimenti meno tecnici, usa un esempio facilmente digeribile che illustri chiaramente la distorsione della selezione. Lo scienziato dei dati Eric Hollingsworth fa riferimento a una lezione appresa dall'epidemia di influenza aviaria del 2011, in cui "solo le persone molto malate sono state contate" in un campione statistico di "casi confermati". L'80% risultante ha riferito che il tasso di mortalità, così terribile a causa della propensione alla selezione, ha creato una notevole paura diffusa.

7. "Come si possono trattare i valori anomali?"

Questa è una domanda di intervista comune per i data scientist, in quanto rivela come usi i dati che ti vengono dati, i metodi che usi per elaborare quei dati e se sei disposto a mettere il tempo per valutare ogni pezzo di quei dati.

Dovresti prima parlare di ciò che costituisce un valore anomalo, come numeri che esistono al di fuori del cluster di dati su un grafico, come 2-3 deviazioni standard dalla media e così via. Il prossimo passo per gestire i valori anomali è valutare il motivo per cui sono accaduti.

Una piccola quantità di valori anomali che possono essere attribuiti a un semplice errore umano o macchina vengono facilmente eliminati. Assicurati di notare, tuttavia, che anche un singolo outlier può essere un punto di dati chiave piuttosto che un problema, in quanto può indicare il successo di una singola tattica di marketing, nuovo ingrediente di farmaco o linea di prodotti.

Successivamente, ti verrà spiegato come gestire un gran numero di valori anomali, il che richiede soluzioni più complesse. Ad esempio, potrebbe essere necessario modificare il modello in uso, normalizzare i dati in media o utilizzare un algoritmo di foresta casuale. Ancora una volta, prova a utilizzare un caso reale della tua esperienza come scienziato di dati per spiegare le tattiche corrette.

8. "Perché la pulizia dei dati è importante?"

La raccolta e la pulizia dei dati sono una parte dominante del tuo lavoro come data scientist, che occupa fino all'80% del tuo tempo. Qualunque sia il settore a cui ti rivolgi, le domande del colloquio includeranno sempre una sul perché la pulizia dei dati è importante. Gli intervistatori chiederanno anche le tue tecniche e programmi di pulizia preferiti.

Dovresti sottolineare quanto siano necessari dati puliti per trarre le conclusioni corrette, ma non si tratta solo dei numeri. Spiega come iniziare con dati completi, accurati, validi e uniformi influisce direttamente sulla loro attività. I principali vantaggi da discutere includono:

  • miglioramento del processo decisionale sugli obiettivi aziendali
  • acquisizione e re-targeting più rapidi dei clienti passati
  • risparmio di tempo e risorse grazie all'eliminazione di dati imprecisi o duplicati
  • produttività migliorata
  • aumentato il morale della squadra grazie a risultati ripetuti efficienti e precisi

9. "Qual è l'obiettivo del test A / B?"

Le domande sui test A / B durante il colloquio per una posizione di data scientist potrebbero iniziare con un riferimento più generico all'utilizzo del design sperimentale per rispondere a una singola domanda sul comportamento o sulle preferenze dell'utente. L'obiettivo di testare una variabile di progettazione di siti Web, app o newsletter è semplicemente valutare se una modifica aumenterà i tassi di interesse, coinvolgimento e conversione.

Un modo per distinguersi nel rispondere a questi tipi di domande di intervista è discutere su come altri scienziati dei dati potrebbero trarre conclusioni errate dai test A / B. Le possibili insidie ​​includono:

  • non raccogliere dati sufficienti per un periodo di tempo sufficientemente lungo
  • test di troppe variabili contemporaneamente
  • non tiene conto di fattori esterni che possono influenzare il traffico durante il periodo di prova
  • ignorando piccoli guadagni che possono accumularsi nel tempo e combinarsi con altri cambiamenti positivi per aumentare le entrate
  • mancano interpretazioni generali come guadagni o perdite finanziarie netti relativi ai tassi di conversione

Oltre a sottolineare questi problemi, dovrai esprimere come li risolveresti o, meglio ancora, come li hai già evitati nei tuoi precedenti progetti di data science.

10. "Hai 48 ore per risolvere questa sfida di codifica."

La sfida di codifica può essere un modo iniziale per selezionare potenziali data scientist o potrebbe essere un secondo passo nel processo di intervista dopo aver superato il primo ostacolo con un recruiter o un responsabile delle assunzioni. Questo può essere un test in loco che richiede da 30 minuti a 2 ore, in cui dovrai scrivere un codice su una lavagna o su una tastiera in vista dell'intervistatore. Ti viene spesso data una scelta di lingua, ma preparati a programmare in SQL o Python.

Alcune aziende assegnano compiti più lunghi, con scadenze fino a una settimana. Le sfide della lavagna potrebbero richiedere la scrittura di query SQL abbastanza semplici, ma i test più lunghi sono, ovviamente, più complessi. In genere, ti verranno dati e ti verrà chiesto di fare previsioni specifiche usando tali dati e dovrai mostrare il tuo lavoro. Ad esempio, una recente intervista di data scientist ha ricevuto dati Airbnb e gli è stato chiesto di prevedere i prezzi delle case in base alle caratteristiche dell'alloggio.

Gli intervistatori vorranno discutere con te delle tue scelte, dei presupposti che hai fatto, delle funzionalità che hai scelto, del motivo per cui hai utilizzato determinati algoritmi e altro ancora. Spesso, la risposta a cui si arriva è meno importante del processo, della creatività, della leggibilità del codice e del design.

Questa può essere un'esperienza di intervista snervante, quindi preparatevi creando e completando le sfide di codifica pratica con amici o colleghi nel campo della scienza dei dati. Puoi anche visitare siti come Leetcode e SQLZOO per esercizi di codifica. Interviste simulate reali che coinvolgono problemi di progettazione algoritmica e di sistema sono disponibili gratuitamente tramite Interviewing.io.

Come puoi vedere, le domande di intervista per i data scientist possono essere difficili e il processo complessivo può essere lungo e estenuante. Uno dei suggerimenti più importanti per il colloquio è quello di rimanere positivi, anche se ritieni che una parte del processo del colloquio sia andata male. Spesso siamo più duri con noi stessi rispetto agli altri e potresti comunque ottenere il lavoro nonostante non ottenga tutte le risposte perfette come avresti voluto.

Se perdi l'opportunità, chiedi un feedback e utilizzalo per migliorare la tua prossima esperienza di intervista. Dopotutto, molti data scientist affermati sono stati respinti da diverse posizioni e hanno continuato ad avere successo nei lavori che alla fine si sono rivelati la soluzione migliore!

Quali domande e sfide di codifica hai incontrato durante il tentativo di ottenere un lavoro di data science? Partecipa alla discussione nei commenti qui sotto e aiuta i tuoi colleghi data scientist a prepararsi per la prossima intervista!

Lascia Il Tuo Commento

Please enter your comment!
Please enter your name here