Introducere la întrebări și răspuns la interviu de date

Așadar, în sfârșit, ți-ai găsit jobul de vis în Data Analytics, dar te întrebi cum să spargi interviul Data Analytics din 2019 și care ar putea fi întrebările posibile pentru interviu Data Analytics. Fiecare interviu Data Analytics este diferit și sfera unui loc de muncă este diferită. Reținând acest lucru, am conceput cele mai comune întrebări și răspunsuri la interviu de date pentru a vă ajuta să obțineți succes în interviul dvs. Data Analytics.

Mai jos găsiți Top 2019 Întrebări de interviu pentru date Analytics care sunt adresate mai ales într-un interviu

1. Care este diferența dintre data mining și analiza datelor?

Răspuns:

Minerirea datelorAnaliza datelor
Nu este necesară o ipoteză pentru Data MiningAnaliza datelor începe cu o ipoteză.
Data Mining necesită date curate și bine documentate.Analiza datelor implică curățarea datelor.
Rezultatele extragerii datelor nu sunt întotdeauna ușor de interpretat.Analistii de date interpretează rezultatele și le prezintă părților interesate.
Algoritmii de extragere a datelor dezvoltă automat ecuații.Analiștii de date trebuie să-și dezvolte ecuațiile proprii.

2. Menționează care sunt diferitele etape ale unui proiect de analiză?

Răspuns:
Analiza datelor se ocupă cu colectarea, curățarea, transformarea și modelarea datelor pentru a obține informații valoroase și pentru a sprijini o mai bună luare a deciziilor într-o organizație. Pașii implicați în procesul de analiză a datelor sunt următorii -

Explorare de date - După ce a explorat problema de afaceri, un analist de date trebuie să analizeze cauza principală a problemei.
Pregătirea datelor - În această etapă a procesului de analiză a datelor găsim anomalii ale datelor, cum ar fi valori lipsă din date.
Modelare date - Etapa de modelare începe după pregătirea datelor. Modelarea este un proces iterativ în care modelul este rulat în mod repetat pentru îmbunătățiri. Modelarea datelor asigură că cel mai bun rezultat posibil pentru o problemă de afaceri.
Validare - În această etapă, modelul oferit de client și modelul dezvoltat de analistul de date sunt validate unul pentru celălalt pentru a afla dacă modelul dezvoltat va satisface cerințele de afaceri.
Implementarea modelului și urmărirea - În acest pas final al implementării modelului de analiză a datelor se face și după aceea urmărirea se face pentru a se asigura că modelul este implementat corect sau nu?

3. Care este responsabilitatea unui analist de date?

Răspuns:
• Rezolva probleme legate de afaceri pentru clienți și efectuează operațiuni de audit de date.
• Interpretați datele folosind tehnici statistice.
• Identificați zonele pentru oportunități de îmbunătățire.
• Analizați, identificați și interpretați tendințele sau tiparele în seturi de date complexe.
• Achiziționați date din surse de date primare sau secundare.
• Menținerea bazelor de date / sistemelor de date.
• Localizați și corectați problemele de cod utilizând indicatori de performanță.
• Securizarea bazei de date prin dezvoltarea sistemului de acces.

4.Care sunt coliziunile cu masa de scurgere? Cum este evitat?

Răspuns:
O coliziune de tabel hash se întâmplă atunci când două taste diferite hash la aceeași valoare. Există multe tehnici de evitare a coliziunii de masă hash, aici enumerăm două:
Înlănțuire separată: folosește structura de date care conține în același slot pentru a stoca mai multe articole.
Adresare deschisă: caută alte sloturi folosind o a doua funcție și stochează elementul în primul slot gol.

5. Lista celor mai bune instrumente care pot fi utile pentru analiza datelor?

Răspuns:
•Tablou
• RapidMiner
• OpenRefine
• KNIME
• Operatori de căutare Google
• Solver
• NodeXL
• io
• Wolfram Alpha
• Tabelele Google Fusion

6. Care este diferența dintre extragerea datelor și profilarea datelor?

Răspuns:
Diferența dintre extragerea datelor și profilarea datelor este următoarea -
• Profilarea datelor: vizează analiza instantanee a atributelor individuale precum prețul variază, prețul distinct și frecvența acestora, o incidență a valorilor nule, tipul de date, lungimea etc.
• Minerirea datelor: se concentrează pe dependențe, descoperirea secvenței, păstrarea relației între mai multe atribute, analiza clusterului, detectarea înregistrărilor neobișnuite etc.

7. Explicați algoritmul K-mean și algoritmul ierarhic de clustering?

Răspuns:
Algoritmul K-Mean - media K este o metodă faimoasă de partiționare. În algoritmul K-mediu, grupurile sunt sferice, adică punctele de date dintr-un cluster sunt centrate pe acel grup. De asemenea, variația clusterelor este similară, adică fiecare punct de date aparține celui mai apropiat cluster
Algoritmul de clustering ierarhic - Algoritmul de clustering ierarhic combină și împarte grupurile existente și creează o structură ierarhică pentru a arăta ordinea în care grupurile sunt împărțite.

8.Care este curățarea datelor? Menționați câteva bune practici pe care trebuie să le urmați în timp ce faceți curățarea datelor?

Răspuns:
Dintr-un set de date dat, este extrem de important să sortăm informațiile necesare pentru analiza datelor. Curățarea datelor este o etapă crucială în care datele sunt inspectate pentru a găsi orice anomalii, pentru a elimina informații repetate și incorecte etc. .
Unele dintre cele mai bune practici pentru curățarea datelor includ -
• Dezvoltarea unui plan de calitate a datelor pentru a identifica unde apar erori de calitate maximă a datelor, astfel încât să puteți evalua cauza principală și să planificați în funcție de aceasta.
• Urmați o metodă obișnuită de fundamentare a informațiilor necesare înainte de a fi introduse în informații.
• Identificați datele duplicate și validați acuratețea, deoarece acest lucru va economisi mult timp în timpul analizei.
• Urmărirea tuturor operațiunilor de îmbunătățire efectuate pe informații este incredibil de necesară pentru a repeta sau elimina orice operațiune, după cum este necesar.

9. Care sunt unele dintre metodele statistice care sunt utile pentru analistul de date?

Răspuns:
Metodele statistice care sunt utile pentru oamenii de știință sunt
• Metoda bayesiană
• Procesul Markov
• Procesele spațiale și cluster
• Statistici de rang, detectare procentuală, anterioară
• Tehnici de imputare etc.
• Algoritmul Simplex
• Optimizare matematică

10. Explicați ce este imputarea? Enumerați diferite tipuri de tehnici de imputare? Ce metodă de imputare este mai favorabilă?

Răspuns:
În timpul imputării, avem tendința de a înlocui informațiile lipsă cu valori substituite. Tipurile de tehnici de imputare implicate sunt -
• Imputare unică: Imputarea unică indică faptul că valoarea care lipsește este înlocuită cu o valoare. În această metodă, se preia dimensiunea eșantionului.
• Imputarea punții la cald: o valoare care lipsește este imputată dintr-o înregistrare similară aleatorie aleasă, utilizând cardul de perforare
• Imputarea punții la rece: funcționează la fel ca și imputarea punții la cald, dar este ceva mai avansată și alege donatorii din alte seturi de date
• Imputarea medie: presupune înlocuirea valorii lipsă cu valorile prevăzute de alte variabile.
• Imputarea de regresie: presupune înlocuirea valorii lipsă cu valorile previzionate ale unei anumite valori, în funcție de alte variabile.
• Regresie stocastică: este la fel ca imputarea regresivă, cu toate acestea, adaugă variația de regresie comună la imputarea regresiei
• Imputare multiplă: Spre deosebire de imputația unică, imputările multiple estimează valorile de mai multe ori

Deși o singură imputare este utilizată pe scară largă, aceasta nu reflectă incertitudinea creată de date lipsă la întâmplare. Deci, mai multe imputări sunt mai favorabile decât o singură imputare în cazul în care datele lipsesc la întâmplare.

Articole recomandate

Acesta a fost un ghid cuprinzător pentru întrebările și răspunsurile la interviu pentru date Analytics, astfel încât candidatul să poată împărți cu ușurință aceste întrebări de interviu cu date Analytics. De asemenea, puteți consulta următoarele articole pentru a afla mai multe -

  1. 10 Întrebări utile și răspuns la interviu agil
  2. 8 întrebări extraordinare pentru interviu Algoritm
  3. 25 Cele mai importante întrebări la interviu în informatică
  4. 10 întrebări și răspunsuri uimitoare la interviu pentru inginerul de date