Introducere la întrebările și răspunsurile la interviu ETL

ETL înseamnă Extract-Transform-Load. Este o bază de sistem a depozitului de date, unde datele sunt extrase din diferite surse și apoi datele sunt transformate acolo unde datele sunt puse în aplicare sau prelucrate, astfel încât să se asigure calitatea, consistența datelor într-un format de prezentare adecvat și apoi în final datele sunt încărcate în Data Warehouse în format de prezentare, astfel încât poate ajuta utilizatorul final să obțină informațiile cu ușurință și să poată lua decizii.

Mai jos sunt cele mai bune întrebări pentru interviu ETL din 2019, care sunt adresate frecvent într-un interviu

Dacă sunteți în căutarea unui loc de muncă care are legătură cu ETL, trebuie să vă pregătiți pentru întrebările de interviu ETL din 2019. Deși fiecare interviu este diferit și sfera unui loc de muncă este de asemenea diferită, vă putem ajuta cu întrebările și răspunsurile la interviu ETL de top, care vă vor ajuta să faceți saltul și să aveți succesul în interviu.

Partea 1 - Întrebări de interviu ETL (de bază)

Această primă parte acoperă întrebările de bază și răspunsurile la interviu ETL

1. Extindeți sistemul ETL în depozitul de date? Explica

Răspuns:
Sistemul Extract-Transform-Load (ETL) este temelia depozitului de date. Un sistem ETL proiectat corespunzător extrage date din sistemele sursă, aplică standardele de calitate și consistență a datelor, confirmă datele astfel încât sursele separate să poată fi utilizate împreună și, în sfârșit, furnizează date într-un format gata de prezentare, astfel încât dezvoltatorii de aplicații să poată construi aplicații și utilizatori finali poate lua decizii.

2. Semnificația sistemului ETL în depozitul de date?

Raspuns :
Înlătură greșelile și corectează datele lipsă. Oferă măsuri documentate de încredere în date. Captează fluxul de date transnaționale pentru păstrare. Ajustează datele din mai multe surse pentru a fi utilizate împreună. Structură datele care pot fi utilizate de instrumentele utilizatorului final.

3. Care este procesul de zi cu zi în sistemul ETL?

Raspuns :
Construiți suita de dezvoltare / testare / producție a proceselor ETL. Înțelegeți compromisurile diferitelor structuri de date din spațiul din spate, inclusiv fișiere plane, scheme normalizate, scheme XML și schemă de dimensiuni (dimensionale). Analizați și extrageți datele sursă. Construiți un subsistem complet de curățare a datelor. Structurați datele în scheme dimensionale pentru o livrare cât mai eficientă utilizatorilor finali, instrumente de informații de afaceri, instrumente de extragere a datelor, cuburi OLAP și aplicații analitice. Furnizați date în mod eficient atât în ​​depozite de date puternic centralizate, cât și profund distribuite, utilizând aceleași tehnici. Reglați procesul global ETL pentru o performanță optimă.

Haideți să trecem la următoarele întrebări la interviu ETL.

4. Formate de date în sistemul ETL?

Raspuns :
Există diverse formate de date în ETL, unele dintre ele sunt fișiere plane, seturi de date XML, tabele de lucru DBMS independente, scheme de entitate / relație (E / R) normalizate și modele de date dimensionale.

5. Profilarea datelor în sistemul ETL?

Raspuns :
Profilarea datelor este o examinare sistematică a calității, a domeniului de aplicare și a contextului unei surse de date pentru a permite construirea unui sistem ETL. La o extremă, o sursă de date foarte curată care a fost bine întreținută înainte de a ajunge la depozitul de date necesită o transformare minimă și o intervenție umană pentru a încărca direct în tabelele de dimensiuni finale și tabele de fapt.

6. Ce este un validator ETL?

Raspuns :
ETL Validator este un instrument de testare a datelor care simplifică foarte mult testarea proiectelor de integrare a datelor, depozit de date și migrare de date. Utilizează arhitectura noastră patentată ELV pentru extragerea, încărcarea și validarea datelor din surse de date, cum ar fi baze de date, fișiere plane, sisteme XML, Hadoop și BI.

Partea 2 - Întrebări de interviu ETL (avansat)

Să aruncăm acum o privire la întrebările avansate de interviu ETL.

7. Care sunt operațiunile din Sistemul ETL?

Raspuns :
Următoarele trei operații: Extrage datele din sistemul dvs. transnațional care poate fi un Oracle, Microsoft sau orice altă bază de date relațională, transformă datele prin efectuarea operațiunilor de curățare a datelor. O încărcare este un proces de scriere a datelor în baza de date țintă.

8. Numește unele dintre instrumentele ETL utilizate mai ales pe piață?

Răspuns:
Există diferite instrumente ETL utilizate pe piață, dar unele dintre instrumentele ETL preferate cu ușurință
• Oracle Warehouse Builder (OWB)
• SAP Data Services.
• IBM Infosphere Information Server.
• Gestionarea datelor SAS.
• Centrul de informatică.
• Repertoriu Elixir pentru Data ETL.
• Migratorul de date (IBI)
• Servicii de integrare SQL Server (SSIS)

9. Care sunt rolurile și responsabilitățile echipei ETL?

Răspuns:
Rolul echipei ETL la cel mai înalt nivel este de a construi camera din spate a depozitului de date.
• Furnizați datele cel mai eficient instrumentelor utilizatorilor finali
• Adăugați valoare datelor în etapele de curățare și conformare
• Protejați și documentați linia de date
• Extragerea datelor din sursele originale
• Asigurarea calității și curățarea datelor
• Conformarea etichetelor și măsurilor din datele de realizat
• coerența între sursele originale
• Furnizarea de date într-un format fizic care poate fi utilizat de instrumentele de interogare,
• Scriitori de rapoarte și tablouri de bord.

Haideți să trecem la următoarele întrebări la interviu ETL.

10. Care este rolul analizei de impact în sistemul ETL?

Răspuns:
Analiza de impact examinează metadatele asociate cu un obiect (în acest caz, un tabel sau o coloană) și determină ce este afectat de o modificare a structurii sau conținutului său. Modificarea obiectelor de stocare a datelor poate sparge procesele care sunt cruciale pentru încărcarea corectă a depozitului de date. Permiterea modificărilor ad-hoc la obiectele de înregistrare a datelor este în detrimentul succesului proiectului. După crearea unui tabel în zona de stadializare, trebuie să efectuați o analiză de impact înainte de a face modificări. Mulți furnizori de instrumente ETL oferă funcționalitate de analiză a impactului, dar această funcționalitate este adesea trecută cu vederea în timpul probei de concept a produsului ETL, deoarece este o funcție de back-room și
Nu este foarte important până când depozitul de date nu funcționează și începe să evolueze.

11. Cum procesați fișierul plat cu lungime fixă?

Răspuns:
O dispunere a fișierului cu lungime fixă ​​ar trebui să includă numele fișierului, unde începe câmpul; lungimea sa; și tipul său de date (de obicei text sau număr). Uneori, poziția finală este furnizată. În caz contrar, trebuie să calculați poziția finală a fiecărui câmp pe baza poziției și a lungimii sale de început, dacă este necesar de instrumentul ETL. În majoritatea instrumentelor ETL, cel mai probabil trebuie să introduceți manual o dată layout-ul fișierului plat. După introducerea machetei, instrumentul amintește aspectul și se așteaptă la aceeași machetare de fiecare dată când interacționează cu fișierul plat real. Dacă aspectul fișierului se schimbă sau datele se opresc din pozițiile alocate, procesul ETL trebuie să fie programat pentru a eșua. Când prelucrați fișiere plane cu lungime fixă, încercați să validați că pozițiile datelor din fișier sunt corecte. O verificare rapidă pentru validarea pozițiilor constă în testarea oricărei date (sau ore) pentru a vă asigura că este o dată valabilă. Dacă pozițiile sunt schimbate, câmpul de date conține cel mai probabil caractere alfa sau numere ilogice. Alte câmpuri cu domenii foarte specifice pot fi testate în același mod. XML oferă abilități de validare mai concrete. Dacă validarea sau consecvența este o problemă, încercați să convingeți furnizorul de date să furnizeze datele în format XML.

12.De ce ETL în timp real în depozitul de date?

Răspuns:
Depozitul de date trebuie să ofere un set de date neclintit pentru factorii de decizie din afaceri, oferind un etaj informațional fiabil pe care să stea. Pentru raportarea actuală împotriva unei baze de date sclipitoare, utilizatorii de afaceri au fost direcționați către aplicațiile de producție care conduc compania. Prin urmare, utilizatorii au fost nevoiți să se prezinte la depozitul de date pentru o imagine istorică a ceea ce s-a întâmplat în afaceri de ieri și au trebuit să caute pe multe sisteme OLTP pentru o imagine a ceea ce se întâmplă astăzi. Utilizatorii de afaceri nu au acceptat niciodată această diferență. Depozitele de date au, desigur, absolut nevoie de fluxuri constante de informații pentru clienți dintr-o operațiune, însă sistemele din ce în ce mai operaționale se bazează pe îmbogățirea datelor de către depozit de date și pentru clienți. Prin urmare, este previzibil că organizațiile au început să exploreze alternative arhitecturale care pot susține scenarii de integrare mai generalizate care mută datele operaționale între aplicații și simultan în și în afara depozitului, cu o urgență din ce în ce mai mare.

Articole recomandate

Acesta a fost un ghid la Lista întrebărilor și răspunsurilor la interviu ETL, astfel încât candidatul să poată împărți cu ușurință aceste întrebări de interviu ETL. De asemenea, puteți consulta următoarele articole pentru a afla mai multe -

  1. Azure Paas vs Iaas - Caracteristici
  2. 9 Amazing MapReduce Interview Întrebări și răspunsuri
  3. Top 11 Cele mai utile întrebări și răspunsuri la interviu RDBMS
  4. 10 Cele mai grozave întrebări de interviu PHP pentru experienți
  5. Cunoașteți cele mai bune 5 întrebări utile pentru interviu DBA și răspuns

Categorie: