Întrebări și răspunsuri la interviu Ab initio

Așadar, în sfârșit, ți-ai găsit jobul de vis în Ab initio, dar te întrebi cum să crape interviul Ab initio și care ar putea fi întrebările de interviu Ab initio probabile pentru 2018. Fiecare interviu este diferit, iar sfera unui job este diferită. Reținând acest lucru, am conceput cele mai obișnuite întrebări și răspunsuri la interviu Ab initio pentru 2018 pentru a vă ajuta să obțineți succes în interviu.

Mai jos se află întrebările de la interviu Ab initio care sunt adresate frecvent într-un interviu. Aceste întrebări la interviu sunt împărțite în două părți:

Partea 1 - Întrebări ale interviului Ab initio (de bază)

Această primă parte acoperă întrebările de bază și răspunsurile la interviu Ab initio.

1. Care sunt componentele sau funcțiile disponibile în ab initio?

Răspuns:
Principalele componente din ab initio sunt aici mai jos,

componentScop
DedupPentru a elimina duplicatele
A te alaturaPentru a vă alătura setului de date de intrare multiple bazat pe o valoare cheie comună.
FelAceastă componentă reordonează datele. Este nevoie de comanda de colaționare și aruncă datele în memorie
FiltruOrice eliminare condiționată a datelor.
replicateAceasta este componentă este în principal pentru paralelism, deoarece o copie suplimentară de date este utilă, în timp ce orice alte noduri nu sunt disponibile.
combinaAceastă componentă este de a combina mai multe date de intrare.

2. Care sunt tipurile de prelucrare paralelă?

Răspuns:
Aceasta este întrebarea comună a interviului Ab initio adresată într-un interviu. Diferite tipuri de prelucrări paralele sunt,

  1. Paralelismul component
  2. Paralelismul de date
  3. Paralelismul conductelor

Paralelismul componentelor: o aplicație care are mai multe componente care rulează simultan pe sistem. Dar datele sunt separate. Acest lucru se realizează prin procesarea paralelă la nivel de componentă.

Paralelismul de date: datele sunt împărțite în segmente și execută operațiunile simultan. Acest tip de proces se realizează folosind paralelismul de date

Paralelismul conductelor: o aplicație cu mai multe componente, dar care rulează pe același set de date. Aceasta folosește paralelismul conductelor.

3. Care este modalitatea diferită de a realiza partițiile?

Răspuns:
Există mai multe modalități de a face partițiile.

PartițiileDescriere
ExpresieDate împărțite în funcție de limbajul de manipulare a datelor.
CheieGruparea datelor după anumite taste
Soldul de încărcareEchilibrarea dinamică a sarcinii
ProcentSeparați datele în care dimensiunea de ieșire este pe fracțiile de 100
GamăÎmpărțiți datele în mod egal pe baza unei chei și a unui interval între noduri
Robin rotundDistribuirea datelor în mod egal în blocuri între partițiile de ieșire.

Să trecem la următoarea întrebare a interviului Ab initio.

4. Ce este un sistem multifile?

Răspuns:
Multifile este un set de directoare pe diferite noduri dintr-un cluster. Au o structură de director identică. Sistemul multifile duce la o performanță mai bună, deoarece este procesarea paralelă, unde datele se află pe mai multe discuri.

Este creat cu partiția de control pe un nod și partiții de date pe celelalte noduri pentru a distribui procesarea pentru a îmbunătăți performanța.

5. Diferența dintre Hadoop și Ab initio?

Răspuns:

HadoopAb initio
Sursa deschisaSoftware proprietar
Prelucrare paralelă prin mapatoare și reductoareArhitectură de procesare paralelă
Orice varietate de date este cea mai potrivită aiciCel mai bun pentru implementările tradiționale EDW
Toleranța la erori este atinsăToleranța la erori nu este atinsă
MapReduce este controlat pe orice componente sau funcțiiComponentele precum alăturarea, gruparea, sortarea sunt ușor

efectuat

Este ieftin ca sursă deschisă și poate încerca orice caz de utilizare a afacerii.Scump și aplicabil pentru un caz de afaceri cu valori ridicate din cauza costului
Componentele cuplate ușor în care sunt construite funcțiile personalizateStrâns cuplate între componente, deoarece acestea sunt foarte recomandate pe baza cazului de utilizare a afacerii.

Partea 2 - Întrebări ale interviului Ab initio (avansat)

Să aruncăm acum o privire la Întrebările avansate de interviu Ab initio.

6. Ce fel de machete acceptă Ab initio?

Răspuns:

  • Acceptă machete seriale și paralele.
  • Un aspect grafic acceptă machete seriale și paralele simultan.
  • Un sistem cu mai multe fișiere este un sistem paralel cu 4 căi
  • O componentă dintr-un sistem grafic poate rula un sistem paralel cu 4 căi.

7. Care este relația dintre mediul de metadate Enterprise (EME), mediul de dezvoltare grafică (GDE) și sistemul de cooperare?

Răspuns:
Sistem coOperating: funcționează deasupra sistemului de operare, iar acesta este furnizat de ab initio și este baza pentru toate procesele Ab Initio. Comenzile aeriene sunt una dintre caracteristicile care pot fi instalate pe diferite sisteme de operare precum UNIX, Linux, IBM etc

Acestea sunt următoarele caracteristici pe care le oferă,
- Gestionează și rulează graficele Ab Initio și controlează procesele ETL
- Asigurarea extensiilor
- ETL procesează monitorizarea și depanarea
- Managementul metadatelor și interacțiunea cu EME

GDE: Este o componentă de proiectare și folosită pentru a rula graficele ab initio.

Graficele sunt formate din componente (predefinite sau definite de utilizator) și fluxuri și parametri. Oferă procesul ETL în Ab Initio, care este reprezentat prin grafice.

Posibilitatea de a rula, depana joburile de jurnal de proces și de a urmări jurnalele de execuție

Enterprise Meta-Environment (EME): Este un mediu de stocare și, de asemenea, de gestionare a metadatelor (atât de afaceri cât și de metadate tehnice). Metadatele sunt accesate din mediul de dezvoltare grafică și, de asemenea, browserul web sau linia de comandă care a cooperat. Este un depozit ab initio pentru deținători de locații.

Haideți să trecem la următoarele întrebări ale interviului Ab initio.

8.Cum sunt prelucrate datele și care sunt fundamentele acestei abordări?

Răspuns:
Există anumite activități care necesită colectarea datelor, iar cel mai bun lucru este prelucrarea depinde în mare măsură de același lucru în multe cazuri. Înainte de a prelucra datele, acesta trebuie să aibă reședință pe un anumit locator ca un spațiu de stocare bine definit. Această sarcină depinde de unii factori majori

1. Colectarea datelor
2. Prezentare
3. Rezultate finale
4.Analysis
5.Sorting

9. Care este diferența dintre partiționarea cu cheie și robinetul rotund?

Raspuns :
Aceasta este întrebările avansate ale interviului Ab initio adresate într-un interviu. Partition by key
În acest sens, trebuie să specificăm cheia pe care se va produce partiția. Rezultă date bine echilibrate datorită partițiilor bazate pe cheie. Este util pentru cheie dependentă
paralelism.
Partiție prin rundă rotundă: În aceasta, distribuirea uniformă a datelor în bucăți de mărime de bloc, înregistrările sunt partiționate într-un mod secvențial în partiția de ieșire. Nu este cheie
bazate și rezultatele sunt date bine echilibrate, în special cu dimensiunea unui bloc de 1. Este util pentru
înregistrează paralelismul independent.

10. Cum îmbunătățiți performanța unui grafic?

Raspuns :
Există multe moduri în care performanța graficului poate fi îmbunătățită.
1) Reduceți utilizarea mai multor componente în anumite faze.
2) Folosiți o valoare rafinată și bine definită a valorilor maxime de bază pentru componente și sortare
3) Minimizați utilizarea funcțiilor de expresie obișnuite precum re_index în funcțiile de transfer
4) Minimizați componenta de alătura sortată și, dacă este posibil, înlocuiți-le prin unire / memorare hash
5) Utilizați numai câmpurile obligatorii din componentele de sortare, reformatare, alăturare
6) Folosirea fazei sau a tamponului de flux în timpul cazurilor de îmbinare sau sortare îmbinate
7) Utilizați hash join dacă cele două seturi de intrare sunt mici, mai bine să alegeți unirea sortată pentru dimensiunea imensă de intrare
8) Pentru setul de date mari mai bine nu folosiți transmisia ca partiționată
9) Reduceți numărul de componente de sortare în timpul procesării.
10) Evitați distribuirea inutilă a datelor

Articol recomandat

Acesta a fost un ghid la Lista întrebărilor și răspunsurilor la interviu Ab initio, astfel încât candidatul să poată împărți cu ușurință aceste întrebări de interviu Ab initio. Aici, în acest post, am studiat despre întrebările de top ale interviului Ab initio, care sunt adesea puse în interviuri. De asemenea, puteți consulta următoarele articole pentru a afla mai multe -

  1. Întrebări cu interviuri Android - Top 10 Întrebări utile
  2. Întrebări la interviu Statistici | Utile și cele mai solicitate
  3. Întrebări la interviu Minitab - Top 7 întrebări utile de învățat
  4. Întrebări și răspunsuri la interviu Splunk pe care ar trebui să le știi