Introducere la interviul de porc Întrebări și răspunsuri

Apache Pig este o platformă la nivel înalt pentru care este folosită pentru a crea programe care rulează pe Hadoop. Limba porcului este cunoscută sub denumirea de Latin Pig. Porcul este scris în Java și a fost dezvoltat de fondurile software de cercetare Yahoo și Apache. Lansarea sa inițială a avut loc la 11 septembrie 2008. Pregătirea pentru un interviu de muncă la Pig. Sunt sigur că doriți să cunoașteți cele mai comune întrebări și răspunsuri la interviul cu porc care vă vor ajuta să spargeți cu ușurință Interviul de porc.

Mai jos este lista cu cele mai bune întrebări și răspunsuri la interviul cu porci la salvarea dvs. aceste întrebări de interviu sunt împărțite în două părți:

  • Partea 1 - Întrebări despre interviul cu porci (de bază)
  • Partea 2 - Întrebări despre interviul cu porci (avansat)

Partea 1 - Întrebări despre interviul cu porci (de bază)

Această primă parte acoperă întrebările și răspunsurile de bază ale interviului cu Pig

Î1.Care este diferența dintre Map Reduce și Pig?

Răspuns:
Map Reduce este un limbaj compilat, iar eficiența codului Map-reduce este mare, iar Pig este un limbaj de script cu o eficiență de cod mai mică.

Î2.Ce vrei să spui cu geanta din porc?

Răspuns:
Colecția de tupluri este cunoscută sub numele de pungă la un porc.

Q3.Care sunt tipurile de date complexe din Pig?

Răspuns:
Harta, tuplurile și geanta sunt tipurile de date complexe ale porcilor.

Q4.Ce este aplatizat în porc?

Răspuns:
Când dorim să eliminăm cuibul din datele din tuple sau geantă, atunci folosim Flatten.

Q5.Supunem că avem un nume de fișier cu abc.csv și care are atributul ca id, nume, an, rating, durată. Cum veți încărca acest fișier la un porc?

Răspuns:
filme = LOAD 'calea abc.csv' UTILIZARE Depozitare porc (', ') ca (id, nume, an, rating, durată);

Q6.Care este diferența dintre PigLatin și HIVEQL?

Răspuns:
HIVEQL este un limbaj declarativ și PigLatin este un mail procedural.

Haideți să trecem la următoarea întrebare la interviu cu porci.

Q7.Ce vrei să spui cu o geantă interioară și geantă exterioară la porc?

Răspuns:
Relația din interiorul sacului se referă la geanta interioară și relația normală este cunoscută sub numele de geantă exterioară.

Q8. Care este diferența dintre Group și COGROUP?

Răspuns:
Operatorul de GRUP este folosit pentru gruparea datelor într-o singură relație, iar COGROUP este utilizat pentru crearea relației în GROUP și JOIN.

Q9. Care este diferența dintre COUNT și COUNT_STAR?

Răspuns:
Funcția COUNT nu funcționează cu o valoare NULL atunci când numărăm un element dintr-un sac, dar COUNT_STAR va lua în considerare valoarea NULL.

Q10. Care sunt operatorii de diagnostic disponibili în Apache Pig?

Răspuns:
Operator de descărcare de gestiune, Descrieți operatorul, Explicați operatorul, ilustrați operatorul.

Q11. Ce vrei să spui prin operator UNION și SPLIT?

Răspuns:
Folosind un operator UNION putem îmbina conținutul a două sau mai multe relații și un operator SPILLED este utilizat pentru a împărți relația unică în două sau mai multe relații.

Q12.Cum să obții primele 10 tupluri din relația R?

Răspuns:
Prin utilizarea funcției TOP ().

Haideți să trecem la următoarea întrebare la interviu cu porci.

Î13.Care sunt asemănările dintre porc și stup?

Răspuns:
Utilizarea porcului PigLatin și Hive folosesc HiveQL convertesc ambele comenzi în joburi MapReduce.

Q14. Care sunt diferitele tipuri de funcții ale UDF ale JAVA care sunt acceptate de Apache Pig?

Răspuns:
Funcțiile algebrice, Eval, Filtru sunt tipurile de funcții UDF.

Q15. Aveți un fișier filme.txt în directorul HDFS cu 1000 de înregistrări. Doriți să vedeți doar primele 10 înregistrări din fișierul films.txt. Cum vei face asta?

Răspuns:
În primul rând, trebuie să încărcați filmele.txt cu numele relației film:
films = LOAD 'calea filmelor.txt' UTILIZARE Depozitare porc (', ') ca (atribute);
Rezultat = angajat limită 10

Partea 2 - Întrebări despre interviul cu porci (avansat)

Haideți să aruncăm o privire asupra întrebărilor avansate de interviu cu porci.

Q16.Cum interacționează utilizatorii cu Hadoop în Porc?

Răspuns:
Folosind coajă grunt

Î17.Por Pig acceptă comenzi cu mai multe linii?

Răspuns:
da

Q18.Care sunt toate clasele de statistici dintr-un pachet de pigstats?

Răspuns:
PigStats, JobStats, OutputStats, InputStats.

Q19.Care este UDF?

Răspuns:
Funcția care nu este construită în operator, dar poate crea programatic o funcție pentru a aduce funcționalitatea.

Q20. Explicați sensibilitatea cazurilor în Pig Latin?

Răspuns:
Funcțiile și numele relațiilor sunt cazuri sensibile în Pig Latin, dar un nume sau un cuvânt cheie și un parametru sunt sensibile la litere mari.

Q21.Cum este Grunt în porc?

Răspuns:
Grunt este un terminal de comandă care este un shell interactiv în care dăm comanda lui Pig.

Q22.Care este cerința MapReduce în programarea Pig?

Răspuns:
MapReduce este un motor de execuție.

Haideți să trecem la următoarea întrebare la interviu cu porci.

Q23.Care este motorul Porc?

Răspuns:
Motorul de porc oferă mediul de execuție pentru a rula programele de porci. Acesta transformă operațiile de porci în locuri de muncă MapReduce.

Q24.Care sunt modurile de execuție ale Pig?

Răspuns:
Mod local: Operația porcului va fi executată într-un singur JVM.
Mod MapReduce: Se va executa clusterul Hadoop.

Q25.Care sunt diferitele funcții Eval disponibile la porc?

Răspuns:
AVG, CONCAT, MAX, MIN, SM, SIZE, COUNT sunt diferite funcții de porc EVAL.

Q26.Ce vrei să spui prin LOAD and MAGAZIN în porc?

Răspuns:
Acesta este operatorul pentru Încărcarea și stocarea datelor în hdfs.

Haideți să trecem la următoarea întrebare la interviu cu porci.

Q27.Care funcție matematică este disponibilă la porc?

Răspuns:
ABS, ACOS, LOG, ROUND, CBRT, SORT sunt funcțiile matematice disponibile la Pig.

Q28. Ce a făcut cuvântul cheie distinct în Pig?

Răspuns:
Cuvintele cheie distincte elimină cuvintele cheie duplicate din înregistrări. De exemplu:
filme = LOAD 'calea abc.csv' UTILIZARE Depozitare porc (', ') ca (id, nume, an, rating, durată);
New_movies = distinct (id, nume, an, rating, durată);

Q29.Ce vrei să spui prin tipul de date primitive în Porc?

Răspuns:
Matricea Int, Long, Float, Double, Char, array Byte sunt tipurile de date primitive din Pig.

Q30.Ce vrei să spui prin tuple în porc?

Răspuns:
Un set ordonat de câmp al unei date se numește Tuple.

Concluzie

Dacă vă pregătiți pentru joburile legate de Hadoop, atunci trebuie să pregătiți porcul pentru asta, deoarece acest subiect va juca un rol major pentru a asigura observații bune în interviu. Întrebările despre interviul cu porci, care sunt împărtășite mai sus, vă vor ajuta să pregătiți elementele de bază și teoretic ale porcului, dar trebuie să aveți mâinile pe porc. Te va ajuta să-ți creezi încrederea și cunoștințele avansate.

Articol recomandat

Acesta a fost un ghid la Lista întrebărilor și răspunsurilor la interviu de porc, astfel încât candidatul să poată împărți cu ușurință aceste întrebări de interviu cu porci. Aici am abordat atât întrebări de basă, cât și avansate. De asemenea, puteți consulta următoarele articole pentru a afla mai multe -

  1. Întrebări utile pentru interviul Apache PIG
  2. Întrebări de interviu C ++
  3. Întrebări la interviu Spark pe care ar trebui să le știi
  4. Întrebări la interviu cu castravete