Introducere la întrebări și răspunsuri la interviu Hbase

HBase este un popular sistem de gestionare a bazelor de date NoSQL, orientat pe coloană, care rulează deasupra sistemului de fișiere distribuite Hadoop (HDFS). Este potrivit pentru seturile de date rare, care sunt comune în multe cazuri mari de utilizare a datelor.

Iată primele 10 întrebări și răspunsuri la interviul HBase din 2019: Așadar, în sfârșit, ți-ai găsit jobul de vis în HBase, dar te întrebi cum să crape interviul Hbase și care ar putea fi întrebările posibile pentru interviu Hbase 2019. Fiecare interviu este diferit și sfera unui loc de muncă este diferită. Reținând acest lucru, am conceput cele mai comune întrebări și răspunsuri la interviu Hbase pentru a vă ajuta să obțineți succes în interviu. Aceste întrebări sunt împărțite în două părți:

Partea 1 - Întrebări cu interviu HBase (de bază)

Această primă parte acoperă întrebările de bază și răspunsurile la interviu HBase.

1. Când ar trebui să utilizați HBase?

Răspuns:
Hbase nu este potrivit pentru toate cazurile de utilizare. Un scenariu cel mai potrivit poate fi identificat cu următoarele verificări -
Volumul i.Data: ar trebui să aibă prelucrate petabytes de date într-un mediu distribuit.
ii.Aplicare: HBase nu este potrivit pentru sistemele OLTP (tranzacții online tranzacții) care necesită tranzacții cu mai multe declarații complexe. De asemenea, nu are suport SQL complex, care este necesar pentru analitice relaționale. Este de preferat atunci când aveți o cantitate imensă de date cu un schema ușor diferită.
iii.Cluster Hardware: HBase rulează pe HDFS. Și HDFS funcționează eficient cu un număr mare de noduri (minim 5). Deci HBase poate fi o selecție bună doar cu suport hardware bun.
iv.Not RDBMS tradițional: Hbase nu poate suporta niciun caz de utilizare care necesită funcții tradiționale, precum Alăturarea mai multor tabele, SQls complexe cu funcții imbricate sau ferestre etc.
v.Accesați rapid la întâmplare la date: Dacă aveți nevoie de un acces aleatoriu și în timp real la datele dvs., HBase este un candidat potrivit. Este, de asemenea, o potrivire perfectă pentru stocarea tabelelor mari cu date multi-structurate.

2. Care este diferența dintre Cassandra și HBase?

Răspuns:
Atât HBase, cât și Cassandra au distribuit baza de date NoSQL pentru Big Data din ecosistemul Hadoop. Ambele sunt construite pentru cazuri de utilizare diferite.
HBase are un fel de arhitectură master-slave cu mai multe componente precum Zookeeper, Namenode, HBase Master (Hmaster) și Data Nodes etc. Cassandra tratează toate nodurile ca maeștri, ceea ce înseamnă că toate nodurile sunt egale și îndeplinesc toate funcțiile.
HBase este optimizat pentru lecturi, scrierea se întâmplă doar la nodul principal și are o consistență puternică pentru citire după scriere. Cassandra are o performanță excelentă de citire într-un singur rând dacă este selectată o eventuală consistență.
Hbase nu suportă nativ indici secundari, Cassandra acceptă indici secundari pe familiile de coloane unde este cunoscut numele coloanei.
Inițial, Hbase este creat pe Google și l-au numit BigTable. Chiar și acum API-urile Bigtable și HBase sunt compatibile. Originea Cassandra provine dintr-o hârtie pentru DynamoDB, care este baza de date NoSQL de la AWS.

Haideți să trecem la următoarea întrebare pentru interviu HBase.

3. Care sunt componentele majore ale Hbase?

Răspuns:
HBase a are trei componente importante - HMaster, Region Server și ZooKeeper.
i.HBase Master - Tabelele HBase sunt împărțite în regiuni. În timp ce startup Master decide ce regiune să atribuie serverului de regiune (Serverul de regiune va fi un nod într-un cluster) .De asemenea, se ocupă operațiunile de metadate ale tabelelor, cum ar fi create sau modificarea schemei. Această componentă joacă, de asemenea, un rol important în recuperarea eșecurilor
ii. Region Server - Așa cum am menționat mai sus, aici se întâmplă scrierea și citirea datelor reale. Acestea sunt noduri de cluster. Aceasta va avea regiuni cu multe tabele, care se decide prin pornirea și încheierea tastelor de rând. Un server de regiune tipic poate servi până la o mie de regiuni
iii.ZooKeeper - ZooKeeper este un cadru de coordonare a clusterului utilizat pe scară largă în ecosistemul Hadoop.Zookeeper urmărește toate serverele (serverele Master și regiunea) prezente în contactele HMaster cluster ZooKeeper și notificările sunt produse în caz de erori.

4. Ce este HBase Bloom Filter?

Răspuns:
Aceasta este întrebarea comună a interviului HBase adresată într-un interviu. Un filtru Bloom HBase este un mecanism eficient pentru a testa dacă un fișier de stocare (Când se scrie ceva pe HBase, este scris mai întâi într-un magazin în memorie, odată ce acest memstore atinge o anumită dimensiune, este curățat pe disc într-un fișier de stocare ) conține o anumită celulă rând sau rând-col. În mod normal, singura modalitate de a decide dacă o cheie rând este prezentă într-un fișier magazin este să verificați indexul de bloc al fișierului, care are cheia de rând a fiecărui bloc din fișierul magazin. Filtrele cu flori acționează ca o structură de date din memorie, care ajută la reducerea lecturilor pe disc numai la fișierele care pot conține acel rând - Nu toate fișierele stochează. Deci, acționează ca un indice de memorie pentru a indica o probabilitate de a găsi un rând într-un anumit fișier de stocare.

5. Ce este compactarea? Explicați diferite tipuri.

Răspuns:
HBase stochează toate operațiunile primite în zona sa de memorie. Când bufferul de memorie este plin, acesta este curățat pe disc. Deoarece acest lucru poate crea multe fișiere mici în HDFS, din când în când, HBase poate selecta fișierele pentru a fi compactate împreună într-unul mai mare. O compactare este numită Minor atunci când HBase alege doar o parte din HFiles să fie compactate, dar nu toate. Într-o compactare majoră, toate fișierele sunt alese pentru a fi compactate împreună. O compactare majoră funcționează ca una minoră, cu excepția faptului că markerii de ștergere pot fi îndepărtați după ce sunt aplicați la toate celulele asociate și toate versiunile suplimentare ale aceleiași celule vor fi, de asemenea, abandonate.

Partea a 2-a - Întrebări la interviu HBase (avansat)

Haideți să aruncăm o privire asupra întrebărilor avansate pentru interviu HBase.

6.Cum sunt datele versiunii HBase?

Răspuns:
Când o informație este introdusă / actualizată / ștersă, HBase va crea o nouă versiune pentru acea coloană. Ștergerea efectivă se întâmplă doar în timpul compactării. Dacă o anumită celulă a depășit un număr de versiuni permise, versiunile suplimentare vor fi abandonate în timpul compactării

7. Care este o diferență între a obține și Scanare?

Răspuns:
Get va întoarce un singur rând din tabela Hbase bazată pe cheia de rând dată. Comanda de scanare returnează setul de rânduri în funcție de condiția de căutare dată. De obicei, obține este mai rapid decât scanarea. Deci ar trebui să preferați să o utilizați dacă este posibil.

Haideți să trecem la următoarea întrebare pentru interviu HBase.

8. Ce se întâmplă la ștergerea unui rând?

Răspuns:
În momentul ștergerii, datele de comandă nu sunt șterse fizic din sistemul de fișiere, ci fac invizibile setând un marker. Ștergerea fizică se întâmplă în timpul unei compactări
Markerii de ștergere a coloanei, a versiunii și a familiei sunt trei tipuri diferite de markeri care marchează ștergerea unei coloane, versiunea coloanei și respectiv familia coloanelor.

9. Explicați diferența dintre HBase și Hive.

Răspuns:
Aceasta este întrebarea avansată pentru interviu HBase adresată într-un interviu. Amândouă, HBase și Hive sunt tehnologii complet diferite pentru procesarea datelor. Hive este un cadru de stocare distribuit compatibil SQL, precum relațional, în timp ce HBase este un depozit de valori cheie NoSQL. Stupul acționează ca un strat de abstracție în partea de sus a Hadoop cu suport SQL. Modelul de acces la date Baza este foarte limitat cu două operații primare-get și scanare. HBase este ideal pentru procesarea datelor în timp real, unde Hive este o alegere ideală pentru procesarea datelor pe loturi.

10. Ce sunt Hlog și HFile?

Răspuns:
HLog este fișierul jurnal de scriere înainte, cunoscut și sub numele de WAL, iar HFile este fișierul real de stocare a datelor. Datele sunt mai întâi scrise în fișierul jurnal de scriere înainte și, de asemenea, scrise în MemStore.Once MemStore este complet, conținutul MemStore este redat pe disc în HFiles.

Articol recomandat

Acesta a fost un ghid la Lista întrebărilor și răspunsurilor la interviu Hbase, astfel încât candidatul să poată împărți cu ușurință aceste întrebări de interviu Hbase. De asemenea, puteți consulta următoarele articole pentru a afla mai multe -

  1. Întrebări utile pentru interviu de grup
  2. Sfaturi importante pentru interviu de bază
  3. Pași esențiali pentru pregătirea interviului
  4. Întrebări de interviu pentru a pune un candidat la finanțe