Introducere pe Tabelul cu picături de stup

Cuvântul cheie „DROP” se referă la ștergere. Pentru ștergerea datelor, avem nevoie de date să fie prezente în stup.

În Hadoop, avem două funcționalități:

  1. Stocare a datelor
  2. Procesarea datelor

Pentru stocarea datelor, HDFS (Sistem de fișiere distribuite Hadoop) intră în imagine. Acum, când spunem că avem date în tabelul stup, înseamnă două lucruri:

  1. Datele sunt în HDFS
  2. Avem un tabel stup creat peste acel fișier HDFS și încărcăm datele acelui fișier HDFS în tabelul stupului.

Deci, practic, pentru ca tabelul cu picături de stup să aibă datele, fișierul de date este o condiție prealabilă. În acest articol, vom vedea cum să aruncăm tabele în stup, ce se întâmplă atunci când tabela este aruncată și toate lucrurile legate de picătura din stup.

Tipuri de tabel de picături în stup

În stup, există două tipuri de tabele:

  1. Tabel intern sau tabel gestionat
  2. Tabel extern sau tabel neadministrat

Tabel gestionat / tabel intern:

  1. În Hive, user / hive / warehouse este directorul implicit. Tabelele interne sunt stocate în acest director în mod implicit. Nu trebuie să furnizăm locația manual în timpul creării tabelului.
  2. Comanda „Tabel cu picături” șterge datele permanent.
  3. Hive gestionează toată securitatea pentru tabelele gestionate.

Am un tabel deja prezent în directorul „utilizator / stup / depozit” numit „coduri”.

Pentru a verifica dacă tabelul existent este gestionat sau neadministrat, am putea folosi comanda de mai jos:

Sintaxa comenzii:

Descrieți numele de tabel formatat;

ieşire:

Să vedem, datele prezentate în tabelul „coduri”.

În primul rând, folosind comanda stup -

În al doilea rând, folosind Hue (Hadoop User Experience un UI Web)

Sterge comanda: Tabel tab nume_nume;

ieşire:

Acum, dacă vreau să selectez datele din „coduri”, îmi va da o eroare, deoarece tabelul este șters.

De asemenea, nu va putea vedea acest tabel în directorul implicit care este

„Utilizator / stup / depozit“

Observați aici,

Masă neadministrată / Tabel extern:

  1. Tabelele externe, trebuie să furnizăm calea unde trebuie să stocăm acea tabelă folosind cuvântul cheie „locație” în comanda de creare a tabelului.

De exemplu:

CREAȚI TABELUL EXTERN stg_s2_json.products

(produs fără șir, șir de nume de produs, șir de descriere, șir activ, șir de date creat, șir de date actualizat) Formatul de rând câmpuri delimitate terminate cu ', '

LOCATION '/user/data/hive/stg_s2_json.db/products';

  1. Stupul șterge doar metadatele. Datele sunt permanente.
  2. Aceste tabele ar putea fi utilizate de oricine are acces la HDFS, deci trebuie să gestioneze securitatea la nivel de folder.

Pentru a înțelege căderea tabelului extern, vom folosi tabelul „produse”.

Să verificăm dacă tabelul este intern sau extern. Din nou, „descrieți formatul table_name”.

Respectați „limita 10” din comanda selectată. Tabela Produse conține datele de mai jos:

Pentru a-l verifica în Hue, arată așa:

Să vedem ce se întâmplă când renunțăm la acest tabel:

Sintaxă:

Drop table table_name;

ieşire:

Acum, dacă încercați să preluați datele tabelului, aceasta aruncă o eroare.

În primul rând, folosind comanda „select” de pe terminal, va arunca o eroare, ceea ce înseamnă că se elimină metadata pentru tabelul extern.

Observați eroarea aici:

În al doilea rând, verificând starea datelor, fișierul „products.json” este încă prezent în HDFS, ceea ce înseamnă că datele sunt permanente.

Concluzie

Voi face acest lucru ușor și vă voi oferi puncte cheie pentru ambele tipuri de tabele. Dvs. decideți ce tip se potrivește cerințelor dvs.

Tabel intern

Tabel extern

Numită și „Tabelul gestionat”Numită și „Masă neadministrată”
Nu este necesară furnizarea locației, directorul implicit Hive gestionează aceste dateNecesitatea furnizării locației
Șterge metadatele tabelului, precum și (Datele sunt temporare)Stupul va lăsa datele neatinse (datele sunt permanente)
Stupul însuși controlează securitatea meseiTrebuie să gestionați securitatea la nivel de folder

Articole recomandate

Acesta este un ghid pentru Tabelul cu picături din stup. Aici discutăm despre introducerea tabelului de picătură a stupului, tipuri de tabelă de picătură în stup de-a lungul sintaxei. Puteți parcurge și alte articole sugerate pentru a afla mai multe -

  1. Ce este un stup?
  2. Arhitectura stupului
  3. Comenzile stupului
  4. Ce este baza de date Oracle
  5. Ordinul stupului Prin
  6. Instalarea stupului

Categorie: