Ce este un stup?

Înainte de a înțelege mai întâi tipurile de date ale stupului, vom studia stupul. Hive este o tehnică de depozitare a datelor Hadoop. Hadoop este segmentul de stocare și procesare a datelor din platforma Big Data. Hive își păstrează poziția în ceea ce privește tehnicile de prelucrare a datelor ulterioare. La fel ca și alte medii continuate, stupul poate fi accesat prin interogări ulterioare. Ofertele majore ale stupului sunt analiza datelor, interogarea ad-hoc și rezumarea datelor stocate dintr-o perspectivă de latență, interogările sunt mai mari.

Tipuri de stup stup

Tipurile de date sunt clasificate în două tipuri:

  • Tipuri de date primitive
  • Tipuri de date colective

1. Tipuri de date primitive

Mijloacele primitive erau vechi și vechi. toate tipurile de date enumerate ca primitive sunt cele vechi. domeniile importante de tipuri de date primitive enumerate mai jos:

Tip Dimensiune (octet) Exemplu
tINYINT 1 20
smallint 2 20
Int 4 20
BIGINT 8 20
boolean Boolean adevărat / Fals FALS
Dubla 8 10.2222
Pluti 4 10.2222
Şir Secvența personajelor ABCD
Timestamp-ul Integer / float / string 2/3/2012 12: 34: 56: 1234567
Data Integer / float / string 2/3/2019

Tipurile de date stup sunt implementate folosind JAVA

Ex: Java Int este utilizat pentru implementarea tipului de date Int aici.

  • Matricele de caractere nu sunt acceptate în HIVE.
  • Hive se bazează pe delimitatori pentru a-și separa câmpurile, stupul pe coordonarea cu Hadoop permite creșterea performanței de scriere și citire.
  • Precizarea lungimii fiecărei coloane nu este așteptată în baza de date a stupului.
  • Literele cu șiruri pot fi articulate fie cu ghilimele duble („) citate simple (').
  • Într-o versiune mai recentă a stupului, tipurile Varchar sunt introduse și formează un specificator al intervalului (în mijlocul 1 și 65535), deci pentru un șir de caractere, acesta acționează ca cea mai mare lungime de valoare pe care o poate acomoda. Când o valoare care depășește această lungime este introdusă, atunci elementele cele mai drepte ale respectivelor valori sunt trunchiate. Lungimea caracterelor este rezoluția cu cifra punctelor de cod controlate de șirul de caractere.
  • Toate literalele întregi (TINYINT, SMALLINT, BIGINT) sunt considerate ca fiind tipuri de date INT, iar numai lungimea depășește nivelul int real pe care îl transmite într-un BIGINT sau în orice alt tip respectiv.
  • Literalele zecimale permit valori definite și colecție superioară pentru valori în virgulă flotantă în comparație cu tipul DOUBLE. Aici valorile numerice sunt stocate pe forma lor exactă, dar în cazul dublei, nu sunt stocate exact ca valori numerice.

Procesul de distribuire a valorii datei

Turnarea efectuată Rezultat
distribuție (data ca dată) Aceeași valoare a datei
distribuție (marcă de timp ca dată) Un fus orar local este utilizat pentru a evalua valorile anului / lună / dată aici și tipărite în rezultat.
distribuire (șir ca dată) Ca urmare a acestei distribuții, va fi solicitată o valoare corespunzătoare a datei, dar trebuie să ne asigurăm că șirul are formatul „AAAA-MM-DD” Nul va fi returnat atunci când valoarea șirului nu va face o potrivire validă.
distribuție (data ca marcă de timp) În conformitate cu fusul orar local curent, o valoare de marcă de timp va fi creată pentru acest proces de turnare
distribuire (data ca șir) AAAA-MM-DD este format pentru valoarea anului / lună / dată, iar ieșirea va fi în format șir.

2. Tipuri de date de colectare

Există patru tipuri de date de colecție în stup, care sunt denumite și tipuri de date complexe.

  • ARRAY
  • HARTĂ
  • STRUCT
  • UNIONTYPE

1. ARRAY: O secvență de elemente de tip comun care pot fi indexate și valoarea indexului începe de la zero.

Cod:

array ('anand', 'balaa', 'praveeen');

2. MAP: Acestea sunt elemente declarate și regăsite folosind perechi cheie-valoare.

Cod:

'firstvalue' -> 'balakumaran', 'lastvalue' -> 'pradeesh' is represented as map('firstvalue', 'balakumaran', 'last', 'PG'). Now 'balakumaran ' can be retrived with map('first').

3. STRUCT: Ca în C, struct este un tip de date care acumulează un set de câmpuri care sunt etichetate și pot fi de orice alt tip de date.

Cod:

For a column D of type STRUCT (Y INT; Z INT) the Y field can be retrieved by the expression DY

4. UNIONTYPE: Uniunea poate deține oricare dintre tipurile de date specificate.

Cod:

CREATE TABLE test(col1 UNIONTYPE ) CREATE TABLE test(col1 UNIONTYPE )

ieşire:

Mai jos sunt enumerați mai mulți delimitați folosiți în tipurile de date complexe,

delimitator Cod Descriere
\ n \ n Înregistrează sau delimitează rândul
A (Ctrl + A) \ 001 Delimitator de câmp
B (Ctrl + B) \ 002 STRUCTURI și SĂRIȚI
C (Ctrl + C) \ 003 lui MAP

Exemplu de tipuri de date complexe

Mai jos sunt exemplele de tipuri de date complexe:

1. CREAREA TABELULUI

Cod:

create table store_complex_type (
emp_id int,
name string,
local_address STRUCT,
country_address MAP,
job_history array)
row format delimited fields terminated by ', '
collection items terminated by ':'
map keys terminated by '_';

2. DATELE TABELULUI DE ECHIPAMENT

Cod:

100, Shan, 4th : CHN : IND : 600101, CHENNAI_INDIA, SI : CSC
101, Jai, 1th : THA : IND : 600096, THANJAVUR_INDIA, HCL : TM
102, Karthik, 5th : AP : IND : 600089, RENIKUNDA_INDIA, CTS : HCL

3. ÎNCĂRCAREA DATELOR

Cod:

load data local inpath '/home/cloudera/Desktop/Hive_New/complex_type.txt' overwrite into table store_complex_type;

4. VIZIONAREA DATELOR

Cod:

select emp_id, name, local_address.city, local_address.zipcode, country_address('CHENNAI'), job_history(0) from store_complex_type where emp_id='100';

Concluzie - Tipuri de date stup

Fiind un DB relațional și totuși un Sequel conectează HIVE oferă toate proprietățile cheie ale bazelor de date SQL obișnuite într-o manieră foarte sofisticată, ceea ce face ca aceasta să fie una dintre cele mai eficiente unități structurate de procesare a datelor din Hadoop.

Articole recomandate

Acesta este un ghid pentru tipul de date stup. Aici discutăm două tipuri de tipuri de date stup, cu exemple adecvate. Puteți parcurge și alte articole conexe pentru a afla mai multe -

  1. Ce este un stup?
  2. Alternative alternative stupului
  3. Funcții încorporate stup
  4. Întrebări la interviu stup
  5. Tipuri de date PL / SQL
  6. Exemple de funcții Python încorporate
  7. Diferite tipuri de date SQL cu exemple

Categorie: