Prezentare generală a cadrului de date R

Cadrele de date sunt o listă de vectori cu lungimea egală. Cu toate acestea, diferența dintre matrice și cadre de date este că cadrele de date acceptă diferite tipuri de date. (Caracter, numeric etc.). În acest subiect, vom afla despre R Data Frame.

Avantajele utilizării cadrelor de date

  • Colectare distribuită de date și organizată.
  • Are optimizări mai bune în comparație cu o bază de date relațională.
  • Deține o varietate de date care este eterogenă.

Crearea unui cadru de date în R

Creăm date_frame. Mai jos este prezentat exemplul pentru a declara un cadru de date.

Data_frame <- data.frame (variable 1, variable 2, variable n…)

În exemplul de mai sus, nu am definit variabilele. Să vedem acum cum atribuim valori variabilelor și le stocăm în cadrul de date.

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
print(Data_frame)

ieşire:

Număr alfa Booleani

1 2 x ADEVĂRAT

2 3 y ADEVĂRAT

3 4 z FALS

Structura cadrului de date

Când dorim să cunoaștem structura unui anumit cadru de date. Putem folosi funcția de mai jos.

Steaua ()

str(Data_frame)

ieşire:

Număr: num 2 3 4

alfa: Factor cu 3 niveluri „x”, „y”, „z”: 1 2 3

Booleans: logi TRUE TRUE FALSE

Extragerea datelor specifice din cadrul de date

1. Folosind numele Coloanei

Putem extrage un anumit set de date din cadrul de date.

Din exemplul nostru de mai sus, să extragem doar prima coloană din cadrul de date care este Numărul.

Data_ frame <- data. Frame(Number)

ieşire:

Număr

1 2

2 3

3 4

2. Folosind rândurile

Putem extrage datele din rânduri la fel ca exemplul de mai jos.

Să presupunem că dorim să tipărim doar două rânduri ale coloanei Număr.

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
print(Data_frame)
output <- Data_frame(1:2, ) print(output)

ieşire:

Număr alfa Booleani

1 2 x ADEVĂRAT

2 3 y ADEVĂRAT

3 4 z FALS

------------

Număr alfa Booleani

1 2 x ADEVĂRAT

2 3 y ADEVĂRAT

Putem observa diferența dintre prima și a doua ieșire.

3. Tipărirea rândurilor și coloanelor specifice

De asemenea, putem tipări rânduri și coloane specifice.

În exemplul de mai jos, tipărim 1 și 2 rânduri, coloane

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
print(Data_frame)
output <- Data_frame(c(1, 2), c(1, 2)) print(output)

ieşire:

Număr alfa Booleani

1 2 x ADEVĂRAT

2 3 y ADEVĂRAT

3 4 z FALS

-------------

Numărul alfa

1 2 x

2 3 y

4. Adăugarea unei alte coloane la cadrul de date

Putem adăuga o altă coloană împreună cu valori în cadrul de date.

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
Data_frame$class <- c("A", "B", "C")
out <- Data_frame
print(out)

ieşire:

Număr alfa Clasa Booleans

1 2 x ADEVĂRAT A

2 3 y ADEVĂRAT B

3 4 z FALSA C

5. Adăugarea unui rând la cadrul de date

Folosim funcția rbind pentru a adăuga un nou rând la cadrul de date existent.

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
Data_frame$class <- c("A", "B", "C")
out <- rbind(Data_frame, c(5, "x", FALSE, "D"))
print(out)

ieşire:

Număr alfa Clasa Booleans

1 2 x ADEVĂRAT A

2 3 y ADEVĂRAT B

3 4 z FALSA C

4 5 x FALSA D

6. Combinarea ambelor cadre de date

De asemenea, putem combina două cadre de date pentru a produce o singură ieșire.

Pentru a combina două cadre de date, trebuie să avem aceeași coloană pentru cadrele de date.

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame1 <- data.frame(Number, alpha, Booleans)
print(Data_frame1)
Number <- c(4, 5, 6)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame2 <- data.frame(Number, alpha, Booleans)
print(Data_frame2)
out <- rbind(Data_frame1, Data_frame2)
print(out)

ieşire:

Număr alfa Booleani
1 2 x ADEVĂRAT
2 3 y ADEVĂRAT
3 4 z FALS
--------------
Număr alfa Booleani
1 4 x ADEVĂRAT
2 5 y ADEVĂRAT
3 6 z FALS

--------------

Număr alfa Booleani
1 2 x ADEVĂRAT
2 3 y ADEVĂRAT
3 4 z FALS
4 4 x ADEVĂRAT
5 5 y ADEVĂRAT
6 6 z FALS

Inspectarea cadrelor de date

Mai jos sunt diferite modalități de a inspecta un cadru de date și oferă informații despre un cadru de date la fel ca funcția stea de mai sus.

1. Nume - Oferă numele variabilelor din cadrul de date

Sintaxa : names(data frame name)

Exemplu

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
names(Data_frame)

ieșire : (1) „Număr” „alfa” „Booleani”

2. Rezumat - Oferă statisticile cadrului de date.

Sintaxa: summary(data frame name)

Exemplu

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
summary(Data_frame)

ieşire:

Număr alfa Booleani
Min. : 2, 0 x: 1 Mod: logic
1. Qu.:2.5 y: 1 FALS: 1
Mediană: 3, 0 z: 1 ADEVĂRAT: 2
Media: 3, 0 NA's: 0
3. Qu.:3.5
Max. : 4.0

3. Head- Furnizează datele pentru primele rânduri.

Sintaxa: Head( name of the data frame)

Exemplu

Number <- c(2, 3, 4, 5, 6, 7, 8, 9, 10, 11)
alpha <- c("x", "y", "z", "a", "b", "c", "d", "f", "g", "j")
Booleans <- c(TRUE, TRUE, FALSE, TRUE, FALSE, FALSE, FALSE, FALSE, FALSE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
head(Data_frame)

ieşire:

Număr alfa Booleani
1 2 x ADEVĂRAT
2 3 y ADEVĂRAT
3 4 z FALS
4 5 a ADEVĂRAT
5 6 b FALS
6 7 c FALS

4. Tail- Tipărește ultimele rânduri din cadrul de date.

Sintaxa: tail( name of the data frame)

Number <- c(2, 3, 4, 5, 6, 7, 8, 9, 10, 11)
alpha <- c("x", "y", "z", "a", "b", "c", "d", "f", "g", "j")
Booleans <- c(TRUE, TRUE, FALSE, TRUE, FALSE, FALSE, FALSE, FALSE, FALSE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
tail(Data_frame)

ieşire:

Număr alfa Booleani
5 6 b FALS
6 7 c FALS
7 8 d FALSE
8 9 f FALSE
9 10 g FALSE
10 11 j FALS

Concluzie

Cadrele de date sunt un concept important în programarea R. Este ușor și puternic creând seturi de date care pot fi modificate și accesate cu ușurință. La fel ca matricea, seturile de date pot fi accesate prin rânduri și nume de coloane, adăugând și eliminând date ușor.

Articole recomandate

Acesta este un ghid pentru R Data Frame. Aici discutăm Crearea cadrului de date în R cu structura și extragerea datelor specifice din cadrul de date. De asemenea, puteți arunca o privire la următoarele articole pentru a afla mai multe -

  1. Tipuri de date în C
  2. Cariera de știință a datelor
  3. Tehnologii de date mari
  4. Platforma de știință a datelor
  5. Booleane Java

Categorie: