Introducere în cadre de date în R
Un cadru de date este o structură asemănătoare unui tablou 2D (Două dimensiuni) în care sunt acceptate diferite tipuri de date precum caractere, numerice etc. Cadrul de date este un subset al unei liste care are fiecare componentă de lungime egală. Practic, cadrul de date este un tabel în care fiecare coloană conține valori ale unei variabile și fiecare rând conține un set de valori din fiecare coloană.
Există câteva caracteristici ale cadrului de date.
- Numele coloanei este necesar
- Numele de rânduri ar trebui să fie unice
- Numărul de articole din fiecare coloană trebuie să fie același
Pași pentru crearea de cadre de date în R
Să începem cu crearea unui cadru de date, care este explicat mai jos,
Pasul 1: Creați un cadru de date al unei clase într-o școală.
Cod:
tenthclass = data.frame(roll_number = c(1:5), Name = c("John", "Sam", "Casey", "Ronald", "Mathew"),
Marks = c(77, 87, 45, 68, 95), stringsAsFactors = FALSE)
print(tenthclass)
Când rulăm acest cod, vom primi un cadru de date ca acesta.
ieşire:
Aici, în exemplul nostru, cadrul de date este foarte mic, dar în viața reală, în timp ce ne ocupăm de problemă, avem o mulțime de date. Deci, pentru a înțelege structura datelor, trecem pe funcția Str ().
Pasul 2: Adăugăm linia de mai jos în codul nostru.
Cod:
Str(tenthclass)
Când rulăm întregul cod, vom primi rezultat.
ieşire:
Rezultatul de mai sus înseamnă că avem 5 observații a 3 variabile. Apoi explică tipul de date al fiecărei variabile. La fel ca în exemplul nostru numărul rolului este un număr întreg, numele este caracter și Marks sunt numerotate.
Odată ce înțelegem structura datelor, atunci vom trece codul menționat mai jos pentru a înțelege datele mai statistic.
Pasul 3: Acum, vom folosi o funcție sumară ()
Cod:
summary(tenthclass)
ieşire:
Rezumatul oferă o mai bună înțelegere a datelor noastre. Ne va spune că înseamnă, median, quartile, Max și Min. Aceste lucruri ne vor ajuta să luăm o decizie mai bună.
Cum să extrageți date din cadre de date în R?
Aici vom continua cazul de mai sus. Să presupunem că vrem să știm numele elevului în clasa a zecea, doar numele. Deci, cum vom extrage?
Cadrul nostru de date arată astfel.
roll_number Marks Name
1 1 Ioan 77
2 2 Sam 87
3 3 Casey 45
4 4 Ronald 68
5 5 Mathew 95
Pentru a obține doar numele ca ieșire, vom transmite următorul cod.
Cod:
onlyname = tenthclass$Name
print(onlyname)
ieşire:
Aici, dacă vom sparge codul, vom pune doar semnul dolarului între numele cadrului nostru de date și numele variabilei pe care o dorim ca ieșire.
Acum ia în considerare o situație, profesorul vrea să știe totul despre rolul numărul 2, cum este numele lui și cât a marcat.
Aici avem nevoie de totul despre ruloul numărul 2, astfel încât vom transmite codul menționat mai jos.
Cod:
result_rollnumber2 = tenthclass(c(2), c(1:3)) print(result_rollnumber2)
ieşire:
Extindeți în cadre de date
Cadrul de date poate fi mărit și scăzut în dimensiune adăugând sau ștergând coloane și rânduri.
1. Adăugați rândul
Avem două cadre de date. Un cadru de date aparține clasei a zecea secțiune A și un alt cadru de date aparține clasei a zecea secțiune B. Acum aceste secțiuni diferite se îmbină într-o singură clasă.
Exemplul # 1: clasa 10 A
Cod:
tenthclass_sectionA = data.frame(roll_number = c(1:5),
Name = c("John", "Sam", "Casey", "Ronald", "Mathew"),
Marks = c(77, 87, 45, 68, 95), stringsAsFactors = FALSE)
print(tenthclass_sectionA)
ieşire:
Exemplul # 2: clasa 10 B
Cod:
tenthclass_sectionB = data.frame(roll_number = c(6:10), Name = c("Ria", "Justin", "Bon", "Tim", "joe"),
Marks = c(68, 98, 54, 68, 42), stringsAsFactors = FALSE)
print(tenthclass_sectionB)
ieşire:
Exemplul # 3: funcția rbind ()
Acum trebuie să unim aceste două clase într-o singură clasă. Vom folosi aici funcția rbind (). Singura limitare în adăugarea unui nou rând este că trebuie să aducem noile rânduri în aceeași structură cu cadrul de date existent.
Cod:
new_tenthclass = rbind(tenthclass_sectionA, tenthclass_sectionB)
print(new_tenthclass)
ieşire:
2. Adăugați Coloana
Acum luați în considerare un caz în care trebuie să adăugăm detalii despre grupul de sânge al fiecărui elev din clasa 10. Vom adăuga o nouă coloană pentru aceasta și o vom numi „Blood_group”.
Cadrul nostru de date arată astfel.
Cod:
tenthclass = data.frame(roll_number = c(1:5), Name = c("John", "Sam", "Casey", "Ronald", "Mathew"),
Marks = c(77, 87, 45, 68, 95), stringsAsFactors = FALSE)
print(tenthclass)
ieşire:
Cod:
tenthclass$Blood_group = c("O", "AB", "B+", "A+", "AB")
print(tenthclass)
ieşire:
Ștergeți Rândul și Coloana din Cadrul de date
Pentru a șterge rândul și coloana din cadrul de date, utilizăm următoarele implementări ale codului.
1. Ștergeți coloana
Cod:
print(tenthclass)
ieşire:
În acest cadru de date, dacă trebuie să ștergem variabila grupului sanguin (coloana din dreapta) vom trece codul de mai jos.
Cod:
tenthclass$Blood_group = NULL
print(tenthclass)
ieşire:
Trecând pe comanda NULL, putem elimina direct variabila din cadrul nostru de date.
2. Ștergeți rândul
Cod:
print(tenthclass)
ieşire:
Acum, luați în considerare o situație în care nu avem nevoie de semne ale lui Ioan, așa că trebuie să eliminăm rândul cel mai de sus.
Cod:
tenthclass = tenthclass(-1, ) print(tenthclass)
ieşire:
Actualizați datele în cadru de date
Cod:
print(tenthclass)
ieşire:
Să presupunem că Sam a marcat 98 de mărci, dar conform graficului cadrului nostru de date sunt 87. Deci putem trece codul de mai jos pentru a-l rectifica.
Cod:
tenthclass$Marks(2) = 98
print(tenthclass)
ieşire:
Concluzie
Cadrele de date sunt o formă foarte comună a enunțului de probleme. Este o listă a variabilei cu același număr de rânduri cu ID-uri de rând unice. Acest articol ne ajută să știm cum putem adăuga un rând, adăugăm o coloană, ștergem un rând, ștergem o coloană din cadrul de date și, de asemenea, ne spune cum putem actualiza datele din cadrul de date.
Articole recomandate
Acesta este un ghid al Cadrelor de date din R. Aici vom discuta diferiții pași pentru crearea cadrelor de date și modul de extragere a datelor din cadrele de date din R. Puteți consulta, de asemenea, articolele următoare pentru a afla mai multe-
- Top 5 tipuri de date în R
- Lista pachetelor R utile
- Fișiere R CSV
- Funcții R Program - Importanță
- Factor în R cu Avantaje