Introducere în histogramă în R

În acest articol, vom începe cu Histograma de bază în implementarea R și personalizări. Histograma joacă un rol important în analizele de date pentru vizualizarea datelor. Programarea R este un mediu special pentru calculul statistic și fundamentele pentru știința datelor. În programarea R seturile de date și funcțiile sunt grupate sub formă de pachete. Cele mai multe dintre programele de analiză vizuală utilizează histograme și fac implicit lățimea coșului. Acestea permit să înțeleagă rapid informațiile despre datele care sunt un rol principal în știința datelor. Aici vom construi o histogramă folosind comenzi R.

Ce este Histograma?

Histograma este o reprezentare picturală a unei distribuții a setului de date cu care am putea analiza cu ușurință ce factor are o cantitate mai mare de date și cele mai puține date. Cu alte cuvinte, histograma permite realizarea de comploturi de frecvență cumulate în axa x și axa Y. De fapt, histogramele preiau atât date grupate, cât și grupate. Pentru o histogramă de date grupate se construiește luând în considerare limitele clasei, în timp ce datele neagrupate este necesar să se formeze distribuția de frecvență grupată. Ele ajută la analizarea eficientă a intervalului și a locației datelor. Unele structuri comune de histograme sunt aplicate ca o stâncă normală, înclinată, în timpul distribuției datelor.

Spre deosebire de o bară, histograma grafică nu are goluri între bare și barele de aici sunt numite coșuri cu care datele sunt reprezentate la intervale egale. Histograma Preia variabila continuă și se împarte în intervale de timp este necesară alegerea lățimii corecte a coșului. Diferența majoră dintre diagrama de bare și histogramă este că prima folosește seturi de date nominale pentru a trama în timp ce histograma grafică seturile de date continue. R utilizează funcția hist () pentru a crea histograme. Această funcție hist () folosește un vector de valori pentru a planifica histograma. Histograma cuprinde o gamă de axe x de valori continue, axa y prezintă graficele frecvente ale datelor în axa x cu bare de variații de înălțime.

Sintaxă:

Sintaxa pentru crearea histogramei este

hist (v, main, xlab, xlim, ylim, breaks, col, border)
where v – vector with numeric values
main – denotes title of the chart
col – sets color
border -sets border color to the bar
xlab - description of x-axis
xlim - denotes to specify range of values on x-axis
ylim – specifies range values on y-axis
break – specifies the width of each bar.

Crearea unei histograme în R

Pentru analiză, histograma de scop necesită unele set de date încorporate pentru a le importa în R. R, iar bibliotecile sale au o varietate de pachete și funcții grafice. Aici folosim setul de date ale pasagerilor suizi și aerieni Pentru a calcula o histogramă pentru o anumită valoare de date funcția hist () este utilizată împreună cu un semn $ pentru a selecta o anumită coloană a unei date din setul de date pentru a crea o histogramă.

Următorul exemplu calculează o histogramă a valorii datelor din coloana Examinarea setului de date numit Elvețian.

Exemplul 1: Să creăm o histogramă simplă

Cod:

hist (swiss $Examination)

ieşire:

Hist este creat pentru un set de date swiss cu o examinare pe coloană. aceasta ilustrează pur și simplu o coș cu frecvență și axa x.

Exemplul 2: Histogramă cu mai multe argumente

Pentru a înțelege mai bine histogramele, trebuie să adăugăm mai multe argumente funcției hist pentru a optimiza vizualizarea graficului. Modificarea etichetă x și y într-o gamă de valori argumente xlim și ylim sunt adăugate funcției.

Exemplu:

hist (Air Passengers, xlim=c (150, 600), ylim=c (0, 35))
In the above example x limit varies from 150 to 600 and Y – 0 to 35.
// Adding breaks
hist (AirPassengers,
main="Histogram with more Arg",
xlab="Name List",
border="Green",
col="Orange",
xlim=c (100, 600),
ylim=c(0, 40),
breaks=5)

ieşire:

Deasupra codului este reprezentată o histogramă pentru valorile din setul de date Air Passagers, dă titlul „Histogramă pentru mai mult arg”, eticheta axei X ca „Listă de nume”, cu o margine verde și o culoare galbenă pentru bare, prin limitarea valoarea de 100 până la 600, valorile tipărite pe axa y cu 2 și făcând lățimea coșului la 5.

Adăugarea a două culori diferite la bara

hist (swiss$Examination, col=c ("violet”, "Chocolate2"), xlab="Examination”, las =1, main=" color histogram")

ieşire:

Adăugarea mai multor bare la histogramă

hist (swiss$Education, breaks=40, col="violet", xlab="Education", main=" Extra bar histogram")

ieşire:

Exemplul 3: Histograma în R Its returnează o valoare

Air <- AirPassengers
hist (Air)
h <- hist (Air)
h
$breaks

ieşire:

Exemplul 4: Utilizarea argumentului Break pentru a schimba lățimea coșului

Pentru a avea mai multe puncte de întrerupere între lățime, se preferă utilizarea valorii în funcția c ().

hist (AirPassengers, breaks=c (100, seq (200, 700, 150)))

ieşire:

Graficul de mai sus ia lățimea barei prin valorile secvenței.

Exemplul 5: Implementarea curbei normale de distribuție în histogramă

Pentru valorile datelor vom folosi setul de date „suisse” pentru a desena un grafic. Aici curba funcției () este utilizată pentru afișarea liniei de distribuție.

Cod:

curve (dnorm(x, mean=mean(swiss$Education), sd=sd(swiss$Education)), add=TRUE, col="red")

ieşire:

Exemplul 6: Diagrama distribuției probabilităților

hist (AirPassengers,
main="Histogram ",
xlab="Passengers",
border="Yellow",
col="pink",
xlim=c(100, 600),
las=2,
breaks=6,
prob = TRUE)

Crearea de parcele de densitate în histogramă în R

Distribuția unei variabile este creată folosind densitatea funcției (). Mai jos este exemplul cu setul de date mtcars. Parcele de densitate ajută la distribuția formei.

density () // this function returns the density of the data
library(ggplot2)
d <- density (mtcars $qsec)
plot (d, main=" Density of Miles Per second")
polygon (d, col="orange",>

ieşire:

Using Line () function
hist (swiss$Examination, freq = FALSE, col=c ("violet”, "Chocolate2"),
xlab="Examination”, las =1, main=" Line Histogram")
lines(density(swiss$Examination), lwd = 4, col = "red")

Următoarea histogramă în R afișează înălțimea ca examinare pe axa x și densitatea este reprezentată pe axa y.

ieşire:

Concluzie

Asta înseamnă totul despre histogramă și tocmai histograma este cea mai simplă modalitate de a înțelege datele. Așa cum am văzut cu o histogramă, am putea desena diagrame unice, multiple, folosind lățimea coșului, corectarea axei, schimbarea culorilor etc. Histograma ajută la vizualizarea diferitelor forme ale datelor. În cele din urmă, am văzut cum histograma permite analizarea seturilor de date și a punctelor mijlocii sunt utilizate ca etichete ale clasei. Histograma ajută la schimbarea intervalelor pentru a produce o descriere îmbunătățită a datelor și funcționează, în special cu date numerice. histogramele sunt mai preferate în analiză datorită avantajului lor de a afișa un set mare de date. Pe baza rezultatelor, am putea vizualiza datele și a face ușor niște presupuneri.

Articole recomandate

Acesta a fost un ghid despre Histograma în R. Aici am discutat Conceptul, Sintaxa și Cum să creăm o Histogramă în R cu exemple. De asemenea, puteți consulta următoarele articole pentru a afla mai multe -

  1. Exemple de histogramă
  2. Cariera în programarea R
  3. Graficul Gantt din Tableau
  4. Carieră în programare computerizată
  5. Cum se creează un grafic liniar în R?

Categorie: