Introducere în Scatterplot în R

  • R este un limbaj de programare open-source utilizat pentru statistici și analize de date. Odată cu popularitatea din ce în ce mai mare a științei datelor, R a câștigat de asemenea popularitate. Este utilizat în principal de către statisticieni și mineri de date pentru extragerea informațiilor valoroase din date. R este un limbaj interpretat și are o interfață de linie de comandă, dar există multe interfețe grafice de utilizator disponibile pentru a ușura lucrările dezvoltatorului. R oferă o mare varietate de biblioteci pentru implementarea statisticilor și tehnicilor grafice. R oferă grafică statică; permite utilizatorului să creeze un grafic stratificat. Astfel, produce grafice de calitate a publicării și oferă o reprezentare mai bună a informațiilor.
  • R oferă un set uriaș de biblioteci pentru implementarea grafică, dar cea mai populară este „ggplot2”. GGPlot2 este o implementare a „Gramaticii graficelor” care face simplă crearea de grafice complexe. Oferă o interfață programatică pentru specificarea variabilelor, poziția lor, culoarea graficului, tipurile de grafic și alte proprietăți de vizualizare. Vă permite să creați grafice pas cu pas, permițându-vă să creați straturi pentru o flexibilitate extinsă și o calitate a publicării.
  • Un astfel de tip de grafic este Scatterplot în R. Scatterplot în R, numit și grafic de dispersie, care este un tip de grafic care arată corelația dintre două variabile. Afișează punctele de date sub formă de puncte. Poate fi trasă între o variabilă independentă continuă și o altă variabilă care depinde de variabila anterioară sau două variabile independente continue. Corelarea poate fi pozitivă, negativă sau nulă. Dacă panta graficului este de la stânga jos la dreapta sus, corelația este pozitivă. Dacă panta este de la stânga sus la dreapta jos, corelația este negativă sau, cu alte cuvinte, creșterea valorii unei variabile va scădea în valoarea altei variabile.

Sintaxă: Există multe pachete în R pentru grafice, de aceea există multe funcții pentru crearea unui Scatterplot în R. Cea mai simplă și simplă funcție este

parcela (x, y)

Unde

x semnifică axa orizontală sau variabila continuă independentă.

y indică axa verticală sau variabila dependentă.

Există mulți alți parametri pentru a funcționa graficul pentru a face graficul ușor de înțeles.

Mai jos sunt câteva cu o definiție:

  • principal: adaugă un titlu în grafic
  • xlab: adăugați o etichetă pe axa x
  • ylab: adaugă o etichetă pe axa y
  • xlim: specifică intervalul axei x
  • ylim: specifică aria axei y
  • pch: indică forma punctelor din graficul de împrăștiere
  • cex: indică mărimea punctelor
  • col: definește culoarea punctelor

Un Scatterplot în R poate fi creat de asemenea folosind pachetul ggplot2. Pentru aceasta, mai întâi trebuie să instalăm și să încărcăm pachetul ggplot2. După adăugarea pachetului la sesiunea curentă de mai jos comanda poate fi utilizată pentru a crea un Scatterplot în R.

ggplot (set de date, aes (x, y, culoare, formă)) + geom_poin () + laborator (x, y, titlu)

Unde

  • setul de date este setul de date pentru care trebuie creată scatterplot.
  • aes () este o mapare estetică într-un grafic. Descrie modul în care variabilele sunt mapate pe grafic.
  • x este axa orizontală sau variabila continuă independentă.
  • y este axa verticală sau variabila dependentă.
  • culoarea înseamnă adăugarea culorii la puncte pe baza variabilei de grupare.
  • forma este utilizată pentru a seta forma pe baza variabilei de grupare.
  • + semnul indică faptul că comanda continuă.
  • geom_point () este funcția pentru diagramă scatter.
  • laboratoare (x, y, titlu): adăugați etichetă x, etichetă y și titlu în grafic.

Creați Scatterplot În R

Pentru a crea un Scatterplot în R, trebuie mai întâi să încărcăm setul de date. Aici folosim setul de date (mtcars) furnizat de R. În primul rând, încărcați setul de date în sesiunea curentă, folosind comanda de mai jos

date (iris)

Odată ce setul de date a fost încărcat, vizualizați datele pentru a obține o înțelegere de bază a tipului de date și a coloanelor din aceasta folosind comanda de mai jos.

iris

După ce obțineți o înțelegere de bază a datelor, permiteți crearea unui simplu scatterplot folosind funcția de complot

complot (iris $ Sepal.Length, iris $ $ Sepal.Wthth, xlim = c (4.0, 9.0), ylim = c (2.0, 5.0))

Adăugarea etichetelor pentru a face citirea graficului

complot (iris $ Sepal.Length, iris $ Sepal.Width, xlim = c (4.0, 9.0), ylim = c (2.0, 4.0), xlab = "Lungime sepală", ylab = "Width Sepal", principal = "Width vs Lungime ”)

Adăugarea unor parametri mai mulți pentru a face graficul mai atractiv

complot (iris $ Sepal.Length, iris $ Sepal.Width, xlim = c (4.0, 9.0), ylim = c (2.0, 4.0), xlab = "Lungime sepală", ylab = "Width Sepal", principal = "Width vs Lungime ", pch = 8, cex = 1, 5, col = 6)

În afară de aceste parcele 2-D, parcelele matrice și parcelele 3-D pot fi, de asemenea, create în R.

Matricile Scatterplot

Când avem mai mult de două variabile într-un set de date și dorim să găsim o corelație a fiecărei variabile cu toate celelalte variabile, atunci se utilizează matricea scatterplot. Cea mai simplă și simplă comandă pentru matricea scatterplot este:

perechi (~ Sepal.Length + Sepal.Width + Petal.Length + Petal.Width, data = iris, main = "Scatterplot Matrix")

Graficul de mai sus arată corelația dintre greutate, mpg, dsp și cyl.

Scatterplot 3D

Uneori, un grafic tridimensional oferă o mai bună înțelegere a datelor. Pentru acest R oferă mai multe pachete, unul dintre ele este „scatterplot3d”. Mai jos sunt comenzile pentru instalarea „scatterplot3d” în spațiul de lucru R și încărcați-l în sesiunea curentă

install.packages ( „scatterplot3d“)

bibliotecă (scatterplot3d)

După încărcarea bibliotecii, execuția comenzilor de mai jos va crea un scatter 3-D.

atașați (iris)

scatterplot3d (Sepal.Length, Sepal.Width, Petal.Length, main = "3D Scatterplot")

În afară de aceasta, există multe alte modalități de a crea o dimensiune tridimensională. Utilizatorii pot adăuga, de asemenea, detalii precum culoarea, titluri pentru a îmbunătăți graficul. Utilizatorul poate crea de asemenea scatterplot 3D interactiv folosind funcția „plot3D (x, y, z)” oferită de pachetul „rgl”. Această funcție creează un scatter 3D rotativ care poate fi rotit folosind un mouse. Astfel, oferind o vedere completă a corelației dintre variabile.

Concluzie

R este unul dintre cele mai cunoscute limbaje pentru implementarea tehnicilor grafice utilizate de oamenii de știință de date. Oferă o gamă largă de pachete și biblioteci pentru grafică și o mai bună înțelegere a datelor. „Gglpot2”, „ggvis”, „rgl”, „plot3d”, „zăbrele”, „animație”, „gganimate”, „cairo” sunt câteva dintre pachetele oferite de R.

Un complot de dispersie este cel mai simplu mod de a obține o mai bună înțelegere a datelor. Utilizând această vizualizare, utilizatorul poate cunoaște modul în care variabilele sunt legate între ele, modul în care schimbarea valorii unei variabile va schimba valoarea altor variabile etc. Panta graficului spune despre relația pozitivă și negativă dintre variabile.

Articole recomandate

Acesta este un ghid pentru Scatterplot în R. Aici discutăm o introducere, matrice scatterplot, scatterplot 3D, cum să creăm scatterplot? împreună cu exemple adecvate. Puteți parcurge și alte articole sugerate pentru a afla mai multe -

  1. Ce este GraphQL
  2. Scrum Framework
  3. Întrebări de interviu R
  4. Introducere în distribuția binomială în R

Categorie: