Introducere în lista de pachete R

Un pachet în limbajul de programare R este o unitate care oferă funcționalitățile necesare care pot fi utilizate încărcându-l în mediul R. O listă de pachete R este similară cu o bibliotecă din C, C ++ sau Java. Deci, în esență, un pachet poate avea numeroase funcționalități, cum ar fi funcții, constante etc., care vom permite utilizatorului să le utilizeze în contextul unei anumite probleme. În R, un pachet necesar poate fi încărcat folosind funcția de bibliotecă (). În cazul în care un pachet nu este prezent, atunci poate fi instalat folosind funcția install.packages (). Pachetele fac ușor sarcinile aparent dificile prin funcționalitățile sale gata.

Ce sunt pachetele R?

Există multe pachete în R, iar selecția unui pachet depinde de aplicația sa. Deși există anumite pachete care sunt utilizate pe scară largă datorită funcționalităților pe care le oferă, nu este cazul ca alte pachete să fie mai puțin importante. Diferite pachete au scopuri diferite; unele sunt legate de tehnici statistice, altele se referă la vizualizări etc.

În secțiunea următoare, vom analiza câteva dintre pachetele importante din R:

1. Mașină

Acest pachet este Companion to Applied Regression. Este un pachet mare care oferă diferite funcționalități pentru analiza statistică. Importarea acestui pachet în mediul R importă alte pachete conexe, cum ar fi MASS, statistici, grafică etc. Unele dintre funcțiile din pachet includ Anova, avPlots, Boxplot, carPalette, loturi de densitate, infIndexPlot, ipoteză liniară, logit, test outlier, qqPlot, comploturi reziduale, scatterplot, matrice scatterplot, etc. Capacitățile extinse ale pachetului pot fi calibrate de la numărul de funcții pe care le oferă.

2. Corrplot

Pachetul oferă o afișare grafică a unei matrice de corelație și un interval de încredere. Pachetul oferă, de asemenea, algoritmi pentru a efectua reordonarea matricei. Numeroase opțiuni includ alegerea culorilor necesare, etichetele textului, etichetele de culoare, aspectul, etc. Diversele metode de vizualizare sau metode de parametri din pachetul corrplot sunt „cerc”, „pătrat”, „elipsă”, „număr”, „umbră”, „culoare”. și „plăcintă”. Funcția corrplot care încorporează diverse opțiuni oferă o reprezentare vizuală atrăgătoare a corelației dintre diferite variabile, care, altfel, în circumstanțe normale, precum numerele, sunt dificil de interpretat. Corelațiile pozitive sunt afișate în albastru și corelațiile negative în roșu. Intensitatea culorii și mărimea cercului sunt proporționale cu coeficienții de corelație.

3. DataExplorer

Acest pachet tratează explorarea și tratarea automată a datelor. Oferă un proces automat de explorare a datelor, destinat sarcinilor analitice și modelării predictive. Acest lucru este crucial deoarece permite utilizatorului să înțeleagă datele și să extragă informații. Fiecare variabilă din analiză este scanată și analizată de pachet. Mai mult, pachetul oferă funcționalități pentru vizualizarea acestor variabile folosind tehnici grafice tipice. De asemenea, oferă metode comune de procesare a datelor pentru tratarea și formatarea datelor.

4. Modele

Pachetul gmodels oferă diverse instrumente în R pentru a planifica date. Conține diferite funcții, cum ar fi glh.test, care este utilizat pentru a testa, imprima sau rezuma o ipoteză liniară generală pentru un model de regresie. Funcția face. contrastele convertesc contrastele care pot fi citite de oameni în forma pe care R o cere pentru calcul. Matricea returnată de make.contrasts poate fi folosită ca argument la argumentul contrastelor funcțiilor modelului. Funcția coefFrame se potrivește unui model la fiecare subgrup definit de , apoi returnează un cadru de date cu un rând pentru fiecare potrivire și o coloană pentru fiecare parametru. Funcția estimativă calculează și testează contrastele și alte funcții liniare estimabile ale coeficienților modelului pentru lm, glm, etc. Funcția fit.contrast calculează și testează contrastele arbitrare pentru obiectele de regresie.

5. Gploturi

Acest pachet oferă funcționalități de vizualizare prin instrumente de programare multiple. Funcțiile din pachet funcționează pe conceptul de calcul și grafic. Capabilitățile grafice ale pachetului sunt demonstrate de diferite funcții, cum ar fi bandă de bandă, boxplot2, col2hex, ci2d, hist2d, text text, scăderă, pilot de balon, plotCI, mijloace de plot, etc. Aceste funcții permit lucrul cu setări legate de culoare, text și alte aspecte grafice complexe ale vizualizării. De asemenea, acestea se ocupă de elemente complexe implicate în vizualizarea bazată pe statistici, de exemplu, lmplot2, funcțiile de resplot care permit utilizatorului să conducă diagnosticul de regresie detaliat prin comploturi de diagnostic. Dacă mai multe date trebuie să fie reprezentate în aceeași regiune, dar cu axe separate, atunci este posibilă utilizarea funcției de complot din pachet.

6. Ggplot2

Este unul dintre cele mai faimoase pachete din R care oferă capacități vizuale extinse și prezintă rezultatele chiar și tehnici statistice și matematice complexe. Numeroasele funcționalități oferite de pachet îi permit analistului să obțină informații din datele cele mai interactive. Descrierea R a funcției este „un sistem pentru crearea declarativă a graficelor care se bazează pe Gramatica graficii”. Această gramatică grafică înseamnă că utilizatorul trebuie să spună „ggplot2” despre modul în care variabilele trebuie să fie mapate la estetică, astfel că, în esență, înseamnă că specificarea aspectelor grafice pe care le utilizează și ggplot2 va funcționa în consecință pe baza detaliilor.

7. Ungeți

Acest pachet R face mai ușor să lucrezi cu datele și orele. Pachetul de lubrifiere permite manipularea ușoară a datelor date și ora. Analizează un număr și oferă o aranjare adecvată a datelor, de fapt, funcțiile de analiză din pachet gestionează o mare varietate de formate și separatoare care simplifică procesul de analiză. Una dintre caracteristicile notabile este faptul că pachetul oferă funcționalități pentru gestionarea datelor cu fusuri orare diferite.

8. Hmisc

Numit Diverse Harrell, pachetul Hmisc conține multe funcții care pot fi utilizate pentru analiza datelor, graficele la nivel înalt și operațiunile utilitare. De asemenea, include funcții pentru calcularea mărimii și puterii eșantionului, importarea și adnotarea seturilor de date, imputarea valorilor lipsă, asigurarea funcționalităților avansate ale tabelelor, gruparea variabilelor, manipularea șirului de caractere, conversia obiectelor R în cod HTML etc.

9. Zăbrele

Pachetul oferă un sistem de vizualizare a datelor la nivel înalt, care a fost inspirat de graficele Trellis. Se subliniază pe datele multivariate. Capacitățile puternice de vizualizare ale pachetului oferă soluția grafică necesară. Unele dintre funcțiile notabile din pachet sunt B_07_cloud, care ajută la producerea parcelei de împrăștiere 3d și a planului de suprafață cu fir; D_level. culori, o functie de a calcula culorile false reprezentand variabila numerica sau categorica; B_06_levelplot, o funcție care generează parcele nivelate și parcele de contur; A_01_Lattice, o funcție care oferă funcții grafice Lattice. B_09_tmd este o funcție care generează Tukey Mean - Difference Plot; B_11_oneway, o funcție care se potrivește modelului unidirecțional. Pachetul, astfel, oferă funcționalități extinse pentru vizualizări prin diferite funcții.

10. MatriceModele

Acest pachet permite modelarea cu matricile „matrice” rare și dense. Pentru a realiza acest lucru, utilizează predicție și răspuns modulare, clase de module. Toate funcțiile oferite de pachet sunt la fel de importante, unele dintre ele fiind lm.fit.sparse, care este o funcție de montaj pentru modele liniare reduse, resolverCoef care rezolvă coeficienții și creșterea coeficientului, model. O matrice care construiește matricile de design sau de model posibil, glm4 care se potrivește modelelor liniare generalizate.

11. Multcomp

Pachetul permite comparații multiple de grupuri k în modele liniare generalizate. O listă de nouă proceduri standard, adică. Dunnet, Tukey, Sequen, AVE, Changepoint, Williams, Marcus, McDermott și Tetrade, sunt furnizate utilizatorului, iar utilizatorul selectează comparațiile pe baza cerinței. În plus, o interfață de intrare gratuită este prevăzută și pentru matricea de contrast care permite comparații speciale. Caracteristica de remarcat este că comparațiile în sine nu sunt limitate la niciun design particular, cum ar fi echilibrat sau simplu, ci mai degrabă programele sunt concepute astfel încât să se potrivească mai multor comparații în cadrul modelului liniar general care permite covariate, mijloace corelate, valori lipsă etc.

12. OpenMx

Acest pachet se ocupă practic de modelarea extinsă a ecuațiilor structurale. Oferă funcționalități pentru a crea modele de ecuații structurale. Aceste modele pot fi manipulate folosind programare. Modelele pot fi specificate cu matrice sau căi, cum ar fi LISREL sau RAM. Unele dintre tipurile de modele includ mai multe grupuri, factorul de confirmare, distribuția amestecului, pragul categoric, funcțiile de montare diferențiale etc.

13. Plyr

Este un pachet foarte important care oferă funcționalități pentru manipularea datelor. Oferă instrumente pentru împărțirea, aplicarea și combinarea datelor. Vine cu un set de instrumente care ajută la rezolvarea unui set comun de probleme. De exemplu, uneori este posibil să avem nevoie să împărțim o sarcină mare în sarcini mai mici, care să fie manevrabile, apoi să acționăm pe fiecare dintre piese și apoi în final, să punem toate piesele la loc.

14. Qcc

Pachetul capătă importanță datorită diverselor funcționalități de analiză a calității pe care le oferă. Oferă diagrame de control al calității Shewhart pentru date continue, atribute și numărări. Printre alte diagrame importante se numără graficele Cusum și EWMA și curbele caracteristicilor de operare. Oferă, de asemenea, funcționalitate de analiză a capacității procesului. Diagrama Pareto și diagrama cauză-efect și diagramele de control multivariate sunt instrumente utile oferite de pachet.

15. RandomForest

După cum sugerează și numele, acest pachet este folosit pentru a construi un algoritm aleatoriu de pădure. Pachetul implementează algoritmul forestier aleatoriu al lui Breiman, care se bazează pe codul original FORTRAN al lui Beiman și Cutler. Algoritmul este utilizat pentru clasificare și regresie. Pachetul poate fi folosit și în modul nesupervizat pentru a evalua proximitățile dintre punctele de date.

16. Psihologie

Este un pachet destinat unui scop special. Pachetul oferă o procedură pentru cercetarea psihologică, psihometrică și a personalității. Funcțiile sunt destinate în principal analizei multivariate folosind diverse tehnici statistice multivariate.

Concluzie-Lista de pachete R

Există numeroase pachete în R, iar aplicarea unui pachet depinde de cerințe. Comunitatea Listă de pachete R a crescut foarte repede și în fiecare zi se adaugă un pachet. Mai multe pachete pot oferi funcționalități similare, dar selectarea unui pachet trebuie să se bazeze pe studiul său atent.

Articole recomandate

Acesta este un ghid pentru o listă de pachete R. Aici discutăm despre introducerea la pachetele R și câteva pachete importante de R. Puteți parcurge și alte articole propuse pentru a afla mai multe -

  1. Pachete Java
  2. Ce este JNDI în Java?
  3. JColorChooser
  4. Programare R vs Python

Categorie: