Introducere în Data Mining

Aici, în acest articol, vom afla despre introducerea mineritului de date, deoarece oamenii au minat de pe pământ de secole, pentru a obține tot felul de materiale valoroase. Uneori, în timp ce miner, lucrurile sunt descoperite din pământ pe care nimeni nu se aștepta să le găsească în primul rând. De exemplu, în 1898, în timpul săpăturii unui mormânt pentru a găsi mumii în Saqqara, Egipt, a fost găsit un artefact din lemn care semăna exact cu un avion. Era datată din 200 î.Hr., acum aproximativ 2200 de ani! Dar ce informații posibile am putea obține dintr-un set mare de date? Și chiar dacă începem să-l extragem, există șanse să obținem rezultate neașteptate din setul de date? Înainte de asta, să trecem la ce este exact Data Mining.

Ce este Data Mining?

  • Este practic extragerea informațiilor / cunoștințelor vitale dintr-un set mare de date.
  • Gândiți-vă la date ca la o suprafață mare / stâncoasă. Nu știm ce se află în interiorul său, nu știm dacă ceva util este sub stânci.
  • În această introducere în Data mining, căutăm informații ascunse, dar fără nici o idee despre ce tip de informații dorim să găsim și ce intenționăm să le utilizăm pentru o singură dată, le găsim.
  • La fel ca în conceptul Minerit tradițional, în Mineritul de date există și diverse tehnici și instrumente, care variază în funcție de tipul de date pe care le exploatăm, deci am clarificat ceea ce este extragerea datelor prin acest subiect de introducere în Data mining.

Exemplu de extragere a datelor

Am aflat despre introducerea mineritului de date în secțiunea de mai sus și continuăm acum cu exemplele de extragere a datelor, care sunt enumerate mai jos:

  • Deci există un operator de rețea mobilă. Ei consultă un miner de date pentru a săpa în înregistrările de apeluri ale operatorului. Nu se acordă obiective specifice pentru Minerul de date.
  • O țintă cantitativă de a găsi cel puțin 2 tipare noi într-o lună.
  • Pe măsură ce minerul de date începe să sape în date, el găsește un tipar că există mai puține apeluri internaționale miercuri în comparație cu alte zile.
  • Aceste informații sunt împărtășite conducerii și vin cu planul de a reduce tarifele internaționale de apel miercuri și de a începe o campanie.
  • Tarifele de apel cresc, clienții sunt mulțumiți de prețul apelului scăzut, mai mulți clienți se înscriu și compania câștigă mai mulți bani! Situatie de castig!

Ținând cont de exemplul de mai sus, să ne uităm acum la diferitele etape implicate în extragerea datelor.

Pașii implicați în Data Mining

Am aflat despre introducerea mineritului de date în secțiunea de mai sus și acum avansăm cu pașii implicați în extragerea datelor, care sunt enumerați mai jos:

  • Înțelegerea afacerilor

În această Introducere în extragerea datelor, vom înțelege fiecare aspect al obiectivelor și nevoilor afacerii. Situația actuală este evaluată prin găsirea resurselor, presupunerilor și a altor factori importanți. În consecință, stabilirea unei bune introduceri a planului de extragere a datelor pentru atingerea obiectivelor de business și de extragere a datelor.

  • Înțelegerea datelor

Inițial, datele sunt colectate din toate sursele disponibile. Apoi alegem cel mai bun set de date de unde putem extrage datele care ar putea fi mai benefice.

  • Pregătirea datelor

Odată identificat setul de date, acesta este selectat, curățat, construit și formatat în forma dorită.

  • Modelarea datelor

Este un proces de remodelare a datelor date conform cerinței utilizatorului. Unul sau mai multe modele ar putea fi create pe setul de date pregătit și, în final, modelele trebuie să fie evaluate cu atenție implicând părțile interesate pentru a vă asigura că modelele create corespund inițiativelor de afaceri.

  • Evaluare

Acesta este unul dintre cele mai necesare procese în exploatarea datelor. Include parcurgerea fiecărui aspect al procesului, astfel încât să se verifice eventualele erori sau scurgeri de date din proces. De asemenea, cerințele de afaceri noi ar putea fi ridicate din cauza noilor tipare descoperite.

  • Implementare

Înseamnă să prezentați pur și simplu cunoștințele în așa fel încât părțile interesate să le poată folosi atunci când doresc acest lucru. În exemplul nostru de mai sus, s-a constatat că apelurile internaționale au fost mai puțin miercuri, astfel încât aceste informații au fost prezentate părților interesate care, la rândul lor, au folosit aceste informații în avantajul lor și le-au crescut profiturile.

Tehnici utilizate în exploatarea datelor

În secțiunea de mai sus, am aflat despre introducerea în exploatarea datelor, acum mergem în continuare cu tehnicile utilizate în minerirea datelor, care sunt enumerate mai jos:

  • Analiza grupului

Analiza clusterului permite identificarea unui grup de utilizatori dat în funcție de caracteristicile obișnuite dintr-o bază de date. Aceste caracteristici ar putea include vârsta, locația geografică, nivelul de învățământ și așa mai departe.

  • Detectarea anomaliilor

Este folosit pentru a determina când ceva este vizibil diferit de modelul obișnuit. Este utilizat pentru a elimina orice inconsistențe sau anomalii ale bazei de date la sursă.

  • Analiza regresiei

Această tehnică este utilizată pentru a face predicții bazate pe relații din setul de date. De exemplu, se poate prezice rata stocului unui anumit produs analizând rata trecută și, de asemenea, luând în considerare diferiții factori care determină rata stocului. Sau după cum se arată mai jos, dacă avem datele despre înălțimea și greutatea diferitelor persoane, atunci având în vedere orice înălțime sau greutate, am putea determina cealaltă valoare.

  • Clasificare

Acest lucru se ocupă de lucrurile care au etichete pe ea. Notă în detecția clusterului, lucrurile nu aveau o etichetă în ea și folosind extragerea de date a trebuit să etichețăm și să formăm în clustere, dar în clasificare, există informații existente care pot fi clasificate cu ușurință folosind un algoritm. Un exemplu sunt filtrele de spam prin e-mail. Filtrul de spam este prevăzut atât cu mesaje relevante, cât și cu mesaje spam (Date de instruire). Diferențele dintre ambele dintre ele sunt identificate, permițându-i astfel să clasifice corect e-mailurile viitoare.

  • Învățare asociativă

Este folosit pentru a analiza ce lucruri tind să se producă împreună, fie în perechi, fie în grupuri mai mari. De exemplu, persoanele care tind să cumpere lămâi, să cumpere și portocale, persoane care tind să cumpere pâine, să cumpere lapte și așa mai departe. Așadar, achizițiile făcute de toți clienții sunt analizate și lucrurile care apar împreună sunt plasate strâns pentru a crește vânzările. Deci laptele este așezat aproape de pâine, lămâile sunt așezate alături de portocale și așa mai departe.

Data mining este etic?

Așadar, îmi propun o excursie de weekend la Goa cu un prieten, caut pe internet locuri bune de vizitat în Goa. Data viitoare când deschid internetul, voi găsi anunțuri despre diverse hoteluri din Goa pentru cazarea.

  • Lucru bun?

Da, internetul m-a ajutat să-mi simplific călătoria. La urma urmei, dacă decid să vizitez Goa, ar trebui să dorm undeva și un anunț care îmi arată un hotel este mult mai util decât un anunț care îmi arată haine aleatorii pentru a cumpăra.

  • Lucru rau?

Da! De ce o companie de exploatare a datelor despre care nu am mai auzit până acum, ar ști unde mă duc într-o vacanță. Ce se întâmplă dacă nu am spus nimănui despre această călătorie, dar aici internetul știe deodată că merg acolo. Adevărul este că modelul de afaceri al companiei de minerit de date depinde de acest lucru. Colectează aceste date prin cookie-uri și scripturi, apoi le vând agenților de publicitate care, la rândul lor, încearcă să-mi vândă altceva (În acest caz, o cameră de hotel).

Deci ar putea fi bine sau rău în funcție de modul în care îl privim. De asemenea, am putea întotdeauna să dezactivăm cookie-urile sau să mergem incognito în cazul de mai sus. Deși este cazul, un lucru este sigur. Minerirea datelor este aici pentru a rămâne.

Articole recomandate

Acesta a fost un ghid pentru Introducere în extragerea datelor. Aici discutăm semnificația, tehnicile și etapele implicate în introducerea în exploatarea datelor cu un exemplu pentru a înțelege mai bine. De asemenea, puteți consulta următoarele articole pentru a afla mai multe -

  1. Întrebări de interviu pentru exploatarea datelor
  2. Analiza predictivă în raport cu data mining
  3. Introducere în știința datelor
  4. Ce este analiza de regresie?

Categorie: