Introducere în designul depozitului de date
Un depozit în cuvânt comun înseamnă să stochezi ceva într-un singur loc și cazuri similare în industrii pentru a stoca cantitatea complexă de date într-o singură locație. Business Intelligence (BI) vă permite să interogați datele de la sursele de date, iar încrederea poate fi făcută numai atunci când există un design bun al depozitului de date.
Depozitul de date integrează mai multe surse de date și va oferi un suport bun pentru analiză și raportare analitică. Dacă aveți un design deficitar al depozitului de date, aceasta va afecta creșterea organizației dvs. prin faptul că aveți date de interogare inexacte.
Luați un exemplu de popularitate al magazinului web Amazon comandând articolul și acesta poate fi livrat la ușa noastră. Când clientul se conectează pe site-ul de e-commerce și caută produsul disponibil în magazin. Apoi am selectat și comandat produsul, imediat ce furnizorul acceptă și expediat imediat. Aici ne putem economisi timpul pentru a cumpăra articolul necesar.
Un caz similar cu acest depozit de date, datele pot fi stocate și procurate din sistemul de tranzacții. Depozitul de date ca două concepte majore
- OLAP - Procesare analitică online
- OLTP - Procesare tranzacțională online
Ambele sunt sisteme de procesare online, dar au unele diferențe. OLTP gestionează aplicația tranzacțională ca ATM, OLAP folosește pentru procesare analitică precum raportare, previziune etc.
Adunarea cerințelor
- Culegerea cerințelor este o fază în proiectarea depozitului de date. Trebuie să stabilească criteriile și să le implementeze cu succes. Vor fi două strategii utilizate pentru proiectarea depozitului de date, una se numește business și alta, denumită tehnică.
- Strategia de afaceri se concentrează pe viziunea de afaceri pe termen lung și ajută la creșterea profitului pentru creștere. Cerința strategiei tehnice se bazează pe raportare, analiză, selecție hardware, metodă de dezvoltare, tehnică de testare, mediu de implementare și instruire utilizator.
- Atunci când am determinat strategia de afaceri și tehnică, trebuie, de asemenea, să proiectăm planul BCP (recuperare în caz de dezastre). Atunci când se întâmplă un dezastru din punct de vedere uman sau natural, trebuie să avem un plan de recuperare a datelor rapid și să asigurăm pierderea datelor. Dezvoltarea planului de recuperare a dezastrelor este una dintre cele mai provocatoare și creează o încredere pentru organizație.
Configurare mediu
- După ce am adunat datele pentru proiectarea depozitului de date, trebuie să realizăm o configurare adecvată a mediului pentru dezvoltare, testare și producție. De preferință, ar trebui să existe un sistem separat pentru aplicație, bază de date și separat pentru raportare / ETL.
- Când construim un mediu separat pentru fiecare asigurăm că toate modificările pot fi dezvoltate / testate și apoi trecem la producție.
- Dacă avem un mediu unic care a fost conceput pentru toate aceste activități, acesta ar putea fi pus la punct cu emiterea și pierderea de date. De exemplu, atunci când există un incident în sistem, nu am putut să navigăm și să aflăm modul de remediere și îl face mai complex.
Modelarea datelor
- Odată configurată colectarea cerințelor și a mediului, următoarea este proiectarea modului de conectare a sursei de date, procesare și stocare în depozitul de date. Această tehnică este numită modelare a datelor. Poate fi o analiză a obiectului și relației dintre ceilalți.
- Când a fost proiectat depozitul de date, inginerii au proiectat cum și unde trebuie stocate datele. Cu aceeași ocazie, ar trebui să definim și modalitatea posibilă de a prelua datele din depozitul de date. Odată identificată sursa, echipa poate construi logica și poate crea o vedere a schemelor de structură.
Tipuri de model de date
Există trei tipuri
- Conceptual
- Logic
- Fizic
Cele trei tipuri de model de date sunt menționate mai jos:
1. Conceptual: spune CE conține sistemul și este conceput de arhitecții de afaceri pentru a defini sfera strategiei de afaceri.
2. Logic: această definiție CUM poate fi creată logica în DBMS, va fi proiectată de Business Analyst și Data Architect pentru a crea un set de reguli pentru stocarea / preluarea datelor
3. Fizic: Aceasta definește CUM poate fi implementat sistemul.
Utilizarea proiectării depozitului de date
Fiind un design bun al depozitului de date poate prelungi mult timp la preluarea datelor. Fiecare pas trebuie să urmeze eficient pentru a face sistemul să fie unul bun. Acesta va ajuta organizația să gestioneze tipurile complexe de date și să îmbunătățească productivitatea pe baza analizei de tendințe. Deci, fiecare pas în proiectarea arhitecturii DWH este important și mai conștient în metoda de selecție. Organizația trece în fiecare flux ulterior și duce la implementarea cu succes a depozitului de date.
Există puține utilizări importante ale aplicației Data Warehouse
1. Industria bancară: Majoritatea băncilor folosesc depozitul de date pentru stocarea unei cantități mari de date de tranzacții și posibilitatea de a prelua datele de interogare mult mai rapid. Poate fi gestionat ca date despre clienți, tendințe de piață, rapoarte, analize etc.
2. Industria finanțelor: este similară cu cea bancară, dar singurul accent este îmbunătățirea schimbărilor financiare prin analizarea datelor clienților
3. Guvern: În prezent, guvernul gestionează o mulțime de date online și magazine în baza de date relațională. Fiecare date are o relație între ele, cum ar fi Aadhaar, PAN este legată de multe surse.
4. Asistența medicală: managerii și serviciile de asistență medicală au atât de multe informații. Menține detaliile clinice, înregistrările clienților și îi ajută să prezică rezultatele, să analizeze feedback-ul și să genereze rapoartele.
5. Asigurări: companie de asigurări folosită în principal pentru modelele de date, tendința clienților și menținerea înregistrărilor.
6. Industria de fabricație și distribuție: este cea mai utilizată pe scară largă în toate industriile pentru stocarea informațiilor despre articol și îi ajută să prezice obiectul cererii pentru fabricare și vânzări. Analiza articolului vândut care oferă tehnici mai bune de luare a deciziilor.
7. Servicii de vânzare cu amănuntul: comercianții cu amănuntul sunt intermediarul dintre producător și client. Depozitul de date îi ajută pentru promoții și tendințe de cumpărare a articolelor.
8. Industria telefonică: Industriile telefonice gestionează o mulțime de date istorice, care ajută la crearea de tendințe a datelor clienților și vizează campaniile publicitare.
Avantajele depozitului de date
- Furnizează informații de afaceri îmbunătățite
- Asigură calitatea și coerența datelor
- Economisește timp și bani
- Urmărește date istoric inteligente
- Generează un ROI ridicat
Dezavantajul de la Data Warehouse
- Raport de lucru suplimentar
- Inflexibilitate și omogenizare a datelor
- Preocupări de proprietate
- Cereri pentru cantități mari de resurse
- Problemele ascunse consumă timp
Articole recomandate
Acesta este un ghid pentru Data Warehouse Design. Aici discutăm tehnica de proiectare a depozitului de date, colectarea cerințelor, configurarea mediului, utilizări, avantaj / dis-avantaj. De asemenea, puteți consulta articolul următor pentru a afla mai multe -
- Beneficiile depozitului de date
- Punerea în aplicare a depozitului de date
- Modelarea depozitului de date
- Instrumente pentru depozitul de date
- Top 4 tipuri diferite de modele de date