Ce este depozitarea datelor?
Depozitarea datelor este stocarea electronică a unei cantități mari de informații de către o întreprindere sau organizație. Depozitarea datelor este o componentă vitală a informațiilor de afaceri care folosește tehnici analitice pe datele de afaceri.
Conceptul de depozitare a datelor a fost introdus în 1988 de cercetătorii IBM Barry Devlin și Paul Murphy. Nevoia de a depozita datele a evoluat pe măsură ce sistemele informatice au devenit mai complexe și au gestionat cantități din ce în ce mai mari. O carte-cheie privind depozitarea datelor este „Construirea depozitului de date” de WH Inmon, care a fost publicată pentru prima dată în 1990 și a fost tipărită de mai multe ori de atunci.
Cum funcționează depozitarea datelor
Depozitarea datelor este utilizată pentru a oferi o perspectivă mai largă asupra performanței unei companii prin compararea datelor consolidate din surse eterogene multiple. Un depozit de date este proiectat pentru a rula interogarea și analiza datelor istorice obținute din surse tranzacționale.
Odată ce datele au fost încorporate în depozit, acestea nu se schimbă și nu pot fi modificate, deoarece un depozit de date rulează analize asupra evenimentelor care au avut loc deja, concentrându-se pe modificările datelor în timp. Datele depozitate trebuie să fie stocate într-o manieră sigură, fiabilă, ușor de recuperat și ușor de gestionat.
Există anumite etape care sunt făcute pentru a crea un depozit de date. Primul pas este extragerea datelor, care presupune colectarea unor cantități mari de date din mai multe puncte sursă. După compilarea datelor, acestea trec prin curățarea datelor, procesul de comasare a datelor pentru erori și corectarea sau excluderea oricăror erori găsite.
Datele curățate sunt apoi transformate dintr-un format de bază de date în format de depozit. Odată stocate în depozit, datele trec prin sortare, consolidare, rezumare etc., astfel încât să fie mai coordonate și mai ușor de utilizat. De-a lungul timpului, în depozit se adaugă mai multe date pe măsură ce mai multe surse de date sunt actualizate.
Cheie de luat cu cheie
- Depozitarea de date este stocarea electronică a unei cantități mari de informații de către o întreprindere sau organizație. Un depozit de date este proiectat pentru a rula interogarea și analiza datelor istorice obținute din surse tranzacționale, în scopuri de informații de afaceri și de extragere a datelor. o perspectivă asupra performanței unei companii prin compararea datelor consolidate din surse eterogene multiple.
Considerații speciale: data mining
Întreprinderile ar putea depozita date pentru utilizare în explorare și minarea de date, căutând modele de informații care să le ajute să își îmbunătățească procesele de afaceri. Un sistem bun de depozitare a datelor poate facilita accesul reciproc la datele departamentelor din cadrul unei companii.
De exemplu, un depozit de date ar putea permite unei companii să evalueze cu ușurință datele echipei de vânzări și să ajute la luarea deciziilor despre cum să îmbunătățească vânzările sau să eficientizeze departamentul. Afacerea ar putea alege să se concentreze asupra obiceiurilor de cheltuieli ale clienților săi pentru a-și poziționa mai bine produsele și pentru a crește vânzările.
Odată cu depozitarea datelor, compania poate strânge date istorice ale cheltuielilor clienților săi în trecut - să zicem, 20 de ani - și să execute analize pe aceste date. Informațiile rezultate ar putea oferi informații despre preferințele consumatorilor săi; ora din zi, luna sau anul cu vânzări mai mari; sau cel mai mare client cu cheltuieli pentru anul.
Stocarea și gestionarea eficientă a datelor sunt, de asemenea, ceea ce face ca procesele să fie posibile, cum ar fi inițierea rezervărilor de călătorie și utilizarea caselor automate.
Procesul de extragere a datelor se descompun în cinci etape:
- Organizațiile colectează date și le încarcă în depozitele de date, apoi stochează și gestionează datele, fie pe serverele interne, fie pe cloud. Programul de aplicație sortează apoi datele pe baza rezultatelor utilizatorului Utilizatorul final prezintă în final datele într-un format ușor de partajat, cum ar fi un grafic sau un tabel.
Depozitare de date vs. baze de date
Un depozit de date nu este neapărat același concept ca o bază de date standard. O bază de date este un sistem tranzacțional care este setat să monitorizeze și să actualizeze datele în timp real pentru a avea doar cele mai recente date disponibile. Un depozit de date este programat pentru a agrega date structurate pe o perioadă de timp. De exemplu, o bază de date poate avea doar cea mai recentă adresă a unui client, în timp ce un depozit de date ar putea avea toate adresele în care clientul a trăit în ultimii 10 ani.
