Ce este știința datelor?
Știința datelor oferă informații semnificative bazate pe cantități mari de date complexe sau date mari. Știința datelor, sau știința bazată pe date, combină diferite domenii de activitate în statistici și calcule pentru a interpreta datele în scop decizional.
Înțelegerea științei datelor
Datele sunt obținute din diferite sectoare, canale și platforme, inclusiv telefoane mobile, social media, site-uri de comerț electronic, sondaje de asistență medicală și căutări pe Internet. Creșterea cantității de date disponibile a deschis ușa către un nou domeniu de studiu bazat pe date mari - seturile masive de date care contribuie la crearea de instrumente operaționale mai bune în toate sectoarele.
Creșterea continuă a accesului la date este posibilă datorită avansărilor tehnologiei și tehnicilor de colectare. Persoanele care cumpără tiparele și comportamentul pot fi monitorizate și previziunile pe baza informațiilor culese.
Cu toate acestea, datele din ce în ce mai mari nu sunt structurate și necesită o analiză pentru o luare eficientă a deciziilor. Acest proces este complex și consumă mult timp pentru companii - prin urmare, apariția științei datelor.
Știința datelor, sau știința bazată pe date, folosește date mari și învățare automată pentru interpretarea datelor în scopuri decizionale.
O scurtă istorie a științei datelor
Termenul de știință a datelor a existat în cea mai bună parte a ultimilor 30 de ani și a fost folosit inițial ca substitut pentru „informatica” în 1960. Aproximativ 15 ani mai târziu, termenul a fost folosit pentru a defini sondajul metodelor de procesare a datelor utilizate în diferite aplicații. În 2001, știința datelor a fost introdusă ca disciplină independentă. Harvard Business Review a publicat un articol în 2012 care descrie rolul oamenilor de știință de date ca fiind „cea mai sexy meserie din secolul XXI”.
Cheie de luat cu cheie
- Avansele tehnologiei, internetului, rețelelor de socializare și utilizării tehnologiei au un acces sporit la date mari. Știința datelor folosește tehnici precum învățarea automată și inteligența artificială pentru a extrage informații semnificative și pentru a prezice viitoarele modele și comportamente. Campul de date știința crește pe măsură ce tehnologia avansează și tehnicile mari de colectare și analiză a datelor devin mai sofisticate.
Modul de aplicare a științei datelor
Știința datelor încorporează instrumente din mai multe discipline pentru a aduna un set de date, procesa și obține perspective din setul de date, extrage date semnificative din set și interpretează-le în scopuri decizionale. Domeniile disciplinare care compun domeniul științei datelor includ minerit, statistici, învățare automată, analitică și programare.
Exploatarea datelor aplică algoritmi la setul de date complexe pentru a dezvălui tipare care sunt apoi utilizate pentru a extrage date utile și relevante din set. Măsurile statistice sau analizele predictive folosesc aceste date extrase pentru a evalua evenimentele care se vor întâmpla în viitor, pe baza a ceea ce arată datele care s-au întâmplat în trecut.
Învățarea automată este un instrument de inteligență artificială care procesează cantități în masă de date pe care un om nu ar putea să le prelucreze într-o viață. Învățarea automată perfecționează modelul decizional prezentat sub analize predictive, corelând probabilitatea ca un eveniment să se întâmple cu ceea ce s-a întâmplat de fapt la un moment prevăzut.
Utilizând analitice, analistul de date colectează și prelucrează datele structurate din stadiul de învățare automată folosind algoritmi. Analistul interpretează, convertește și rezumă datele într-un limbaj coerent pe care echipa de decizie îl poate înțelege. Știința datelor se aplică practic în toate contextele și, pe măsură ce rolul oamenilor de știință evoluează, câmpul se va extinde pentru a cuprinde arhitectura de date, inginerie de date și administrarea datelor.
Fapt rapid
Potrivit IBM, cererea pentru oamenii de știință de date este de așteptat să crească cu 28% până în 2020.
Datologul definit
Un om de știință de date colectează, analizează și interpretează volume mari de date, în multe cazuri, pentru a îmbunătăți operațiunile unei companii. Profesioniștii din oamenii de știință a datelor dezvoltă modele statistice care analizează datele și detectează tiparele, tendințele și relațiile din seturile de date. Aceste informații pot fi utilizate pentru a prezice comportamentul consumatorilor sau pentru a identifica riscurile operaționale și de afaceri. Cercetătorul de date este adesea un povestitor care prezintă informații despre factorii de decizie într-un mod care poate fi înțeles și aplicabil pentru rezolvarea problemelor.
Știința datelor astăzi
Companiile aplică date mari și date științifice pentru activitățile de zi cu zi pentru a aduce valoare consumatorilor. Instituțiile bancare valorifică date mari pentru a-și îmbunătăți succesele de detectare a fraudei. Firmele de administrare a activelor utilizează date mari pentru a prezice probabilitatea ca prețul unei garanții să se ridice în sus sau în jos la un moment dat.
Companii precum Netflix mina date mari pentru a determina ce produse să livreze utilizatorilor săi. Netflix folosește, de asemenea, algoritmi pentru a crea recomandări personalizate pentru utilizatori, pe baza istoricului de vizualizare. Știința datelor evoluează într-un ritm rapid, iar aplicațiile sale vor continua să schimbe viețile în viitor.
