Big data is een Engelse term en betekent: grote hoeveelheid informatie. Big data verwijst naar de enorme hoeveelheden gegevens die worden gegenereerd door digitale apparaten en systemen. Dit omvat gegevens die worden verzameld door sociale media, e-commerce websites, mobiele apps, IoT-apparaten en andere bronnen.
Big data gedefinieerd
De definitie van big data is data met meer verscheidenheid die in steeds grotere volumes en met meer snelheid aankomt. Dit zijn tevens de drie belangrijkste termen. Eenvoudig gezegd zijn big data grotere, complexere datasets, vooral uit nieuwe databronnen.
Denk hierbij aan slimme pillen, smart meters, met het internet verbonden vrachtauto's, vliegtuigmotoren, hardloopschoenen, koelkasten, pompen enzovoorts. Bekijk hier de 5 kenmerken van Big Data. Deze realtime data noemen we Internet of Things Big Data, omdat het om grote hoeveelheden (ongestructureerde) gegevens gaat.
Big data software kan je 'realtime' inzetten om correlaties te vinden tussen data en op basis daarvan beslissingen te maken, oftewel data mining. Data mining is het zoeken naar correlaties, patronen en statistische verbanden binnen zeer grote hoeveelheden data in databases, met als doel om relaties te ontdekken.
Data is simpel gezegd een ander woord voor gegevens. De tekst die je hier leest is een gegeven en bestaat uit een reeks lettertekens die woorden vormen van een bepaalde betekenis. Letters en cijfers zijn symbolen.
Data kan verwijzen naar: Gegeven, een vastgelegde uitdrukking van een feit: datum, meervoud data gegevens. Dataset, een gegevensverzameling. Meervoud van Datum (dagaanduiding) (ook wel datums), een verzameling van tijdsaanduidingen.
Data bestaat uit alle soorten gegevens in en rond uw organisatie die een weergave zijn van feiten.
Volgens Gartner heeft big data drie kenmerken, de “drie V's”: Volume (hoeveelheid), Velocity (snelheid) en Variety (verscheidenheid). Als al deze drie kenmerken aanwezig zijn, is er sprake van big data. Verwerking met traditionele systemen is dan niet meer mogelijk.
Soorten Big Data
Big Data kan worden onderverdeeld in drie hoofdtypen: gestructureerde, ongestructureerde en semigestructureerde gegevens.
Getallen, woorden, foto's en video's zijn ook allemaal voorbeelden van data. Het kan ons in het bedrijfsleven leren hoe een organisatie ervoor staat en waar er bijgestuurd moet worden. Data helpt dus bij het creëren van inzicht, en het helpt bij het onthullen van trends en patronen.
Waar komt big data vandaan? Big data kan gegenereerd worden van diverse kanalen.Denk hierbij aan data van social media kanalen, transactionele data uit het bedrijfsleven, maar bijvoorbeeld ook aan data van machines. Kortom big data is overal.
Big data-analyse helpt organisaties bepalen wat hun klanten willen door hun behoeften te achterhalen aan de hand van grote hoeveelheden bedrijfsanalytische gegevens, en sturen zo de ontwikkeling van functies en de strategie van de roadmap.
Door middel van data kun je onder andere het consumentengedrag analyseren, financiële keuzes inschatten, de markt in kaart brengen, gerichte aanbiedingen aan je klanten doen en concurrentieanalyses maken. Door data kunnen we sneller en goedkoper waardevolle analyses doen.
Een deel van de grootte van "Big Data" wordt alleen al verklaard door de enorme toename van data in de wereld. Bekijk maar eens goed de grafiek hierboven. Je ziet in de grafiek dat de hoeveelheid data die in de wereld aanwezig is exponentieel toeneemt. Ongeveer iedere twee jaar is er een verdubbeling.
In het kort komen deze vaak neer op het volgende: Data = gegevens = symbolen, tekens, getallen, woorden, etc.Informatie = data die in een bepaalde context gezet kan worden. Er is dus sprake van data of gegevens als er iets waargenomen kan worden, los van het feit of er betekenis gegeven kan worden aan deze gegevens.
Big data kan heel veel verschillende vormen aannemen, maar in het algemeen kunnen we big data definiëren als 'grote datasets'. Deze datasets kunnen met behulp van de rekenkracht van een computer geanalyseerd worden om hier patronen, trends, relaties of andere nuttige informatie uit te halen.
Hieronder bespreken we de vijf belangrijkste risico's die big data met zich meebrengen: Data wordt gestolen of gehackt.Het beperkt je privacy.De data-interpretatie verloopt slecht.
Met data-analyse kan een bedrijf rapporten maken en patronen vinden waarmee het efficiënter kan werken. Het analyseren van gegevens kan ook de besluitvorming verbeteren door een bedrijf in staat te stellen: trends in zijn branche voorspellen of voorspellen wat zijn klanten hierna willen.
Big data bestaan uit alle potentieel bedrijfsrelevante gegevens, zowel gestructureerd als ongestructureerd, uit allerlei verschillende bronnen. Na analyse worden ze gebruikt om dieper inzicht en nauwkeurigere informatie te geven over alle operationele gebieden van een bedrijf en zijn afzetgebied.
Data-eigenaar
Vanuit het normale spraakgebruik is het begrijpelijk om te spreken over een “eigenaar” van gegevens/data, maar juridisch klopt dat niet. Data is juridisch niet iets wat je in eigendom kan hebben. Persoonsgegevens – die ook data zijn – hebben strikt genomen dus ook geen eigenaar.
Een data-analyse is het grondig en zorgvuldig bekijken en interpreteren van gegevens die via een onderzoek zijn verzameld. Uit de data-analyse komen vervolgens resultaten naar boven waarmee de onderzoeksvragen goed beantwoord kunnen worden.
Als een meervoudig woord het onderwerp van de zin is, hoort daar een meervoudige persoonsvorm bij. Dus net zoals De gegevens zijn onderzocht juist is (en niet De gegevens is onderzocht), is ook De data zijn onderzocht juist.
Grootste data slurpers
Met 1 uur Netflix kijken zonder wifi bent u bijvoorbeeld al snel 2000 mb data kwijt. En een uurtje muziek luisteren of video's kijken via Youtube kost zo'n 1650 mb. Luistert u veel muziek via Spotify, dan bent u veel voordeliger uit, maar u zult nog steeds 70 mb verbruiken.
Data is een meervoudig woord. Het is het meervoud van het Latijnse datum, dat letterlijk 'gegeven' betekent (en ook 'dagtekening', 'dag' en 'tijdstip'). 'De data zijn onderzocht' is dus in principe te vergelijken met 'De gegevens zijn onderzocht.