Er wordt zoveel gesproken over Big Data, maar hoe weet je eigenlijk wanneer je met Big Data te maken hebt. Samuel Greengard in zijn artikel ‘What Does Big Data Look Like?’ houdt het simpel. Volgens hem draait het allemaal om de 3 V's: volume, velocity en variety. In gewoon Nederlands: volume, snelheid en variĆ«teit.
Volume (Volume)
Je kunt pas een voordeel behalen met Big Data als je in staat bent zeer grote hoeveelheden data te verwerken en te analyseren. En dat is waar "Big Analitics" om draait. In techneutentaal praat je over hoeveelheden in termen van petabytes, in managerstaal praat je over 1000 kilometer aan Excelrijen. Maar uiteindelijk kan je voor een sentimentanalyse van twitterfeeds misschien nog maar 200.000 rijen overhouden van de 1000 kilometer.
Velocity (Snelheid)
Alles draait om de snelheid waarmee informatie gegenereerd wordt. In veel voorbeelden van Big Data haalt men social media aan omdat dit de bronnen die continue ‘feeds’ genereren. Ofwel, het is alsof er een spuitende waterkraan openstaat. Maar die informatiesnelheid zie je ook bij informatiesystemen van investeringsmaatschappijen, telecombedrijven en ziekenhuizen.
Variety (Variƫteit)
Vaak staat Big Data niet in keurige rijtje in een Excelsheet, die direct te analyseren is met een draaitabel. Een belangrijk kenmerk van Big Data is dat de data gevarieerd is. Het komt voor in verschillende vormen. Het kan tekst zijn van Facebook of Twitter, het kunnen plaatjes zijn, of het kan rauwe data zijn van een sensor. Overigens zijn er tools beschikbaar waar bijvoorbeeld tekst, html en xml kan worden omgezet naar rijen in een spreadsheet.
Kortom, als je data voldoet aan de ‘3 V’s’ dan heb je waarschijnlijk te maken met Big Data.
Een interessante video over Big Data
Link
Analyzing Big Data with Twitter
Volume (Volume)
Je kunt pas een voordeel behalen met Big Data als je in staat bent zeer grote hoeveelheden data te verwerken en te analyseren. En dat is waar "Big Analitics" om draait. In techneutentaal praat je over hoeveelheden in termen van petabytes, in managerstaal praat je over 1000 kilometer aan Excelrijen. Maar uiteindelijk kan je voor een sentimentanalyse van twitterfeeds misschien nog maar 200.000 rijen overhouden van de 1000 kilometer.
Velocity (Snelheid)
Alles draait om de snelheid waarmee informatie gegenereerd wordt. In veel voorbeelden van Big Data haalt men social media aan omdat dit de bronnen die continue ‘feeds’ genereren. Ofwel, het is alsof er een spuitende waterkraan openstaat. Maar die informatiesnelheid zie je ook bij informatiesystemen van investeringsmaatschappijen, telecombedrijven en ziekenhuizen.
Variety (Variƫteit)
Vaak staat Big Data niet in keurige rijtje in een Excelsheet, die direct te analyseren is met een draaitabel. Een belangrijk kenmerk van Big Data is dat de data gevarieerd is. Het komt voor in verschillende vormen. Het kan tekst zijn van Facebook of Twitter, het kunnen plaatjes zijn, of het kan rauwe data zijn van een sensor. Overigens zijn er tools beschikbaar waar bijvoorbeeld tekst, html en xml kan worden omgezet naar rijen in een spreadsheet.
Kortom, als je data voldoet aan de ‘3 V’s’ dan heb je waarschijnlijk te maken met Big Data.
Een interessante video over Big Data
Link
Analyzing Big Data with Twitter
Reacties
Een reactie posten