Ruwe of verwerkte data?
In dit kennisbank artikel leggen we het verschil uit tussen ruwe en verwerkte data.
Ruwe data
Ruwe data zijn de data die direct wordt vastgelegd zonder dat er een aanpassing of een berekening aan gedaan wordt. Hierbij kan je bijvoorbeeld denken aan de waarden vanuit bepaalde meetapparatuur, zoals een bloeddrukmeter of een weegschaal. Het kan ook de snelheid zijn die op je fietscomputer wordt verzameld. Ruwe data bevatten dus alle meetpunten. Ruwe data worden veelal in tabellen opgeslagen en met alleen de ruwe data heb je niet direct een antwoord op je vraag. Daarvoor moet je de data eerst verwerken en analyseren.
Verwerkte data
In ruwe data kunnen datapunten zitten die erg ver van de rest liggen, bijvoorbeeld door een (technische) fout. Als je snelheid op de fiets normaliter tussen de 10 en 30 kilometer per uur is, maar je hebt een meting waar je 80 kilometer per uur gaat, dan is die meting waarschijnlijk fout. Voordat je de data kan gebruiken om je vraag te beantwoorden moet je de data verwerken. Bij het verwerken van de data kijk je of er fouten in je dataset zitten en of er overbodige gegevens in zitten. Het kan ook zijn dat je de ruwe data gebruikt om iets anders te berekenen, bijvoorbeeld als je gewicht en lengte gebruikt om het BMI te berekenen of als de temperatuur is gemeten in Celsius maar je hebt het in Fahrenheit nodig. Je kan de gegevens ook verwerken tot een andere vorm, bijvoorbeeld door je snelheid af te beelden in een grafiek of tabel.
Let wel op dat er een verschil is tussen het verwerken van gegevens volgens de AVG (zie Wat is de AVG) en het spreken van ruwe of verwerkte data.