Datawetenschap - Wat is data?
Wat is gegevens?
Data is een verzameling informatie.
Een doel van Data Science is om gegevens te structureren, zodat ze interpreteerbaar zijn en gemakkelijk om mee te werken.
Gegevens kunnen worden onderverdeeld in twee groepen:
- Gestructureerde gegevens
- ongestructureerde gegevens
Ongestructureerde gegevens
Ongestructureerde gegevens zijn niet georganiseerd. We moeten de gegevens ordenen voor analysedoeleinden.
Gestructureerde gegevens
Gestructureerde gegevens zijn georganiseerd en gemakkelijker om mee te werken.
Hoe gegevens te structureren?
We kunnen een array of een databasetabel gebruiken om gegevens te structureren of te presenteren.
Voorbeeld van een array:
[80, 85, 90, 95, 100, 105, 110, 115, 120, 125]
Het volgende voorbeeld laat zien hoe u een array maakt in Python:
Voorbeeld
Array = [80, 85, 90, 95, 100, 105, 110, 115, 120, 125]
print(Array)
In Data Science is het gebruikelijk om met zeer grote datasets te werken.
In deze tutorial zullen we proberen het zo gemakkelijk mogelijk te maken om de concepten van Data Science te begrijpen. We zullen daarom werken met een kleine dataset die gemakkelijk te interpreteren is.