Datawetenschap - Wat is data?


Wat is gegevens?

Data is een verzameling informatie.

Een doel van Data Science is om gegevens te structureren, zodat ze interpreteerbaar zijn en gemakkelijk om mee te werken.

Gegevens kunnen worden onderverdeeld in twee groepen:

  • Gestructureerde gegevens
  • ongestructureerde gegevens

Ongestructureerde gegevens

Ongestructureerde gegevens zijn niet georganiseerd. We moeten de gegevens ordenen voor analysedoeleinden.

Ongestructureerde gegevens

Ongestructureerde gegevens


Gestructureerde gegevens

Gestructureerde gegevens zijn georganiseerd en gemakkelijker om mee te werken.

Gestructureerde gegevens


Hoe gegevens te structureren?

We kunnen een array of een databasetabel gebruiken om gegevens te structureren of te presenteren.

Voorbeeld van een array:

[80, 85, 90, 95, 100, 105, 110, 115, 120, 125]

Het volgende voorbeeld laat zien hoe u een array maakt in Python:

Voorbeeld

Array = [80, 85, 90, 95, 100, 105, 110, 115, 120, 125]
print(Array)

In Data Science is het gebruikelijk om met zeer grote datasets te werken.

In deze tutorial zullen we proberen het zo gemakkelijk mogelijk te maken om de concepten van Data Science te begrijpen. We zullen daarom werken met een kleine dataset die gemakkelijk te interpreteren is.