Gegevenswetenschap - Databasetabel
Databasetabel
Een databasetabel is een tabel met gestructureerde gegevens.
De volgende tabel toont een databasetabel met gezondheidsgegevens die zijn geëxtraheerd uit een sporthorloge:
Looptijd | Gemiddelde_Puls | Max_Pulse | Calorie_Burnage | Uren_Werk | Uren_Slaap |
---|---|---|---|---|---|
30 | 80 | 120 | 240 | 10 | 7 |
30 | 85 | 120 | 250 | 10 | 7 |
45 | 90 | 130 | 260 | 8 | 7 |
45 | 95 | 130 | 270 | 8 | 7 |
45 | 100 | 140 | 280 | 0 | 7 |
60 | 105 | 140 | 290 | 7 | 8 |
60 | 110 | 145 | 300 | 7 | 8 |
60 | 115 | 145 | 310 | 8 | 8 |
75 | 120 | 150 | 320 | 0 | 8 |
75 | 125 | 150 | 330 | 8 | 8 |
Deze dataset bevat informatie van een typische trainingssessie zoals duur, gemiddelde hartslag, calorieverbruik etc.
Databasetabelstructuur
Een databasetabel bestaat uit kolom(men) en rij(en):
Kolom 1 | Kolom 2 | Kolom 3 | Kolom 4 | Kolom 5 | Kolom 6 | |
Looptijd | Gemiddelde_Puls | Max_Pulse | Calorie_Burnage | Uren_Werk | Uren_Slaap | |
---|---|---|---|---|---|---|
Rij 1 | 30 | 80 | 120 | 240 | 10 | 7 |
Rij 2 | 30 | 85 | 120 | 250 | 10 | 7 |
Rij 3 | 45 | 90 | 130 | 260 | 8 | 7 |
Rij 4 | 45 | 95 | 130 | 270 | 8 | 7 |
Rij 5 | 45 | 100 | 140 | 280 | 0 | 7 |
Rij 6 | 60 | 105 | 140 | 290 | 7 | 8 |
Rij 7 | 60 | 110 | 145 | 300 | 7 | 8 |
Rij 8 | 60 | 115 | 145 | 310 | 8 | 8 |
Rij 9 | 75 | 120 | 150 | 320 | 0 | 8 |
Rij 10 | 75 | 125 | 150 | 330 | 8 | 8 |
Een rij is een horizontale weergave van gegevens.
Een kolom is een verticale weergave van gegevens.
Variabelen
Een variabele wordt gedefinieerd als iets dat kan worden gemeten of geteld.
Voorbeelden kunnen karakters, cijfers of tijd zijn.
In het onderstaande voorbeeld kunnen we zien dat elke kolom een variabele vertegenwoordigt.
Looptijd | Gemiddelde_Puls | Max_Pulse | Calorie_Burnage | Uren_Werk | Uren_Slaap |
---|---|---|---|---|---|
30 | 80 | 120 | 240 | 10 | 7 |
30 | 85 | 120 | 250 | 10 | 7 |
45 | 90 | 130 | 260 | 8 | 7 |
45 | 95 | 130 | 270 | 8 | 7 |
45 | 100 | 140 | 280 | 0 | 7 |
60 | 105 | 140 | 290 | 7 | 8 |
60 | 110 | 145 | 300 | 7 | 8 |
60 | 115 | 145 | 310 | 8 | 8 |
75 | 120 | 150 | 320 | 0 | 8 |
75 | 125 | 150 | 330 | 8 | 8 |
Er zijn 6 kolommen, wat betekent dat er 6 variabelen zijn (Duur, Gemiddelde_Pulse, Max_Pulse, Calorie_Burnage, Hours_Work, Hours_Sleep).
Er zijn 11 rijen, wat betekent dat elke variabele 10 waarnemingen heeft.
Maar als er 11 rijen zijn, hoe komt het dan dat er maar 10 waarnemingen zijn?
Het is omdat de eerste rij het label is, wat betekent dat het de naam van de variabele is.