Data Science -functies


Dit hoofdstuk toont drie veelgebruikte functies bij het werken met Data Science: max(), min() en mean().


De sporthorloge-gegevensset

Looptijd Gemiddelde_Puls Max_Pulse Calorie_Burnage Uren_Werk Uren_Slaap
30 80 120 240 10 7
30 85 120 250 10 7
45 90 130 260 8 7
45 95 130 270 8 7
45 100 140 280 0 7
60 105 140 290 7 8
60 110 145 300 7 8
60 115 145 310 8 8
75 120 150 320 0 8
75 125 150 330 8 8

Bovenstaande dataset bestaat uit 6 variabelen met elk 10 waarnemingen:

  • Duur - Hoe lang duurde de trainingssessie in minuten?
  • Average_Pulse - Wat was de gemiddelde hartslag van de trainingssessie? Dit wordt gemeten in slagen per minuut
  • Max_Pulse - Wat was de maximale hartslag van de trainingssessie?
  • Calorie_Burnage - Hoeveel calorieën zijn er tijdens de trainingssessie verbrand?
  • Hours_Work - Hoeveel uur hebben we op ons werk gewerkt vóór de trainingssessie?
  • Hours_Sleep - Hoeveel hebben we de nacht voor de trainingssessie geslapen?

We gebruiken onderstrepingsteken (_) om tekenreeksen te scheiden, omdat Python geen spatie als scheidingsteken kan lezen.



De max() functie

De Python max()-functie wordt gebruikt om de hoogste waarde in een array te vinden.

Voorbeeld

Average_pulse_max = max(80, 85, 90, 95, 100, 105, 110, 115, 120, 125)

print (Average_pulse_max)

De min() functie

De Python min()-functie wordt gebruikt om de laagste waarde in een array te vinden.

Voorbeeld

Average_pulse_min = min(80, 85, 90, 95, 100, 105, 110, 115, 120, 125)

print (Average_pulse_min)

De gemiddelde() functie

De NumPy- mean()functie wordt gebruikt om de gemiddelde waarde van een array te vinden.

Voorbeeld

import numpy as np

Calorie_burnage = [240, 250, 260, 270, 280, 290, 300, 310, 320, 330]

Average_calorie_burnage = np.mean(Calorie_burnage)

print(Average_calorie_burnage)

We schrijven nl. voor mean om Python te laten weten dat we de functie mean uit de Numpy- bibliotheek willen activeren .