Gegevenswetenschap - Lineaire functies plotten
De sporthorloge-gegevensset
Bekijk onze gezondheidsdataset:
Looptijd | Gemiddelde_Puls | Max_Pulse | Calorie_Burnage | Uren_Werk | Uren_Slaap |
---|---|---|---|---|---|
30 | 80 | 120 | 240 | 10 | 7 |
30 | 85 | 120 | 250 | 10 | 7 |
45 | 90 | 130 | 260 | 8 | 7 |
45 | 95 | 130 | 270 | 8 | 7 |
45 | 100 | 140 | 280 | 0 | 7 |
60 | 105 | 140 | 290 | 7 | 8 |
60 | 110 | 145 | 300 | 7 | 8 |
60 | 115 | 145 | 310 | 8 | 8 |
75 | 120 | 150 | 320 | 0 | 8 |
75 | 125 | 150 | 330 | 8 | 8 |
Plot de bestaande gegevens in Python
Nu kunnen we eerst de waarden van Average_Pulse uitzetten tegen Calorie_Burnage met behulp van de matplotlib-bibliotheek.
De plot()
functie wordt gebruikt om een 2D hexagonale binningplot te maken van de punten x,y:
Voorbeeld
import matplotlib.pyplot as plt
health_data.plot(x ='Average_Pulse',
y='Calorie_Burnage', kind='line'),
plt.ylim(ymin=0)
plt.xlim(xmin=0)
plt.show()
Voorbeeld uitgelegd
- Importeer de pyplot-module van de matplotlib-bibliotheek
- Zet de gegevens van Average_Pulse tegen Calorie_Burnage
kind='line'
vertelt ons welk type perceel we willen. Hier willen we een rechte lijn hebben- plt.ylim() en plt.xlim() vertellen ons op welke waarde we willen dat de as begint. Hier willen we dat de as vanaf nul begint
- plt.show() toont ons de uitvoer
De bovenstaande code geeft het volgende resultaat:
De grafiekuitvoer
Zoals we kunnen zien, is er een verband tussen Average_Pulse en Calorie_Burnage. Calorie_Burnage neemt evenredig toe met Average_Pulse. Het betekent dat we Average_Pulse kunnen gebruiken om Calorie_Burnage te voorspellen.
Waarom is de lijn niet volledig naar de y-as getrokken?
De reden is dat we geen waarnemingen hebben waarbij Average_Pulse of Calorie_Burnage gelijk is aan nul. 80 is de eerste waarneming van Average_Pulse en 240 is de eerste waarneming van Calorie_Burnage.
Kijk naar de lijn. Wat gebeurt er met de calorieverbranding als de gemiddelde hartslag stijgt van 80 naar 90?
We kunnen de diagonale lijn gebruiken om de wiskundige functie te vinden om het calorieverbruik te voorspellen.
Zoals het blijkt:
- Als de gemiddelde hartslag 80 is, is de calorieverbranding 240
- Als de gemiddelde puls 90 is, is de calorieverbranding 260
- Als de gemiddelde hartslag 100 is, is de calorieverbranding 280
Er is een patroon. Als de gemiddelde hartslag met 10 toeneemt, neemt de calorieverbranding met 20 toe.