Gegevenswetenschap - Regressietabel
Regressietabel
De output van lineaire regressie kan worden samengevat in een regressietabel.
De inhoud van de tabel omvat:
- Informatie over het model
- Coëfficiënten van de lineaire regressiefunctie
- Regressiestatistieken
- Statistieken van de coëfficiënten van de lineaire regressiefunctie
- Overige informatie die we in deze module niet behandelen
Regressietabel met Average_Pulse als verklarende variabele
U kunt nu beginnen met het analyseren van geavanceerde output!
Maak een lineaire regressietabel in Python
Hier leest u hoe u een lineaire regressietabel in Python maakt:
Voorbeeld
import pandas as pd
import statsmodels.formula.api as smf
full_health_data = pd.read_csv("data.csv", header=0, sep=",")
model = smf.ols('Calorie_Burnage ~ Average_Pulse', data =
full_health_data)
results = model.fit()
print(results.summary())
Voorbeeld uitgelegd:
- Importeer de bibliotheek statsmodels.formula.api als smf. Statsmodels is een statistische bibliotheek in Python.
- Gebruik de set full_health_data.
- Maak een model op basis van gewone kleinste kwadraten met smf.ols(). Merk op dat de verklarende variabele als eerste tussen haakjes moet worden geschreven. Gebruik de dataset full_health_data.
- Door .fit() aan te roepen, verkrijgt u de variabele resultaten. Dit bevat veel informatie over het regressiemodel.
- Roep samenvatting() aan om de tabel met de resultaten van lineaire regressie te krijgen.