Gegevenswetenschap - Regressietabel


Regressietabel

De output van lineaire regressie kan worden samengevat in een regressietabel.

De inhoud van de tabel omvat:

  • Informatie over het model
  • Coëfficiënten van de lineaire regressiefunctie
  • Regressiestatistieken
  • Statistieken van de coëfficiënten van de lineaire regressiefunctie
  • Overige informatie die we in deze module niet behandelen

Regressietabel met Average_Pulse als verklarende variabele

Lineaire regressietabel

U kunt nu beginnen met het analyseren van geavanceerde output!


Maak een lineaire regressietabel in Python

Hier leest u hoe u een lineaire regressietabel in Python maakt:

Voorbeeld

import pandas as pd
import statsmodels.formula.api as smf

full_health_data = pd.read_csv("data.csv", header=0, sep=",")

model = smf.ols('Calorie_Burnage ~ Average_Pulse', data = full_health_data)
results = model.fit()
print(results.summary())

Voorbeeld uitgelegd:

  • Importeer de bibliotheek statsmodels.formula.api als smf. Statsmodels is een statistische bibliotheek in Python.
  • Gebruik de set full_health_data.
  • Maak een model op basis van gewone kleinste kwadraten met smf.ols(). Merk op dat de verklarende variabele als eerste tussen haakjes moet worden geschreven. Gebruik de dataset full_health_data.
  • Door .fit() aan te roepen, verkrijgt u de variabele resultaten. Dit bevat veel informatie over het regressiemodel.
  • Roep samenvatting() aan om de tabel met de resultaten van lineaire regressie te krijgen.