Machine Learning - Gemiddelde mediane modus
Gemiddelde, mediaan en modus
Wat kunnen we leren door naar een groep getallen te kijken?
In Machine Learning (en in wiskunde) zijn er vaak drie waarden die ons interesseren:
- Gemiddelde - De gemiddelde waarde
- Mediaan - De middelpuntwaarde
- Modus - De meest voorkomende waarde
Voorbeeld: We hebben de snelheid van 13 auto's geregistreerd:
speed = [99,86,87,88,111,86,103,87,94,78,77,85,86]
Wat is de gemiddelde, middelste of meest voorkomende snelheidswaarde?
Gemeen
De gemiddelde waarde is de gemiddelde waarde.
Om het gemiddelde te berekenen, zoekt u de som van alle waarden en deelt u de som door het aantal waarden:
(99+86+87+88+111+86+103+87+94+78+77+85+86) / 13 =
89.77
De NumPy module heeft hier een methode voor. Lees meer over de NumPy-module in onze NumPy-zelfstudie .
Voorbeeld
Gebruik de NumPy- mean()
methode om de gemiddelde snelheid te vinden:
import numpy
speed = [99,86,87,88,111,86,103,87,94,78,77,85,86]
x = numpy.mean(speed)
print(x)
Mediaan
De mediaanwaarde is de waarde in het midden, nadat je alle waarden hebt gesorteerd:
77, 78, 85, 86, 86, 86,
87
, 87, 88, 94, 99, 103, 111
Het is belangrijk dat de getallen gesorteerd zijn voordat u de mediaan kunt vinden.
De NumPy module heeft hier een methode voor:
Voorbeeld
Gebruik de NumPy- median()
methode om de middelste waarde te vinden:
import numpy
speed = [99,86,87,88,111,86,103,87,94,78,77,85,86]
x = numpy.median(speed)
print(x)
Als er twee getallen in het midden zijn, deel je de som van die getallen door twee.
77, 78, 85, 86, 86,
86, 87
,
87, 94, 98, 99, 103
(86 + 87) / 2 = 86.5
Voorbeeld
De NumPy-module gebruiken:
import numpy
speed = [99,86,87,88,86,103,87,94,78,77,85,86]
x = numpy.median(speed)
print(x)
Modus
De Mode-waarde is de waarde die het vaakst voorkomt:
99,
86
, 87, 88, 111,
86
, 103, 87, 94, 78, 77, 85,
86
= 86
De SciPy-module heeft hier een methode voor. Lees meer over de SciPy-module in onze SciPy-zelfstudie .
Voorbeeld
Gebruik de SciPy- mode()
methode om het nummer te vinden dat het meest voorkomt:
from scipy import stats
speed =
[99,86,87,88,111,86,103,87,94,78,77,85,86]
x = stats.mode(speed)
print(x)
Hoofdstuk samenvatting
Het gemiddelde, de mediaan en de modus zijn technieken die vaak worden gebruikt bij machine learning, dus het is belangrijk om het concept erachter te begrijpen.