Gegevenswetenschap - Percentielen voor statistieken


25%, 50% en 75% - Percentielen

Percentielen worden in statistieken gebruikt om u een getal te geven dat de waarde beschrijft die een bepaald percentage van de waarden lager is dan.

percentielen

Laten we proberen het uit te leggen aan de hand van enkele voorbeelden, met behulp van Average_Pulse.

  • Het 25% percentiel van Average_Pulse betekent dat 25% van alle trainingssessies een gemiddelde hartslag heeft van 100 slagen per minuut of lager. Als we de stelling omdraaien, betekent dit dat 75% van alle trainingssessies een gemiddelde hartslag hebben van 100 slagen per minuut of hoger
  • Het 75% percentiel van Average_Pulse betekent dat 75% van alle trainingssessies een gemiddelde hartslag van 111 of lager heeft. Als we de stelling omdraaien, betekent dit dat 25% van alle trainingssessies een gemiddelde hartslag heeft van 111 slagen per minuut of hoger

Taak: Zoek het 10%-percentiel voor Max_Pulse

Het volgende voorbeeld laat zien hoe u dit in Python doet:

Voorbeeld

import numpy as np

Max_Pulse= full_health_data["Max_Pulse"]
percentile10 = np.percentile(Max_Pulse, 10)
print(percentile10)
  • Max_Pulse = full_health_data["Max_Pulse"] - Isoleer de variabele Max_Pulse van de volledige set gezondheidsgegevens.
  • np.percentile() wordt gebruikt om te definiëren dat we het 10% percentiel van Max_Pulse willen.

Het 10% percentiel van Max_Pulse is 120. Dit betekent dat 10% van alle trainingen een Max_Pulse van 120 of lager heeft.