Statistieken
Statistiek gaat over het verzamelen, analyseren, interpreteren en presenteren van gegevens:
- Wat is de meest voorkomende?
- Wat wordt het meest verwacht?
- Wat is het meest normaal?
Inferentiële statistieken
Inferentiële statistiek zijn methoden voor het kwantificeren van eigenschappen van een populatie uit een kleine steekproef :
Je haalt data uit een steekproef en doet een voorspelling over de hele populatie.
Je kunt bijvoorbeeld in een winkel gaan staan en een staal van 100 mensen vragen of ze van chocolade houden.
Op basis van je onderzoek, met behulp van inferentiële statistieken, zou je kunnen voorspellen dat 91% van alle shoppers van chocolade houdt.
Ongelooflijke chocoladefeiten
Negen op de tien mensen houden van chocolade.
50% van de Amerikaanse bevolking kan niet elke dag zonder chocolade leven.
Beschrijvende statistieken
Beschrijvende statistiek zijn methoden om waarnemingen samen te vatten in informatie die we kunnen begrijpen.
Omdat we elke pasgeboren baby registreren, kunnen we zien dat 51 van de 100 jongens zijn.
Uit de cijfers die we hebben verzameld, kunnen we een kans van 51% voorspellen dat een nieuwe baby een jongen zal zijn.
Het is een mysterie dat de verhouding niet 50% is, zoals de basisbiologie zou voorspellen. We kunnen alleen maar zeggen dat we deze gekantelde geslachtsverhouding in ieder geval sinds de 17e eeuw hebben gehad.
Gemiddelde waarden
De gemiddelde waarde is het gemiddelde van alle waarden.
Deze tabel bevat huizenprijzen versus grootte:
Prijs | 7 | 8 | 8 | 9 | 9 | 9 | 10 | 11 | 14 | 14 | 15 |
Maat | 50 | 60 | 70 | 80 | 90 | 100 | 110 | 120 | 130 | 140 | 150 |
De gemiddelde prijs is (7+8+8+9+9+9+10+11+14+14+15)/11 = 10.363636.
Procedure : Alle getallen optellen en vervolgens delen door het aantal getallen.
Het gemiddelde is de som gedeeld door de graaf .
De gemiddelde waarde (in JavaScript):
var mean = (7+8+8+9+9+9+10+11+14+14+15)/11;
Of als u een wiskundebibliotheek zoals math.js gebruikt :
var mean = math.mean([7,8,8,9,9,9,10,11,14,14,15]);
de variantie
In statistieken is de variantie het gemiddelde van de gekwadrateerde verschillen van de gemiddelde waarde.
Met andere woorden, het beschrijft hoe ver een reeks getallen is uitgespreid van hun gemiddelde waarde.
De variantie (in JavaScript):
// Calculate the Mean (m)
var m = (7+8+8+9+9+9+10+11+14+14+15)/11;
// Calculate the Sum of Squares (ss)
var ss = (7-m)**2 + (8-m)**2 + (8-m)**2 + (9-m)**2 + (9-m)**2 + (9-m)**2 + (9-m)**2 + (10-m)**2 + (11-m)**2 + (14-m)**2 + (15-m)**2;
// Calculate the Variance
var variance = ss / 11;
Of als u een wiskundebibliotheek zoals math.js gebruikt :
var variance = math.variance([7,8,8,9,9,9,10,11,14,14,15],"uncorrected");
Standaardafwijking
Standaarddeviatie is een maat voor hoe uitgespreide getallen zijn.
Het symbool is σ (Griekse letter sigma).
De formule is de √ variantie (de vierkantswortel van de variantie).
De standaarddeviatie is (in JavaScript):
// Calculate the Mean (m)
var m = (7+8+8+9+9+9+10+11+14+15)/11;
// Calculate the Sum of Squares (ss)
var ss = (7-m)**2 + (8-m)**2 + (8-m)**2 + (9-m)**2 + (9-m)**2 + (9-m)**2 + (9-m)**2 + (10-m)**2 + (11-m)**2 + (14-m)**2 + (15-m)**2;
// Calculate the Variance
var variance = ss / 11;
// Calculate the Standard Deviation
var std = Math.sqrt(variance);
Of als u een wiskundebibliotheek zoals math.js gebruikt :
var std = math.std([7,8,8,9,9,9,9,10,11,14,15],"uncorrected");
Normale verdeling
De normale verdelingscurve is een klokvormige curve.
Elke band van de curve heeft een breedte van 1 standaarddeviatie :