Statistieken

Statistiek gaat over het verzamelen, analyseren, interpreteren en presenteren van gegevens:

  • Wat is de meest voorkomende?
  • Wat wordt het meest verwacht?
  • Wat is het meest normaal?

Inferentiële statistieken

Inferentiële statistiek zijn methoden voor het kwantificeren van eigenschappen van een populatie uit een kleine steekproef :

Je haalt data uit een steekproef en doet een voorspelling over de hele populatie.

Je kunt bijvoorbeeld in een winkel gaan staan ​​en een staal van 100 mensen vragen of ze van chocolade houden.

Op basis van je onderzoek, met behulp van inferentiële statistieken, zou je kunnen voorspellen dat 91% van alle shoppers van chocolade houdt.


Ongelooflijke chocoladefeiten

Negen op de tien mensen houden van chocolade.

50% van de Amerikaanse bevolking kan niet elke dag zonder chocolade leven.


Beschrijvende statistieken

Beschrijvende statistiek zijn methoden om waarnemingen samen te vatten in informatie die we kunnen begrijpen.

Omdat we elke pasgeboren baby registreren, kunnen we zien dat 51 van de 100 jongens zijn.

Uit de cijfers die we hebben verzameld, kunnen we een kans van 51% voorspellen dat een nieuwe baby een jongen zal zijn.

Het is een mysterie dat de verhouding niet 50% is, zoals de basisbiologie zou voorspellen. We kunnen alleen maar zeggen dat we deze gekantelde geslachtsverhouding in ieder geval sinds de 17e eeuw hebben gehad.


Gemiddelde waarden

De gemiddelde waarde is het gemiddelde van alle waarden.

Deze tabel bevat huizenprijzen versus grootte:

Prijs7889991011141415
Maat5060708090100 110120130140150

De gemiddelde prijs is (7+8+8+9+9+9+10+11+14+14+15)/11 = 10.363636.

Procedure : Alle getallen optellen en vervolgens delen door het aantal getallen.

Het gemiddelde is de som gedeeld door de graaf .

De gemiddelde waarde (in JavaScript):

var mean = (7+8+8+9+9+9+10+11+14+14+15)/11;

Of als u een wiskundebibliotheek zoals math.js gebruikt :

var mean = math.mean([7,8,8,9,9,9,10,11,14,14,15]);


de variantie

In statistieken is de variantie het gemiddelde van de gekwadrateerde verschillen van de gemiddelde waarde.

Met andere woorden, het beschrijft hoe ver een reeks getallen is uitgespreid van hun gemiddelde waarde.

De variantie (in JavaScript):

// Calculate the Mean (m)
var m = (7+8+8+9+9+9+10+11+14+14+15)/11;

// Calculate the Sum of Squares (ss)
var ss = (7-m)**2 + (8-m)**2 + (8-m)**2 + (9-m)**2 + (9-m)**2 + (9-m)**2 + (9-m)**2 + (10-m)**2 + (11-m)**2 + (14-m)**2 + (15-m)**2;

// Calculate the Variance
var variance = ss / 11;

Of als u een wiskundebibliotheek zoals math.js gebruikt :

var variance = math.variance([7,8,8,9,9,9,10,11,14,14,15],"uncorrected");


Standaardafwijking

Standaarddeviatie is een maat voor hoe uitgespreide getallen zijn.

Het symbool is σ (Griekse letter sigma).

De formule is de variantie (de vierkantswortel van de variantie).

De standaarddeviatie is (in JavaScript):

// Calculate the Mean (m)
var m = (7+8+8+9+9+9+10+11+14+15)/11;

// Calculate the Sum of Squares (ss)
var ss = (7-m)**2 + (8-m)**2 + (8-m)**2 + (9-m)**2 + (9-m)**2 + (9-m)**2 + (9-m)**2 + (10-m)**2 + (11-m)**2 + (14-m)**2 + (15-m)**2;

// Calculate the Variance
var variance = ss / 11;

// Calculate the Standard Deviation
var std = Math.sqrt(variance);

Of als u een wiskundebibliotheek zoals math.js gebruikt :

var std = math.std([7,8,8,9,9,9,9,10,11,14,15],"uncorrected");


Normale verdeling

De normale verdelingscurve is een klokvormige curve.

Elke band van de curve heeft een breedte van 1 standaarddeviatie :

Standaard normale verdeling