Willekeurige gegevensdistributie


Wat is gegevensdistributie?

Gegevensdistributie is een lijst met alle mogelijke waarden en hoe vaak elke waarde voorkomt.

Dergelijke lijsten zijn belangrijk bij het werken met statistiek en data science.

De willekeurige module biedt methoden die willekeurig gegenereerde gegevensdistributies retourneren.


Willekeurige verdeling

Een willekeurige verdeling is een verzameling willekeurige getallen die een bepaalde kansdichtheidsfunctie volgen .

Kansdichtheidsfunctie: Een functie die een continue kans beschrijft. dwz waarschijnlijkheid van alle waarden in een array.

We kunnen willekeurige getallen genereren op basis van gedefinieerde kansen met behulp van de choice()methode van de randommodule.

De choice()methode stelt ons in staat om de waarschijnlijkheid voor elke waarde te specificeren.

De kans wordt bepaald door een getal tussen 0 en 1, waarbij 0 betekent dat de waarde nooit zal voorkomen en 1 betekent dat de waarde altijd zal voorkomen.

Voorbeeld

Genereer een 1-D-array met 100 waarden, waarbij elke waarde 3, 5, 7 of 9 moet zijn.

De kans dat de waarde 3 is, is ingesteld op 0,1

De kans dat de waarde 5 is, is ingesteld op 0,3

De kans dat de waarde 7 is, is ingesteld op 0,6

De kans dat de waarde 9 is, is ingesteld op 0

from numpy import random

x = random.choice([3, 5, 7, 9], p=[0.1, 0.3, 0.6, 0.0], size=(100))

print(x)

De som van alle kansgetallen moet 1 zijn.

Zelfs als u het bovenstaande voorbeeld 100 keer uitvoert, zal de waarde 9 nooit voorkomen.

U kunt arrays van elke vorm en grootte retourneren door de vorm in de sizeparameter op te geven.

Voorbeeld

Hetzelfde voorbeeld als hierboven, maar retourneert een 2D-array met 3 rijen, die elk 5 waarden bevatten.

from numpy import random

x = random.choice([3, 5, 7, 9], p=[0.1, 0.3, 0.6, 0.0], size=(3, 5))

print(x)