Willekeurige gegevensdistributie
Wat is gegevensdistributie?
Gegevensdistributie is een lijst met alle mogelijke waarden en hoe vaak elke waarde voorkomt.
Dergelijke lijsten zijn belangrijk bij het werken met statistiek en data science.
De willekeurige module biedt methoden die willekeurig gegenereerde gegevensdistributies retourneren.
Willekeurige verdeling
Een willekeurige verdeling is een verzameling willekeurige getallen die een bepaalde kansdichtheidsfunctie volgen .
Kansdichtheidsfunctie: Een functie die een continue kans beschrijft. dwz waarschijnlijkheid van alle waarden in een array.
We kunnen willekeurige getallen genereren op basis van gedefinieerde kansen met behulp van de
choice()
methode van de
random
module.
De choice()
methode stelt ons in staat om de waarschijnlijkheid voor elke waarde te specificeren.
De kans wordt bepaald door een getal tussen 0 en 1, waarbij 0 betekent dat de waarde nooit zal voorkomen en 1 betekent dat de waarde altijd zal voorkomen.
Voorbeeld
Genereer een 1-D-array met 100 waarden, waarbij elke waarde 3, 5, 7 of 9 moet zijn.
De kans dat de waarde 3 is, is ingesteld op 0,1
De kans dat de waarde 5 is, is ingesteld op 0,3
De kans dat de waarde 7 is, is ingesteld op 0,6
De kans dat de waarde 9 is, is ingesteld op 0
from numpy import random
x = random.choice([3, 5, 7, 9], p=[0.1, 0.3,
0.6, 0.0], size=(100))
print(x)
De som van alle kansgetallen moet 1 zijn.
Zelfs als u het bovenstaande voorbeeld 100 keer uitvoert, zal de waarde 9 nooit voorkomen.
U kunt arrays van elke vorm en grootte retourneren door de vorm in de
size
parameter op te geven.
Voorbeeld
Hetzelfde voorbeeld als hierboven, maar retourneert een 2D-array met 3 rijen, die elk 5 waarden bevatten.
from numpy import random
x = random.choice([3, 5, 7, 9], p=[0.1, 0.3,
0.6, 0.0], size=(3, 5))
print(x)