Zipf-distributie
Zipf-verdelingen worden gebruikt om gegevens te samplen op basis van de wet van zipf.
De wet van Zipf: In een verzameling is de n-de algemene term 1/n keer de meest voorkomende term. Het 5e veelgebruikte woord in het Engels komt bijvoorbeeld bijna 1/5 keer voor als het meest gebruikte woord.
Het heeft twee parameters:
a
- distributieparameter.
size
- De vorm van de geretourneerde array.
Voorbeeld
Teken een voorbeeld voor zipf-distributie met distributieparameter 2 met maat 2x3:
from numpy import random
x = random.zipf(a=2, size=(2, 3))
print(x)
Visualisatie van Zipf-distributie
Sample 1000 punten, maar plot alleen die met een waarde < 10 voor een meer betekenisvolle grafiek.
Voorbeeld
from numpy import random
import matplotlib.pyplot as plt
import seaborn as sns
x = random.zipf(a=2, size=1000)
sns.distplot(x[x<10], kde=False)
plt.show()