Zipf-distributie


Zipf-verdelingen worden gebruikt om gegevens te samplen op basis van de wet van zipf.

De wet van Zipf: In een verzameling is de n-de algemene term 1/n keer de meest voorkomende term. Het 5e veelgebruikte woord in het Engels komt bijvoorbeeld bijna 1/5 keer voor als het meest gebruikte woord.

Het heeft twee parameters:

a - distributieparameter.

size - De vorm van de geretourneerde array.

Voorbeeld

Teken een voorbeeld voor zipf-distributie met distributieparameter 2 met maat 2x3:

from numpy import random

x = random.zipf(a=2, size=(2, 3))

print(x)

Visualisatie van Zipf-distributie

Sample 1000 punten, maar plot alleen die met een waarde < 10 voor een meer betekenisvolle grafiek.

Voorbeeld

from numpy import random
import matplotlib.pyplot as plt
import seaborn as sns

x = random.zipf(a=2, size=1000)
sns.distplot(x[x<10], kde=False)

plt.show()

Resultaat