پراکندگی Zipf برای نمونه برداری از داده ها بر اساس قانون zipf استفاده می شود.
قانون زیپ: در یک مجموعه ، نهمین اصطلاح مشترک 1/n برابر رایج ترین اصطلاح است. به عنوان مثال ، پنجمین کلمه رایج در انگلیسی تقریباً 1/5 بار از کلمه پرکاربردتر دیده می شود.
دارای دو پارامتر است:
a
– پارامتر توزیع
size
– شکل آرایه بازگشتی.
مثال
یک نمونه برای توزیع zipf با پارامتر توزیع 2 با اندازه 2×3 تهیه کنید:
from numpy import random x = random.zipf(a=2, size=(2, 3)) print(x)
تجسم توزیع Zipf
نمونه 1000 را امتحان کنید اما فقط نمرات با ارزش <10 را برای نمودار معنی دار ترسیم کنید.
مثال
from numpy import random import matplotlib.pyplot as plt import seaborn as sns x = random.zipf(a=2, size=1000) sns.distplot(x[x<10], kde=False) plt.show()