نقشه کشی
Pandas از این plot()
روش برای ایجاد نمودار استفاده می کند.
ما می توانیم از Pyplot ، یک زیرمجموعه از کتابخانه Matplotlib برای تجسم نمودار روی صفحه استفاده کنیم.
در مورد Matplotlib در آموزش Matplotlib ما بیشتر بخوانید .
مثال
pyplot را از Matplotlib وارد کنید و DataFrame ما را تجسم کنید:
import pandas as pd import matplotlib.pyplot as plt df = pd.read_csv('data.csv') df.plot() plt.show()
نمونه های موجود در این صفحه از یک فایل CSV به نام: ‘data.csv’ استفاده می کند.
data.csv را بارگیری کنید یا data.csv را باز کنید
طرح پراکنده
مشخص کنید که می خواهید یک طرح پراکندگی با kind
آرگومان داشته باشید:
kind = 'scatter'
نمودار پراکندگی به محور x و y نیاز دارد.
در مثال زیر از “مدت” برای محور x و “کالری” برای محور y استفاده خواهیم کرد.
آرگومان های x و y را مانند این شامل کنید:
x = 'Duration', y = 'Calories'
مثال
import pandas as pd import matplotlib.pyplot as plt df = pd.read_csv('data.csv') df.plot(kind = 'scatter', x = 'Duration', y = 'Calories') plt.show()
نتیجه
به یاد داشته باشید: در مثال قبلی ، ما متوجه شدیم که همبستگی بین “مدت” و “کالری” وجود دارد 0.922721
، و ما با این واقعیت کنار می آییم که مدت زمان بیشتر به معنای کالری بیشتر سوزانده شده است.
با مشاهده پراکندگی ، موافقم.
بیایید پراکندگی دیگری ایجاد کنیم ، جایی که بین ستون ها رابطه بدی وجود دارد ، مانند “مدت” و “Maxpulse” ، با همبستگی 0.009403
:
مثال
پراکندگی که هیچ ارتباطی بین ستون ها وجود ندارد:
import pandas as pd import matplotlib.pyplot as plt df = pd.read_csv('data.csv') df.plot(kind = 'scatter', x = 'Duration', y = 'Maxpulse') plt.show()
نتیجه
هیستوگرام
از kind
آرگومان برای تعیین اینکه می خواهید هیستوگرام داشته باشید استفاده کنید:
kind = 'hist'
هیستوگرام فقط به یک ستون نیاز دارد.
هیستوگرام فرکانس هر فاصله را به ما نشان می دهد ، به عنوان مثال چند تمرین بین 50 تا 60 دقیقه طول کشید؟
در مثال زیر از ستون “مدت” برای ایجاد هیستوگرام استفاده می کنیم:
مثال
df["Duration"].plot(kind = 'hist')
نتیجه
توجه: هیستوگرام به ما می گوید که بیش از 100 تمرین بین 50 تا 60 دقیقه انجام شده است.