正在加载图片...
再看看数据: In [10]:dt.head(3) 0ut[101: Cause CauseCN Code-ICD-10-113 Age Gender Year Deaths Population Crude Rate 0 Salmonella infections沙r门氏菌染Gn113-001 2005 1956682 Unreliable 1 GA113-001 0 2010 1 1829677 Unreliable 2 Salmonella infections沙门氏感染G113-001 /0 20153 1942904 Urreliable 2005,2010,2015死亡人数分别为多少? 我们先按照年份远行分组,然后对死亡数列求和,就可以得到每年的死亡敌 In [11]:by_year df.groupby('Year").Deaths.sum() by year 0u[111:05 2143662 2010 7107234 2015 2294942 Name:Deaths,dtype:int64 然后,我们可以把它们绘制成直方图,绘图的时候是在数据集上直接调用plot 的方法,kind表示绘制的图形的样子,bar就表示是直方图。 In [12]:by year.plot(kind -"bar') Out[12]:<matplotlib.axes.subplots.Axessubplot at 0x111f915c0> 下面对比男性和女性的死亡率,我们把2015年的数据提取出来,按照性别 进行分组,然后分别统计死亡人数。我们可以看到这是统计的结果,同样我们可 以把统计的结果绘制成直方图。 在2015年,哪个性别死亡率更高? In [14]:df2015 df[df.Year =2015] df2015\ ,groupby《"Gender")\ .Deaths\ .n(】 out[14]:Gender 1103789 5 Name:Deaths. dtype:int64然后,我们可以把它们绘制成直方图,绘图的时候是在数据集上直接调用瀃濿瀂t 的方法,濾i瀁d 表示绘制的图形的样子,bar 就表示是直方图。 下面对比男性和女性的死亡率,我们把 2015 年的数据提取出来,按照性别 进行分组,然后分别统计死亡人数。我们可以看到这是统计的结果,同样我们可 以把统计的结果绘制成直方图
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有