正在加载图片...
载入matplotlib库 1n【11: fenable grapha to be diaplayed in notebooks smatplotlib inline reload(sys) python2 sys.setdofaultencoding('GBK')varning may display but 1e OK out[1]:<module 'sys'(built-in)> 获得数据 从下面的链接中下载deaths.cy In ]#inux fwget --output-document /resources/data/deatha.csv https://ibm.box.com/shared/static/10iexjaa280qzdxcdtu98xlv51h 读取deaths.csw文件内容: ng-'GaK' 很好现在数据都在变量df内了 理解数据 前10行: In【3]:df.head(310) 0ut3]: Cause CauseCN Code-ICD-10-113 Age Gender Year Deaths Population Crude Rate 0 沙门氏萄悬染 G113-001 10 20050 1956682 Unmiable 沙门氏菌感染 GR113-001 0 20101 1929677 沙门氏菌暴染 GR13-001 20153 1942904 3 Saimonela infections 沙门氏菊懸染 GR113-001 20060 1950494 4 沙门氏萄蒸染 GR113-001 20100 1947217 沙门氏菌感染 GR113-001 F 20150 1939269 6Saimonella infections 沙门氏葡暴染 GR113-001 2 20050 1932337 Unreliable 7Salmonela infections 沙门氏葡瑟染 GR113-001 2 20100 2004731 Urriabie 8Salmonella infections 沙门氏菌藤染 GR113-001 20150 1939979 Unreliable 9Salmonela infections 沙门氏菌綦染 G113-001 3 20050 1930395 Unreliable 我们可以对死亡的年龄做一个汇总,可以看到,最大的死亡人员有100岁, 最小的是刚出生的婴儿,平均年龄是50岁,我们还可以看看数据集中到底包含 了哪些年份,可以看到数据集里面包含了死亡年份有2005年、2010年、2015 年。我们还可以看看性别是否只包含男女两种,我们看到Gender这一列确实只 包含F和M这两个取值。我们可以对死亡的年龄做一个汇总,可以看到,最大的死亡人员有 100 岁, 最小的是刚出生的婴儿,平均年龄是 50 岁,我们还可以看看数据集中到底包含 了哪些年份,可以看到数据集里面包含了死亡年份有 2005 年、2010 年、2015 年。我们还可以看看性别是否只包含男女两种,我们看到 Ge瀁der 这一列确实只 包含 F 和 M 这两个取值
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有