数据科学论 —Python之道 第4课数据分析入门 本课程基于BigDataUniversity.com.cn的《Data science with Python Bootcamp》 进行了重新组织与扩充 1
数据科学引论 —— Python之道 第4课 数据分析入门 本课程基于B濼濺D濴瀇濴U瀁濼瀉濸瀅瀆濼瀇瀌.濶瀂瀀.濶瀁的《D濴瀇濴 瀆濶濼濸瀁濶濸 瀊濼瀇濻 P瀌瀇濻瀂瀁 B瀂瀂瀇濶濴瀀瀃》 进行了重新组织与扩充 1
内容提纲 ·NumPy库 ·Pandas ·Series和DataFrame ·Pandas DataFrame.上的操作 2
内容提纲 • N瀈瀀P瀌 库 • P濴瀁濷濴瀆 • S濸瀅濼濸瀆 和D濴瀇濴F瀅濴瀀濸 • P濴瀁濷濴瀆 D濴瀇濴F瀅濴瀀濸上的操作 2
NumPy)库 3
NumPy 库 3
什么是NumPy? ·NumPy:NumPy是Python用于科学计算的基础包 ·快速 ·多维数组 ·向量化计算 import numpy as np data=np.array([[1.9526,-0.246,-0.8856], [0.5639,0.2379,0.9104]]) data array([[1.9526,-0.246,-0.8856], [0.5639,0.2379,0.9104]]) 4
什么是NumPy? • NumPy: N瀈瀀P瀌 是P瀌瀇濻瀂瀁用于科学计算的基础包 • 快速 • 多维数组 • 向量化计算 4
Pandas:Series and DataFrames
Pandas: Series and DataFrames 5
什么是Pandas? ·Pandas是Python用于数据分析的包 ·它有下面两部分构成: 1.Series 2.Data frames ·你可以下载数据 ·可视化数据 ·分析数据 6
什么是Pandas? • Pandas 是 Python 用于数据分析的包 • 它有下面两部分构成: 1. S濸瀅濼濸瀆 2. D濴瀇濴 濹瀅濴瀀濸瀆 • 你可以下载数据 • 可视化数据 • 分析数据 6
Pandas Series ·Series是由数字构成的列表,其中每个元素都拥有数据和索引 ·缺省情况下,索引是整数 data=[11,23,23] s pd.Series(data) data 11 23 23 6 Index 0 1 2 0 11 1 23 2 23 dtype:int64 s[1]=23 s[1] 23 7
Pandas : Series • S濸瀅濼濸瀆 是由数字构成的列表,其中每个元素都拥有数据和索引 • 缺省情况下,索引是整数 data 11 23 23 I瀁濷濸瀋 0 1 2 瀆[1]=23 7
Pandas Series ·Series是由数字构成的列表,其中每个元素都拥有数据和索引 ·使用索引在数组中查找元素 data=[11,23,23] index=["a","b","c"] s pd.Series(data,index=index) data 11 23 23 Index a b C 8 a 11 b 23 23 dtype:int64 s["a"]=11 s["a"] 11 8
Pandas : Series • S濸瀅濼濸瀆 是由数字构成的列表,其中每个元素都拥有数据和索引 • 使用索引在数组中查找元素 data 11 23 23 I瀁濷濸瀋 濴 濵 濶 瀆[ "濴" ]=11 8
Pandas Series ·Series是由数字构成的列表,其中每个元素都拥有数据和索引 ·使用索引在数组中查找元素 s["b"]=12 import pandas as pd data=[11,12,13 ind=【"a","b","c"】 data 11 12 13 Index a b C s pd.Series(data,index=ind) s[["a","b"] 11 b12 s["a"]=11 dtype:int64 9
Pandas : Series • S濸瀅濼濸瀆 是由数字构成的列表,其中每个元素都拥有数据和索引 • 使用索引在数组中查找元素 data 11 12 13 I瀁濷濸瀋 濴 濵 濶 瀆[ "濴" ]=11 瀆[ "濵" ]=12 9
Pandas DataFrame ·类似电子表格,包含一个有序的列集合 ·同时具有行和列索引 ·可以将其看作是由Series?构成的字典 列 Dictionary A B C 行 Index Series 1 Series 2 Series 2 10
• 类似电子表格,包含一个有序的列集合 • 同时具有行和列索引 • 可以将其看作是由S濸瀅濼濸瀆构成的字典 Dictionary A B C 行 I瀁濷濸瀋 S濸瀅濼濸瀆 1 S濸瀅濼濸瀆 2 S濸瀅濼濸瀆 2 列 Pandas : DataFrame 10