
Python数据分析第9章时间序列数据分析
Python数据分析 第 9 章 时间序列数据分析

9.1日期和时间数据类型9.1.1datetime构造Python标准库中包含了用于日期(date)、时间(time)、日历(calendar)等功能的数据类型,主要会用到datetime、time、calendar模块,我们主要介绍一下datetime模块。表9-1datetime库的时间数据类型为:类型使用说明date日期(年、月、日)time时间(时、分、秒、毫秒)日期和时间datetimetimedelta两个datetime的差(日、秒、毫秒)
9.1 日期和时间数据类型 Python标准库中包含了用于日期(date)、时间( time)、日历(calendar)等功能的数据类型,主要会用 到datetime、time、calendar模块,我们主要介绍一下 datetime模块。 ❖ 9.1.1 datetime构造 类型 使用说明 date 日期(年、月、日) time 时间(时、分、秒、毫秒) datetime 日期和时间 timedelta 两个datetime的差(日、秒、毫秒) 表9-1 datetime库的时间数据类型为:

9.1日期和时间数据类型*9.1.2数据转换1.datetime ->str:将datetime类数据转换为字符串数据。str方法:datetime.strftime方法:可以将datetime类数据转换为格式化字符串数据。2.str->datetime:将字符串数据转换为datetime类数据。datetime.strptime(...):根据string,format2个参数,返回一个对应的datetime对象
9.1 日期和时间数据类型 1. datetime -> str:将datetime类数据转换为字符串数 据。 str方法: datetime.strftime方法: 可以将datetime类数据转换 为格式化字符串数据。 2. str -> datetime :将字符串数据转换为datetime类数 据。 datetime.strptime(.):根据string, format 2个参数, 返回一个对应的datetime对象 ❖ 9.1.2 数据转换

9.1日期和时间数据类型表9-2datetime格式说明类型描述%Y四位的年份%y两位的年份%m两位的月份[01,-——,12]%d两位的日期[01,-—-,31]%H小时,24小时制[00,---,24]% I小时,12小时制[01,---,12]%M两位的分钟[00,-——,59]%S两位的秒%W每年的第几周,星期一为每周第一天%F%Y-%m-%d的简写(如2019-5-5)%D%m/%d%y的简写(如05/20/19)
9.1 日期和时间数据类型 类型 描述 %Y 四位的年份 %y 两位的年份 %m 两位的月份[01,-,12] %d 两位的日期[01,-,31] %H 小时,24小时制[00,-,24] %I 小时,12小时制[01,-,12] %M 两位的分钟[00,-,59] %S 两位的秒 %W 每年的第几周,星期一为每周第一天 %F %Y-%m-%d的简写(如 2019-5-5) %D %m/%d%y的简写(如 05/20/19) 表9-2 datetime格式说明

9.2 时间序列基础×9.2.1时间序列构造Pandas中的时间序列指的是以时间数据为索引的Series或DataFrame,构造方法即为Series的构造方法。·9.2.2索引与切片
9.2 时间序列基础 ❖ 9.2.1 时间序列构造 Pandas 中的时间序列指的是以时间数据为索引的 Series 或 DataFrame,构造方法即为Series的构造方法。 • 9.2.2 索引与切片

9.3日期范围、频率和移动·9.3.1日期范围Pandas的通用时间序列是不规则的,即时间序列的频率是不固定的。然而经常有需要处理固定频率的场景,如每天、每月等。使用pd.daterange函数可以创建指定长度的DatetimeIndex。*9.3.2频率和移位pandas中的频率是由一个基础频率和一个乘数组成的。基础频率通常以一个字符串别名表示,比如”H”表示每小时。对于每个基础频率,都有一个被称为日期偏移量的对象与之对应。可以通过实例化日期偏移量来创建某种频率:在基础频率前面放上一个整数即可创建偏移量的倍数
9.3 日期范围、频率和移动 • 9.3.1 日期范围 Pandas的通用时间序列是不规则的,即时间序列的频率是不固 定的。然而经常有需要处理固定频率的场景,如每天、每月等。使 用pd.date_range函数可以创建指定长度的DatetimeIndex。 ❖ 9.3.2 频率和移位 pandas中的频率是由一个基础频率和一个乘数组成的。基础频 率通常以一个字符串别名表示,比如”H”表示每小时。对于每个基 础频率,都有一个被称为日期偏移量的对象与之对应。可以通过实 例化日期偏移量来创建某种频率:在基础频率前面放上一个整数即 可创建偏移量的倍数

9.4 时期·9.4.1时期基础Period可以创建时期型的数据,传入字符串、整数或频率即可?9.4.2频率转换Period和PeriodIndex对象可以通过asfreq方法转换频率。*9.4.3时期数据转换利用toperiod方法可以将由时间戳索引的时间序列数据转换为以时期为索引
9.4 时期 • 9.4.1 时期基础 Period可以创建时期型的数据,传入字符串、整数或频率即可。 ❖ 9.4.2 频率转换 Period和PeriodIndex对象可以通过asfreq方法转换频率。 ❖ 9.4.3 时期数据转换 利用to_period方法可以将由时间戳索引的时间序列数据转换为 以时期为索引

9.5频率转换和重采样·9.5.1重采样重采样是时间序列频率转换的过程,Pandas中的resample函数用于各种频率的转换工作。resample方法的参数与说明见下表。类型描述freq转换频率axies = 0重采样的轴closed = 'right'在降采样中,设置各时间段哪端是闭合的label = 'right"在降采样中,如何设置聚合值的标签设置时间偏移offset = Nonekind = None聚合到时期,默认为时间序列的索引类型convention升采样采用的约定(start或end),默认end
9.5 频率转换和重采样 • 9.5.1 重采样 重采样是时间序列频率转换的过程,Pandas中的resample函数用于 各种频率的转换工作。 resample方法的参数与说明见下表。 类型 描述 freq 转换频率 axies = 0 重采样的轴 closed = ’right’ 在降采样中,设置各时间段哪端是闭合的 label = ’right’ 在降采样中,如何设置聚合值的标签 offset = None 设置时间偏移 kind = None 聚合到时期,默认为时间序列的索引类型 convention 升采样采用的约定(start或end),默认end

9.5频率转换和重采样·9.5.2降采样在降采样中,需要考虑closed和label参数,分别表示哪边区间是闭合的,哪边是标记的。*9.5.3升采样在升采样中主要是数据的插值,即对缺失值进行填充,填充方法与fillna相似
9.5 频率转换和重采样 • 9.5.2 降采样 在降采样中,需要考虑closed和label参数,分别表示哪边区间是 闭合的,哪边是标记的。 ❖ 9.5.3 升采样 在升采样中主要是数据的插值,即对缺失值进行填充,填充方法 与fillna相似