数据集合体
数据集合体 ■ 很多程序都需要处理大量类似数据的集 合 -文档中的大量单词 学校学生,企业客户 一实验得到的数据 ■■■■■■ 2
2
数据集合体 回顾:输入一批数据求平均值的程序 无需保存数据:用累积变量sum和count 即可 但:求中位数和标准差需要保存全部数据. 用很多独立变量保存? 中位数,一组数据按从小到大(或从大到小)的顺序依次排列,处在 中间位置的一个数(或最中间两个数据的平均数) 标准差(Standard Deviation),也称均方差(mean square error),是各数据偏离平均数的距离的平均数。标准差是方差的算 术平方根。标准差能反映一个数据集的离散程度。平均数相同的,标 准差未必相同。 3
3
列表 有没有一个对象能包含很多数据?Yes! -如range(10)=[0,1,2,3,4,5,6,7,8,9] 又如string.split(This is it.")= This',"is',"it'] 列表(Lst):是一种数据集合体 一是数据的有序序列 整体用一个名字表示:如seq 各成员通过下标(索引)引用:如seq[3] 4
4
列表与字符串 回顾:Python字符串是序列,可通过索 引引用 ■列表与字符串的区别 一列表的成员可以是任何数据类型,而字符 串中只能是字符: 一列表的成员可修改,而字符串不能修改 5
5
列表与数组 ■很多编程语言提供数组(array)类型. Python列表与数组的区别: 列表是动态的,而数组是定长的 列表元素可以是混合类型的而数组元素是 同类型的 6
6
列表操作 ■对字符串的操作也可应用于列表: -合并:+≤seq> 重复:* 索引:≤seq≥[] 分段:[:] -长度:len(in:. ■列表删除: del [:] 7
7
列表操作(续) 应用于列表的专门方法: - 追加:.append(x) -排序:.sort() 逆转:.reverse() 查找:.index(x) 插入:.insert(i,x) -计数:.count(x) 删除:.remove(x) 弹出:,pop(i) 隶属:xin 8
8
编程实例stats.py stats.py from math import sqrt def getNumbers () def mean (nums): def stdDev(nums,xbar): def median(nums): def main() data getNumbers() xbar mean(data) std stdDev(data,xbar) med median(data) print ..... if name ==main:main() 9
9
列表与类结合使用 类将一些数据与操作封装成一个对象 列表将一些同类对象组合成整体 这两者的结合可以表示任意复杂的数据 集合体 10
10