HASH表查找效率的讨论和验证

HASH造表、查表方法广泛而有效地应用于计算机基本软件和应用软件的设计中,尤其在计算机的数据处理和数据库技术中,更为如此。本文使用初等的数学方法对这种先进的查找技术的效率—表平均查找长度A进行了理论上的讨论,同样得到了前人已经得到的两个理论计算公式。此外,我们还在M—150计算机上做了随机模拟试验,得到了一系列试验结果,支持和验证了理论的正确性。

团购合买资源类别：文库，文档格式：PDF，文档页数：7，文件大小：465.47KB

D0I:10.13374/j.issn1001053x.198M.01.031 北京钢铁学院学报 1984年第1期 HASH表查找效率的讨论和验证 2 软件工程教研室冯克清曾绍良摘要 HAS造表、查表方法广泛而有效地应.用于计算机基本软件和应用软件的设计中，尤其在计算机的数据处理和数据库技术中，更为如此。本文使用初等的数学方法对这种先进的查找技术的效率一表平均查找长度A进行了理论上的讨论，同样得到了前人已经得到的两个理论计算公式。此外，我们还在M-150计算机上做了随机模拟试验，得到了一系列试验结果，支持和验证了理论的正确性。一、两种HASH造表、查表方法设有个表项T(K),其中K为表项T中的一个栏目，由它可唯一地标别出一个表项T, 我们称K为表项T的关键字(KEY)。例如，某班学生成绩表的一个表项可以是如下格式：学学生姓名政治程序设计数据结构数据岸那末，其中的栏目：“姓名”，如果无重名时，可为该表项的关键字。当然， “学号”也可以为关键字。今欲将个表项组织到m个位置编号为1到m的连续存贮单位中去，这就是造表。设n≤m。并且假定已找到了一个定义于 2,{K}上的映象函数H(K),满足： ①H(K)为整函数，且1≤H(K)≤m,当K∈2时。 ②对于任何的K∈2，H()均匀地分布于〔1，m)之中。于是，任取-一项T(K*),通过映象函数H(K),均可得到一个介于1和m之间的位置 H(K),自然，我们可以将T(K*)存放在H(K◆)位置上。但是，尽管有n≤m,但由于 H(K)的随机性，完全有可能对于T(K),K+K*,而H(《)=H(*衣)。这样将有两个（或两个以上)互不相同的项T映象到同一个位置，这就称之为“冲突”。为解决“冲突”，可以采用以下两种HASH造查表方法： 1.开放定址HASH方法。 ∧)造表算法： ①i=H(K),/*K为欲登入的项T的关键字/. ②IFP(i)=empty THEN {enter T(K)in P(i);RETURN} 183

北京钢铁学院学报年筑翔表查找效率的讨论和验证软件工程教研室冯克清曾绍良摘要造表、查表方法广泛而有效地应用于计算机基本软件和应用软件的设计中，尤其在计算机的数据处理和数据库技术中，更为如此。本文使用初等的数学方法对这种先进的查找技术的效率一表平均查找长度进行了理论上的讨论，同样得到了前人已经得到的两个理论计算公式。此外，我们还在一计算机上做了随机模拟试验，得到了一系列试验结果，支持和验证了理论的正确性。一、两种造表、查表方法设有个表项，其中为表项中的一个栏目，由它可唯一地标别出一个表项，我们称为表项的关键字。例如，某班学生成绩表的一个表项可以是如下格式学号学生姓名政治程序设计数据结构数据库那末，其中的栏目 “ 姓名” ，如果无重名时，可为该表项的关键字。当然， “ 学号 ” 也可以为关键字。今欲将个表项组织到个位置编号为到的连续存贮单位中去，这就是造表。设《。并且假定已找到了一个定义于的映象函数，满足 ① 为整函数，且镇，当〔时。 ② 对于任何的任，二均匀地分布于〔，〕之中。于是，任取一项，通过映象函数，均可得到一个介于和之间的位置中，自然，我们可以将存放在位置上。但是，尽管有，但由于的随机性，完全有可能对于，钾，而又又。这样将有两个或两个以上互不相同的项映象到同一个位置，这就称之为 “ 冲突” 。为解决 “ 冲突” ，可以采用以下两种造查表方法开放定址方法。造表算法 ① ，为欲登入的项的关键字， ② ， DOI ：10．13374／j ．issn1001－053x．1984．01．031

点击下载完整版文档（PDF格式）

已到末页，全文结束

点击下载（PDF格式）

浏览记录

HASH表查找效率的讨论和验证