2-3现代文献和信息资源发展的整体特征 、数量庞大,增长迅速 、时效性强,代谢频繁 广泛分散,交叉重复 四、载文聚散,分布有序 五、形式多样,文种复杂 附录:社会科学文献的基本特征思考题与课题
1 2-3 现代文献和信息资源发展的整体特征 一、数量庞大,增长迅速 二、时效性强,代谢频繁 三、广泛分散,交叉重复 四、载文聚散,分布有序 五、形式多样,文种复杂 附录:社会科学文献的基本特征 思考题与课题
数量庞大,增长迅速 1、现象描述:据统计,世界图书产量为80万种/年,期刊 为10万种/年,并以5%的速度增长。科技期刊的增长速 度更快,每7~8年就增长一倍;有些新兴学科,每隔3年 左右就翻一番。目前,全世界专利文献每年增加100万 件,技术标准增加20万件,产品样本增加50~60万件 会议文献增加100万篇左右,各种连续出版物40万种。 若以信息单位计算,当今每天约有40亿个信息单位的信 息量向全世界发送,年递增速度为18~20%
2 一、数量庞大,增长迅速 1、现象描述:据统计,世界图书产量为80万种/年,期刊 为10万种/年,并以5%的速度增长。科技期刊的增长速 度更快,每7~8年就增长一倍;有些新兴学科,每隔3年 左右就翻一番。目前,全世界专利文献每年增加100万 件,技术标准增加20万件,产品样本增加50~60万件, 会议文献增加100万篇左右,各种连续出版物40万种。 若以信息单位计算,当今每天约有40亿个信息单位的信 息量向全世界发送,年递增速度为18~20%
2、数学描述:1961年,D.Prce在 Science since babylon一书中指 出:“似乎没有理由怀疑任何正常的、日益增长的科学领域内 的文献是按指数增加的,每隔大约10~15年时间增加一倍,每 年增长约5~7%‰。”他进一步指出,整个科学系统资金、人力 和物力的指数输入是造成科研成果和科技文献指数输出的重要 原因;并且认为,科研人员、科研经费与文献量呈η、n2、n1/2 三个阶数关系。通过对科学期刊的历时性研究,普赖斯得出科 学文献增长同时间呈指数函数关系
3 2、数学描述:1961年,D. Price在Science Since Babylon一书中指 出:“似乎没有理由怀疑任何正常的、日益增长的科学领域内 的文献是按指数增加的,每隔大约10~15年时间增加一倍,每 年增长约5~7%。”他进一步指出,整个科学系统资金、人力 和物力的指数输入是造成科研成果和科技文献指数输出的重要 原因;并且认为,科研人员、科研经费与文献量呈n、n 2 、n 1/2 三个阶数关系。通过对科学期刊的历时性研究,普赖斯得出科 学文献增长同时间呈指数函数关系
3、图像描述:以历史年代为横轴,以文献量为纵轴,普赖斯描绘了 文献增长的指数模型。即:F(4)=ae,a>0,b>0,t为时间,a 为条件常数,即t=0时的文献量,b为时间常数即持续增长率。 F(1)tF()=aetF(t)t科学少期刊 106 文摘杂志 10 16651770180019001965
4 3、图像描述:以历史年代为横轴,以文献量为纵轴,普赖斯描绘了 文献增长的指数模型。即:F(t)=aebt ,a>0,b>0,t为时间,a 为条件常数,即t=0时的文献量,b为时间常数即持续增长率。 F(t) F(t)=aebt F(t) 科学 期刊 106 104 文摘杂志 t 102 t 1665 1770 1800 1900 1965
4、理论研究之进展。B·纳里莫夫逻辑曲线增长模型;AⅥ·米哈依诺夫 直线增长模型:F(t)=bt+a。一般的看法,文献增长经历四个阶段: 缓慢增长的初始阶段,指数增长阶段,线性增长阶段和缓慢增长阶 段 5、文献增长对文献检索的影响是多方面的 勒希尔的分级滑动指数模型:F(t)为文献总量,则在入级上的文献量为 [F(t)]λ,λ为文献的质量等级指标,0≤入≤1。具体而言: (1)入=1,起码是常规文献(代表了所有文献):F(==b (2)λ=3/4,起码是有意义的文献:F(t)=34=[aey4; (3)A=1/2,重要文献:F(y=12=[ae]2 (4)λ=1/4,起码是非常重要的文献:F(y-=14=[aeb (5)λ=0,头等重要的文献:F(t)y=0=la+bt
5 4、理论研究之进展。 B·纳里莫夫逻辑曲线增长模型;A·И·米哈依诺夫 直线增长模型:F(t)=bt+a。一般的看法,文献增长经历四个阶段: 缓慢增长的初始阶段,指数增长阶段,线性增长阶段和缓慢增长阶 段。 5、文献增长对文献检索的影响是多方面的。 勒希尔的分级滑动指数模型:F(t)为文献总量,则在λ级上的文献量为 [F(t)]λ ,λ为文献的质量等级指标,0≤λ≤1。具体而言: (1) λ=1,起码是常规文献(代表了所有文献):F(t)λ=1=aebt; (2) λ=3/4,起码是有意义的文献:F(t)λ=3/4=[aebt] 3/4; (3) λ=1/2,重要文献:F(t)λ=1/2=[aebt] 1/2; (4) λ=1/4,起码是非常重要的文献:F(t)λ=1/4=[aebt] 1/4; (5) λ=0,头等重要的文献:F(t)λ=0=㏑a+bt
∴、时效性强,代谢频繁 文献老化( Obsolescence)是指文献随着时间推移而使 用频次逐渐减少的现象 2、1文献老化的衡量指标 Half-life、 Price' s Index和 Residual utility 2、2文献老化的数学模型 负指数模型和伯尔顿-凯普勒老化方程
6 二、时效性强,代谢频繁 文献老化(Obsolescence)是指文献随着时间推移而使 用频次逐渐减少的现象。 2、1文献老化的衡量指标 Half-life、Price’s Index和Residual utility 2、2文献老化的数学模型 负指数模型和伯尔顿-凯普勒老化方程
2、1文献老化的衡量指标 衡量文献时效,一般有3个指标 ◆半衰期:指现有活性文献中一半的出版时间,或者说,某一学科 或专业被利用的文献总量中,一半文献失去效用所经历的时间。 各个学科领域和文献类型的半衰期。 ◆普赖斯指数:在某一知识领域内,把对年限不超过5年的文献的 引文数量与引文总量之比当作指数,用以度量文献老化。即P 被引 文献数 量(≤ 5年)/被 文献总 ×100 有一当性是指某二如叫她用户和用的立音的 的 次数,经过若干年后,期刊还保留的有益性即称为剩余有益性
7 2、1 文献老化的衡量指标 衡量文献时效,一般有3个指标: 半衰期:指现有活性文献中一半的出版时间,或者说,某一学科 或专业被利用的文献总量中,一半文献失去效用所经历的时间。 各个学科领域和文献类型的半衰期。 普赖斯指数:在某一知识领域内,把对年限不超过5年的文献的 引文数量与引文总量之比当作指数,用以度量文献老化。即P= 被引文献数量(≤5年)/被引文献总量×100%。 剩余有益性。有益性是指某一年份某一期刊被用户利用的文章的 次数,经过若干年后,期刊还保留的有益性即称为剩余有益性
各个学科领域和文献类型的半衰期 Burton& Kepler对9个领域半衰期的测定数据(1960) 学科领域冶金物理学化工机械|生理学化学植物学数学地质学 半衰期(年)3.9464852 7.2 8.110.010.511.8 苏联《发明杂志》对各类文献半衰期的统计研究数据: 文献类型图书科技报告学位论文技术标准连续出版物产品样本 半衰期(年)10-20105~75 3~5 3~5
8 各个学科领域和文献类型的半衰期 Burton & Kebler 对9个领域半衰期的测定数据(1960): 苏联《发明杂志》对各类文献半衰期的统计研究数据: 学科领域 冶金 物理学 化工 机械 生理学 化学 植物学 数学 地质学 半衰期(年) 3.9 4.6 4.8 5.2 7.2 8.1 10.0 10.5 11.8 文献类型 图书 科技报告 学位论文 技术标准 连续出版物 产品样本 半衰期(年) 10~20 10 5~7 5 3~5 3~5
2、2文献老化的数学模型 ◆负指数模型:1970年,英国的B.C. Brookes提出了科技期刊文献 的被引数量随着时间推移的衰减过程服从简单的负指数规律的假 设:C(t)=Cet。式中,t表示文献的出版年龄(以10年为单位), C(t)表示t年所发表的文献的引用频率,Co为t=0时文献被引用的 初始量,b为文献老化速度,0<b<1 ◆伯尔顿-凯普勒老化方程:1960年,美国的伯尔顿和物理学家凯 普勒发现科技文献衰变曲线并求出了这一曲线的标准公式:Y=1 (a/ex+b/ezx),式中,a+b=1,Y是被文献量累积百分数(经过 定时间该学科尚在利用的文献的相对数量),x为时间即被引文 献出版年龄(以10年为单位),a、b是因学科专业而变化的常数。 ◆文献老化规律对信息检索的具有重要的影响
9 2、2 文献老化的数学模型 负指数模型:1970年,英国的B. C. Brookes提出了科技期刊文献 的被引数量随着时间推移的衰减过程服从简单的负指数规律的假 设:C(t)=C0e -bt 。式中,t表示文献的出版年龄(以10年为单位), C(t)表示t年所发表的文献的引用频率,C0为t=0时文献被引用的 初始量,b为文献老化速度,0<b<1。 伯尔顿-凯普勒老化方程:1960年,美国的伯尔顿和物理学家凯 普勒发现科技文献衰变曲线并求出了这一曲线的标准公式:Y=1 -(a/ex+b/e2x ) ,式中,a+b=1,Y是被文献量累积百分数(经过 一定时间该学科尚在利用的文献的相对数量),x为时间即被引文 献出版年龄(以10年为单位),a、b是因学科专业而变化的常数。 文献老化规律对信息检索的具有重要的影响
三、广泛分散,交叉重复 科技知识的高度分化和高度综合,使科技文献呈现出高度 的离散性和冗余性。 ◆就离散性而言,同一专业文献分散在众多的相关专业刊 物上,与此同时,某一学科或专业的刊物,除刊载本学 科或专业的文献外,还刊载其他学科或专业的文献。这 种离散性使用户无法检索到专业文献的全部;但同时也 把用户引入到一个交叉渗透的科技世界,有利于用户思 考和研究学科的相关性以及科学发展的网络结构 ◆就冗余性而言,科研选题的重复,同一知识内容的不同 表现方式等使文献的内容交叉重复现象比比皆是。 10
10 三、广泛分散,交叉重复 科技知识的高度分化和高度综合,使科技文献呈现出高度 的离散性和冗余性。 就离散性而言,同一专业文献分散在众多的相关专业刊 物上,与此同时,某一学科或专业的刊物,除刊载本学 科或专业的文献外,还刊载其他学科或专业的文献。这 种离散性使用户无法检索到专业文献的全部;但同时也 把用户引入到一个交叉渗透的科技世界,有利于用户思 考和研究学科的相关性以及科学发展的网络结构。 就冗余性而言,科研选题的重复,同一知识内容的不同 表现方式等使文献的内容交叉重复现象比比皆是