第七章政策评估 政策评估是政策过程的一个重要环节。只有通过政策评估,人们才能够判断一项政策是 否收到了预期效果,从而决定这项政策是应该继续、调整还是终结:同时,通过政策评估, 还可以总结政策执行的经验教训。本章讨论政策评估的几个基本理论问题。 第一节政策评估概述 政策评估是政策分析的重要方面,是一种具有特定标准、方法和程序的专门研究活动, 在相当长的时间里,政策评估并为引起人们的重视。作为公共政策分析过程中不可或缺的 环,政策评估在政策分析过程中有着重要意义。 一、政策评估的概念 尽管目前对政策评估的研究己越来越多,但对于政策评估这个概念却没有一个统一的 能被绝大多数学者、专家普遍认同的定义。先看看几种有代表性的定义: 安德森:“如果把政策过程看作某种有序的活动的话,那么,它的最后一个阶段便是政 簧评价。总的说来,政策评价与政策(包括它的内容、实施及后果)的估计、评价和鉴定相 关。作为某种功能活动,政策评价能够而且确定发生在整个政策过程中,而不能简单地将其 作为最后的阶段。”①依这种看法,政策评估的目的是评价人们所执行的政策在实现其预定目 标上的效果,该政策在多大程度上解决了政策所指向的问题,以及该效果的取得是政策本身 的作用还是政策以外其它因素所导致的等等。 那格尔:政策评价“主要关心的是解析和预测 ,它依靠经验性证据和分析,强调建立利 检验中期理论,关心是否对政策有用,而主要关心的是把评价看成一种科学研究活动”。②在 这里,政策评估被看作一种分析的过程,评估者通过搜集相关信息,运用定性与定量分析方 法和技术,对各政策方案进行分析,确定各种方案的现实可行性及优缺点,以供决策者参考。 林水波 张世贤:政策评价是“有系统地应用各种社会研究程序,搜集有关资讯, 用 论断政策概念与设计是否周全完整,知悉政策实际执行情形、遭遇的困难,有无偏离既定的 政策方向:指明社会干预政策的效用。”在他们看来,政策评估不仅是对政策方案的评估, 而且包括对执行情况和政策结果的评估。政策评估被看作是一种若眼于整个公共政策全过程 的广博的收集资料、论证评价的过程。 朱志宏:“就 一项公共政策而言 ,发现误差、修正误差就是政策评估,换言之,政策词 估的工作就是发现并修正政策的误差。”④按照朱志宏等人的观点,公共政策过程是未来取向 的,评估者凭借自己已具备的知识和经验,对公共政策全程跟踪观察,发现问题并随时纠正。 在某种程度上 类似于引领航行的导航员。 可见 学者们对于政策评估概念的界定见仁见智,归纳起来主要有四种观点政策评估含 义的四种观点:(1)政策评估的者眼点应是政策效果:(2)政策评估主要是对政策方案的评 估.属于政策评估中预测评估的范畴:(3)政策评估是对政策全过程的评估,既包括对政策 方案的评估,还强调对政策执行以及政策结果的评估:(4)政策评估就是发现误差,修正误 美姆斯:E:安德在公共决策北京:华夏出版社, 1990:183页 ·来整公政若魔民书胶份有公公 9页
1 第七章 政策评估 政策评估是政策过程的一个重要环节。只有通过政策评估,人们才能够判断一项政策是 否收到了预期效果,从而决定这项政策是应该继续、调整还是终结;同时,通过政策评估, 还可以总结政策执行的经验教训。本章讨论政策评估的几个基本理论问题。 第一节 政策评估概述 政策评估是政策分析的重要方面,是一种具有特定标准、方法和程序的专门研究活动。 在相当长的时间里,政策评估并为引起人们的重视。作为公共政策分析过程中不可或缺的一 环,政策评估在政策分析过程中有着重要意义。 一、政策评估的概念 尽管目前对政策评估的研究已越来越多,但对于政策评估这个概念却没有一个统一的, 能被绝大多数学者、专家普遍认同的定义。先看看几种有代表性的定义: 安德森:“如果把政策过程看作某种有序的活动的话,那么,它的最后一个阶段便是政 策评价。总的说来,政策评价与政策(包括它的内容、实施及后果)的估计、评价和鉴定相 关。作为某种功能活动,政策评价能够而且确定发生在整个政策过程中,而不能简单地将其 作为最后的阶段。”①依这种看法,政策评估的目的是评价人们所执行的政策在实现其预定目 标上的效果,该政策在多大程度上解决了政策所指向的问题,以及该效果的取得是政策本身 的作用还是政策以外其它因素所导致的等等。 那格尔:政策评价“主要关心的是解析和预测,它依靠经验性证据和分析,强调建立和 检验中期理论,关心是否对政策有用,而主要关心的是把评价看成一种科学研究活动”。②在 这里,政策评估被看作一种分析的过程,评估者通过搜集相关信息,运用定性与定量分析方 法和技术,对各政策方案进行分析,确定各种方案的现实可行性及优缺点,以供决策者参考。 林水波、张世贤:政策评价是“有系统地应用各种社会研究程序,搜集有关资讯,用以 论断政策概念与设计是否周全完整,知悉政策实际执行情形、遭遇的困难,有无偏离既定的 政策方向;指明社会干预政策的效用。”③在他们看来,政策评估不仅是对政策方案的评估, 而且包括对执行情况和政策结果的评估。政策评估被看作是一种着眼于整个公共政策全过程 的广博的收集资料、论证评价的过程。 朱志宏:“就一项公共政策而言,发现误差、修正误差就是政策评估,换言之,政策评 估的工作就是发现并修正政策的误差。”④按照朱志宏等人的观点,公共政策过程是未来取向 的,评估者凭借自己已具备的知识和经验,对公共政策全程跟踪观察,发现问题并随时纠正。 在某种程度上,类似于引领航行的导航员。 可见,学者们对于政策评估概念的界定见仁见智,归纳起来主要有四种观点政策评估含 义的四种观点:(1)政策评估的着眼点应是政策效果;(2)政策评估主要是对政策方案的评 估,属于政策评估中预测评估的范畴;(3)政策评估是对政策全过程的评估,既包括对政策 方案的评估,还强调对政策执行以及政策结果的评估;(4)政策评估就是发现误差,修正误 ① [美]詹姆斯·E·安德森.公共决策.北京:华夏出版社,1990:183 页. ② [美]S·S·那格尔.政策研究百科全书. 北京:634-635 页. ③ 林水波 张世贤.公共政策.台北:五南图书出版公司,1988:499 页. ④ 朱志宏.公共政策.台北:三民书局股份有限公司,1995:299 页
差。这些定义各有千秋,但后面三种定义的不足之处较为明显的。我们倾向于第一种观点, 将政策评估主要看作是对政策结果的评估。 因此,可以给政策评估下这样的定义:政策评估是依据一定的标准和程序,对政策的效 益、效率及价值进行判断的一种政治行为,目的在于取得有关这些方面的信息,作为决定政 笛变化、政箭改讲和制定新政策的依据。 二、政策评估的类型 随着政府活动的日益复杂化和邑影响的深广化,改簧平估也日益呈现出多样化的特点。国 内外学者依据不同的标准,从不同的角度对政策评估进行了分类。不同的分类显示了学者们 研究重点的不同 在国外评估研究的文献中,有不少关于政策评估的分类方法:美国评估研究协会根据] 作程式把方案评估分为六类,即前端分析、评估性测定、过程评价、效力评估或称影响力评 估、方案和问题监控以及元评估(或称综合评估),这六种评估类型构成了方案评估的日常 内容。美国社区服务管理局曾提出三种类型:方案影响评估、方案策略评估和方案监控, 而学者R·M·克朗赞同R·施赖德的看法,认为评估是一种循环的问题过程并将评估分为 五类:系统评估、投入评估、过程评估、总结评估和测评估。德尔金斯(D.N.T.Derkins) 则根据政策发展过程建立了六种评估类别,分别是策路评估、顺服评估、政策设计评估、管 理评估、干预效果评估和影响评估。 在国内评估研究的文献中,政策评估的分类表现为两个大的趋势:一是认为政策评估应 分为三类,即正式评估和非正式评估:内部评估与外部评估:事前、执行和事后评估。二是 赞同从政策影响的角度对政策评估做诸如效益、效率、效果等方面的分类。台湾学者林水波 张世贤则把政策评估分为四类:第一类是政策执行评估,包括内容摘要、政策的背景环境、 原定政策主要特征总述、执行评价描述、总结与考虑:第二类是影响评估:第三类是经济效 率分析:第四类是推测评估。 从不同的角度,依据不同的标准,我们也可将多样化的政策评估分为不同的种类。从评 估组织活动形式上看,可分为正式评估和非正式评估:从评估机构的地位看,可分为内部评 估和外部评估:从政策评估在政簧过程所处的阶段来看,政策评估又可分为事前评估、执行 评估和事后评估】 1.正式评估和非正式评估 从评估组织活动形式上看,可分为正式评估和非正式评估。非正式评估指对评估者、评 估形式、评估内容没有严格规定,对评估的最后结论也不作严格的要求,人们根据自己掌握 的情况对政策做出评鉴的评估。正式评估指事先制定完整的评估方案,并严格按规定的程序 和内容执行,并由确定的评估者进行的评估。它在政策评估中占据主导地位,其结论是政府 部门考察政策的主要依据。 2.内部评估和外部评估 从评估机构的地位看,政策评估可分为内部评估和外部评估。内部评估是由行政机构内 部的评估者所完成的评估。它可分为由操作人员自己实施的评估和由专职评估人员实施的评 估。外部评估是由行政机构外的评估者所完成的评估。它可以是由行政机构委托营利性或非 营利性的研究机构、学术团体,专业性的咨询公司,大专院校进行的,也可以是由投资或立 法机构组织的或由报纸、电视、民间团体等其他各种外部评估者自己组织的。内部评估和外
2 差。这些定义各有千秋,但后面三种定义的不足之处较为明显的。我们倾向于第一种观点, 将政策评估主要看作是对政策结果的评估。 因此,可以给政策评估下这样的定义:政策评估是依据一定的标准和程序,对政策的效 益、效率及价值进行判断的一种政治行为,目的在于取得有关这些方面的信息,作为决定政 策变化、政策改进和制定新政策的依据。 二、政策评估的类型 随着政府活动的日益复杂化和影响的深广化,政策评估也日益呈现出多样化的特点。国 内外学者依据不同的标准,从不同的角度对政策评估进行了分类。不同的分类显示了学者们 研究重点的不同。 在国外评估研究的文献中,有不少关于政策评估的分类方法:美国评估研究协会根据工 作程式把方案评估分为六类,即前端分析、评估性测定、过程评价、效力评估或称影响力评 估、方案和问题监控以及元评估(或称综合评估),这六种评估类型构成了方案评估的日常 内容。美国社区服务管理局曾提出三种类型:方案影响评估、方案策略评估和方案监控。 而学者R• M• 克朗赞同R• 施赖德的看法,认为评估是一种循环的问题过程并将评估分为 五类:系统评估、投入评估、过程评估、总结评估和测评估。德尔金斯(D.N.T.Derkins) 则根据政策发展过程建立了六种评估类别,分别是策略评估、顺服评估、政策设计评估、管 理评估、干预效果评估和影响评估。 在国内评估研究的文献中,政策评估的分类表现为两个大的趋势:一是认为政策评估应 分为三类,即正式评估和非正式评估;内部评估与外部评估;事前、执行和事后评估。二是 赞同从政策影响的角度对政策评估做诸如效益、效率、效果等方面的分类。台湾学者林水波、 张世贤则把政策评估分为四类:第一类是政策执行评估,包括内容摘要、政策的背景环境、 原定政策主要特征总述、执行评价描述、总结与考虑;第二类是影响评估;第三类是经济效 率分析;第四类是推测评估。 从不同的角度,依据不同的标准,我们也可将多样化的政策评估分为不同的种类。从评 估组织活动形式上看,可分为正式评估和非正式评估;从评估机构的地位看,可分为内部评 估和外部评估;从政策评估在政策过程所处的阶段来看,政策评估又可分为事前评估、执行 评估和事后评估。 1.正式评估和非正式评估 从评估组织活动形式上看,可分为正式评估和非正式评估。非正式评估指对评估者、评 估形式、评估内容没有严格规定,对评估的最后结论也不作严格的要求,人们根据自己掌握 的情况对政策做出评鉴的评估。正式评估指事先制定完整的评估方案,并严格按规定的程序 和内容执行,并由确定的评估者进行的评估。它在政策评估中占据主导地位,其结论是政府 部门考察政策的主要依据。 2.内部评估和外部评估 从评估机构的地位看,政策评估可分为内部评估和外部评估。内部评估是由行政机构内 部的评估者所完成的评估。它可分为由操作人员自己实施的评估和由专职评估人员实施的评 估。外部评估是由行政机构外的评估者所完成的评估。它可以是由行政机构委托营利性或非 营利性的研究机构、学术团体,专业性的咨询公司,大专院校进行的,也可以是由投资或立 法机构组织的或由报纸、电视、民间团体等其他各种外部评估者自己组织的。内部评估和外
部评估各有其利弊,因此,在实践中,应把内、外评估结合起来,取长补短 3.率前评估、执行评估和事后评估 从政策评估在政策过程所处的阶段来看,政策评估又可分为事前评估、执行评估和事后 评估。事前评估是在政策执行之前进行的一种带有预测性质的评估。事前评估的内容包含三 方面:对政策实施对象发展趋势的预测,政策可行性的评估,对政策效果进行评估。执行评 估就是对在执行过程中的政策实施情况的评估,就是具体分析政策在实际执行过程中的情 况,以确认政策是否得到严格地贯彻执行。事后评估是政策执行完成后对政策效果的评估 旨在鉴定人们执行的政策对所确认问题确定达到的解决程度和影响程度,辨识政策效果成 因,以求通过优化政策运行机制的方式,强化和扩大政策效果的一种行为。它在政策执行完 成以后发生,是最主要的一种评估方式。 三、政策评估的标准 政策的评估过程是一种紧紧围绕者政策效果而展开的活动。为了弄清楚一项政策的效果 究竟是好是坏,是否实现了预期的目标,就必须首先建立一套评估的标准,即进行价值判断 的尺度。没有标准将无法对一项政策进行正确客观的评估。而且这些标准是“所要分析问题 的核心所在”。由此可见标准在评估中的重要 地位。此 “较早说明评估标准也有助于日后 避免出现选择个人焗好的方案的倾问”。①但是,在现实的政策活动过程中,由于政策涉及直面 广,参与人数众多,政策过程中的变量因素很多,因此难以设定一个统一的,能被绝大多数 学者共同认可的标准。 国内外学者在这个问题上也是各有自己的见解。例如,帕顿和大卫·沙维奇说:“我们 将运用巴尔达奇的类型学方法来组织我们对通常使用的评估标准进行一次回顾。巴尔达奇界 定了对政策设计目标会产生较大影响并会如期发挥作用的四种主要制约因素:技术可行性、 政治可行性、经济和财政可能性以及行政可操作性。我们相信,大部分的评估标准都可归入 这四种综合类型, 而且分析人员应当在每 类型中为每 个政策问圈确定相关标准。” 威廉·N·邓恩在其所著的《公共政策分析导轮》一书中,将评估标准分为七类,分别是: 效果、效率、充足性、公平性、回应性和话宜性。 台湾学者林水波、张世贤认为,评价标准大致右八个方面:第一,投入工作量。在 策执行过程中所投入的各项资源的质与量以及分配状况:第 绩效。依据具体明确的目 分析政策对客观事物与政策环境所造成的实际影响。绩效既包括政策推动的结果,又含有民 众心目中认定的满意程度:第三,效率。投入工作量与结效之间的比例关系:第四,充足性。 满足人们需求、价值或机会的有效程度,反映了绩效的高低:第五,公平性。政策所投入的 工作量,以及产生的绩效在社会不同群体间公平分配的程度。政策的类型不一样,所反映的 公平性的角度与观点也不一样:第六,适当性。政策目标和所表现的价值偏好,以及所依据 的该假设是否合适。第七,执行力。探求影响政策成败的原因,进而导致因果模型性的构建。 第八,社会发展总指标。对社会状态与发展的数量描述与分析。既反映过去的动向,又可作 为社会现状的说明,其特征是以描述性指标为主。 张国庆在《现代公共政策导论》一书中,从一个较独特的视角提出了评估的首要标准和 [澳做文·E:休斯公共管理导论(第2版)北京: 中人民大学出版社 200 e、2 中人民大学 华夏出版社,2001 02
3 部评估各有其利弊,因此,在实践中,应把内、外评估结合起来,取长补短。 3.事前评估、执行评估和事后评估 从政策评估在政策过程所处的阶段来看,政策评估又可分为事前评估、执行评估和事后 评估。事前评估是在政策执行之前进行的一种带有预测性质的评估。事前评估的内容包含三 方面:对政策实施对象发展趋势的预测,政策可行性的评估, 对政策效果进行评估。 执行评 估就是对在执行过程中的政策实施情况的评估, 就是具体分析政策在实际执行过程中的情 况,以确认政策是否得到严格地贯彻执行。事后评估是政策执行完成后对政策效果的评估, 旨在鉴定人们执行的政策对所确认问题确定达到的解决程度和影响程度,辨识政策效果成 因,以求通过优化政策运行机制的方式,强化和扩大政策效果的一种行为。它在政策执行完 成以后发生,是最主要的一种评估方式。 三、政策评估的标准 政策的评估过程是一种紧紧围绕着政策效果而展开的活动。为了弄清楚一项政策的效果 究竟是好是坏,是否实现了预期的目标,就必须首先建立一套评估的标准,即进行价值判断 的尺度。没有标准将无法对一项政策进行正确客观的评估。而且这些标准是“所要分析问题 的核心所在”。由此可见标准在评估中的重要地位。此外,“较早说明评估标准也有助于日后 避免出现选择个人偏好的方案的倾向”。①但是,在现实的政策活动过程中,由于政策涉及面 广,参与人数众多,政策过程中的变量因素很多,因此难以设定一个统一的,能被绝大多数 学者共同认可的标准。 国内外学者在这个问题上也是各有自己的见解。例如,帕顿和大卫·沙维奇说:“我们 将运用巴尔达奇的类型学方法来组织我们对通常使用的评估标准进行一次回顾。巴尔达奇界 定了对政策设计目标会产生较大影响并会如期发挥作用的四种主要制约因素:技术可行性、 政治可行性、经济和财政可能性以及行政可操作性。我们相信,大部分的评估标准都可归入 这四种综合类型,而且分析人员应当在每一种类型中为每一个政策问题确定相关标准。”② 威廉·N·邓恩③在其所著的《公共政策分析导轮》一书中,将评估标准分为七类,分别是: 效果、效率、充足性、公平性、回应性和适宜性。 台湾学者林水波、张世贤④认为,评价标准大致有八个方面:第一,投入工作量。在政 策执行过程中所投入的各项资源的质与量以及分配状况;第二,绩效。依据具体明确的目标, 分析政策对客观事物与政策环境所造成的实际影响。绩效既包括政策推动的结果,又含有民 众心目中认定的满意程度;第三,效率。投入工作量与绩效之间的比例关系;第四,充足性。 满足人们需求、价值或机会的有效程度,反映了绩效的高低;第五,公平性。政策所投入的 工作量,以及产生的绩效在社会不同群体间公平分配的程度。政策的类型不一样,所反映的 公平性的角度与观点也不一样;第六,适当性。政策目标和所表现的价值偏好,以及所依据 的该假设是否合适。第七,执行力。探求影响政策成败的原因,进而导致因果模型性的构建。 第八,社会发展总指标。对社会状态与发展的数量描述与分析。既反映过去的动向,又可作 为社会现状的说明,其特征是以描述性指标为主。 张国庆在《现代公共政策导论》一书中,从一个较独特的视角提出了评估的首要标准和 ① [澳]欧文·E·休斯.公共管理导论(第 2 版).北京:中国人民大学出版社,2001: ② [美]卡尔·帕顿,大卫·沙维奇:《公共政策分析和规划的初步方法》(第 2 版).北京:华夏出版社,2001: ③ [美]威廉·N·邓恩.公共政策分析导论(第 2 版).北京:中国人民大学出版社,2002: ④ 林水波,张世贤.公共政策.台北:五南图书出版公司,1982:
次要标准的概今。他认为,对干一顶政管的整体平估是建立在若干单元评估基础上的。所以 他把用于整体评估的标准称为首要标准,把用于单元评估的标准称为次要标准。在这个意义 上,他得出的结论是:总量评估和首要标准是自变量,而单元评估和次要标准就成了因变量 但他对首要标准和次要标准的具体内容没有进行阐释。这样,他就从立体的角度构建了一个 评估标准的架构。①台湾学者朱志宏也提出了“次级标准”的概念。 在公共 央策过程 由于客观条件所限,找到最优决策方案是相当困难的,所以,人们 往往退而求其次,在现有条件下,选定一种较为满意的方案,做出一种“满意决策”。同理 在进行政策评估的实践过程中,要寻求一种近乎完美的、放之四海而皆准的评估标准也是相 当闲难滩的。因为“洗择什么样的评估标准,不权取决干评估日的、评价者,面日还决定干浮 价的技术与方法”。因此 在大多数的情况下,人们在评估实践中所依据的也仅仅是一种在 此时此地较为满意的评估标准。 我们认为,一般而言,政策评估有如下五个标准:生产力标准、效益标准、效率标准、 公正标淮和政策回应度(我们将“政策分析过程各步中常用的方法”一章中对这个问愿加以 讨论)。 四、政策评估的意义 政策评估作为一种对政策的效益、效率、效果及价值进行判断的一种政治行为,是政策 运行过程这一有机链条中的重要一环。但是,长期以来,人们只顾无休止地制定、颁布这样 或那样的政策, 对政策的效果如何,所知甚少,缺乏关心。这种只问耕耘,不问收获的态度 固然有体制的原因,但是也与人缺乏对政策评估重要性认识有密切关系。事实上,政策评估 对于改进政策制定系统,克服政策运行中的弊端和障碍,增强政策的活力和效益,提高政策 水平具有重要作用,意义深远。概括地讲主要表现于以下几个方面: 1. 政策评估是检验政策的效果、效益和效率的基本途径 任何政策,如果投入运行后,就再没有人去做相关的评估反馈工作,那它的效果如何我 们就不得而知。尤其是一项构思精良,经多方论证认定是无懈可击的政策投入运行以后,究 竞有没有达到预期目标,产生预期效果,或产生了哪些非预期的连带的效果,这都需要我们 进行科学的评估工作。 也就是说,评估人员要密切关注政策执行的动向 搜集相 的资料 信总,再加以科学的分析、论证,得出可靠的结论,以确定该项政策是否有好的效果,执行 过程是否效率很高以及其效益所在。比如计划生有这一作为我国基本国策的全国性政策,在 执行过程中,就需要我们密切关注它的发展状况,以便了解该项政策执行的情况。我们可以 通过定期的人口普查以及年度的人口统计资料来确定, 通过实行计划生有政策,我国在几 内少增加多少人口,与原始人口数据进行对比,从而可以判定计划生育政策是否被有效执行 哪些地区执行得较好,哪些地区稍差一些。 2,政策评估是决定改策去向的重要依据 项政策在执行过程中总 呈现出 定的走向。伴随着政策目标实现程度的不断推进 该项政策是应该继续、调整、革新还是终止?这都必须依据一定的客观资料。能够提供这利 客观资料的有效活动,只有政策评估。政策的走向一般分为三种情况:第一,政策继续,即 通过科学的评估,发现该政策所指向的问题还未得到解决,其政策环境也没有发生大的变化 基于这种情况,还适宜用原来的政策继续指导这个问题的解决。如上面我们提到的计划生有 政策,目前我国通过第五次人口普查,确定该项政策的执行已经取得了显著效果,但我国 张庆现代公共致策学号论北:北京大学饭社,197 。陈庆云公共政策分析北京:中国经济出版社,1996:257页 4
4 次要标准的概念。他认为,对于一项政策的整体评估是建立在若干单元评估基础上的。所以, 他把用于整体评估的标准称为首要标准,把用于单元评估的标准称为次要标准。在这个意义 上,他得出的结论是:总量评估和首要标准是自变量,而单元评估和次要标准就成了因变量。 但他对首要标准和次要标准的具体内容没有进行阐释。这样,他就从立体的角度构建了一个 评估标准的架构。①台湾学者朱志宏也提出了“次级标准”的概念。② 在公共决策过程中,由于客观条件所限,找到最优决策方案是相当困难的,所以,人们 往往退而求其次,在现有条件下,选定一种较为满意的方案,做出一种“满意决策”。同理, 在进行政策评估的实践过程中,要寻求一种近乎完美的、放之四海而皆准的评估标准也是相 当困难的。因为“选择什么样的评估标准,不仅取决于评估目的、评价者,而且还决定于评 价的技术与方法”。③因此,在大多数的情况下,人们在评估实践中所依据的也仅仅是一种在 此时此地较为满意的评估标准。 我们认为,一般而言,政策评估有如下五个标准:生产力标准、效益标准、效率标准、 公正标准和政策回应度(我们将“政策分析过程各步中常用的方法”一章中对这个问题加以 讨论)。 四、政策评估的意义 政策评估作为一种对政策的效益、效率、效果及价值进行判断的一种政治行为,是政策 运行过程这一有机链条中的重要一环。但是,长期以来,人们只顾无休止地制定、颁布这样 或那样的政策,对政策的效果如何,所知甚少,缺乏关心。这种只问耕耘,不问收获的态度 固然有体制的原因,但是也与人缺乏对政策评估重要性认识有密切关系。事实上,政策评估 对于改进政策制定系统,克服政策运行中的弊端和障碍,增强政策的活力和效益,提高政策 水平具有重要作用,意义深远。概括地讲主要表现于以下几个方面: 1.政策评估是检验政策的效果、效益和效率的基本途径 任何政策,如果投入运行后,就再没有人去做相关的评估反馈工作,那它的效果如何我 们就不得而知。尤其是一项构思精良,经多方论证认定是无懈可击的政策投入运行以后,究 竟有没有达到预期目标,产生预期效果,或产生了哪些非预期的连带的效果,这都需要我们 进行科学的评估工作。也就是说,评估人员要密切关注政策执行的动向,搜集相关的资料和 信息,再加以科学的分析、论证,得出可靠的结论,以确定该项政策是否有好的效果,执行 过程是否效率很高以及其效益所在。比如计划生育这一作为我国基本国策的全国性政策,在 执行过程中,就需要我们密切关注它的发展状况,以便了解该项政策执行的情况。我们可以 通过定期的人口普查以及年度的人口统计资料来确定,通过实行计划生育政策,我国在几年 内少增加多少人口,与原始人口数据进行对比,从而可以判定计划生育政策是否被有效执行, 哪些地区执行得较好,哪些地区稍差一些。 2.政策评估是决定政策去向的重要依据 一项政策在执行过程中总会呈现出一定的走向。伴随着政策目标实现程度的不断推进, 该项政策是应该继续、调整、革新还是终止?这都必须依据一定的客观资料。能够提供这种 客观资料的有效活动,只有政策评估。政策的走向一般分为三种情况:第一,政策继续,即 通过科学的评估,发现该政策所指向的问题还未得到解决,其政策环境也没有发生大的变化。 基于这种情况,还适宜用原来的政策继续指导这个问题的解决。如上面我们提到的计划生育 政策,目前我国通过第五次人口普查,确定该项政策的执行已经取得了显著效果,但我国人 ① 张国庆.现代公共政策学导论.北京:北京大学出版社,1997: ② 朱志宏.公共政策.台北:三民书局,1995:299 页. ③ 陈庆云.公共政策分析.北京:中国经济出版社,1996:257 页
口彩,基数大,所以要继续执行该项政箭。第二,政策调整,或称政策革新。如果一项政第 在执行过程中,遇到了新情况、新变化,原来的政策己明显不适应新的政策情况,那我们必 须对原有政策进行调整或者革新,以适应新变化,更好地实现政策目标。第三,政策终结 也就是完全终止原来的政策。政策终结分为两种情况:一种是改策目标己经实现,原有政第 的存在已经没有意义,完成了一个政策周期,自然终结:另一种情况是政策环境或问题本身 发生了非常大的变化,原有政策己明显不能解决问题,甚至会使问题变得更为严重,而且通 过调整已无济于事,这时就需要终结旧政策,代之以新的,更为有效的政策。为了避免终 旧政策带来的混乱,最好旧政策的终结与新政策的出台能够同步。由此可见,无论是改策的 殊续、调整还是终结,都必须建立在科学、系统、全面的政策评估基础上。 3.政策评估是合理配置资源的有效手段 在政策实践中 政府的政策资源是有限的,但政府部门却要同时执行多项政策,如经济 政策、政治政策、环境政策、教有政策等等。那么,究竞哪项政策该投入多少政策资源,也 就是说政策资源要怎样配置才最为合理呢?这就体现出了评估的重要意义。只有通过政策评 估,才能确认每项政策的价值,并决定投入各项政策的资源的优先顺序和比例,以寻求最佳 的整体效果,以便有效推动政府各个方面的活动。同时,通过政策评估,也可以对照以往的 政策资源分配情况,看其是否合理,总结经验,吸取教训,使政策活动优质高效进行。 4.政策评估是公共决策科学化、民主化的必由之路 在现代社会,国家管理活动中重要的一环就是政府利用政策来调整、组织社会生产和社 会生活。随着社会的发展,各种新情况和新变化层出不穷 单靠传统的经验来决策已经日益 应付不了复杂的决策间题。实践证明,经验决策必须向科学决策转变:而政策评估正是使决 策迈向科学化的必由之路。通过政策评估,不仅可以检验政策的效果、效益和效率,更合理 地配置政策资源,形成一种优先顺序和比例,而且可以与时俱进,随时抓住情况的变化,对 政策做出继续、调整或终止的决定。从另 一个角度来看,通过评估得出的结论体现了科学性 为下一步的民主决策奠定了坚实的基础。因此,政策评估对于公共决策的科学化民主化是不 可或缺的。 第二节政策评估的过程和模式 政策评估是一种有计划、按步骤进行的活动,是一个有规律可循的系统过程。虽然评估 活动步骤会因为评估类型的不同而不尽相同。但是,只要是正规的、科学的政策评估,一般 都要经过准备、实施和结束三个阶段。 一、政策评估过程的三个阶段 1.准备阶段 作为一项复杂的、系统的工作,政策评估在实施以前必须进行周密的组织准备工作,这 是评估工作的基础和起点,也是评估政策得于顺利进行和卓有成效的前提条件。组织准备日 较充分,才能保证评估工作有计划、按步骤展开实施,避免评估工作首目性。组织准备阶段 的主要任务包括: 不容易。同时,并不是任何政策在任何时候都可以而且有必要进行评估。比如,某些政策仅 具有象征性意义或者尚未完全发生作用,评估的时机尚未成熟,则暂时没有必要进行评估。 因此,根据理论研究与实际工作需要,遵循有效性与可行性相结合的原则精选评估对象(特 5
5 口多,基数大,所以要继续执行该项政策。第二,政策调整,或称政策革新。如果一项政策 在执行过程中,遇到了新情况、新变化,原来的政策已明显不适应新的政策情况,那我们必 须对原有政策进行调整或者革新,以适应新变化,更好地实现政策目标。第三,政策终结, 也就是完全终止原来的政策。政策终结分为两种情况:一种是政策目标已经实现,原有政策 的存在已经没有意义,完成了一个政策周期,自然终结;另一种情况是政策环境或问题本身 发生了非常大的变化,原有政策已明显不能解决问题,甚至会使问题变得更为严重,而且通 过调整已无济于事,这时就需要终结旧政策,代之以新的,更为有效的政策。为了避免终结 旧政策带来的混乱,最好旧政策的终结与新政策的出台能够同步。由此可见,无论是政策的 继续、调整还是终结,都必须建立在科学、系统、全面的政策评估基础上。 3.政策评估是合理配置资源的有效手段 在政策实践中,政府的政策资源是有限的,但政府部门却要同时执行多项政策,如经济 政策、政治政策、环境政策、教育政策等等。那么,究竟哪项政策该投入多少政策资源,也 就是说政策资源要怎样配置才最为合理呢?这就体现出了评估的重要意义。只有通过政策评 估,才能确认每项政策的价值,并决定投入各项政策的资源的优先顺序和比例,以寻求最佳 的整体效果,以便有效推动政府各个方面的活动。同时,通过政策评估,也可以对照以往的 政策资源分配情况,看其是否合理,总结经验,吸取教训,使政策活动优质高效进行。 4.政策评估是公共决策科学化、民主化的必由之路 在现代社会,国家管理活动中重要的一环就是政府利用政策来调整、组织社会生产和社 会生活。随着社会的发展,各种新情况和新变化层出不穷,单靠传统的经验来决策已经日益 应付不了复杂的决策问题。实践证明,经验决策必须向科学决策转变;而政策评估正是使决 策迈向科学化的必由之路。通过政策评估,不仅可以检验政策的效果、效益和效率,更合理 地配置政策资源,形成一种优先顺序和比例,而且可以与时俱进,随时抓住情况的变化,对 政策做出继续、调整或终止的决定。从另一个角度来看,通过评估得出的结论体现了科学性, 为下一步的民主决策奠定了坚实的基础。因此,政策评估对于公共决策的科学化民主化是不 可或缺的。 第二节 政策评估的过程和模式 政策评估是一种有计划、按步骤进行的活动,是一个有规律可循的系统过程。虽然评估 活动步骤会因为评估类型的不同而不尽相同。但是,只要是正规的、科学的政策评估,一般 都要经过准备、实施和结束三个阶段。 一、政策评估过程的三个阶段 1.准备阶段 作为一项复杂的、系统的工作,政策评估在实施以前必须进行周密的组织准备工作,这 是评估工作的基础和起点,也是评估政策得于顺利进行和卓有成效的前提条件。组织准备比 较充分,才能保证评估工作有计划、按步骤展开实施,避免评估工作盲目性。组织准备阶段 的主要任务包括: (1)确定评估对象。确定评估对象实质上是解决评估什么的问题。政策具有相关性, 某一结果的产生往往是多项政策共同作用的产物,要清楚地划出一项政策作用范围的边界并 不容易。同时,并不是任何政策在任何时候都可以而且有必要进行评估。比如,某些政策仅 具有象征性意义或者尚未完全发生作用,评估的时机尚未成熟,则暂时没有必要进行评估。 因此,根据理论研究与实际工作需要,遵循有效性与可行性相结合的原则精选评估对象(特
别是那些比较成熟的、政策效果与环境变化之因果关系比较明显己评估结论比较有推广价值 的政策)》 才能是评估收到最佳效果。 (2)制定评估方案。这是政策评估准备阶段最为重要的一项工作。评估方案是评估实 施的依据和内容,评估方案设计的合理程度直接关系到评估质量高低和评估活动的成败。评 估方案必须以书面的形式系统、详细地说明以下内容:第一,阐述评估对象,明确指出评由 什么:第二,明确评估的目的 、意义和要求。评估目的决定评估的基本方向,解决的是为什 么进行评估的问题:第三,确定评估标准。事实分析和价值分析以及它们的有机结合是评估 标准的基本内容,①评估标准通常体现为评估指标体系,它决定评估类型和评估方法:第四, 提出评估的基本设想,根据评估目标确定评估的内容、范围,制定出评估方案:第五,评估 还要 场日 间和工作进度 人及评估经费的筹措和使用等问题 简言 评估方案应将评估的五个基本要素,即评估者(主体)、评估对象(客体)、评估目的(出发 点)、评估标准(准则)和评估方法(手段)都包括在内,使它们共同构成一个完整的政策 评估系统。 (3)挑选和培训人员。评估的过程实际上是一种理论研究过程,它对评估人员的理论 素养要求很高。换句话说,评估人员自身素质和理论水平将直接影响评估的质量。因此,必 须选择适当的评估人员,提高他们的理论分析水平和实际操作能力,构建具有较高水准的评 估队伍。 2.实施阶段 实施评估是整个政策评估活动中最为重要的阶段,实施评估工作的好坏于评估活动的成 败紧密相关。实施评估阶段关键是一些具体调查方法和评估方法的运用,该阶段的主要任务 有: (1)利用各种调查手段,全面收集政策制定、政策执行、政策影响和政策效益等方面 的信息。信息是政策评估的基础,评估政策的过程其实也是收集信息、处理信息的过程。为 了保证所获信息具有全面性、系统性和准确性,需要综合采用各种科学方法来收集信息,常 用的方法有:观察法:查阅资料法:调查发:个案法:实验法等。 (2)综合分析政策信息。就是要在收集信息的基础上对那些有关政策的原始数据和信 息资料进行系统的整理、归类、统计和分析 (3)综合运用适合的评估方法,对政策进行评估,得出评估结论。在实施评估的过程 中,评估者应该坚持评估材料的完整性和具体分析的科学性两个原则,客观、公正地反映出 政策的实际效果。 3. 结束阶段 结束阶段是处理评估结果、撰写评估报告的阶段。政策评估离不开价值判断,个人的价 值判断受客观条件和一些非理性因素的影响,难免有疏漏。因此,当我们收集评估信总,得 出评估后,还必须善加处理。首先,要自我检验统计分析评估信息所得出的结果的可信度和 有效度。其次,让评估结论与政策设计者、决策者 执行者 参与者会面 以便发挥评估的 诊断、监督、反馈、完善和开发功能,提高政策的科学性。为此,必须做好两个方面的工作 撰写评估报告和总结评估。结束阶段政策评估者须形成书面形式的评估报告,提交给有关领 导和实际部门,使之了解一项政策实施的最终情形,及时根据情形决定政策的殊续、修改」 中止等。评估报告除了对政策效果进行客观陈述、对政策进行价值判断、提出政策建议以匀 还应包括对评估过程、评估方法和评估中一些重要问题进行必要说明,对评估工作的优缺点 进行总结,为提高今后政策活动水平服务。此外,结束阶段还要注意妥善处理决策者与评估 者之间的分歧,实现决策者与评估者之间对评估报告的最大限度的协调。 ①参见陈庆云.公共政策分析.北京:中国经济出版社,1996:262页
6 别是那些比较成熟的、政策效果与环境变化之因果关系比较明显己评估结论比较有推广价值 的政策),才能是评估收到最佳效果。 (2)制定评估方案。这是政策评估准备阶段最为重要的一项工作。评估方案是评估实 施的依据和内容,评估方案设计的合理程度直接关系到评估质量高低和评估活动的成败。评 估方案必须以书面的形式系统、详细地说明以下内容:第一,阐述评估对象,明确指出评估 什么;第二,明确评估的目的、意义和要求。评估目的决定评估的基本方向,解决的是为什 么进行评估的问题;第三,确定评估标准。事实分析和价值分析以及它们的有机结合是评估 标准的基本内容,①评估标准通常体现为评估指标体系,它决定评估类型和评估方法;第四, 提出评估的基本设想,根据评估目标确定评估的内容、范围,制定出评估方案;第五,评估 方案还要说明评估的场所、时间和工作进度,以及评估经费的筹措和使用等问题。简言之, 评估方案应将评估的五个基本要素,即评估者(主体)、评估对象(客体)、评估目的(出发 点)、评估标准(准则)和评估方法(手段)都包括在内,使它们共同构成一个完整的政策 评估系统。 (3)挑选和培训人员。评估的过程实际上是一种理论研究过程,它对评估人员的理论 素养要求很高。换句话说,评估人员自身素质和理论水平将直接影响评估的质量。因此,必 须选择适当的评估人员,提高他们的理论分析水平和实际操作能力,构建具有较高水准的评 估队伍。 2.实施阶段 实施评估是整个政策评估活动中最为重要的阶段,实施评估工作的好坏于评估活动的成 败紧密相关。实施评估阶段关键是一些具体调查方法和评估方法的运用,该阶段的主要任务 有: (1)利用各种调查手段,全面收集政策制定、政策执行、政策影响和政策效益等方面 的信息。信息是政策评估的基础,评估政策的过程其实也是收集信息、处理信息的过程。为 了保证所获信息具有全面性、系统性和准确性,需要综合采用各种科学方法来收集信息,常 用的方法有:观察法;查阅资料法;调查发;个案法;实验法等。 (2)综合分析政策信息。就是要在收集信息的基础上对那些有关政策的原始数据和信 息资料进行系统的整理、归类、统计和分析。 (3)综合运用适合的评估方法,对政策进行评估,得出评估结论。在实施评估的过程 中,评估者应该坚持评估材料的完整性和具体分析的科学性两个原则,客观、公正地反映出 政策的实际效果。 3.结束阶段 结束阶段是处理评估结果、撰写评估报告的阶段。政策评估离不开价值判断,个人的价 值判断受客观条件和一些非理性因素的影响,难免有疏漏。因此,当我们收集评估信息,得 出评估后,还必须善加处理。首先,要自我检验统计分析评估信息所得出的结果的可信度和 有效度。其次,让评估结论与政策设计者、决策者、执行者、参与者会面,以便发挥评估的 诊断、监督、反馈、完善和开发功能,提高政策的科学性。为此,必须做好两个方面的工作: 撰写评估报告和总结评估。结束阶段政策评估者须形成书面形式的评估报告,提交给有关领 导和实际部门,使之了解一项政策实施的最终情形,及时根据情形决定政策的继续、修改、 中止等。评估报告除了对政策效果进行客观陈述、对政策进行价值判断、提出政策建议以外, 还应包括对评估过程、评估方法和评估中一些重要问题进行必要说明,对评估工作的优缺点 进行总结,为提高今后政策活动水平服务。此外,结束阶段还要注意妥善处理决策者与评估 者之间的分歧,实现决策者与评估者之间对评估报告的最大限度的协调。 ① 参见陈庆云.公共政策分析.北京:中国经济出版社,1996:262 页
二、政策评估的八种模式@ 在西方政策评估实践中,有各种各样的模式。如何对这些模式进行分类,这是政策评估 学者一直研究的问题。有些学者,如古巴(Guba)和林肯(Lincoln),提出以“组织者” (organiz2er)作为焦点来进行分类。通常,所选择的价值标准就是评估的“组织者”,这样 根据“组织者”的不同就形成不同的评估模式(evaluation model)。以古巴和林肯的观点为 基础,德国学者韦唐(Evert Vedung)在《公共政策和项目评估》(1997)一书中,从社会科 学更广阔的视角出发,赋予了“组织者”更抽象的含义,从而提出了一个关于政策评估模式 的系统分类框架。 韦唐博士从政府干预的实质结果入手,按“组织者”的不同将评估模式分为三大类:效 果模式(effectiveness models)、经济模式(economic models)、和职业化模式(professional mods)。“效果模式由一个相当大的、各不相同的团体组成。除了传统的目标达成评估 (goal-attainment evaluation)外,效果模式还包括附带效果模式(side-effects evaluation)、 无目标评估(goal-)、综合评估()、顾客导向评估 (client-oriented evaluation)和利益相关者模式(stakeholder model).”经济模式与效果模式 的不同在于前者总是关心成本,而后者是忽略成本的。经济模式的两个基本变种是生产率模 式(productivity model)和效率模式(efficiency model)。职业化模式并不直截了当地关心评 估的内容,因为它把重点放在了执行评估的人身上。最著名的职业化模式是同行评议模式 (peer review model),用这种方法,举个例子来说,就是教授评估教授、工程师评估工程师 外科医生评估外科医生。按照韦唐的概括,政策评估模式的分类如下图所示: 目标达成模式 目标 附带效果模式 效果模式 结果一无目标评估檬式 系统单元一综合评估模式 顾客的关心一顾客导向模式 利益相关者的关心等 利益相关者模式(北美) 评估模式 政策委员会(瑞典) 生产率模式一生产率模式 经济模式 「成本一利益分析 、效率模式 成本一效能分析 职业化模式一同行评议 图1政策深估模式的分类 1.目标达成模式 >
7 二、政策评估的八种模式① 在西方政策评估实践中,有各种各样的模式。如何对这些模式进行分类,这是政策评估 学者一直研究的问题。有些学者,如古巴(Guba)和林肯(Lincoln),提出以“组织者” (organizer)作为焦点来进行分类。通常,所选择的价值标准就是评估的“组织者”,这样 根据“组织者”的不同就形成不同的评估模式(evaluation model)。以古巴和林肯的观点为 基础,德国学者韦唐(Evert Vedung)在《公共政策和项目评估》(1997)一书中,从社会科 学更广阔的视角出发,赋予了“组织者”更抽象的含义,从而提出了一个关于政策评估模式 的系统分类框架。 韦唐博士从政府干预的实质结果入手,按“组织者”的不同将评估模式分为三大类:效 果模式(effectiveness models)、经济模式(economic models)、和职业化模式(professional models)。“效果模式由一个相当大的、各不相同的团体组成。除了传统的目标达成评估 (goal-attainment evaluation)外,效果模式还包括附带效果模式(side-effects evaluation)、 无目标评估(goal-free evaluation)、综合评估(comprehensive evaluation)、顾客导向评估 (client-oriented evaluation)和利益相关者模式(stakeholder model)。”经济模式与效果模式 的不同在于前者总是关心成本,而后者是忽略成本的。经济模式的两个基本变种是生产率模 式(productivity model)和效率模式(efficiency model)。职业化模式并不直截了当地关心评 估的内容,因为它把重点放在了执行评估的人身上。最著名的职业化模式是同行评议模式 (peer review model),用这种方法,举个例子来说,就是教授评估教授、工程师评估工程师、 外科医生评估外科医生。按照韦唐的概括,政策评估模式的分类如下图所示: 图 1 政策评估模式的分类 1.目标达成模式 ①本节主要资料来源:Evert Vedung, Public Policy and Program Evaluation. New Brunswick and London: Transaction Publishers,1997,pp.35—92. 评估模式 效果模式 经济模式 职业化模式-同行评议 目标达成模式 附带效果模式 目标 结果—无目标评估模式 系统单元—综合评估模式 顾客的关心—顾客导向模式 利益相关者的关心等 利益相关者模式(北美) 政策委员会(瑞典) 效率模式 成本-利益分析 成本-效能分析 生产率模式-生产率模式
目标达成模式是探讨评估问题的传统方法,它主要由两部分组成:(1)目标达成评价。 关注的是结果与由政策(项目)目标是否一致:(2)影响评价。关注的是结果是不是由政策 (项目)所造成。应用目标达成模式要按三个步骤进行:第一,明确政策(项目)目标政策 (目标)及它们的真正含义,并将它们按重要程度加以排序,再把它们转变成可以测量的客 体:第二,测定这些预定目标实际上可在多大程度上实现:第三,弄清楚政策(项目)促使 或阻碍目标实现的程度。可见,该模式是以预定的政策(目标)作为评估的标准和组织者, 评估的主要任务是判断预定的政策(项目)目标是否已经实现,以及项目在多大程度上有利 于目标的实现。 同任何方法一样,目标达成模式有它无可替代的优点,也有它鲜明的缺陷。韦唐对此作 了具体的阐述。在韦唐看来,存在三个主要理由去推崇目标达成评估:一是体现了民主。目 标达成模式是以预定的政府政策目标作为评估的组织者,政府预定的政策目标是公开而法定 地被人民代表在政治议会上所采纳,体现了政治过程中的民主。同时,政治目标是在责任成 之下制定的,政治官员在制定目标时会更多地考虑民众利益和可利用的资源。二是提供客观 的评估标准。目标达成模式以既定的政策(目标)作为组织者,以项目目标来判断项目结果 所以可以避免评估者在评估项目的价值问题上持个人的主观标准。三是具有简单性。这个模 式只包含两个主要的问题,即结果是否与目标一致?结果是否由政策(项目)所引起? 韦唐认为,目标达成模式的缺路表现在五个方面:第一,忽略了成本。政策过程中需圆 投入大量的人力、财力、物力和时间等各种资源,这些资源在目标达成模式中完全被忽略了。 第二,在目标不清的情况下难以运用。而政策目标的不确定性又是政策分析中常常碰到的问 题。第三,不考虑意料之外的结果。目标达成评估只考虑预定的项目目标的结果,而忽视那 些偶然发现的结果或意料之外的结果,这是片面的做法。第四,忽视了公共政策制定中的隐 秘议程的作用。目标达成评估将官方宣布的、表面的预定目标作为评估的“组织者”,而忽 视政治游戏现实中的一些重要东西。比如,官方宜布的目标可能仅有象征性意义,并不打算 真正去实现。在这种情况下,目标达成评估往往是无效的。第五,忽视实施过程。目标达成 模式只关心项目结果,而实施过程则被看作是一个黑箱。 2.附带效果模式 附带效果模式正好解决了目标达成模式的“困境”,即关注非预期的、预料之外的政策 效果。附带效果是指项目目标范围之外的影响,与主要效果 一政策制定者有意识地想要得 到的主要实质性影响一一相区别。附带效果模式的特征是预定目标仍然是基本的“组织者” 但是要充分考虑到附带效果的存在。 要认识附带效果,应该把它政策活动中可能出现的反常效果和零效果相区别。反常效果 是指产生的与预期目标完全相反的结果:零效果是指政策在目标范围内没有产生任何影响: 反常效果和零效果都是产生在目标范围之内,而附带效果则是产生在目标范围之外。 在人们的印象中,附带效果似乎带有贬义,但它并非总是有害的,也可能是有利的。附 带效果可以是预期的,也可能是非预期的。一些政策分析家甚至认为大部分政策效果在决策 做出时是非预期的。附带效果不管是否有利,都是综合评价政策活动的关键因素,因此必须 受到重视。项目可能产生副产品,副产品反过来组成或产生新问题,从而又产生新的政策(项
8 目标达成模式是探讨评估问题的传统方法,它主要由两部分组成:(1)目标达成评价。 关注的是结果与由政策(项目)目标是否一致;(2)影响评价。关注的是结果是不是由政策 (项目)所造成。应用目标达成模式要按三个步骤进行:第一,明确政策(项目)目标政策 (目标)及它们的真正含义,并将它们按重要程度加以排序,再把它们转变成可以测量的客 体;第二,测定这些预定目标实际上可在多大程度上实现;第三,弄清楚政策(项目)促使 或阻碍目标实现的程度。可见,该模式是以预定的政策(目标)作为评估的标准和组织者, 评估的主要任务是判断预定的政策(项目)目标是否已经实现,以及项目在多大程度上有利 于目标的实现。 同任何方法一样,目标达成模式有它无可替代的优点,也有它鲜明的缺陷。韦唐对此作 了具体的阐述。在韦唐看来,存在三个主要理由去推崇目标达成评估:一是体现了民主。目 标达成模式是以预定的政府政策目标作为评估的组织者,政府预定的政策目标是公开而法定 地被人民代表在政治议会上所采纳,体现了政治过程中的民主。同时,政治目标是在责任感 之下制定的,政治官员在制定目标时会更多地考虑民众利益和可利用的资源。二是提供客观 的评估标准。目标达成模式以既定的政策(目标)作为组织者,以项目目标来判断项目结果, 所以可以避免评估者在评估项目的价值问题上持个人的主观标准。三是具有简单性。这个模 式只包含两个主要的问题,即结果是否与目标一致?结果是否由政策(项目)所引起? 韦唐认为,目标达成模式的缺陷表现在五个方面:第一,忽略了成本。政策过程中需要 投入大量的人力、财力、物力和时间等各种资源,这些资源在目标达成模式中完全被忽略了。 第二,在目标不清的情况下难以运用。而政策目标的不确定性又是政策分析中常常碰到的问 题。第三,不考虑意料之外的结果。目标达成评估只考虑预定的项目目标的结果,而忽视那 些偶然发现的结果或意料之外的结果,这是片面的做法。第四,忽视了公共政策制定中的隐 秘议程的作用。目标达成评估将官方宣布的、表面的预定目标作为评估的“组织者”,而忽 视政治游戏现实中的一些重要东西。比如,官方宣布的目标可能仅有象征性意义,并不打算 真正去实现。在这种情况下,目标达成评估往往是无效的。第五,忽视实施过程。目标达成 模式只关心项目结果,而实施过程则被看作是一个黑箱。 2.附带效果模式 附带效果模式正好解决了目标达成模式的“困境”,即关注非预期的、预料之外的政策 效果。附带效果是指项目目标范围之外的影响,与主要效果——政策制定者有意识地想要得 到的主要实质性影响——相区别。附带效果模式的特征是预定目标仍然是基本的“组织者”, 但是要充分考虑到附带效果的存在。 要认识附带效果,应该把它政策活动中可能出现的反常效果和零效果相区别。反常效果 是指产生的与预期目标完全相反的结果;零效果是指政策在目标范围内没有产生任何影响; 反常效果和零效果都是产生在目标范围之内,而附带效果则是产生在目标范围之外。 在人们的印象中,附带效果似乎带有贬义,但它并非总是有害的,也可能是有利的。附 带效果可以是预期的,也可能是非预期的。一些政策分析家甚至认为大部分政策效果在决策 做出时是非预期的。附带效果不管是否有利,都是综合评价政策活动的关键因素,因此必须 受到重视。项目可能产生副产品,副产品反过来组成或产生新问题,从而又产生新的政策(项
目)。韦达夫斯基写道:“越开越多的公共政策是关于解决过去政策的结果。”①因此,有关附 带效果的信总对于任何一个政府政策的综合性评价来说都是不容忽视的,不及时发现与及时 解决将可能导致更复杂的问题的出现。 附带效果评估遭遇的主要挑战是判断价值时应用的什么样标淮。对此,韦唐也没有明确 的分析。但他指出,应勾划出主要效果并由委员们和其他评估的使用者去明确它们的价值, 计算全部价值的方法是将知道的每一个单独附带效果的价值与主要效果价值相加或者相减。 3. 无目标 无目标模式最初是由米歇尔·斯克里文设计出的,他猛烈抨击评估者沉迷于预定的干预 目标,被牵着鼻子走。无目标模式的“组织者”是结果一一不管是计划内还是计划外的结果。 平估者的主要任务是全面观察政策实临,然后找出所有相关的效果。无目标模式对政策效果 持广阔的视角,它帮助评估者全面关注结果 尤其是一些可能被忽视的结果。无目标模式与 政策效果模式的主要区别是:附带效果模式仍然是“基于目标”之上的,同时辅之于对各利 附带效果的考察评估:而无目标模式则完全抛开政策的预定目标和其他事前标准,只分析研 究结果,单纯判断结果的价值。 可见,无目标模式是针对目标达成模式忽视附带效果,在目标模糊时束手无策的弊端而 提出的。因此,其应用领域也十分广泛。但是,它完全忽视评估标准和预定目标,只依赖 决策者和权力使用者的公正判断,这显然容易导致主观因素的介入,影响评估的客观公正性。 此外,这种模式在实践中还存在难于操作上的闲难。斯克里文认为,项目的效果要和顾客以 及受影响的人们的需要相比较,但评估者如何查明需求呢?从方法论上来说,找出需要比描 述结果更困难 4.综合模式 综合模式的评估范围比目标达成模式广泛得多。该模式认为,评估不应只局限在已得到 的结果上,而至少应包括执行,甚至还包括计划。综合模式与目标达成模式的主要区别在于 目标达成模式关心的是预定的和实际的结果是否相符,而综合模式除了关心结果,也包括判 断政府干预的计划、决策和执行阶段。 从系统论的观占看,公共政箭可分为“投入”、“转换”和“产出”二个阶段。综合模式 准和判断。整个干预过程被分成了12个单元,如表1所示: 描述. ①意图(目标是什么样的,希望得到什么样的效果 投入阶段 ②观察(发生在这一阶段的活动的相关数据:对现状的描述 判断: 标准(作为比较基础而使用的价值准侧) 判断(比较意图、观察和标准的过程 描述: ①意图(项目如它所计划的那样执行吗) ②理察(实际的执行和项目交付) 判断 ①标准(作为比较基础面使用的价值准则 ②判断(比较意图、观察和标准的过程)
9 目)。韦达夫斯基写道:“越开越多的公共政策是关于解决过去政策的结果。”①因此,有关附 带效果的信息对于任何一个政府政策的综合性评价来说都是不容忽视的,不及时发现与及时 解决将可能导致更复杂的问题的出现。 附带效果评估遭遇的主要挑战是判断价值时应用的什么样标准。对此,韦唐也没有明确 的分析。但他指出,应勾划出主要效果并由委员们和其他评估的使用者去明确它们的价值, 计算全部价值的方法是将知道的每一个单独附带效果的价值与主要效果价值相加或者相减。 3.无目标模式 无目标模式最初是由米歇尔·斯克里文设计出的,他猛烈抨击评估者沉迷于预定的干预 目标,被牵着鼻子走。无目标模式的“组织者”是结果——不管是计划内还是计划外的结果。 评估者的主要任务是全面观察政策实施,然后找出所有相关的效果。无目标模式对政策效果 持广阔的视角,它帮助评估者全面关注结果,尤其是一些可能被忽视的结果。无目标模式与 政策效果模式的主要区别是:附带效果模式仍然是“基于目标”之上的,同时辅之于对各种 附带效果的考察评估;而无目标模式则完全抛开政策的预定目标和其他事前标准,只分析研 究结果,单纯判断结果的价值。 可见,无目标模式是针对目标达成模式忽视附带效果,在目标模糊时束手无策的弊端而 提出的。因此,其应用领域也十分广泛。但是,它完全忽视评估标准和预定目标,只依赖于 决策者和权力使用者的公正判断,这显然容易导致主观因素的介入,影响评估的客观公正性。 此外,这种模式在实践中还存在难于操作上的困难。斯克里文认为,项目的效果要和顾客以 及受影响的人们的需要相比较,但评估者如何查明需求呢?从方法论上来说,找出需要比描 述结果更困难。 4.综合模式 综合模式的评估范围比目标达成模式广泛得多。该模式认为,评估不应只局限在已得到 的结果上,而至少应包括执行,甚至还包括计划。综合模式与目标达成模式的主要区别在于 目标达成模式关心的是预定的和实际的结果是否相符,而综合模式除了关心结果,也包括判 断政府干预的计划、决策和执行阶段。 从系统论的观点看,公共政策可分为“投入”、“转换”和“产出”三个阶段。综合模式 又在每个阶段中区分了描述和判断两个范畴。描述范畴又细分为意图和观察;判断则分成标 准和判断。整个干预过程被分成了 12 个单元,如表 1 所示:② 投 入 阶 段 描述: ① 意图(目标是什么样的,希望得到什么样的效果) ② 观察(发生在这一阶段的活动的相关数据;对现状的描述) 判断: 标准(作为比较基础而使用的价值准则) 判断(比较意图、观察和标准的过程) 转 换 阶 段 描述: ① 意图(项目如它所计划的那样执行吗) ② 观察(实际的执行和项目交付) 判断: ① 标准(作为比较基础而使用的价值准则) ② 判断(比较意图、观察和标准的过程) ① See,Evert Vedung, Public Policy and Program Evaluation. p.56. ② Evert Vedung, Public Policy and Program Evaluation. p.64
描述 意图(项目所预期的结果) 产出阶 观察(项目结束后所收集的与实际结果相关的数据】 判断。 ①标准(作为比较基础面使用的价值准则〉 ②判断(比较意图、观察和标准的过程 表1综合课估模式框菜 从表中我们可以看出,综合模式将整个评估活动划分得细致而全面。每一阶段全面而细 致的描述为评估工作提供了丰富的信息。从信息到判断,步步递进,使主观判断建立在客观 描述基础之上。而且,在每个阶段,政策价值的实现都被衡量到了。因此,这种评估模式是 相当完整的。但是,综合檬式也存在一些缺路,加只关注宜方的具体日标,不重视成本等 此外,模式的12个单元的设计在实践中很难理解,也很难操作,因而使综合模式在实际应 用中受到阻碍。 5.顾客导向棋式 顾客导向模式将政策干预对象的目标、期望、关心甚至需要作为评估的组织原则和价值 准则。顾客导向评估的核心是项目是否使项客的关心、需要和期望得到满足 什么是顾客导向?奥斯本和盖特勒在《改革政府》中指出:“顾客导向的政府”向顾客 提供选择,“把各种资源直接交到顾客手中,让他们选择服务的提供者,从而开始让顾客坐 到驾驶的座位上”,并且“为顾客建立后果负责机制”。①可见,顾客导向评估正是基于这样 种观点:公共行政在市场领域为顾客提供物品与服务,顾客表明对服务供应的态度会导致 服务交付的改进和顾客满意度的提高。应用顾客导向评估的关键是定位政策(项目)的顾客 得出顾客对项目的看法。顾客导向模式没有明确规定项目的哪些部分应该被评估,它允许进 行广泛的、多样的评估。价值的多元化是而客导向橙式的一个显菱特征。评估者会要求顾家 对服务的某些方面做出判断和发表看法,而不同的顾客的需要和对公共服务的满意度肯定是 不同的,顾客可以在评估中表达不同的意见,甚至是相互冲突的观点。 顾客导向模式的最大优点在于体现了民主和参与。由顾客根据自己的价值观评估公共服 条,使师客处在主动的位置上,而不是被动地接受服条:而时参与评估,硬客可以对服条的 供应者表达他们的需求和 下满,这必然在一定程度上影响服务供应者,并使之提供更加符合 顾客需要的服务。这种模式也使得评估更容易为政策制定者或服务提供者所使用,并使他们 清楚地了解顾客的需求和不满,从而最终提高公共服务的水平。 至于顾客导向模式的应用领域,韦唐指出:“顾客的价值标准在公共服及务方面的评价 比在受规章限制的政府干预的评估中扮演更占统治地位的角色。”2也就是说,顾客导向评估 主要应用于公共物品和服务的提供领域。但是,顾客的价值标准是以个人利益倾向为准,顾 客个人价值的多元化难于形成对政策总的看法。而且,顾客导向模式要获取顾客的看法和需 要,则要花费很多的时间。因此,顾客导向模式不能成为平估的唯一模式,而只能起补充作 用。 6.利益相关者模式 利益相关者是指所有对政策(项目)的目标和执行感兴趣,并对其具有影响的团体和个 ①美]戴维奥斯本,特德盖布勒著.改革政府一一企业精神如何改革着公营部门.上海:上海译文出版社, Publi Policy and Po
10 产 出 阶 段 描述: 意图(项目所预期的结果) 观察(项目结束后所收集的与实际结果相关的数据) 判断: ① 标准(作为比较基础而使用的价值准则) ② 判断(比较意图、观察和标准的过程) 表 1 综合评估模式框架 从表中我们可以看出,综合模式将整个评估活动划分得细致而全面。每一阶段全面而细 致的描述为评估工作提供了丰富的信息。从信息到判断,步步递进,使主观判断建立在客观 描述基础之上。而且,在每个阶段,政策价值的实现都被衡量到了。因此,这种评估模式是 相当完整的。但是,综合模式也存在一些缺陷,如只关注官方的具体目标,不重视成本等。 此外,模式的 12 个单元的设计在实践中很难理解,也很难操作,因而使综合模式在实际应 用中受到阻碍。 5.顾客导向模式 顾客导向模式将政策干预对象的目标、期望、关心甚至需要作为评估的组织原则和价值 准则。顾客导向评估的核心是项目是否使顾客的关心、需要和期望得到满足。 什么是顾客导向?奥斯本和盖特勒在《改革政府》中指出:“顾客导向的政府”向顾客 提供选择,“把各种资源直接交到顾客手中,让他们选择服务的提供者,从而开始让顾客坐 到驾驶的座位上”,并且“为顾客建立后果负责机制”。①可见,顾客导向评估正是基于这样 一种观点:公共行政在市场领域为顾客提供物品与服务,顾客表明对服务供应的态度会导致 服务交付的改进和顾客满意度的提高。应用顾客导向评估的关键是定位政策(项目)的顾客, 得出顾客对项目的看法。顾客导向模式没有明确规定项目的哪些部分应该被评估,它允许进 行广泛的、多样的评估。价值的多元化是顾客导向模式的一个显著特征。评估者会要求顾客 对服务的某些方面做出判断和发表看法,而不同的顾客的需要和对公共服务的满意度肯定是 不同的,顾客可以在评估中表达不同的意见,甚至是相互冲突的观点。 顾客导向模式的最大优点在于体现了民主和参与。由顾客根据自己的价值观评估公共服 务,使顾客处在主动的位置上,而不是被动地接受服务;通过参与评估,顾客可以对服务的 供应者表达他们的需求和不满,这必然在一定程度上影响服务供应者,并使之提供更加符合 顾客需要的服务。这种模式也使得评估更容易为政策制定者或服务提供者所使用,并使他们 清楚地了解顾客的需求和不满,从而最终提高公共服务的水平。 至于顾客导向模式的应用领域,韦唐指出:“顾客的价值标准在公共服务方面的评价, 比在受规章限制的政府干预的评估中扮演更占统治地位的角色。”②也就是说,顾客导向评估 主要应用于公共物品和服务的提供领域。但是,顾客的价值标准是以个人利益倾向为准,顾 客个人价值的多元化难于形成对政策总的看法。而且,顾客导向模式要获取顾客的看法和需 要,则要花费很多的时间。因此,顾客导向模式不能成为评估的唯一模式,而只能起补充作 用。 6.利益相关者模式 利益相关者是指所有对政策(项目)的目标和执行感兴趣,并对其具有影响的团体和个 ① [美]戴维.奥斯本,特德.盖布勒著.改革政府——企业精神如何改革着公营部门. 上海:上海译文出版社, 1996:152 页. ② Evert Vedung. Public Policy and Program Evaluation. p.69