正在加载图片...
·400 智能系统学报 第4卷 进行辩论协商时,管理者也生成系统任务 的存储格式为数组.最基本的可操作单位为特征分 一个任务具有如下的格式: 量.一个汉字样本,可以对应多组特征. (<任务名><对象><类型><目标> 4)单字层.识别器基于特征的识别结果,连同其 [<领域>]). 候选字、识别信度存放于该层.基本的存储格式为一 其中,<任务名>是任务标识,由系统自动分 结构,该结构含有2个关键域,一个域为按信度大小 配,任务名可以惟一地表示出一个任务;<对象>给 顺序存放的候选字,另一个域为候选字所对应的信 出该任务的操作对象,如一个切分任务,其对象可以 度,2个域均为数组.该层最基本可操作单位为字 是一个TF或BMP文件,而一个识别任务,其对象 5)词汇层.利用词汇知识对单字识别结果(包 则可以是已切分好的汉字图像点阵等;<类型>指 括候选)进行评判,评判结果存放于该层.基本的存 定了<对象>的类型,如TF_FLE、BMP_FLE等; 储格式为含有2个关键域的结构,一个域记录候选 <目标>给出该任务对给定对象最终求解到什么程 字的构词情况,另一个域记录评判信度.该层的最基 度,如对于一个T亚文件对象,是只给出切分结果 本可操作单位为词,包括单字词和多字词. (因为用户可能并不要求识别)就行了呢,还是要对 6)短语层.对各候选可能形成的短语或句子, 其进行识别,如果是识别是否进行后处理等等;<领 利用汉语的上下文知识进行评判,评判结果存放于 域>是一个可选参数,如果需要或者可能的话,它指 该层.基本的存储格式是一个复杂的多级链表结构, 定出<对象>所在的领域.领域既可以标识出识别 实际上表达的是一个搜索图.该层的基本可操作单 对象是汉字、数字还是英文等信息,又可以给出待处 位为短语或句子 理的对象属于社会科学范围,还是属于计算机科学 7)结果层.该层记录系统最终的识别结果,基 范围等信息,供与领域有关的Agent使用, 本的存储格式同单字层一样为一结构,该结构含有 2.2环境 2个关键域,一个域为按综合评判信度大小顺序存 环境由一个公告牌和一个分层结构的黑板组 放的候选字,另一个域为候选字所对应的信度,2个 成.用户提供的原始信息、招标投标信息、各Aget 域均为数组. 的处理结果及相互间的交互信息等均存放于环境之 2.3管理者 中.环境对于每个Agent是共享的. 管理者可以看作是一个特殊的Agent,它具有 公告牌是各种消息的集合.管理者与Agent之 多重身份.其一,管理者是一个中间商,它对用户或 间、Agent与Agent之间的各种通讯与交互均通过公 其他Agent提交的任务,规划求解路径,分解为若干 告牌进行 个子任务,发布于公告牌上,组织招标.在接收到A 黑板是问题的解空间以层次结构方式组织起来 get的标书后,根据任务的具体要求,从求解精度、 的全局数据库,是所有公有信息的集合,Agent使用 时间消耗和资源消耗等几个方面选择中标者.对于 的所有数据均存放于黑板之中.一个黑板被划分为 同一个求解目标,中标者可以是一个,也可以是多 以下7个层次: 个.为发挥更多的Agent的作用,在时间允许的情况 1)版面层.这是由扫描仪扫描汉字样张得到的 下,管理者尽可能多地选择中标者.其二,管理者实 最原始黑白二值图像,存储格式为F文件格式或 现对环境的管理.所有的任务请求,均通过管理者张 BMP文件格式.最基本的可操作单位为图像的 贴于公告牌上,所有处理结果,也要经过管理者组织 “点”.该层内容简称为版面, 之后放置于环境之中.其三,管理者是一个调节人, 2)样本层.对版面进行分析后,经行切分、字切 当发生矛盾冲突时,管理者负责组织各相关Agent 分后,得到单个汉字的点阵及其结构属性信息(如 间的辩论与协调,听取各辩论者的意见,使得在各 上下结构、左右结构、内外结构等)存放于该层.对 Aget间最终达成一个一致的意见或可能性最大的 汉字点阵进行噪声处理、光滑处理、规格化等预处理 结果 的结果也放于该层之中.汉字点阵基本的存储格式 2.4 Agent 为二维矩阵,最基本的可操作单位为“点”.该层内 Agent由感知器、发送器、任务分配器、知识库、 容简称为样本, 方法集和局部黑板6部分组成,其一般结构如图2 3)特征层.对汉字样本抽取出的识别特征存放 所示.其中感知器用于感知环境中的信息,它时刻监 于特征层,一个汉字的特征为一个N维向量,基本 视着环境的变化,随时捕捉与自己相关的信息.任务
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有