基于多智能Agent计算机科学信息检索个性化服务的探讨亚博体育手机版登录入口
作者:佚名; 更新时间:2018-12-17

  文章论述了智能agent搜索理论的提出背景,阐述了智能agent的搜索理论及多种智能agent的功能和工作原理,并在此基础上构建了一个基于多种智能agent个性计算机科学信息检索系统,得出该系统是当今图书馆智能化的主动服务模式。

  关键词:智能agent;智能化;主动服务;信息检索

  1、问题的提出。

  近年来,随着振兴东北老工业基地战略的实施,齐齐哈尔大学加快计算机科学专业的建设与发展,检索大量的有关计算机科学专业的信息资源成为学科馆员的必须工作,但网上计算机科学信息资源浩如烟海,专业数据库不计其数。通过计算机科学类信息检索实践发现浩瀚如海且不断变化的计算机科学信息资源与有效获取之间存在着尚需解决的技术问题,且越来越明显,主要表现在以下几个方面:

  (1)搜索准确性问题。

  目前我们使用的大部分搜索引擎和专业数据库检索都是依据查询字段的匹配来收集信息,在查询的结果中,常常包含着一些无用信息即信息过载和资源迷向,浪费了用户的时间与精力。

  (2)个性同化问题。

  不同的用户使用同一个搜索引擎对同一个关键词进行查找,得到的结果均是相同的,毫无个性可言。

  (3)结果差异问题。

  我们对相同的“计算机编程”进行搜索时,在百度能搜到770个网页,而在雅虎中却可搜到8832765个网页,在中国期刊全文数据库中搜到10624篇(精确)亚博体育手机版登录入口,而在重庆维普数据库中却搜到208篇(精确)亚博体育手机版登录入口,体现出不同搜索引擎产生不同的结果,对同一关键词使用不同的搜索引擎得出的结果差别很大。

  (4)主动服务问题。

  我们目前所使用的搜索引擎都是通过在搜索引擎中键入关键词搜索才能得到所需要的信息,而引擎本身不能为用户提供主动的服务,这是一种较为被动的信息获取方法。

  (5)动态监测问题。

  网络中计算机科学方面的信息是实时动态变化的,如果为计算机科学的研究提供更新的信息,我们只有花费很多时间与精力实时查询网络,才能做好服务工作,而在现有搜索引擎技术条件下,对我们来说是极为不便的。

  这些问题正是数字图书馆个性化信息服务所要解决的。对于搜索引擎来说,也是其自身无法克服的,为适应信息的个性化需求,一种智能agent搜索工具已被研发出来,在工业、商业领域广泛应用,本文拟将该理论引入数字图书馆的个性化服务中来,探讨其在计算机科学信息检索中的应用。

  2、agent智能搜索理论。

  智能agent的研究起始于20世纪90年代,是人工智能和代理技术的集成运用,它代表了信息技术最前沿的发展方向,是一个全新的研究开发领域。是具有划时代意义的智能化、主动服务用户的研究热点。

  agent智能搜索理论,核心功能就是智能代理,利用一种计算机软件(实体)自动执行用户委托的任务来达到用户的检索需求,如学习agent、中介agent、通信agent、信息协作查询agent、信息采集agent、信息分析agent、信息传递agent等等,每种智能agent都需要相应的技术支持,这些技术包括了人工智能和代理技术、神经网络技术、信息检索技术、计算机网络技术、数据库数据挖掘技术、自然语言处理技术等,这些技术,近年来的研究已非常成熟,在这些技术支持下的多种agent组成的智能系统已被开发者广泛应用于工业和商业领域,智能agent能把用者的需求通过自身的自治性、代理性、学习性、分析性描绘读者需求、建立导出信息模块、自动搜索信息。专家学者设计了许多面向agent的建模语言以支持基于借助于面向agent的软件,和支持不同系统模型之间转换的软件,以使各系统之间相互兼容,从而建立起一种逐步求精的agent系统,为解决网络中计算机科学专业信息服务与计算机科学专业信息搜索问题提供了新思路。遵循这一理论,我们进行计算机科学专业专业智能检索的探讨。

  3、基于多种智能agent的计算机科学专业检索系统的工作原理。

  完成用户的完整的检索过程需要许多智能agent的有机配合,以下分别介绍相关的agent在完成用户检索过程的工作原理。

  (1)信息采集agent执行网络的搜索任务。

  信息采集agent是该系统的核心部分,信息采集agent是一组独立运行于各个物理节点上的网络信息搜索程序,它根据所分配的任务和知识库中的信息对网络站点进行遍历,并把采集到的信息存进本地信息库中。

  信息采集agent工作流程如下:

  ①初始化时,信息采集agent派遣信息协作agent取回知识库中适当的外部地址作为运行种子。

  ②由取回的外部地址作为初始种子,采集该网站信息,并把采集到的内部地址信息存储到本地信息库中的内部地址列表结构中去。

  ③从本地信息库中的内部地址列表中取地址,采集信息。

  ④内部地址列表为空,则表示完成该网站采集任务,执行步骤。

  (2)学习agent总结用户检索习惯形成个性化的检索模式。

  学习agent安装在用户个人机上,每个用户一个学习agent,学习agent根据用户注册信息了解用户背景、兴趣、爱好、检索目的、任务等,自动从用户提交的初始的兴趣样本中提取特征自动学习,并且根据用户经常的检索习惯,自动完成用户检索习惯的反馈学习任务和用户个性化模式的生成。学习agent根据用户的注册信息能主动地分析和获取用户的个性信息并根据用户的兴趣模型或当前的环境状态了解用户的潜在需求,以主动服务方式提供服务,例如,设定计算机科学的信息,学习agent可根据用户的信息和检索习惯,获取信息服务网站地址,自动监测相关网站的更新情况,自动将新信息推送给用户,将主动络上计算机科学资源的使用现状。

  工作流程:

  ①学习agent将用户使用类似自然语言的描述限制在一个概念区域中,拥有完成学习任务的准备知。

  ②然后agent在用户的教导下不断训练,直至能有效地找到用户感兴趣的检索语言。

  ③学习agent发挥它的学习和适应能力,形成一种记忆型的模式,能自动代表用户将用户经常检索的问题在网上搜索,推送给用户。

  (3)中介agent协调整个信息搜索过程。

  中介agent在整个搜索过程中至关重要,是实现系统分布式透明性的关键。主要用于协调采集、管理、统计、查询等各种agent,按其功能分类或建立联盟,保证各种agent之间的安全通信机制。

  工作流程:

  ①当学习agent从本地机知识库储存的信息状态,了解到用户和个性化信息及多次关于计算机科学专业的检索习惯形成固定的检索模块。

  ②根据用户的需求自动推送计算机科学专业信息给中介agent检索。

  ③中介agent首先把信息传递给各个采集系统中的信息采集协作agent。

  ④信息采集协作agent,与各个信息采集agent进行交流。

  ⑤与此同时中介agent与信息分析agent交流。

  ⑥信息分析agent通过调取本地知识库进行分析,把结果通过信息分析agent递给信息中介agent,中介agent从信息分析系统中获得数据,再传递给信息采集系统,完成信息采集。

  (4)信息协作agen在动态的情况下自主完成搜索任务。

  这是一个可移动的agent(mobileagent),能根据当前动态变化的环境状态,在无需外界参与的情况下,独立地发现和利用完成任务所(来源:)需的资源,独立地制定完成任务的规划,最终实现规划、达到目标。

  工作流程:

  ①信息协作查询agen移动于采集系统和分析系统。

  ②从信息采集agent和数据传送agent处接受协作信息查询请求。

  ③再从中介agent系统获得目标系统地址后,移动到这个新的目标主机,完成信息查询任务。

  (5)信息传输agent。

  信息传输agent负责把本地信息库中已经采集到的信息安全传送到sad中去。由于各子系统分

  别处于不同的物理节点上,数据传送的安全性和可靠性就变得尤为重要。数据传送agent通过与信息协作查询agent以及中介agent的合作有效解决了这一问题。

  工作流程:

  ①数据传送agent向信息协作查询agent发出对目的地系统地址的查询请求。

  ②信息查询agent从中介agent处取得数据分析子系统的ip地址,并返回给数据传送agent。

  ③数据传送agent根据所得到的目的地址,创建一个数据接收mobileagent,并移动到数据分析系统所在地。

  ④数据接收mobileagent对数据分析系统所在地的网络通讯质量和系统空闲时间进行评价;⑤若评价值满足数据传送质量的要求,数据传送agent开始向数据接收agent传送数据,直到数据传送完毕,收回并销毁数据接受mobileagent,若评价值不能满足要求,直接收回并销毁数据接收mobileagent。

  (6)数据分析agent通过智能筛选呈现给用户理想的检索结果。

  数据分析agent负担着对采集回来的数据进行文本化、中文分词和评价网站的任务。由数据接收mobileagent、信息协作查询agent、数据分析agent协作完成。平时,数据分析agent处于休眠状态,不加载入内存,当有新数据传送到sad本地时,数据分析agent被激活,从硬盘上读入状态数据,进入工作状态。

  ①数据进行统一化,采集到的数据可能是一段html代码、pdf文件、word文件等,统一化就是利用代码转换方法把这些数据转化成纯文本格式。

  ②如果其中有中文词汇,则调用中文分词模块进行中文分词,并调用专业词库与其中的专业词汇相比较,统计网站中出现专业词汇的频率,把结果写入知识库中,作为对网站与本专业相关度的评价,把相关内容插入索引数据库,若没有中文词汇,则与专业词汇比较,并形成索引。

  4、基于多种智能agent的计算机科学专业检索系统的工作流程。

  多种智能agent相互协作完成计算机科学检索任务的工作流程:本地知识库存储用户的注册信息,学习agent由中介agent获取用户的检索模式交给采集agen并通过采集agent采集信息,采集agent把采集的结果通过协作agent、接收agent交于分析agent,分析agent经过处理把理想化的结果储存到知识库中,完成检索任务。在整个过程中体现的是智能化的主动的推送的服务,是智能采集agen根据用户注册的个性化信息资料、并把多次的检索习惯通过学习建立模块,自动采集网络,完成服务的。整个过程体现的是主动的服务方式,是当今图书馆智能化的主动服务模式。

  参考文献

  [1]蔡栋.第二代搜索引擎模式探析[j].情报理论与实践,,(3)。

  [2]漆宏,等。谈谈个性化信息服务[j]。情报资料工作,(4)。

  [3]韩立新,等。一个面向internet的个性化信息检索系统模型[j]。电子学报,(2)。

  [4]刘颖.多智能agent系统的结构与功能[j].图书情报知识,,(4)。

    Copyright@2000-2030 职称亚博体育手机版登录入口期刊网 Corporation All Rights Reserved.
    《中华人民共和国信息产业部》备案号:ICP备07016076号;《公安部》备案号:33010402003207
    cnqika@163.com;zclwnet@126.com;zclwnet@163.com;
    本网站收录了海量免费亚博体育手机版登录入口资料和上百个经国家新闻出版总署审批过的具有国内统一CN刊号与国际标准ISSN刊号的期刊杂志,供诸位查阅参考和选择,亚博体育手机版登录入口版权属原作者所有,谨防侵权。