浙江大学计算机学院研究生人工智能引论课件.ppt
《浙江大学计算机学院研究生人工智能引论课件.ppt》由会员分享,可在线阅读,更多相关《浙江大学计算机学院研究生人工智能引论课件.ppt(89页珍藏版)》请在三一文库上搜索。
1、1,浙江大学计算机学院研究生人工智能引论课件,第13讲 智能Agent及多Agent系统 Chapter 13 Intelligent Agent & Multi-Agent Systems 徐从富 浙江大学人工智能研究所 2003年第一稿 2005年10月修改补充 2007年10月第二次修改,2,内容,概述 2. 分布式问题求解 3. Agent 4. Agent理论 5. Agent结构 6. Agent通信 7. Agent的协调与协作 8. 多Agent环境MAGE 9. 面向Agent的软件技术 Mobile Agent 若干前沿问题讨论,3,13.1 概述,分布式人工智能(DAI)
2、主要研究在逻辑上或物理上分散的智能系统如何并行的、相互协作地实现问题求解。 两种解决问题的方法: 自顶向下:分布式问题求解 自底向上:基于Agent的方法,4,DAI系统的特色,系统中的数据、知识, 以及控制不但在逻辑上, 而且在物理上是分布的, 既没有全局控制, 也没有全局的数据存储。 各个求解机构由计算机网络互连, 在问题求解过程中, 通信代价要比求解问题的代价低得多。 系统中诸机构能够相互协作, 来求解单个机构难以解决, 甚至不能解决的任务。,5,DAI系统的主要优点,提高问题求解能力 提高问题求解效率 扩大应用范围 降低软件的复杂性,6,13.2 分布式问题求解,特点: 数据、知识、控
3、制均分布在系统的各节点上,既无全局控制,也无全局数据和知识存储。 两种协作方式: 任务分担 结果共享,7,13.2.1 分布式问题求解系统分类,根据组织结构,分布式问题求解系统可以分为三类: 层次结构类 平行结构类 混合结构类,8,13.2.2 分布式问题求解过程,分布式问题求解过程可以分为四步: 任务分解 任务分配 子问题求解 结果综合,9,分布式问题求解系统中协作的分类,按节点间协作量的多少,协作分为三类: 全协作系统 无协作系统 半协作系统 常用的通信方式有: 共享全局存储器 信息传递 黑板模型,10,13.3 智能Agent及多Agent系统,多Agent系统主要研究在逻辑上或物理上分
4、离的多个Agent协调其智能行为,即知识、目标、意图及规划等,实现问题求解。可以看作是一种由底向上设计的系统。,11,Agent的思想,智能Agent的几个典型的实例: Microsoft的Office助手 计算机病毒(破坏Agent) 计算机游戏或模拟中的智能角色 贸易和谈判Agent(如Ebay的拍卖Agent) 网络蜘蛛Web Spider(搜索引擎中的数据搜集和索引Agent,如Google),12,Agent概念的出现,面向过程的方法,面向实体的方法,面向对象的方法,面向Agent的方法,软件开发方法的进化,13,Agent的定义,在计算机和人工智能领域中,Agent可以看作是一个实
5、体,它通过传感器感知环境,通过效应器作用于环境。,14,Agent的强定义,基于某种场景,并具有灵活、自主的行为能力,以满足设计目标的计算机系统。,15,Agent的弱定义,满足如下特征的基于硬件或(更经常是)软件的计算机系统: 自主性(Autonomy) 社会性(Social ability) 反应性(Reactivity) 主动性(Pro-activeness)(或称“前 瞻性”) 基于场景性(Situatedness) 灵活性(Flexibility),16,移动性(Mobility) 理性(Rationality) 此外,许多学者还提出一些其它特性: 诚实性(Veracity) 友好性
6、(Benevolence) 长寿性(或时间连贯性) 自适应性(Adaptability),17,Agent的特性,Agent弱概念: 自治性、社会能力(可通信性)、反应能力、自发行为 Agent强概念: 知识、信念、意图、承诺等心智状态 其它属性: 长寿性、移动性、推理能力、规划能力、学习和适应能力、诚实、善意、理性,18,13.4 Agent理论,智能Agent的理论模型研究主要从逻辑、行为、心理、社会等角度出发,对智能Agent的本质进行描述,为智能Agent系统创建奠定基础。,19,可能世界模型(Possible Worlds Model),地位:Agent理论基础的开创性工作之一。思想
7、:将Agent的知识、信念等特征化为一 系列“可能世界”,在可能世界模型中包括对象、属性及其关系。 优点:理论基础(特别是模态逻辑)比较完善。 缺点:存在“逻辑万能”(Logical Omniscience)问题。,20,“意图系统”(Intentional System),作用:用于描述其行为可用信念、愿望等理性智慧来预测的实体。分为:一阶和二阶两种形式。对象、属性及其关系。,21,“意图姿态”(Intentional Stance),意义:启发AI学者将信念(Belief)、愿望(Desire)、承诺(Commitment)等人类特有的思想和概念应用于Agent。,22,13.4.1 理性
8、Agent(BDI模型),思想:认为Agent行为可由信念、愿望和意图来表达 作用:已成为经典模型,并被广泛采用 Belief信念,Agent对环境的基本看法。 Desire愿望,Agent想要实现的状态,即目标。 Intention意图,目标的子集。,23,13.4.2 BDIAgent模型,BDIAgent模型可以通过下列要素描述: 一组关于世界的信念; Agent当前打算达到的一组目标; 一个规划库,描述怎样达到目标和怎样改变信念; 一个意图结构,描述Agent当前怎样达到它的目标和改变信念。,24,BDI解释器,BDI-Interpreter initialize-state(); d
9、o options := option-generator(event-queue, B, G, I); selected-options := deliberate(options, B, G, I); update-intentions(selected-options, I); execute(I); get-new-external-events(); drop-successful-attitudes(B,G,I); drop-impossible-attitudes(B,G,I); until quit,25,13.4.3 RAO逻辑框架,目标:以一种自然的方式描述多Agent系统
10、中关于别的Agent的状态的推理过程。 系统的分类:由于多Agent系统太复杂,建立一种通用的推理模式的想法是不现实的,有必要对系统分类以便区别对待。 常识的获得:和单个Agent情形一样,常识问题是阻碍推理的大难题。,26,13.4.4 换位推理,思想:模仿语言学中的虚拟语气,即为了对某个Agent在某种场景下的状态或行为进行推测,设想自己处于那种场景时的状态或行为,再把这种设想结果作为被猜测Agent的状态或行为。 作用:使得一Agent对其它Agent的状态和行为的推理过程变得简单明了。,27,13.4.5 动作理论,情景演算是描述动作的主要的形式框架。 在情景演算中引入了状态和动作的概
11、念,并利用两条逻辑公理来描述动作与状态的关系。一条公理描述一个动作在满足什么条件的状态之下可能发生,另外一条描述在一个状态之下某个动作发生以后当前状态如何改变。,28,13.4.6 “言语行为”理论(Speech Acts Theory),地位:这是多Agent交互(通信)的重要理论基础之一。 思想:任何行为都可以等价地表示为言语行为(既任何行为的含义都可用言语来表达),甚至认为所有的行为都是言语行为。 作用:大大简化了Agent之间交互的复杂度。,29,规划库的形式化表示,环境状态: State = P1, P2, Pn 目标: Goal= 动作模板: Act_template = Agen
12、t能力: Ability=,30,13.5 Agent结构,Agent结构需要解决的问题包括: Agent由那些模块组成, 模块之间如何交互信息, Agent感知到的信息如何影响它的行为和内部状态, 如何将这些模块用软件或硬件的方式组合起来形成一个有机的整体。,31,Agent基本结构,环境,Agent,感知,作用,黑箱软件Agent,32,智能Agent的工作过程,环境,交互,信息融合,信息处理,作用,交互,感知,作用,33,Agent骨架程序,function Skeleton-Agent(percept) return action static: memory /* Agent的世界记
13、忆 */ memory Update- Memory(memory,percept) action Choose-Best-Action(memory) memory Update-Memory(memory,action) return action,34,Agent的分类,根据人类思维的层次模型,可以将Agent分成四类: 反应Agent 形象思维Agent 抽象思维Agent 复合式Agent 形象思维Agent和抽象思维Agent也可以合称为认知Agent,35,13.5.1 反应Agent,环 境,当前世界,传感器,动 作,效应器,条件-动作 规则,Agent,36,反应Agent程
14、序,function Reactive-Agent(percept) returns action static: rules, /* 一组条件-动作规则 */ state Interpret-Input(percept) rule Rule-Match(state,rules) action Rule-Actionrule return action,37,13.5.2 认知Agent,环 境,信息融合,传感器,动 作,效应器,Agent,规 划,知识库,目标,内部状态,38,认知Agent程序,function Cognitive-Agent(percept) returns action
15、 static: environment, /* 描述当前世界环境 */ kb, /* 知识库 */ environment Update-World-Model(environment,percept) state Update-Mental-State(environment,state) action Decision-Making(state,kb) environment Update-World-Model(environment,action) return action,39,BDI结构,知 识,信 念,规 划,意 图,目 标,愿 望,40,13.5.3 复合式Agent,决策
16、生成,规 划,反 射,建 模,通 信,感 知,行 动,其他 智能Agent,智能Agent,外部世界,预测,协作与协商,动作,请求或应答信息,一 般 情 况,紧急情 况和简 单情况,41,规划模块,世界的模型 (包括其他 Agent的模型),经 验 库,目标集合,局 部 规 划 器,决 策 生 成,重新 规划,规划,规划,目标,42,建模模块,世界的模型 (包括其他 Agent的模型),模 型 库,模 型 生 成 和 维 护,预 测,规划,决策生成,感 知,通 信,建模,43,通信模块,词 法 库,语 法 库,词 义 库,物理通信,语言生成,语言理解,通信,44,13.6 Agent通信,策
17、略,对 话,消 息,黑 板,协 议,通 信,协 作,协 议,45,Agent通信中的主要问题,语义:全部有关的Agent必须知道通信语言的语义,消息的语义内容知识是分布式问题求解的核心部分。 言语行为:通信语言也是一种动作,说话是为了使世界的状态发生改变。 交互协议:Agent之间消息交换的典型模式 通信语言:传递消息的标准语法。 Foundation for Intelligent Physical Agents http:/www.fipa.org,46,Agent间的消息传递,消息发送/传输服务器,转换到传输格式,从传输格式转换,消息M,言语行为,意图I,目标G,Agent i,消息M,
18、Agent j,47,本体论(Ontology),本体论是概念化的明确的表示和描述。 对某一领域中的概念有共同理解,可以提高交流和协作的效率,从而提高了软件的重用性。,48,言语行为,有关言语行为理论的研究主要集中在如何划分不同类型的言语行为。 在Agent通信语言的研究中,言语行为理论主要用来考虑Agent之间可以交互的信息类型。,49,FIPA通信动作库,Accept Proposal 接受提议 Agree 同意 Cancel 取消 Call for Proposal 要求提议 Confirm 确认 Disconfirm 确认为否定 Failure 失败 Inform 通知 Inform
19、If 通知 是否 Inform Ref 通知 有关对象 Not Understood 不理解,50,Propagate 传播 Propose 提议 Proxy 代理 Query If 询问 是否 Query Ref 询问 有关对象 Refuse 拒绝(请求) Reject Proposal 拒绝提议 Request 请求 Request When 请求 某个条件下执行 Request Whenever 请求 一旦某个条件成立就执行 Subscribe 预定 详细说明: http:/www.fipa.org/repository/cas.html,51,交互协议,Agent之间的会话常常形成典型
20、模式,这种情况下某些消息序列是可知的,这些消息交换的典型模式称为协议。 Agent间交互的理想情况:Agent充分地理解消息的含意和意图,然后根据自身的信念、目标等心智状态,做出相应的回答 比较实际的实现:预先规范这些协议,规定好消息的顺序。,52,FIPA 英国拍卖协议,53,通信语言,KQML:由美国ARPA的知识共享计划中提出,规定了消息格式和消息传送系统,为多Agent系统通信和协商提供了一种通用框架。 ACL:由FIPA制定的一种规范。与KQML非常相似,54,KQML,一个例子: (ask-all : sender A : receiver B : in-reply-to ido
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 浙江 大学计算机 学院 研究生 人工智能 引论 课件
链接地址:https://www.31doc.com/p-2750365.html