Agent¶
基本属性
-
感知:任何给定时刻Agent的感知输入
-
感知序列:所有输入数据的完整历史
-
Agent函数:将任意给定感知序列映射为行动,可以由Agent程序实现
能够感知和动作的实体,具体来说,是一个从感知序列到动作的一个函数
理性智能体 | Rational Agent¶
是做事正确的智能体。
- 性能度量
由设计者给出,根据实际在所处的环境中希望得到的结果来设计度量,而不根据智能体应该表现的行为。
- 理性的判断
理性的判断
-
定义成功标准的性能度量(Performance measure)
-
Agent对环境的先验知识(Environment)
-
Agent可以执行的动作(Actuators)
-
Agent的感知序列(Sensors)
一个理性的Agent,对于每一个可能的感知序列,能根据已知的感知序列和内建的先验知识,选择能使性能指标的期望值最大化的动作。
理性 vs 全知
理性不要求全知。
-
全知是知道它的动作产生的实际效果
-
理性应该经常观察,有助于最大化期望性能。
理性 | 完美 |
---|---|
使期望的性能最大化 | 使实际的性能最大化 |
- 自主性
不应该依赖设计者的先验知识,尽可能地学习
任务环境¶
分类
- 完全可观察和部分可观察
智能体能够获取环境的完整状态,与传感器有关
- 确定性:环境的下一个状态完全取决于当前状态和智能体的行动
如此,若无其他智能体的活动,那么环境是策略的
-
片段式与延续式:行动的选择是否取决于当前片段,是否会对未来有影响。
-
静态和动态:环境在智能体思考时是否变化
-
离散与连续
真实的世界是部分客观、随机的、延续式的、动态的、连续的、多智能体的。
智能体的结构¶
AI的目的是设计Agent程序,实现把感知信息映射到行动的Agent函数。注意,有些函数不能被任何agent程序构成,如图灵机。
- 体系结构:把程序在某个具备物理传感器和执行器的计算装置上运行的抽象整体
它为程序提供:来自传感器的感知信息、运行程序、把程序产生的行动送到执行器
四种基本的智能体结构
- 简单反射型: if-then 结构(条件-行为规则)
function Simple-Reflex-Agent
persistent: a set of condition-action rules.
state = interpret-input(percept)
rule = Rule-match(state, rules)
action = rule.ACTION
return action
- 基于模型的简单反射型
function Model_Based-Agent
persistent: a set of condition-action rules,
state, the agent's current conception of the world state,
model, a description of how the next state depends on current state and action,
action, the most recent action
state = Undate-State(percept, state, action, model)
rule = Rule-match(state, rules)
action = rule.ACTION
return action
- 基于目标型
效率降低,灵活度增加,功能增强
- 基于效用型(utility)
- 学习型
学习元件(Learning element): 根据反馈对agent做评价,修改执行元件
执行元件(Performance element):之前的所有agent
评论元件(Critic):根据性能标准来做反馈
问题生成器(Problem generator):建议探索性行动,短期次优,长期更好