AI 代理环境基础教程文档

收录于 2023-04-20 00:10:05 · بالعربية · English · Español · हिंदीName · 日本語 · Русский язык · 中文繁體

环境是包围代理的世界上的所有事物,但它不是代理本身的一部分。环境可以描述为存在代理的情况。
该环境是代理生活,操作并为代理提供感知并对其采取行动的环境。通常认为环境是非女性化的。

环境的特征

根据Russell和Norvig的观点,环境可以具有各种特征代理商的身分:
完全可观察与部分可观察 静态与动态 离散与连续 确定性与随机性 单代理与多代理 偶发与顺序 已知与未知 可访问与不可访问

1、完全可观察与部分可观察:

如果代理传感器可以在每个时间点感知或访问环境的完整状态,则它是完全可观察的环境,否则它是部分可观察的 完全可观察的环境很容易,因为无需维护内部状态即可跟踪世界历史。 在所有环境中都没有传感器的代理,那么这种环境称为不可观察

2、确定性与随机性:

如果代理的当前状态和选定的动作可以完全确定环境的下一个状态,则这种环境称为确定性环境。 随机环境本质上是随机的,不能由主体完全确定。 在确定性,完全可观察的环境中,业务代表无需担心不确定性。

3、情节与顺序:

在情景环境中,有一系列的一次性动作,并且仅需要当前感知即可。 但是,在顺序环境中,座席需要记忆过去的动作以确定下一个最佳动作。

4、单代理与多代理

如果一个环境中仅涉及一个代理程序,并由其自身进行操作,则这种环境称为单代理程序环境。 但是,如果在一个环境中运行多个代理,那么这种环境称为多代理环境。 多代理环境中的代理设计问题不同于单代理环境。

5、静态与动态:

如果环境在代理程序进行讨论时可以改变自身,则该环境称为动态环境,否则称为静态环境。 静态环境易于处理,因为代理在决定采取行动时无需继续观察世界。 但是对于动态环境,座席需要始终关注每个动作的世界。 出租车驾驶是动态环境的一个例子,而填字游戏则是静态环境的一个例子。

6、离散与连续:

如果在一个环境中可以执行有限数量的感知和动作,则这种环境称为离散环境,否则称为连续环境。 象棋游戏是在离散环境下进行的,因为可以执行的动作数量有限。 无人驾驶汽车就是一个连续环境的例子。

7、已知与未知

已知和未知实际上不是环境的特征,但是执行动作是代理的知识状态。 在已知环境中,所有操作的结果对于代理都是已知的。在未知环境中,座席需要了解其工作方式才能执行操作。 一个已知环境很有可能是部分可观察的,而一个未知环境是完全可观察的。

8、可访问与不可访问

如果代理可以获取有关该州环境的完整且准确的信息,则该环境称为可访问环境,否则称为不可访问环境。 一个空房间,其状态可以通过其温度来定义,这是可访问环境的一个示例。 关于地球上事件的信息是无法访问的环境的一个例子。