理性Agent

理性的判斷依賴于以下四個方面：

定義成功標準的性能度量（P）
Agent 對環境的先驗知識（E）
Agent可以完成的行動（A）
Agent截止到此時的感知序列（S）

理性Agent的定義：對每一個可能的感知序列，根據已知的感知序列提供的證據和Agent具有的先驗知識，理性Agent應該選擇能使其性能度量最大化的行動，

環境的性質

考慮任務環境是理性Agent要“求解”的基本“問題”，

根據理性的定義，我們的任務環境也必須將上述的四個方面性能度量、環境·、Agent執行器、傳感器歸結在一起才能構建出合適的任務環境，（根據四方面的首字母定義該描述為PEAS描述）

簡單例子：自動駕駛出租車系統

性能度量：油耗、到達目的地的時間長短、安全性、乘客舒適度等等
環境：各種道路、路上的行人車輛、天氣等等
執行器：個人感覺可以理解成action，如踩油門，方向盤的控制，與顧客的交流等等
傳感器：主要是車上搭載的攝像頭來感知環境變化

更多示例：

Agent的結構

Agent程式，它實作的是把感知資訊映射到行動的Agent 函式，
假設該程式要在某個具備物理傳感器和執行器的計算裝置上運行——我們稱為體系結構，
Agent =體系結構＋程式

基于反射的Agent

這類Agent基于當前的感知和內置的規則集選擇行動，不關注感知歷史，雖然結構簡單，但只感知當前的資訊，對于許多需要考慮歷史對當前影響的場景是不適用的，

基于模型的Agent

這類Agent不僅僅是有規則集，還有它需要知道Agent的行動會對環境造成什么影響，即知道世界如何運轉，在內部需要有一個世界模型（model）

基于目標的Agent

這類Agent除了知道自己當前的狀態，還可以用目標資訊來描述想要達到的狀態，基于目標的Agent更加的明確，通過目標的指引，利用自己已知的模型和感知的資訊不斷更新自己的狀態以達到目標，
此類決策與前面描述的條件-行動規則有根本的不同，原因是它考慮了未來——包括“如果我這樣做會發生什么?”和“這樣做會讓我高興嗎?”這樣的問題，基于目標用的做動作是是推理，而基于反射是基于規則進行行動的，

基于效用的Agent

這類Agent是對于基于目標Agent更加精細化的描述，如果說基于目標的Agent對于性能度量是二值的，那么基于效用的Agent對于目標的性能度量是從0到1的連續值，

轉載請註明出處，本文鏈接：https://www.uj5u.com/qita/261795.html

標籤：其他

上一篇：圖結構練習——最短路徑

下一篇：比例運算電路

《人工智能：一種現代的方法》筆記（一）