本文是中國人工智能學會編著的《人工智能導論(面向非計算機專業)》一書第二章的摘要與筆記,僅供個人學習之用,其它章節請訪問下列相應 URL,
第一章 緒論
第二章 概念表示(本章)
章節目錄
- 第二章
- 2.1 經典概念理論
- 2.2 數理邏輯
- 2.3 集合論
- 2.3.1 集合的概念
- 2.3.2 集合的表示方法
- 2.3.3 集合的關系與運算
- 2.4 概念的現代表示理論
- 2.4.1 原型理論
- 2.4.2 樣例理論
- 2.4.3 知識理論
第二章
??對于人工智能來說,知識是最重要的部分,知識由概念組成,概念是構成人類知識世界的基本單元, 人們借助概念才能正確地理解世界,與他人交流,傳遞各種資訊,如果缺少對應的概念,將自己的想法表達出來是非常困難甚至是不可能的,鑒于知識自身也是一個概念,因此,想要表達知識,能夠準確表達概念是先決條件,
2.1 經典概念理論
??所謂概念的精確定義,就是可以給出一個命題,亦稱概念的經典定義方法,在這樣一種概念定義中,物件屬于或不屬于一個概念是一個二值問題——一個物件要么屬于這個概念,要么不屬于這個概念,二者必居其一,而一個經典概念的組成,正如第一章所述包含三個部分,即:概念名、概念的內涵表示、概念的外延表示,
- 概念名由一個(漢語、英語、阿拉伯語等各種自然語言)詞語來表示,屬于符號世界或者認知世界,
- 概念的內涵表示用命題來表示,反映和揭示概念的本質屬性,是人類主觀世界對概念的認知,可存在于人的心智之中,屬于心智世界,所謂命題,就是非真即假的陳述句,
- 概念的外延表示由概念指稱的具體實體組成,是一個由滿足概念的內涵表示的物件構成的經典集合,概念的外延表示外部可觀可測,
英文字母的概念名為“英文字母”,其內涵表示為如下命題:英語單詞里使用的字母符號(不區分字體),英文字母的外延表示為經典集合 {a, b, c, d, e, f, g, h, i, j, k, l, m, n, o, p, q, r, s, t, u, v, w, x, y, z},
經典概念在科學研究、日常生活中具有極其重要的意義,如果限定概念都是經典概念,則既可以使用其內涵表示計算(即數理邏輯);也可以使用外延表示進行計算(集合論),下面進行簡單介紹,
2.2 數理邏輯
數理邏輯作為一門獨立學科,內容龐雜,在此僅簡要介紹命題邏輯中最基本的概念——命題,更多知識請學習“數理邏輯”或“離散數學”相關內容,
??在數理邏輯中,真用“1”來表示,假用“0”來表示,
??命題是可判斷真偽的陳述句,真命題表達的判斷為正確,假命題表達的判斷為錯誤,任何命題的真值唯一,
??不能分解為更簡單的命題的命題稱為簡單命題或原子命題;通過連結詞聯結而成的命題稱為復合命題,在命題邏輯中,簡單命題是基本單位,不能再細分,
給出下列自然語言陳述句:
- 您去看電影嗎?
- 看雪去!
- 這句話是謊話,
- 哎呀,您……
- x=2
- 兩個奇數之和是奇數,
- 歐拉常數是無理數,
- 任何人都會死,蘇格拉底是人,因此,蘇格拉底是會死的,
- 如果下雨,則我打傘,
- 李白要么擅長寫詩,要么擅長喝酒,
- 李白既不擅長寫詩,又不擅長喝酒,
??1~5 不是命題,1, 2, 4 不是陳述句;3 雖為陳述句,但無法判斷真偽(稱為悖論);5 的真偽依賴于 x 的取值,不能確定,
??6~11 都是命題,6 和 7 是簡單命題,6 是假命題,7 是命題,但目前不知歐拉常數是否為無理數,故目前無法判斷其為真命題或為假命題;但可以確定歐拉常數要么是有理數(則該命題為假),要么是無理數(則該命題為真),判斷一個陳述句是否為命題時,只要知道該陳述句可判斷真偽即可(即要求真值唯一),是否知道真值對于判斷是否為命題并不重要,(說到底,還是要先判斷是不是命題,再判斷是真命題還是假命題) 8~10 是復合命題,其真值在此不做討論,
??在命題邏輯中,簡單命題常用 p, q, r, s, t 等小寫字母表示,復合命題則用簡單命題和邏輯詞進行符號化,
??常見的邏輯聯結詞有五個——否定聯結詞、合取聯結詞、析取聯結詞、蘊含聯結詞、等價聯結詞,
- 否定聯結詞為一元聯結詞,其符號為 ?, 設 p 為命題,復合命題“非 p”(或“p 的否定”)稱為 p 的否定式,記作 ?p,規定 ?p 為真當且僅當 p 為假, 在自然語言中,否定聯結詞一般用“非”、“不”等表示,但是,不是自然語言中所有的“非”、“不”都對應否定聯結詞,
- 合取聯結詞為二元聯結詞,其符號為 ?, 設 p、q 為兩個命題,復合命題“p 并且 q”(或 “p 與 q”)稱為 p 與 q 的合取式,記作 p?q,規定 p?q 為真當且僅當 p 與 q 同時為真, 在自然語言中,合取聯結詞對應相當多的連詞,如“既……又……”“不但……而且……”“雖然……但是……”“一面……一面……”“一邊……一邊……”等都表示兩件事情同時成立,可以符號化為 ?,同時,也需要注意不是所有的“與”“和”對應 ?,比如“趙構與秦檜是同謀”,
- 析取聯結詞為二元聯結詞,其符號為 ?, 設 p、q 為兩個命題,復合命題“p 或者 q”稱為 p 與 q 的析取式,記作 p?q,規定 p?q 同時為真, 在自然語言中,合取聯結詞中的“或者”與 ? 不完全相同,自然語言中的“或者”有時是排斥或,有時是相容或,而在數理邏輯中,? 是相容或,
- 蘊含聯結詞為二元聯結詞,其符號為 →, 設 p、q 為兩個命題,復合命題“如果 p 則 q”稱為 p 與 q 的蘊含式,記作 p→q,規定 p→q 為假當且僅當 p 為真且 q 為假, p→q 的邏輯關系為 q 是 p 的必要條件,使用蘊含聯結詞 →,必須注意自然語言中存在許多看起來差別很大的表達方式,如“只要 p,就 q”、“因為 p,所以 q”、“p 僅當 q”、“只有 q 才 p”、“除非 q 才 p”等都對應命題符號化 p→q,同時,必須注意到當 p 為假時,無論 q 為真或為假,p→q 總為真,(此時稱為“善意推定”)
??需要指出的是,日常生活里 p→q 中的前件 p 與后件 q 往往存在某種內在關系;而在數理邏輯里,并不要求前件 p 與后件 q 有任何聯系,前件 p 與后件 q 可以完全沒有內在聯系,
??例:給出三個命題:p: 建國同志發動武裝暴動奪得了美國總統職位;q: 建國同志被授予諾貝爾和平獎;r: 太陽從西邊出來,
??根據現實(截止至2021年2月4日)容易得出:p 為假,q 為假,r 為假,
??用自然語言表述 p→q 有:如果建國同志發動武裝暴動奪得了美國總統職位,則建國同志被授予諾貝爾和平獎,
??用自然語言表述 r→q 有:如果太陽從西邊出來,則建國同志被授予諾貝爾和平獎,
??比較上述兩個命題可知,兩個命題的邏輯結構完全一致,雖然命題 p→q 看似荒謬,但在命題邏輯看來,p 為假,無論 q 為真或為假,p→q 均為真,抽象為真值表示為:0→0=1,故上述兩命題均為真,
- 等價聯結詞為二元聯結詞,其符號為 ?, 設 p,q 為兩個命題,復合命題“p 當且僅當 q”稱為 p 與 q 的等價式,記作 p?q,規定 p?q 為真當且僅當 p 與 q 同為真或同為假, p?q意味著 p 與 q 互為充要條件,不難看出,(p→q)?(q→p) 與 p?q 完全等價,都表示 p 與 q 互為充要條件,
真值表
| p | q | ?p | p?q | p?q | p→q | p?q |
|---|---|---|---|---|---|---|
| 0 | 0 | 1 | 0 | 0 | 1 | 1 |
| 0 | 1 | 1 | 0 | 1 | 1 | 0 |
| 1 | 0 | 0 | 0 | 1 | 0 | 0 |
| 1 | 1 | 0 | 1 | 1 | 1 | 1 |
2.3 集合論
2.3.1 集合的概念
??當需要定義或使用一個概念時,常常需要明確概念指稱的物件,一個由概念指稱的所有物件組成的整體稱為該概念的集合,這些物件就是集合的元素或者成員, 該概念名為集合的名稱,該集合稱為對應概念的外延表示,集合中的元素為對應概念的指稱物件,如一元二次方程 x2-2=0 的解組成的集合、人類性別的集合、質數集合等等,
??為了方便計算,集合通常用大寫英文字母標記,例如,自然數集合 N、整數集合 Z、有理數集合 Q、實數集合 R、復數集合 C等,因此,集合的名字常常有兩個,一個用在自然語言里,對應該集合的概念名;一個用在數學里,用來降低書寫的復雜度,
2.3.2 集合的表示方法
??集合有兩種表示方法:一種是列舉表示法,一種是謂詞表示法,
??集合的列舉表示法 :列出集合中的所有元素,元素之間用逗號隔開,并把它們用花括號括起來,如 N={0, 1, 2, 3, 4, …},并不是所有的集合都可以用列舉法來表示,比如實數集合,
??在用列舉表示法時,集合中的元素彼此不同,不允許一個元素在集合中多次出現(互異性);集合中的元素地位是平等的,出現的次序無關緊要,即集合中的元素無順序,或者說兩個集合如果在其對應的列舉表示法中元素完全相同而其出現順序不同,則認為這兩個集合是相同的(無序性),
??集合的謂詞表示法 :用謂詞來概括集合中元素的屬性,該謂詞是與集合對應的概念的內涵表示,即其命題表示的謂詞符號化中的謂詞,例如集合 B={x|x∈R?x2-2=0},
2.3.3 集合的關系與運算
??如果同一層次的不同概念之間有各種關系,則對于同一層次上的兩個集合,彼此之間也存在各種不同關系,
定義 2.1 ??如果 A、B 是兩個集合,且 A 中的任意元素都是集合 B 中的元素,則稱集合 A 是 B 的子集合,這時也稱 A 被 B 包含,或者 B 包含 A,記作
A
?
B
A\subseteq B
A?B,如果 A 不被 B 所包含,則記作
A
?
B
A\nsubseteq B
A?B,
??包含的謂詞符號化為:
A
?
B
?
?
x
(
x
∈
A
→
x
∈
B
)
A\subseteq B ? \forall x(x\in A→x\in B)
A?B??x(x∈A→x∈B),
定義 2.2 ??如果 A、B 是兩個集合,且
A
?
B
A\subseteq B
A?B 與
B
?
A
B\subseteq A
B?A 同時成立,則稱 A 與 B 相等,記作
A
=
B
A=B
A=B,如果 A 與 B 不相等,則記作
A
≠
B
A\ne B
A?=B,
??相等的符號化表示為:
A
=
B
?
A
?
B
∧
B
?
A
A=B ? A\subseteq B\wedge B\subseteq A
A=B?A?B∧B?A,
定義 2.3 ??如果 A、B 是兩個集合,且
A
?
B
A\subseteq B
A?B 與
A
≠
B
A\ne B
A?=B 同時成立,則稱 A 是 B 的真子集,記作
A
?
B
A\subset B
A?B,如果 A 不是 B 的真子集,則記作
A
??
B
A\not\subset B
A??B,
??真子集的符號化表示為:
A
?
B
?
A
?
B
∧
A
≠
B
A\subset B ? A\subseteq B\wedge A\ne B
A?B?A?B∧A?=B,
定義 2.4 ??不含任何元素的集合叫做空集,記作 ?,
??空集可以符號化表示為:
?
=
{
x
∣
x
≠
x
}
\emptyset = \{x|x\ne x\}
?={x∣x?=x},
定理 2.1 ??空集是一切集合的子集,
定義 2.5 ??集合 A 的全體子集構成的集合叫做集合 A 的冪集,記作 P(A),不難知道,如果 A 為 n 元集,則 P(A) 有 2 n 2^n 2n 個元素,
定義 2.6 ??在一個具體問題中,如果涉及的集合都是某個集合的子集,則稱該集合為全集,記作 E,
定義 2.7 ??設 A、B 為集合,A 與 B 的并集
A
∪
B
A\cup B
A∪B,交集
A
∩
B
A\cap B
A∩B,對稱差
A
⊕
B
A\oplus B
A⊕B,B 對 A 的相對補集
A
?
B
A-B
A?B 可分別定義如下:
A
∪
B
=
{
x
∣
x
∈
A
∨
x
∈
B
}
A\cup B = \{x|x\in A\vee x\in B\}
A∪B={x∣x∈A∨x∈B}
A
∩
B
=
{
x
∣
x
∈
A
∧
x
∈
B
}
A\cap B = \{x|x\in A\wedge x\in B\}
A∩B={x∣x∈A∧x∈B}
A
⊕
B
=
{
x
∣
(
x
∈
A
∧
x
?
B
)
∧
(
x
∈
B
∧
x
?
A
)
}
A\oplus B = \{x|(x\in A\wedge x\notin B)\wedge(x\in B\wedge x\notin A)\}
A⊕B={x∣(x∈A∧x∈/?B)∧(x∈B∧x∈/?A)}
A
?
B
=
{
x
∣
x
∈
A
∧
x
?
B
}
A-B = \{x|x\in A\wedge x\notin B\}
A?B={x∣x∈A∧x∈/?B}
??如果兩個集合的交集為空集,則稱這兩個集合是不可交的,
??在給定全集 E 以后,
A
?
E
A\subseteq E
A?E,A 的絕對補集 ~A 可定義如下:
~
A
=
E
?
A
=
{
x
∣
x
∈
E
∧
x
?
A
}
\sim A = E-A = \{x|x\in E\wedge x\notin A\}
~A=E?A={x∣x∈E∧x∈/?A}
??由此,可以具體計算集合之間的并、交、對稱差、相對補和絕對補,
??顯然,當概念的外延表示為經典集合時,概念之間的計算可以由集合運算來代替,
2.4 概念的現代表示理論
??不是所有的概念都具有經典概念表示, 第一章已經指出,概念的經典理論假設概念的內涵表示由一個命題表示,外延表示由一個經典集合表示,但是對于日常生活里使用的概念來說,這個要求過高,比如常見的概念人、勺子、美、丑等就很難給出其內涵表示或者外延表示,人們很難用一個命題來準確定義什么是人、勺子、美、丑,也很難給出一個經典集合將對應著人、勺子、美、丑這些概念的物件一一列舉出來,命題的真偽與物件屬不屬于某個經典集合都是二值假設,非 0 即 1,但現實生活中的很多事情難以以這種方式計算,
??著名的“禿子悖論”可以清楚地說明這一點,所謂“禿子悖論”是如下一個陳述句:比禿子多一根頭發地人也是禿子,如果假設“禿子”這個概念是經典概念,那么運用經典推理技術,從“頭上一根頭發也沒有的人是禿子”這個基準論斷出發,經過 10 萬次推理,就可以推斷出“一個人即使具有 10 萬根頭發也是禿子”,顯然,這是一個荒謬的結論,因為據統計,一個成年人正常也就有 10 萬根頭發,錯誤發生在哪里呢?顯然,“禿子”屬于經典概念這個假設并不正確,
??在 1953 年出版的《哲學研究》里,通過仔細剖分“游戲”這個概念,維特根斯坦對概念的內涵表示的存在性提出了嚴重質疑,明確指出如下假設并不正確:所有的概念都存在經典的內涵表示(命題表示),現代認知科學是這一觀點的支持者,認為各種生活中的實用概念如人、貓、狗等都不一定存在經典的內涵表示(命題表示),
??但是,這并不意味著概念的內涵表示在沒有發現時,該概念就不能被正確使用,實際上,人們對于日常生活中的概念應用得很好,但是其相應的內涵表示不一定存在,為此,認知科學家提出了一些新概念表示理論,如原型理論、樣例理論和知識理論,
2.4.1 原型理論
??原型理論認為一個概念可由一個原型來表示, 一個原型既可以是一個實際的或者虛擬的物件樣例,也可以是一個假設性的圖示性表征,通常,假設原型為概念的最理想代表,
??比如“好人”這個概念很難有一個命題表示,但在中國,好人通常用雷鋒來表示,雷鋒就是好人的原型,又比如,對于“鳥”這個概念,成員一般具有羽、卵生、有喙、會飛、體輕等特點,麻雀、燕子都符合這個特點,而鴕鳥、企鵝、雞、家鴨等不太符合鳥的典型特征,顯然,麻雀、燕子適合作為鳥的原型,而鴕鳥、企鵝、雞、家鴨等不太適合作為鳥的原型,雖然也屬于鳥類,但不屬于典型的鳥類,
??因此,在原型理論里,同一個概念中的物件對于概念的隸屬度并不都是 1,會根據其與原型的相似程度而變化,在概念原型理論里,一個物件歸為某類而不是其他類僅僅因為該物件更像某類的原型表示而不是其他類的原型表示,
??正是注意到這一現象,扎德于 1965 年提出了模糊集合的概念,其與經典集合的主要區別在于物件屬于集合的特征函式不再是非 0 即 1,而是一個不小于 0、不大于 1 的實數,據此,基于模糊集合發展出模糊邏輯,可以解決禿子悖論問題,
但是,要找到概念的原型也不是簡單的事情,一般需要辨識屬于同一個概念的許多物件,或者事先有原型可以展示才可能,但這兩個條件并不一定存在,特別是 20 世紀 70 年代兒童發育學家通過觀察發現,一個兒童只需要認識同一個概念的幾個樣例,就可以對這幾個樣例進行辨識,但其并沒有形成相應概念的原型,據此,又提出了概念的樣例理論,
2.4.2 樣例理論
??樣例理論認為概念不可能由一個物件或者原型來代替,但是可以由多個已知樣例來表示, 理由是,一兩歲的嬰兒已經可以正確辨識什么是人、什么不是人,即可以使用“人”這樣的概念了,但是一兩歲的嬰兒解除的人的個體數量非常有限,其不可能形成“人”這個概念的原型,
這實際上與很多人的實際經驗也相符,人們認識一個概念,比如認識“一”這個字,顯然,只可能通過有限的這個字的樣本來認識,不可能將所有“一”這個字的樣本都拿來讓人學習,
??在樣例理論中,一個樣例屬于某個特定概念 A 而不是其他概念,僅僅因為該樣例更像特定概念 A 的樣例表示而不是其他概念的樣例表示,
個人認為原型理論和樣例理論的區別在于:
- 原型理論需要找到一個概念中特征最典型、最明顯的個體,作為該概念的原型,判斷新的個體是否屬于該概念時,需要將該個體與原型比較判斷隸屬度(相似度)是否達到閾值,
- 樣例理論則是從屬于一個概念中任意取出多個個體中,作為該概念的樣例,判斷新的個體是否屬于該概念時,需要將該個體與樣例之間的共性是否相符,
若有誤歡迎指點批評
2.4.3 知識理論
??更進一步,認知科學家發現在各種人類文明中都存在顏色概念,但是具體的顏色概念各有差異,并由此推斷出單一概念不可能獨立于特定的文明之外而存在,由此形成了概念的知識理論,認知理論認為,概念是特定知識框架(文明)的一個組成部分, 但是不管怎樣,認知科學總是假設概念在人的心智中是存在的,概念在人心智中的表示稱為認知表示,其屬于概念的內涵表示,
??最后需要指出的是,已有研究發現不同的概念具有不同的內涵表示,可能是命題表示,可能是原型表示,可能是樣例表示,也可能是知識表示,當然也可能存在不同于以上的認知表示,對于一個具體的概念,到底是哪一種表示,需要根據實際情況具體研究,據此可知,對于概念表示,一個公開的問題是:是否存在一種統一的可以與已知的概念表示理論相容的概念表示理論?
轉載請註明出處,本文鏈接:https://www.uj5u.com/qukuanlian/258790.html
標籤:區塊鏈
