主頁 >  其他 > [書目20200808]數學之美 第三版

[書目20200808]數學之美 第三版

2020-09-12 03:56:03 其他

I 第二版序言

III 第一版序言

VI 第三版前言

 

1 第1章 文字和語言 vs 數字和資訊

文字和語言與數學,從產生起原本就有相通性,雖然它們的發展一度分道揚鑣,但是最侄訓是能走到一起,

1 資訊

2 文字和數字

3 文字和語言背后的數學

 

15 第2章 自然語言處理——從規則到統計

人類對機器理解自然語言的認識走了一條大彎路,早期的研究集中采用基于規則的方法,雖然解決了一些簡單的問題,但是無法從根本上將自然語言理解實用化,直到20多年后,人們開始嘗試用基于統計的方法進行自然語言處理,才有了突破性進展和實用的產品,

1 機器智能

2 從規則到統計

 

27 第3章 統計語言模型

統計語言模型是自然語言處理的基礎,并且被廣泛應用于機器翻譯、語音識別、印刷體,或手寫體識別、拼寫糾錯、漢字輸入和文獻查詢,

1 用數學的方法描述語言規律

2 延伸閱讀:統計語言模型的工程訣竅

 

41 第4章 談談分詞

中文分詞是中文資訊處理的基礎,它同樣走過了一段彎路,目前依靠統計語言模型已經基本解決了這個問題,

1 中文分詞方法的演變

2 延伸閱讀:如何衡量分詞的結果

 

50 第5章 隱馬爾可夫模型

隱馬爾可夫模型最初應用于通信領域,繼而推廣到語音和語言處理中,成為連接自然語言處理和通信的橋梁,同時,隱馬爾可夫模型也是機器學習的主要工具之一,

1 通信模型

2 隱馬爾可夫模型

3 延伸閱讀:隱馬爾可夫模型的訓練

 

60 第6章 資訊的度量和作用

資訊是可以量化度量的,資訊熵不僅是對資訊的量化度量,也是整個資訊論的基礎,它對于通信、資料壓縮、自然語言處理都有很強的指導意義,

1 資訊熵

2 資訊的作用

3 互資訊

4 延伸閱讀:相對熵

 

72 第7章 賈里尼克和現代語言處理

作為現代自然語言處理的奠基者,賈里尼克教授成功地將數學原理應用于自然語言處理領域中,他的一生富于傳奇色彩,

1 早年生活

2 從水門事件到莫妮卡·萊溫斯基

3 一位老人的奇跡

 

82 第8章 簡單之美——布爾代數和搜索引擎

布爾代數雖然非常簡單,卻是計算機科學的基礎,它不僅把邏輯和數學合二為一,而且給了我們一個全新的視角看待世界,開創了數字化時代,

1 布爾代數

2 索引

 

89 第9章 圖論和網路爬蟲

互聯網搜索引擎在建立索引前需要用一個程式自動地將所有的網頁下載到服務器上,這個程式稱為網路爬蟲,它的撰寫是基于離散數學中圖論的原理,

1 圖論

2 網路爬蟲

3 延伸閱讀:圖論的兩點補充說明

 

98 第10章 PageRank——Google的民主表決式網頁排名技術

網頁排名技術PageRank是早期Google的殺手锏,它的出現使得網頁搜索的質量上了一個大的臺階,它背后的原理是圖論和線性代數的矩陣運算,

1 PageRank演算法的原理

2 延伸閱讀:PageRank的計算方法

 

104 第11章 如何確定網頁和查詢的相關性

確定網頁和查詢的相關性是網頁搜索的根本問題,其中確定查詢中每個關鍵詞的重要性有多高是關鍵,TF-IDF是目前通用的關鍵詞重要性的度量,其背后的原理是資訊論,

1 搜索關鍵詞權重的科學度量TF-IDF

2 延伸閱讀:TF-IDF 的資訊論依據

 

111 第12章 有限狀態機和動態規劃——地圖與本地搜索的核心技術

地圖與本地搜索中要用到有限狀態機和動態規劃技術,這兩項技術是機器智能和機器學習的工具,它們的應用非常廣泛,還包括語音識別、拼寫和語法糾錯、拼音輸入法、工業控制和生物的序列分析等,

1 地址分析和有限狀態機

2 全球導航和動態規劃

3 延伸閱讀:有限狀態傳感器

 

121 第13章 Google AK-47的設計者——阿米特·辛格博士

在所有輕武器中最有名的是AK-47沖鋒槍,因為它從不卡殼,不易損壞,可在任何環境下使用,可靠性好,殺傷力大并且操作簡單,Google的產品就是按照上述原則設計的,

 

127 第14章 余弦定理和新聞的分類

計算機雖然讀不懂新聞,卻可以準確地對新聞進行分類,其數學工具是看似毫不相干的余弦定理,

1 新聞的特征向量

2 向量距離的度量

3 延伸閱讀:計算向量余弦的技巧

 

136 第15章 矩陣運算和文本處理中的兩個分類問題

無論是詞匯的聚類還是文本的分類,都可以通過線性代數中矩陣的奇異值分解來進行,這樣一來,自然語言處理的問題就變成了一個數學問題,

1 文本和詞匯的矩陣

2 延伸閱讀:奇異值分解的方法和應用場景

 

142 第16章 資訊指紋及其應用

世間萬物都有一個唯一標識的特征,資訊也是如此,每一條資訊都有它特定的指紋,通過這個指紋可以區別不同的資訊,

1 資訊指紋

2 資訊指紋的用途

3 延伸閱讀:資訊指紋的重復性和相似哈希

 

153 第17章 由電視劇《暗算》所想到的——談談密碼學的數學原理

密碼學的根本是資訊論和數學,沒有資訊論指導的密碼是非常容易被破解的,只有在資訊論被廣泛應用于密碼學后,密碼才真正變得安全,

1 密碼學的自發時代

2 資訊論時代的密碼學

 

162 第18章 閃光的不一定是金子——談談搜索引擎反作弊問題和搜索結果的權威性問題

閃光的不一定是金子,搜索引擎中排名靠前的網頁也未必是有用的網頁,消除這些作弊網頁的原理和通信中過濾噪聲的原理相同,這說明資訊處理和通信的很多原理是相通的,

1 搜索引擎的反作弊

2 搜索結果的權威性

 

171 第19章 談談數學模型的重要性

正確的數學模型在科學和工程中至關重要,而發現正確模型的途徑常常是曲折的,正確的模型在形式上通常是簡單的,

 

179 第20章 不要把雞蛋放到一個籃子里——談談最大熵模型

最大熵模型是一個完美的數學模型,它可以將各種資訊整合到一個統一的模型中,在資訊處理和機器學習中有著廣泛的應用,它在形式上非常簡單、優美,而在實作時需要有精深的數學基礎和高超的技巧,

1 最大熵原理和最大熵模型

2 延伸閱讀:最大熵模型的訓練

 

186 第21章 拼音輸入法的數學原理

漢字的輸入程序本身就是人和計算機之間的通信,好的輸入法會自徑訓不自覺地遵循通信的數學模型,當然要做出最有效的輸入法,應當自覺使用資訊論做指導,

1 輸入法與編碼

2 輸入一個漢字需要敲多少個鍵——談談香農第一定理

3 拼音轉漢字的演算法

4 延伸閱讀:個性化的語言模型

 

197 第22章 自然語言處理的教父馬庫斯和他的優秀弟子們

將自然語言處理從基于規則的研究方法轉到基于統計的研究方法上,賓夕法尼亞大學的教授米奇·馬庫斯功不可沒,他創立了今天在學術界廣泛使用的LCD語料庫,同時培養了一大批精英人物,

1 教父馬庫斯

2 從賓夕法尼亞大學走出的精英們

 

204 第23章 布隆過濾器

日常生活中,經常要判斷一個元素是否在一個集合中,布隆過濾器是計算機工程中解決這個問題最好的數學

工具,

1 布隆過濾器的原理

2 延伸閱讀:布隆過濾器的誤識別問題

 

209 第24章 馬爾可夫鏈的擴展——貝葉斯網路

貝葉斯網路是一個加權的有向圖,是馬爾可夫鏈的擴展,而從認識論的層面看:貝葉斯網路克服了馬爾可夫鏈那種機械的線性約束,它可以把任何有關聯的事件統一到它的框架下面,它在生物統計、影像處理、決策支持系統和博弈論中都有廣泛的使用,

1 貝葉斯網路

2 貝葉斯網路在詞分類中的應用

3 延伸閱讀:貝葉斯網路的訓練

 

217 第25章 條件隨機場、文法分析及其他

條件隨機場是計算聯合概率分布的有效模型,而句子的文法分析似乎是英文課上英語老師教的東西,這兩者有什么聯系呢?

1 文法分析——計算機演算法的演變

2 條件隨機場

3 條件隨機場在其他領域的應用

 

227 第26章 維特比和他的維特比演算法

維特比演算法是現代數字通信中使用最頻繁的演算法,也是很多自然語言處理采用的解碼演算法,可以毫不夸張地

講,維特比是對我們今天的生活影響力最大的科學家之一,因為基于CDMA的3G移動通信標準主要就是他和厄文·雅各布創辦的高通公司制定的,

1 維特比演算法

2 CDMA技術——3G移動通信的基礎

 

238 第27章 上帝的演算法——期望最大化演算法

只要有一些訓練資料,再定義一個最大化函式,采用EM演算法,利用計算機經過若干次迭代,就可以得到所需要的模型,這實在是太美妙了,這也許是造物主刻意安排的,所以我把它稱作上帝的演算法,

1 文本的自收斂分類

2 延伸閱讀:期望最大化和收斂的必然性

 

244 第28章 邏輯回歸和搜索廣告

邏輯回歸模型是一種將影響概率的不同因素結合在一起的指數模型,它不僅在搜索廣告中起著重要的作用,而且被廣泛應用于資訊處理和生物統計中,

1 搜索廣告的發展

2 邏輯回歸模型

 

249 第29章 各個擊破演算法和Google云計算的基礎

Google頗為神秘的云計算中最重要的MapReduce工具,其原理就是計算機演算法中常用的“各個擊破”演算法,它的原理原來這么簡單——將復雜的大問題分解成很多小問題分別求解,然后再把小問題的解合并成原始問題的解,由此可見,在生活中大量用到的、真正有用的方法常常都是簡單樸實的,

1 分治演算法的原理

2 從分治演算法到MapReduce

 

254 第30章 Google大腦和人工神經網路

Google大腦并不是一個什么都能思考的大腦,而是一個很能計算的人工神經網路,因此,與其說Google大腦很聰明,不如說它很能算,不過,換個角度來說,隨著計算能力的不斷提高,計算量大但簡單的數學方法有時能夠解決很復雜的問題,

1 人工神經網路

2 訓練人工神經網路

3 人工神經網路與貝葉斯網路的關系

4 延伸閱讀:Google大腦

 

274 第31章 區塊鏈的數學基礎——橢圓曲線加密原理

希爾伯特講,“我們直到能夠把一門自然科學的數學內核剝出并完全地揭示出來,才能夠掌握它,”以位元幣為代表的加密貨幣的基礎是數學的演算法,只有搞清楚加密貨幣的數學內核,我們才能了解它的本質,

1 不對稱、不透明之美

2 橢圓曲線加密的原理

 

282 第32章 大資料的威力——談談資料的重要性

如果說在過去的40年里,主導全球IT產業發展的是摩爾定律,那么在今后的20年里,主導IT行業繼續發展的動力則將來自于資料,

1 資料的重要性

2 資料的統計和資訊技術

3 為什么需要大資料

 

304 第33章 隨機性帶來的好處——量子密鑰分發的數學原理

人們總是喜歡確定性而不喜歡隨機性,但是從對確定性規律的把握上升到對隨機性規律的把握,恰恰是近代數學進步的標志,量子通信就是建立在把握了有關隨機性規律的基礎之上,

1 用(激光)量子的偏振方向傳遞資訊

2 利用隨機性保證資訊安全

 

312 第34章 數學的極限——希爾伯特第十問題和機器智能的極限

世界上只有一小部分問題是數學問題,而數學問題中又只有極小的一部分問題有解,在這些問題中,今天已經找到相應演算法的少之又少,因此,數學不是萬能的,我們需要了解數學的邊界在哪里,

1 圖靈劃定計算機可計算問題的邊界

2 希爾伯特劃定有解數學問題的邊界

3 延伸閱讀:關于圖靈機

 

323 附錄 計算復雜度

 

327 第三版后記

 

333 索引

轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/10370.html

標籤:其他

上一篇:在那顆名為太陽的恒星下 UNDER A STAR CALLED SUN

下一篇:opencv —— imread、namedWindow & imshow、cvtColor、imwrite 加載、顯示、修改、保存影像

標籤雲
其他(157675) Python(38076) JavaScript(25376) Java(17977) C(15215) 區塊鏈(8255) C#(7972) AI(7469) 爪哇(7425) MySQL(7132) html(6777) 基礎類(6313) sql(6102) 熊猫(6058) PHP(5869) 数组(5741) R(5409) Linux(5327) 反应(5209) 腳本語言(PerlPython)(5129) 非技術區(4971) Android(4554) 数据框(4311) css(4259) 节点.js(4032) C語言(3288) json(3245) 列表(3129) 扑(3119) C++語言(3117) 安卓(2998) 打字稿(2995) VBA(2789) Java相關(2746) 疑難問題(2699) 细绳(2522) 單片機工控(2479) iOS(2429) ASP.NET(2402) MongoDB(2323) 麻木的(2285) 正则表达式(2254) 字典(2211) 循环(2198) 迅速(2185) 擅长(2169) 镖(2155) 功能(1967) .NET技术(1958) Web開發(1951) python-3.x(1918) HtmlCss(1915) 弹簧靴(1913) C++(1909) xml(1889) PostgreSQL(1872) .NETCore(1853) 谷歌表格(1846) Unity3D(1843) for循环(1842)

熱門瀏覽
  • 網閘典型架構簡述

    網閘架構一般分為兩種:三主機的三系統架構網閘和雙主機的2+1架構網閘。 三主機架構分別為內端機、外端機和仲裁機。三機無論從軟體和硬體上均各自獨立。首先從硬體上來看,三機都用各自獨立的主板、記憶體及存盤設備。從軟體上來看,三機有各自獨立的作業系統。這樣能達到完全的三機獨立。對于“2+1”系統,“2”分為 ......

    uj5u.com 2020-09-10 02:00:44 more
  • 如何從xshell上傳檔案到centos linux虛擬機里

    如何從xshell上傳檔案到centos linux虛擬機里及:虛擬機CentOs下執行 yum -y install lrzsz命令,出現錯誤:鏡像無法找到軟體包 前言 一、安裝lrzsz步驟 二、上傳檔案 三、遇到的問題及解決方案 總結 前言 提示:其實很簡單,往虛擬機上安裝一個上傳檔案的工具 ......

    uj5u.com 2020-09-10 02:00:47 more
  • 一、SQLMAP入門

    一、SQLMAP入門 1、判斷是否存在注入 sqlmap.py -u 網址/id=1 id=1不可缺少。當注入點后面的引數大于兩個時。需要加雙引號, sqlmap.py -u "網址/id=1&uid=1" 2、判斷文本中的請求是否存在注入 從文本中加載http請求,SQLMAP可以從一個文本檔案中 ......

    uj5u.com 2020-09-10 02:00:50 more
  • Metasploit 簡單使用教程

    metasploit 簡單使用教程 浩先生, 2020-08-28 16:18:25 分類專欄: kail 網路安全 linux 文章標簽: linux資訊安全 編輯 著作權 metasploit 使用教程 前言 一、Metasploit是什么? 二、準備作業 三、具體步驟 前言 Msfconsole ......

    uj5u.com 2020-09-10 02:00:53 more
  • 游戲逆向之驅動層與用戶層通訊

    驅動層代碼: #pragma once #include <ntifs.h> #define add_code CTL_CODE(FILE_DEVICE_UNKNOWN,0x800,METHOD_BUFFERED,FILE_ANY_ACCESS) /* 更多游戲逆向視頻www.yxfzedu.com ......

    uj5u.com 2020-09-10 02:00:56 more
  • 北斗電力時鐘(北斗授時服務器)讓網路資料更精準

    北斗電力時鐘(北斗授時服務器)讓網路資料更精準 北斗電力時鐘(北斗授時服務器)讓網路資料更精準 京準電子科技官微——ahjzsz 近幾年,資訊技術的得了快速發展,互聯網在逐漸普及,其在人們生活和生產中都得到了廣泛應用,并且取得了不錯的應用效果。計算機網路資訊在電力系統中的應用,一方面使電力系統的運行 ......

    uj5u.com 2020-09-10 02:01:03 more
  • 【CTF】CTFHub 技能樹 彩蛋 writeup

    ?碎碎念 CTFHub:https://www.ctfhub.com/ 筆者入門CTF時時剛開始刷的是bugku的舊平臺,后來才有了CTFHub。 感覺不論是網頁UI設計,還是題目質量,賽事跟蹤,工具軟體都做得很不錯。 而且因為獨到的金幣制度的確讓人有一種想去刷題賺金幣的感覺。 個人還是非常喜歡這個 ......

    uj5u.com 2020-09-10 02:04:05 more
  • 02windows基礎操作

    我學到了一下幾點 Windows系統目錄結構與滲透的作用 常見Windows的服務詳解 Windows埠詳解 常用的Windows注冊表詳解 hacker DOS命令詳解(net user / type /md /rd/ dir /cd /net use copy、批處理 等) 利用dos命令制作 ......

    uj5u.com 2020-09-10 02:04:18 more
  • 03.Linux基礎操作

    我學到了以下幾點 01Linux系統介紹02系統安裝,密碼啊破解03Linux常用命令04LAMP 01LINUX windows: win03 8 12 16 19 配置不繁瑣 Linux:redhat,centos(紅帽社區版),Ubuntu server,suse unix:金融機構,證券,銀 ......

    uj5u.com 2020-09-10 02:04:30 more
  • 05HTML

    01HTML介紹 02頭部標簽講解03基礎標簽講解04表單標簽講解 HTML前段語言 js1.了解代碼2.根據代碼 懂得挖掘漏洞 (POST注入/XSS漏洞上傳)3.黑帽seo 白帽seo 客戶網站被黑帽植入劫持代碼如何處理4.熟悉html表單 <html><head><title>TDK標題,描述 ......

    uj5u.com 2020-09-10 02:04:36 more
最新发布
  • 2023年最新微信小程式抓包教程

    01 開門見山 隔一個月發一篇文章,不過分。 首先回顧一下《微信系結手機號資料庫被脫庫事件》,我也是第一時間得知了這個訊息,然后跟蹤了整件事情的經過。下面是這起事件的相關截圖以及近日流出的一萬條資料樣本: 個人認為這件事也沒什么,還不如關注一下之前45億快遞資料查詢渠道疑似在近日復活的訊息。 訊息是 ......

    uj5u.com 2023-04-20 08:48:24 more
  • web3 產品介紹:metamask 錢包 使用最多的瀏覽器插件錢包

    Metamask錢包是一種基于區塊鏈技術的數字貨幣錢包,它允許用戶在安全、便捷的環境下管理自己的加密資產。Metamask錢包是以太坊生態系統中最流行的錢包之一,它具有易于使用、安全性高和功能強大等優點。 本文將詳細介紹Metamask錢包的功能和使用方法。 一、 Metamask錢包的功能 數字資 ......

    uj5u.com 2023-04-20 08:47:46 more
  • vulnhub_Earth

    前言 靶機地址->>>vulnhub_Earth 攻擊機ip:192.168.20.121 靶機ip:192.168.20.122 參考文章 https://www.cnblogs.com/Jing-X/archive/2022/04/03/16097695.html https://www.cnb ......

    uj5u.com 2023-04-20 07:46:20 more
  • 從4k到42k,軟體測驗工程師的漲薪史,給我看哭了

    清明節一過,盲猜大家已經無心上班,在數著日子準備過五一,但一想到銀行卡里的余額……瞬間心情就不美麗了。最近,2023年高校畢業生就業調查顯示,本科畢業月平均起薪為5825元。調查一出,便有很多同學表示自己又被平均了。看著這一資料,不免讓人想到前不久中國青年報的一項調查:近六成大學生認為畢業10年內會 ......

    uj5u.com 2023-04-20 07:44:00 more
  • 最新版本 Stable Diffusion 開源 AI 繪畫工具之中文自動提詞篇

    🎈 標簽生成器 由于輸入正向提示詞 prompt 和反向提示詞 negative prompt 都是使用英文,所以對學習母語的我們非常不友好 使用網址:https://tinygeeker.github.io/p/ai-prompt-generator 這個網址是為了讓大家在使用 AI 繪畫的時候 ......

    uj5u.com 2023-04-20 07:43:36 more
  • 漫談前端自動化測驗演進之路及測驗工具分析

    隨著前端技術的不斷發展和應用程式的日益復雜,前端自動化測驗也在不斷演進。隨著 Web 應用程式變得越來越復雜,自動化測驗的需求也越來越高。如今,自動化測驗已經成為 Web 應用程式開發程序中不可或缺的一部分,它們可以幫助開發人員更快地發現和修復錯誤,提高應用程式的性能和可靠性。 ......

    uj5u.com 2023-04-20 07:43:16 more
  • CANN開發實踐:4個DVPP記憶體問題的典型案例解讀

    摘要:由于DVPP媒體資料處理功能對存放輸入、輸出資料的記憶體有更高的要求(例如,記憶體首地址128位元組對齊),因此需呼叫專用的記憶體申請介面,那么本期就分享幾個關于DVPP記憶體問題的典型案例,并給出原因分析及解決方法。 本文分享自華為云社區《FAQ_DVPP記憶體問題案例》,作者:昇騰CANN。 DVPP ......

    uj5u.com 2023-04-20 07:43:03 more
  • msf學習

    msf學習 以kali自帶的msf為例 一、msf核心模塊與功能 msf模塊都放在/usr/share/metasploit-framework/modules目錄下 1、auxiliary 輔助模塊,輔助滲透(埠掃描、登錄密碼爆破、漏洞驗證等) 2、encoders 編碼器模塊,主要包含各種編碼 ......

    uj5u.com 2023-04-20 07:42:59 more
  • Halcon軟體安裝與界面簡介

    1. 下載Halcon17版本到到本地 2. 雙擊安裝包后 3. 步驟如下 1.2 Halcon軟體安裝 界面分為四大塊 1. Halcon的五個助手 1) 影像采集助手:與相機連接,設定相機引數,采集影像 2) 標定助手:九點標定或是其它的標定,生成標定檔案及內參外參,可以將像素單位轉換為長度單位 ......

    uj5u.com 2023-04-20 07:42:17 more
  • 在MacOS下使用Unity3D開發游戲

    第一次發博客,先發一下我的游戲開發環境吧。 去年2月份買了一臺MacBookPro2021 M1pro(以下簡稱mbp),這一年來一直在用mbp開發游戲。我大致分享一下我的開發工具以及使用體驗。 1、Unity 官網鏈接: https://unity.cn/releases 我一般使用的Apple ......

    uj5u.com 2023-04-20 07:40:19 more