??大家好,我是herosunly,985院校碩士畢業,現擔任演算法研究員一職,CSDN博客專家,2020年博客之星TOP,曾獲得阿里云天池比賽第一名、科大訊飛比賽第一名、CCF比賽第一名等Top名次,擁有多項發明專利,對機器學習和深度學習擁有自己獨到的見解,曾經輔導過若干個非計算機專業的學生進入到演算法行業就業,其中經常被同學和同事夸贊的一項能力就是搜索,所以今天特意給大家分享搜索引擎使用方法,希望能對大家有所幫助,如果大家覺得有用,請幫忙點贊評論收藏(一鍵三連),謝謝大家的支持~



文章目錄
- 1. 寫在前面的話
- 2. 搜索引擎的選擇
- 3. 搜索符號語言
- 3.1 精確搜索(雙引號)
- 3.2 指定網站搜索(site:)
- 3.3 或運算(OR)
- 3.4 非運算(減號)
- 3.5 改變運算順序(小括號)
- 3.6 同義詞(波浪號)
- 3.7 通配符(星號)
- 3.8 范圍表示符(兩個點)
- 3.9 時間范圍表示符(datarange:)
- 3.10 指定檔案格式(filetype:)
- 3.11 英語單詞詳細解釋(define:)
- 3.12 查找相關網站(related:)
- 3.13 在URL、標題、主題、正文中搜索
- 4. 搜索思維淺談
1. 寫在前面的話
??對于小白編程者來說,無論是在編程程序中,還是在軟體安裝、配置、使用程序中,往往都會遇到各種意料之外的Bug,但很多時候遇到Bug后不知所措,就很容易從入門走向放棄,

??時至今日,當有同學在群里提問時,也不時會看到下圖的解決方案,即通過百度或者其他搜索引擎來解決問題:

??但問題來了,究竟如何使用搜索引擎呢?以及如何更高效的使用搜索引擎呢?

2. 搜索引擎的選擇

??簡單的說就是一句話,優先谷歌,百度備選,主要原因在于以下幾點:
- 谷歌廣告少,百度廣告多,
- 在技術問題的解決方案上,谷歌的結果來自全世界的開發者,而百度主要來源于中國的開發者,眾人拾柴火焰高,這也就是為什么搜索技術問題優先使用谷歌的最重要原因,
??至于如何能用上谷歌,不在本文討論范圍內,請自行解決,
3. 搜索符號語言
??除了最簡單而且常用的搜索方法,即在搜索框中輸入內容進行搜索以外,還可以通過符號來使用更高級的搜索功能,
3.1 精確搜索(雙引號)
??最精確的搜索方法是對關鍵詞加上雙引號,就能得到和關鍵詞完全吻合的搜索結果,
??比如在輸入"python network" tutorial,此時就會把python和network當成一個整體來進行搜索,

??而不輸入雙引號,則在第三頁出現以下結果:

??精確搜索可使用在形容詞+名詞或者多個名詞構成的地名、人名和專用名詞的情況下,幫助用戶完成結果篩選,在搜索資訊較為常見或者搜索結果較多時使用最佳,
3.2 指定網站搜索(site:)
??對于個人搜索而言,本質上是在合適的來源找到想要的內容,但如果直接使用搜索引擎,往往會得到很多冗余的資料源,所以需要花費大量的時間進行篩選和鑒別,從而得到有效的資訊,
??如果平日內進行了大量的積累,直接在指定源上搜索就能夠大大提高解決問題的效率,比如在debug時可以在stackoverflow上進行搜索,亦或者在CSDN上尋找優秀學習教程:
??搜索關鍵詞為:module ‘aioredis’ has no attribute ‘create_redis’ site:stackoverflow.com

??搜索關鍵詞為:阿里云冠軍經驗分享 site:csdn.net

3.3 或運算(OR)
??通過或運算可以同時搜索兩個關鍵詞或者關鍵詞組(需要注意的是要用大寫的OR):


??或運算可以提高搜索的容錯率,尤其是在未能確定哪個關鍵詞是最重要的搜索關鍵詞時使用,值得一提的是,OR的同義運算子為|(豎杠),用OR或者|均可,
3.4 非運算(減號)
??非運算是用在明確排除掉部分資訊時使用,比如只想保留多義詞中的某一個特定的含義,
??首先以python為例;

??python是個多義詞,它不僅是最熱門的編程語言,而包含了大蟒蛇的意思,通過非運算可以洗掉掉大蟒蛇的搜索結果,可以看到搜索結果減少了三千萬,

3.5 改變運算順序(小括號)
??涉及到復雜運算后,運算順序是極其重要的,那如何保證運算順序是自己想要的呢?可以使用小括號來達到上述效果,
??上文中使用了python book OR java book,那如何進行簡化呢?如下圖所示:

3.6 同義詞(波浪號)
??有時想在保留搜索關鍵詞語意的基礎上增加搜索到的結果,那該如何進行操作呢?具體來說比如想查找Python的相關教程,可以搜索python tutorial,但包含教程的關鍵詞不僅為tutorial,也可能是lecture或者seminar,


??由上圖可見,使用波浪號即同義詞表示后,搜索結果多了四個億,是不是很有用啊,在搜索結果寥寥無幾時,可能是個很不錯的選擇,
3.7 通配符(星號)
??一般來說,通配符星號(*)主要是用在表示檔案路徑中,但在搜索引擎中,它可以用來缺失的關鍵詞,比如只記得某個函式名稱的一部分時,可以使用星號進行表示,例如,在機器學習常用庫Numpu中有個很常用的API:concatenate,但只能隱隱約約想起前幾個字母,如下圖所示:

3.8 范圍表示符(兩個點)
??在實際生活或者作業中,往往需要查閱多年的資料,比如1990年到2021年中國的GDP、1974年到2021年的美國總統,那該如何進行表示呢?
??以1974年1974年到2021年的美國總統為例,在輸入框中輸入American president 1974…2021,如下所示:

??在鏈接為https://www.loc.gov/rr/print/list/057_chron.html中可以查閱到相關資料,其中第一列為總統,第二列為總統夫人,第三列為副總統,

??范圍表示符不僅能表示時間范圍,也能夠表示其他的范圍,但表示時間范圍上顆粒度過大,是否有更精確的查詢方法呢?
3.9 時間范圍表示符(datarange:)
??對于上文中的提問,答案是使用datarange:time1-time2,需要注意的是time1和time2的時間格式為朱利安(Julian time format),可點擊鏈接http://www.longpelaexpertise.com.au/toolsJulian.php將時間進行轉換,比如想查詢2021年1月1日到2021年10月24日新冠感染人數,輸入則應為COVID-19 infected number daterange:21001-21141,如下圖所示:


3.10 指定檔案格式(filetype:)
??使用該運算子能夠快速找到包含指定格式的檔案,該操作適用于各種檔案格式,例如PDF檔案、word檔案、PPT幻燈片、excel表格等格式,
??舉例來說,我們已知神經網路與深度學習這本書的PDF檔案是開源的,想下載后進行深入學習,則可輸入搜索關鍵詞為:神經網路與深度學習 filetype:pdf,如下圖所示:

??可得到該書的對應下載鏈接為https://nndl.github.io/nndl-book.pdf,
3.11 英語單詞詳細解釋(define:)
??在學習英語單詞時,學習單詞對應的中文含義往往并不能準確理解該單詞,尤其是部分單詞中文含義相同之時,此時最好的學習方法就是查閱它的英文解釋,比如我們想查詢machine learning對應的詳細解釋,則可輸入搜索關鍵詞為:define: machine learning,如下圖所示:

??順便說一句,百度并不支持上述功能,哈哈,
3.12 查找相關網站(related:)
??如果對谷歌的PageRank演算法有所了解的話,就會知道在谷歌的資料中網站之間是相互參考的,所以就可以輕松的查找到相關的網站,比如,我想了解與Python官網相關聯的網站,則可輸入搜索關鍵詞為:related:python.org,如下圖所示:

??可以看到相關網站也是常用的幾門編程語言等,但美中不足的是,該功能僅可用在體量較大的國際網站上,
3.13 在URL、標題、主題、正文中搜索
??為了簡單起見,方便給大家進行演示,每項的搜索內容均為python,
- 在URL中搜索:inurl:python

- 在標題中進行搜索:intitle:python
- 在主題中進行搜索:insubject:python
- 在文本中進行搜索:intext:python
4. 搜索思維淺談
??搜索思維本質上是把自然語言(人類語言)表達成更讓機器容易理解的形式,那什么樣的表達機器更容易理解呢?相比于復雜的句子而言,機器更容易理解若干個詞,在早些年使用搜索引擎時,使用若干個詞進行搜索效率要比用句子高太多倍,隨著自然語言處理領域的蓬勃發展,神經網路模型已經能夠理解句子的語意,所以使用句子進行搜索也能夠達到較好的效果,但如果發現搜索結果并不如意,不妨嘗試自己提取句子中的關鍵詞進行搜索,
轉載請註明出處,本文鏈接:https://www.uj5u.com/houduan/330630.html
標籤:python
