文章目錄
- 引語
- XPath Helper簡介
- XPath Helper安裝方法
- XPath Helper簡單使用方法
引語
在爬蟲各個應用場景下,資料決議為其中重要的一環,而在資料決議中,BeautifulSoup、Xpath以及正則運算式等多種方法均為利器,在實際應用中根據不同場景選擇不同的方法是最高效的,但是對各個方法的掌握程度要求很高,事實上,精通一種方法就已經滿足需要了,再此基礎之上,用輔助工具幫助理解提高效率,
本文將提供給“爬蟲大師們”使用xpath方法的輔助工具XPath Helper插件,
XPath Helper簡介
XPath即為XML路徑語言,它是一種用來確定XML(標準通用標記語言的子集)檔案中某部分位置的語言,XPath基于XML的樹狀結構,提供在資料結構樹中找尋節點的能力,起初XPath的提出的初衷是將其作為一個通用的、介于XPointer與XSL間的語法模型,
XPath Helper是一款專用于chrome內核瀏覽器的實用型爬蟲網頁決議工具,XPath Helper插件功能強勁,支持進行XPath查詢功能,XPath Help插件可以幫助用戶在各類網站上通過按shift鍵選擇想要查看的頁面元素來提取查詢其代碼,同時還支持用戶對查詢出來的代碼進行編輯,而編輯出的結果將立即顯示在旁邊的結果框中,
XPath Helper安裝方法
- 根據下面的鏈接將檔案下載到本地,
鏈接:https://pan.baidu.com/s/18_Ws5qjHW9skhE1cb1jtYA
提取碼:x0no - 下載完成后,將檔案的后綴名改為“.zip”,并進行解壓,
- 解壓之后有兩個檔案,將檔案名為“2.0.2_0.crx”后綴名改為“.zip”,并對其進行二次解壓,
至此,所有彈出的提示陳述句全部選擇 是 - 二次解壓完成,獲得如下圖所示的檔案夾,如果紅色框內檔案夾如圖所示,將“_metadata”改為“metadata”,如果默認就是“metadata”則不需要做任何操作,

- 進入自己對應的瀏覽器,在此,我以Google瀏覽器為基礎操作,
點擊谷歌右上角的三個點的按鈕
選擇更多工具——>選擇擴展程式
進入,打開開發者模式,加載已解壓的擴展程式,選擇相應的已解壓的檔案,確認!
重啟瀏覽器,確認可以正常使用 - 如下圖表示創建成功,

XPath Helper簡單使用方法
作用
- 獲取頁面元素的xpath地址,
- 驗證用戶自己寫的xpath地址是否正確,
使用方法
- 打開/關閉XPath Helper快捷鍵:Ctrl+Shift+x
- 打開Xpath Helper后的結果如下圖所示

- 打開該插件的情況下,按住Shift在頁面內進行移動,滑鼠所經過之處會有黃色方框顯示,下圖為在CSDN首頁,選中標題引導框的結果,左側的query框內即為選中內容的xpath地址,

- 如果作為驗證的方法,在query框內寫入自己寫入xpath地址,看result框內是否是自己想要抓取的元素,如果不正確,可以實時在query內進行修改,直至獲得正確xpath地址,

轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/259201.html
標籤:其他
上一篇:Redis你能跟面試官聊哪些?
下一篇:6軸并聯機器人開發
