
Python Web高級爬蟲工程師測驗題
(請本檔案發送到: [email protected] 并附帶簡歷)
1、 用yield寫一個斐波那契數列的生成器函式,
2、 放一段scrapy專案parse函式的代碼(決議串列頁,使用分組提取,決議欄位),
3、 遇到過哪些反爬策略,如果突破?
4、 scrapy各個模塊啟動順序(Spider, Middleware, Pipeline的加載、實體化、Open、Close的順序),
5、 使用過哪些抓包工具,各有什么優點,
6、 有沒有自己博客,貼一下網址,
7、 字體加密反爬機制及分類,
8、 遇到過那些驗證碼,怎么突破的,不使用打碼平臺有辦法嗎?
9、 簡述了解的采集任務管理平臺,有何不同,有修改過原始碼嗎?
10、 遇到過哪些難度大的網站,卡在哪了,認為反爬的天花板網站/軟體有哪些,
11、 selenium/splash/puppeteer(谷歌)/playwright(微軟)/web scraper(插件) 優劣勢,
12、 js/小程式/apk的Hook 原理,
13、 遇到過那些防御系統,極驗驗證碼/易盾/觀鏡防御系統反爬策略優劣,
14、 簡述繞過小程式動態除錯中用戶驗證的方式,
15、 還有哪些問題是沒問到的,又是自己的優勢優點,可自行作答
附件:高級爬蟲面試測驗題 v1.3
轉載請註明出處,本文鏈接:https://www.uj5u.com/houduan/315881.html
標籤:Python
