??在NLP任務中,通過資料增強(例如EDA、回譯等)的方式增加訓練集是一個非常常用的trick,其中回譯就需要用到翻譯系統,但由于構建翻譯系統需要大規模的語料和算力,所以不如直接使用現有的翻譯系統,除此之外,還有很多的場景均需要翻譯,所以為了滿足大家的需求,特花時間來給大家寫一篇通過爬蟲使用百度翻譯的博客,
??這次的天選之子就是百度翻譯,但事先說明下該腳本只是為了學習,請勿濫用、商用,否則后果自負,
??雖然在網上有很多類似的博客,但絕大多數講的過粗,不利于新手的學習,所以就給大家準備一篇極為詳細的博客,
文章目錄
- 1. 搭建環境
-
- 1.1 安裝Python庫
- 1.2 安裝nodejs
- 2. 原理分析和實戰操作
-
- 2.1 尋找對應的XHR項
- 2.2 破解引數
- 3. 代碼
1. 搭建環境
1.1 安裝Python庫
pip install PyExecJS
pip install requests
1.2 安裝nodejs
??nodejs下載地址為:
CSDN認證博客專家
演算法研究員
天池冠軍
CSDN簽約作者
轉載請註明出處,本文鏈接:https://www.uj5u.com/houduan/252143.html
標籤:python
