熟悉橡皮擦的朋友都知道,橡皮擦最愛寫的文章是關于 Python 的,但是呢,橡皮擦確實是一個產品經理,哈哈,所以每次給大家分享 Python 相關知識的時候,總想著自己是一個前端工程師(好迷糊),有時候當我發現一款非常棒的 Python 庫的時候,忍不住要推薦給大家,
Python 大神庫夸夸
作為一個產品經理,哦不,程式員每天最快樂的事情就是去 github 翻閱,在閑逛的途中經常會發現一些非常棒的大佬開發的開源庫,有時候忍不住點贊分享,這不,在 1024 這么一個特殊的日期里就碰到了這個神奇的庫,而且作者還是用 Python 撰寫的,雙重符合要求,必須嘮叨嘮叨了,
該專案是基于 Python 爬蟲采集資料,積累大量的 唐詩,宋詞資料,作者在 github 說明中已經進行了說明:
The most comprehensive database of Chinese poetry 最全中華古詩詞資料庫, 唐宋兩朝近一萬四千古詩人, 接近 5.5 萬首唐詩加 26 萬宋詩. 兩宋時期 1564 位詞人,21050 首詞,
厲害厲害!
是不是非常期待看到了,下面的鏈接就是大佬的專案地址了 https://github.com/chinese-poetry/chinese-poetry,
所有的資料都被作者上傳分享了出來,大家可以利用資料做一些詩詞類的網站或者 APP 都是非常不錯的,
資料格式已經轉成了 JSON,方便匯入到各種資料庫中,

分享這些還不夠,作者也同時分享了爬取代碼,方便你閱讀,貼上鏈接地址:https://ijg.io/r/words/crawl-ci.html,
代碼閱讀程序中,發現 parsel 庫在爬蟲百例中竟然還給遺漏了,抽時間加餐篇給大家增加上去,
寫在后面
本文單純的為愛好爬取資料的人點贊,希望更多的朋友加入到資料采集的大軍中,當然更想讓大家看到,用 Python 爬蟲可以去做很多自己喜歡的事情,當資料慢慢積累到一定量的時候,你就已經開辟出來一條獨特的路線了,
如果你想跟博主建立親密關系,可以關注博主,或者關注博主公眾號“
非本科程式員”,了解一個非本科程式員是如何成長的,
博主 ID:夢想橡皮擦,希望大家點贊、評論、收藏
爬蟲百例教程導航鏈接 : https://blog.csdn.net/hihell/article/details/86106916
以下內容無用,為本篇博客被搜索引擎抓取使用
(* ̄︶ ̄)(* ̄︶ ̄)(* ̄︶ ̄)(* ̄︶ ̄)(* ̄︶ ̄)(* ̄︶ ̄)(* ̄︶ ̄)(* ̄︶ ̄)
python 是干什么的 零基礎學 python 要多久 python 為什么叫爬蟲
python 爬蟲菜鳥教程 python 爬蟲萬能代碼 python 爬蟲怎么掙錢
python 基礎教程 網路爬蟲 python python 爬蟲經典例子
python 爬蟲
夢想橡皮擦夢想橡皮擦夢想橡皮擦夢想橡皮擦夢想橡皮擦夢想橡皮擦
(* ̄︶ ̄)(* ̄︶ ̄)(* ̄︶ ̄)(* ̄︶ ̄)(* ̄︶ ̄)(* ̄︶ ̄)(* ̄︶ ̄)(* ̄︶ ̄)
以上內容無用,為本篇博客被搜索引擎抓取使用
CSDN認證博客專家
大學老師
高級產品經理
互聯網從業者
轉載請註明出處,本文鏈接:https://www.uj5u.com/qianduan/194038.html
標籤:其他
上一篇:5分鐘學會Hadoop的集群部署
