各位專家們:
本人新手,遇到網址變化問題,有點沒頭緒了,網址如下:
http://www.****.cn/newepaper/pc/layout/202005/13/node_001.html
這是某報紙電子版的網址,這個網址只有/202005/13/node_001.html 這個部分是變化的,
/202005/13/這個部分就是日期,但是每個月里面節假日沒有報紙,所以不包括。
/node_001.html 這個部分是版面,變化規律是每天的日期后面會有node_001--008,但是1-8沒有規律,有時是1-4,有時1-8,有時還會缺一個。
那么我怎么才能用python簡潔地設定一個有規律“URL”,遍歷出一個月里面所有出現的版面的內容呢?
求解答~~~~
uj5u.com熱心網友回復:
都學到爬蟲了,還不明白這個?另外,既然是爬蟲,就不需要搞明白這個,本來就是從其他地方獲得真實網址的,比如一個索引頁面
轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/44932.html
標籤:其他開發語言
上一篇:跪求!
下一篇:python django 求助
