使用正則運算式去除htm標簽,只取出標簽里面的文本內容
>>> import re
>>>
>>> html='<p class="txt" node-type="feed_list_content" nick-name="人民日報">\n 【<a href=https://www.cnblogs.com/Jaryer/p/"http://s.weibo.com/weibo?q=" target="_blank">#13個求職新方向#!有你心動的職業嗎
】近日,人社部、市場監管總局、統計局聯合發布13個新職業,既有現在流行的人工智能、大資料、云計算、物聯網等工程技術人員,也有電子競技員、無人機駕駛員等新穎工種…你心動了嗎?哪些學校開設了相關專業值得關注?戳圖了解↓↓轉給正在求學的TA! '
>>>
>>>
>>> pre = re.compile('>(.*?)<')
>>> text= ''.join(pre.findall(html))
>>> print(text)
#13個求職新方向#!有你心動的職業嗎】近日,人社部、市場監管總局、統計局聯合發布13個新職業,既有現在流行的人工智能、大資料、云計算、物聯網等工程技術人員,也有電子競技員、無人機駕駛員等新穎工種…你心動了嗎?哪些學校開設了相關專業值得關注?戳圖了解↓↓轉給正在求學的TA!
轉載請註明出處,本文鏈接:https://www.uj5u.com/houduan/1947.html
標籤:Python

】近日,人社部、市場監管總局、統計局聯合發布13個新職業,既有現在流行的人工智能、大資料、云計算、物聯網等工程技術人員,也有電子競技員、無人機駕駛員等新穎工種…你心動了嗎?哪些學校開設了相關專業值得關注?戳圖了解↓↓轉給正在求學的TA! '
>>>
>>>
>>> pre = re.compile('>(.*?)<')
>>> text= ''.join(pre.findall(html))
>>> print(text)
#13個求職新方向#!有你心動的職業嗎】近日,人社部、市場監管總局、統計局聯合發布13個新職業,既有現在流行的人工智能、大資料、云計算、物聯網等工程技術人員,也有電子競技員、無人機駕駛員等新穎工種…你心動了嗎?哪些學校開設了相關專業值得關注?戳圖了解↓↓轉給正在求學的TA!