我正在嘗試使用 Python 將 HTML 字串標記轉換為字串。
這是我要轉換的內容:
htmltxt = "<b>Hello World</b>".
結果應該像Hello World 一樣以粗體顯示。但我越來越喜歡
<html><body><b>Hello World</b></body></html>
使用下面的代碼片段
from bs4 import BeautifulSoup
htmltxt = "<b>Hello World</b>"
soup = BeautifulSoup(htmltxt, 'lxml')
誰能建議我如何轉換?
uj5u.com熱心網友回復:
在這種情況下,您正試圖從您的湯物件中找到一個標簽。鑒于這是唯一的,并且沒有您可以使用的 id 或類名:
hello_world_tag = soup.find("b")
hello_world_tag_text = hello_world_tag.text
print(hello_world_tag_text) # Output: 'Hello World'
這里的關鍵是“.text”。使用 Beautiful Soup 查找特定標簽將回傳整個標簽,但 .text 方法僅回傳該標簽內的文本。
編輯以下評論:
我仍然建議使用 bs4 來決議 html。一旦你有你的文字,如果你想要粗體,你可以列印:
print('\033[1m' text)
uj5u.com熱心網友回復:
注意 您不會得到bold字串本身,它總是必須通過解釋或格式化來完成。
使用 BeautifulSoup 從 HTML 字串中提取文本,您可以呼叫方法text或get_text():
from bs4 import BeautifulSoup
htmltxt = "<b>Hello World</b>"
soup = BeautifulSoup(htmltxt, 'lxml')
soup.text
轉載請註明出處,本文鏈接:https://www.uj5u.com/yidong/383173.html
上一篇:Javascript中的復雜字串
下一篇:文本到字串陣列并洗掉重復項
