我有一段很長的文字,我想把它分成一個段落串列。我一直找不到作業包,所以我自己寫了一個啟發式。
首先,我想用兩個換行符在所有地方分割文本。使下面的文字:
"Lorem ipsum dolor sit amet, consectetur adipiscing elit. Suspendisse tortor neque, tempor condimentum erat eget, faucibus tristique quam. Praesent hendrerit, mi non finibus iaculis, justo lacus pharetra purus, vitae bibendum lectus erat sit amet risus. Integer porta, risus id accumsan accumsan, lacus augue finibus orci, eu interdum sapien odio at enim. Vestibulum eget libero nisl. Donec accumsan justo a sem semper vehicular.
Etiam convallis sodales felis quis iaculis. Aenean eget rhoncus libero, non iaculis leo. Pellentesque dictum mauris libero, a feugiat elit mollis facilisis. Nulla facilisi. Aliquam dictum lorem vitae nisl suscipit faucibus. Suspendisse at rhoncus est, vitae sagittis metus. Etiam massa lacus, gravida ut elit sit amet, sagittis feugiat enim. Nullam dictum pretium mi ac rutrum. Fusce ornare sollicitudin augue, dignissim bibendum ante cursus non.
Sed et urna ac nibh molestie venenatis non at eros. Suspendisse eget enim ornare turpis gravida finibus. Vestibulum ante ipsum primis in faucibus orci luctus et ultrices posuere cubilia curae; Quisque hendrerit eros eros, nec euismod erat maximus quis. Donec fringilla nibh id ligula porta lacinia. Orci varius natoque penatibus et magnis dis parturient montes, nascetur ridiculus mus. Cras sit amet auctor augue.
Aenean porttitor cursus tempor. Ut rutrum feugiat purus, ac tincidunt nisl pharetra in. Nunc nunc libero, placerat eu tempus et, sagittis volutpat libero. Maecenas sit amet arcu sed felis consectetur dapibus."
將按如下方式拆分(僅一個換行符被視為同一段落):
["Lorem ipsum dolor sit amet, consectetur adipiscing elit. Suspendisse tortor neque, tempor condimentum erat eget, faucibus tristique quam. Praesent hendrerit, mi non finibus iaculis, justo lacus pharetra purus, vitae bibendum lectus erat sit amet risus. Integer porta, risus id accumsan accumsan, lacus augue finibus orci, eu interdum sapien odio at enim. Vestibulum eget libero nisl. Donec accumsan justo a sem semper vehicular.",
"Etiam convallis sodales felis quis iaculis. Aenean eget rhoncus libero, non iaculis leo. Pellentesque dictum mauris libero, a feugiat elit mollis facilisis. Nulla facilisi. Aliquam dictum lorem vitae nisl suscipit faucibus. Suspendisse at rhoncus est, vitae sagittis metus. Etiam massa lacus, gravida ut elit sit amet, sagittis feugiat enim. Nullam dictum pretium mi ac rutrum. Fusce ornare sollicitudin augue, dignissim bibendum ante cursus non.",
"Sed et urna ac nibh molestie venenatis non at eros. Suspendisse eget enim ornare turpis gravida finibus. Vestibulum ante ipsum primis in faucibus orci luctus et ultrices posuere cubilia curae; Quisque hendrerit eros eros, nec euismod erat maximus quis. Donec fringilla nibh id ligula porta lacinia. Orci varius natoque penatibus et magnis dis parturient montes, nascetur ridiculus mus. Cras sit amet auctor augue.
Aenean porttitor cursus tempor. Ut rutrum feugiat purus, ac tincidunt nisl pharetra in. Nunc nunc libero, placerat eu tempus et, sagittis volutpat libero. Maecenas sit amet arcu sed felis consectetur dapibus."]
我怎樣才能做到這一點?(也歡迎用于此任務的軟體包)。
uj5u.com熱心網友回復:
注意:我將您的文本保存在一個文本檔案中作為 b.txt
enter code here
a = open("b.txt","r")
read_a = a.read()
a.close()
c =read_a.split("\n\n")
print(len(c))
print(c)
uj5u.com熱心網友回復:
如果文本來自檔案,您可以使用 pythons readlines() 開始。結果是文本行到 ASCII LR/CR。如果文本不是來自檔案,您可以在字串中搜索 '\r\n' 以查找 LF/CR。
轉載請註明出處,本文鏈接:https://www.uj5u.com/yidong/407625.html
標籤:
上一篇:如何列印.txt/.py檔案具有和沒有另一個.txt/.py檔案與之比較的那些單詞?
下一篇:使用字串參考類中的物件?
