我有一個文本,其中包含許多連接成單個字串的文章。每篇新文章都以 ,= Article 1 =開頭= = Article 1 Section 1 = =,= = Article 1 Section 2 = =依此類推。我想拆分這個字串并為每篇文章創建一個字串。
為此,我正在使用正則運算式拆分
import re
pattern = "=[\s\w\'\(\)] ="
l = re.compile(pattern).split(test_data)
但這并沒有給我想要的結果。這篇文章也分為部分和小節。我嘗試=從匹配中排除多個s,但沒有發現任何成功,也不知道如何繼續。我已粘貼的樣本資料(兩篇文章)在這里 -Robert Boulder和Kiss You ( One Direction song )
uj5u.com熱心網友回復:
這個正則運算式應該可以完成這項作業:
^ *= [^=]* = *$
看到它在這里作業:
https://regex101.com/r/l3tziI/1
基本上匹配一個 '=' 后跟一個空格,任意數量的不是 '='([^=]部分)的字符,然后是另一個空格和另一個 '='。還包括行首和行尾的可選空格,因為您的示例文本在某些行上有前導和尾隨空格。
轉載請註明出處,本文鏈接:https://www.uj5u.com/houduan/401262.html
