附件中重復的標題段落怎么用代碼洗掉,重復的第一個標題段落保留(要洗掉的我已經用黃色部分做了個標記做參考)
uj5u.com熱心網友回復:
有時候,需要整理的檔案有大量重復的段落,如何批量清除呢?[準備作業]
1、把每個段落標記替換為二個(查找內容“^p”,替換為“^p^p”)
2、把游標放在文章開始處(Ctrl+Home),因為WORD默認是從游標開始處查找。或者全選檔案(Ctrl+A)。
[正式開始]
如果是連續的重復段落:
點擊:編輯-替換 勾選通配符
查找內容:(^13[!^13]@^13){2,}
替換為:\1
全部替換
重復一下,看看有沒有替換干凈(一個段落一般不會重復255次以上吧,呵呵),不行就再來幾次,直到
替換處數為0。
此命令效率非常之高!成千上萬頁內容可瞬間完成!
如果是不連續的重復段落:
點擊:編輯-替換
勾選通配符
查找內容:(^13[!^13]@^13)(*)\1
替換為:^13\1\2
全部替換
重復幾次,只到替換處數為0。
此命令對數百頁檔案可能需時較長,因為要執行回圈比較,請耐心等候!
這段代碼的意思:
查找內容:(^13[!^13]@^13){2,}
替換為:\1
^13表示段落標記,[!]表示“非”,[!^13]表示段落標記之外的任意單個字符;@表示一個以上的前一字符或運算式,它跟[!^13]一起表示一個以上的段落標記之外的字符,^13[!^13]@^13也就是包含前后段落標記的、有任意個字符的、非空的段落;用圓括號將其括起來(^13[!^13]@^13),意思是將這一部分加以標識,這是我們標識的第一部分,下面替換為框中的\1代表的就是它!
{n,}代表至少 n 個前一字符或運算式,那么{2,}當然就表示2個以上這樣的段落(括號括起來的部分),注意,應該是完全相同的段落!注意這里的{2,}不可以用@來替代,如果用@的話,因為它也包括“一個”的情況,那么在執行的時候,所有的不重復的段落也會被它自己替換一遍,執行效率要大打折扣!
題外話:正則運算式里要是有一個代碼表示“兩個或兩個以上”的意思,該多好啊
轉載請註明出處,本文鏈接:https://www.uj5u.com/caozuo/98486.html
標籤:非技術區
上一篇:動態IP監控、MAC地址獲取
下一篇:EXCEL超鏈問題
