我有一個 ispell 巨大的 .mwl 檔案,我想洗掉所有 ispell 后綴以使用 unix ispell、bash 或 perl 命令生成一個簡單的純文本單詞詞典。
是否有 ispell 命令選項可以做到這一點?
(在 unix 中,.mwl.gz 檔案位于 /usr/share/ispell/ 目錄中)
該檔案的簡短摘錄:
a/MRSY
A'asia
a'body
a'thing
aaa
AAAS
Aaberg/M
Aachen/M
Aaedon/M
AAeE
AAeE's
aaerially
aaerialness
Aaerope/M
AAgr/M
aah/DGS
aal/MS
Aalborg
Aalesund
aalii/MS
Aaliyah/M
Aalst/M
Aalto
aam
Aandahl/M
Aani/M
Aaqbiye/M
Aar/MN
Aara/M
Aarau
aardvark/MS
aardwolf/M
aardwolves
Aaren/M
Aargau
aargh
Aarhus
Aarika/M
aarogramme
uj5u.com熱心網友回復:
我不確定您所說的后綴是什么意思,但我假設它是示例文本中 / 或 ' 之后的部分。您可以使用來自 Bash 的簡單管道來完成此操作。
cat something.mwl | perl -pe 's{[/\x27].*$}{}; ' > stripped_something.txt
該-p開關手段在管道運行perl。您輸入的任何內容都會一次放入$_一行,進行處理,然后列印出來。請注意,我\x27在正則運算式中添加了撇號。在命令列中轉義它是一個很大的痛苦。如果有任何其他字符以后綴開頭,您可以將它們放在字符類中。
在以這種方式列印出來之前,您也可以在線上進行任何其他作業。
有關該開關的更多資訊,請參閱perlrun檔案-p。
轉載請註明出處,本文鏈接:https://www.uj5u.com/qiye/376619.html
