我正在努力從 Java 的書籍檔案中取出連接詞(連詞),因此只剩下實質的詞。我能夠讀取 book.txt 檔案的資訊,將其拆分為標記,洗掉標點符號,并按單詞的說次數進行排序。但是,我無法弄清楚如何將這本書的資料與前面提到的這些連詞的另一個檔案進行比較。我想過將每個連接詞放入一個 HashMap 中,但是將數值和詞放在一起對我來說似乎不合適。有沒有人對如何有效地做到這一點有任何建議?我仍然是一個初學者程式員:)
謝謝!
uj5u.com熱心網友回復:
如果我理解正確的話,您將有一段文本存盤在一個檔案中,您希望從中洗掉“連詞”字樣。連詞存盤在單獨的檔案中。
如果您想要從文本中洗掉這些連詞的所有實體,以下代碼將執行此操作。(假設您已經將文本和連詞加載到兩個字串中)
//Load text from file into string 'text'
//Load conjuctions from file into string 'conjs'
//Split the conjunctions into separate elements of an array
List<String> conjsArray = Arrays.asList(conjs.split("\\s "));
//Iterate over each conjunction word, and remove all instances of it from the text
for (String conjunction : conjsArray){
text = text.replaceAll(conjunction, "");
}
轉載請註明出處,本文鏈接:https://www.uj5u.com/qukuanlian/318447.html
上一篇:來自文本檔案的有效JSON
