文本示例:
問:你今天來派出所干什么?答:報案,我的手機被小偷偷走了。問:你把事情經過說一下?答:99年1月20日上午10點多鐘,我去兒童醫院給兒子取藥,我把我的手機放在我的左邊的口袋里裝著,當時,在我給兒子送病歷單的時間,從我的后面擠過去一男青年,站了一會兒,就走了,停了幾分鐘聽見有人喊誰的手機丟了,我聽到喊聲,看見一個高個子青年手里拿的手機,我一看是我的手機,我隨手摸了摸了我的口袋,手機不見了,這時我聽見高個兒青年說,我們是公安局的,我過去說手機是我的,同時,看到旁邊幾個人抓住一個男青年,這個人正是我剛才在我身后擠的青年,身穿一件棕色皮夾克,下身蘭褲子,年齡大約在30歲左右。隨后我和公安人員一塊到派出所。問:你的手機是多少號,價值多少錢,什么時間買的?答:手機號1383865230,價值2500元錢,我是98年5月份買的。問:你以上所說的是否實話?答:是實話。
如何更好的對上方的示例中問答式內容切割存到陣列,問的內容存到一個陣列,答的內容存到另一個陣列。還有怎么提取這一段問答式內容的關鍵字???目前想到的是hanlp處理方式,希望大神們提供點思路。
uj5u.com熱心網友回復:
public class Test3 {
public static void main(String[] args) {
String content
= "問:你今天來派出所干什么?答:報案,我的手機被小偷偷走了。問:你把事情經過說一下?答:99年1月20日上午10點多鐘,我去兒童醫院給兒子取藥,我把我的手機放在我的左邊的口袋里裝著,當時,在我給兒子送病歷單的時間,從我的后面擠過去一男青年,站了一會兒,就走了,停了幾分鐘聽見有人喊誰的手機丟了,我聽到喊聲,看見一個高個子青年手里拿的手機,我一看是我的手機,我隨手摸了摸了我的口袋,手機不見了,這時我聽見高個兒青年說,我們是公安局的,我過去說手機是我的,同時,看到旁邊幾個人抓住一個男青年,這個人正是我剛才在我身后擠的青年,身穿一件棕色皮夾克,下身蘭褲子,年齡大約在30歲左右。隨后我和公安人員一塊到派出所。問:你的手機是多少號,價值多少錢,什么時間買的?答:手機號1383865230,價值2500元錢,我是98年5月份買的。問:你以上所說的是否實話?答:是實話。";
String regx = "問:([^答]*)答:([^問]*)";
Matcher matcher = Pattern.compile(regx).matcher(content);
while (matcher.find()) {
String q = matcher.group(1);
String a = matcher.group(2);
//自行放到陣列
System.out.println("問:" + q);
System.out.println("答:" + a);
}
}
}
uj5u.com熱心網友回復:
這個切割比較快,知道怎么從這些提取關鍵詞,特征提取????目前只想到hanlp的有一個可以提取關鍵詞的方法HanLP.extractKeyword(content, 25);
uj5u.com熱心網友回復:
public class Test3 {
public static void main(String[] args) {
String content
= "問:你今天來派出所干什么?答:報案,我的手機被小偷偷走了。問:你把事情經過說一下?答:99年1月20日上午10點多鐘,我去兒童醫院給兒子取藥,我把我的手機放在我的左邊的口袋里裝著,當時,在我給兒子送病歷單的時間,從我的后面擠過去一男青年,站了一會兒,就走了,停了幾分鐘聽見有人喊誰的手機丟了,我聽到喊聲,看見一個高個子青年手里拿的手機,我一看是我的手機,我隨手摸了摸了我的口袋,手機不見了,這時我聽見高個兒青年說,我們是公安局的,我過去說手機是我的,同時,看到旁邊幾個人抓住一個男青年,這個人正是我剛才在我身后擠的青年,身穿一件棕色皮夾克,下身蘭褲子,年齡大約在30歲左右。隨后我和公安人員一塊到派出所。問:你的手機是多少號,價值多少錢,什么時間買的?答:手機號1383865230,價值2500元錢,我是98年5月份買的。問:你以上所說的是否實話?答:是實話。";
String regx = "問:(.*?)答:(.*?)(?=問:|。)";
Matcher matcher = Pattern.compile(regx).matcher(content);
while (matcher.find()) {
String q = matcher.group(1);
String a = matcher.group(2);
//自行放到陣列
System.out.println("問:" + q);
System.out.println("答:" + a);
}
}
}這個更合理些 你說的提取是什么意思 可以舉個栗子
uj5u.com熱心網友回復:
提取這份問答中的關鍵詞,特征,比如嫌疑人的特征轉載請註明出處,本文鏈接:https://www.uj5u.com/houduan/58270.html
標籤:Java相關
上一篇:求救啊兄弟萌
