import difflib
text1 = ['1. 一種會話摘要生成方法', '2. 根據權利要求1所述的方法, 將所述向量化會話組樣本和向量化摘要樣本輸入到預先建立的神經網路結構中進行 多次迭代,得到所述摘要生成 模型。', '3. 根據據權利要求1所述的方法,其特征在于,所述根據所述會話內容得到會話文本包 括: 若會話內容為文本內容,則將所述文本內容作為與會話內容對應的會話文本; 若會話內容為語音內容,則將所述語音內容轉化為文本內容,并將所述文本內容作為 與所述會話內容對應的會話文本。', '4. 根據權利要求1所述的方法,其特征在于,若否,則將每潭訓話文本作為一個會話組', '5. 根據權利要求4所述的方法,其特征在于,所述確定會話內容中每一潭訓話文本的主 題和意圖,包括: 根據預先保存的語料文本與主題的對應關系,識別會話內容中的每一潭訓話文本,若 會話文本包含所述語料文本,則將所述語料文本對應的主題確定為該潭訓話文本的主題, 若會話文本不包含所述語料文本,則計算該潭訓話文本中每個詞的主題,,將分布概率最大的主題確定為該潭訓話文本的主題;以及, 根據預先保存的語料文本與意圖的對應關系,識別會話內容中的每一潭訓話文本,若 會話文本包含所述語料文本意 圖。']
text2 = ['1.一種會話摘要生成方法,', '2.根據權利要求1所述的方法,將所述向量化會話組樣本和向量化摘要樣本輸入到預先建立的神經網路結構中進行多次迭代,得到所述摘要生成模型。', '3.根據據權利要求1所述的方法,其特征在于,所述根據所述會話內容得到會話文本包括:若會話內容為文本內容,則將所述文本內容作為與會話內容對應的會話文本;若會話內容為語音內容,則將所述語音內容轉化為文本內容,并將所述文本內容作為與所述會話內容對應的會話文本。', '4.根據權利要求3所述的方法,其特征在于,所述確定會話內容中每一潭訓話文本的主題和意圖,包括:根據預先保存的語料文本與主題的對應關系,識別會話內容中的每一潭訓話文本,若會話文本包含所述語料文本,則將所述語料文本對應的主題確定為該潭訓話文本的主題,若會話文本不包含所述語料文本,則計算該潭訓話文本中每個詞的主題,統計所有詞在主題上的分布概率,將分布概率最大的主題確定為該潭訓話文本的主題;以及,根據預先保存的語料文本與意圖的對應關系,識別會話內容中的每一潭訓話文本,若會話文本包含所述語料文本,則將所述語料文本對應的意圖確定為該潭訓話文本的意圖,若會話文本不包含所述語料文本,則將所述會話文本輸入到預先建立的意圖識別模型中,計算該會話文本在不同意圖上的分布概率,將分布概率最大的意圖作為該會話文本的意圖。', '5.根據權利要求4所述的方法,其特征在于,所述意圖識別模型通過以下方式建立:']
d = difflib.HtmlDiff()
con = d.make_file(text1,text2) # 創建HtmlDiffer()物件
with open('123.html','w',encoding='utf8')as f:
f.write(con)
運行結所生成的html頁面為什么會有空行

轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/34965.html
下一篇:PythonAPI呼叫
