依存分析
兩個句法分析工具:
Context-free grammars(CFGs) 背景關系無關文法
Dependency structure 依存句法結構
Dependency syntax 依存句法
單詞A修飾單詞B,則稱單詞A是單詞B的依賴,表示為BA
解決句法歧義問題,可探究詞匯或短語間的依存結構,關于嵌套規則有一定的約束條件,最終可能的結構的個數稱為Catalan數

Treebanks 樹庫:人工標注的依存關系樹
依存關系語法,依存結構
Projective dependency tree 投影依存樹:依存關系相互嵌套,不出現交叉
非投影依存樹往往可以通過移動短語位置調整為投影依存樹
依存分析方法:動態編程、圖演算法(e.g. MST最小生成樹)、約束補償問題、確定型依存句法分析
Arc-standard transition-based parser 基于弧標準轉換的依存分析
一種確定型依存句法分析方法(deterministic dependency parsing)
思路是使用機器學習分類器,優點:線性時間復雜度
在一個堆疊和一個緩沖區上進行三種操作:Shift、Left-Arc、Right-Arc

隨后使用機器學習分類器訓練得到每種狀態下選擇的操作(復雜模型中每種弧代表的依存關系還需要進一步給出類別標簽)
用于訓練的變數資料:稀疏的特征矩陣,如單詞的位置和詞性
評價指標:UAS(僅考查弧的準確率)、LAS(考查弧上的標簽)
對于演算法的改進:使用引入詞向量、POS標簽(part-of-speech tags)和弧標簽(前置狀態下選擇的弧標簽)稠密的資料訓練
轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/433214.html
標籤:AI
上一篇:資料分布探索函式(可以直接呼叫)
