主頁 >  其他 > 自然語言處理 Paddle NLP - 詞法分析技術及其應用

自然語言處理 Paddle NLP - 詞法分析技術及其應用

2023-06-17 07:32:57 其他

詞法分析就是利用計算機對自然語言的形態(morphology) 進行分析,判斷詞的結構和類別等,”簡單而言,就是分詞并對每個詞進行分類,包括:分詞、詞性標注、物體識別三個任務

image

image

image

image
問答
知識圖譜,類似一張表, 里面放了 姚明(人) 、妻子(屬性)對應的是誰
這張表來源于網頁挖掘,也是詞法分析,進行對應識別
image
對話
詞法分析得到標簽,根據動作進行具體操作
image
image

image
image
image
image

對每個字打標簽:B 是一個詞的開始,I 是一個詞的持續,通過一個公式轉換成序列標注
image
image
image
image
image

OOV(out of vocabulary) 問題:新詞,沒有見過的詞
將預訓練模型插進來進行替換,解決OOV問題
image

預測有4個詞,只有3個和標簽標注的一樣,它的準確就是 3/4
只有一個錯了應該是8/9 實際比它要小,所以說以詞為力度去計算是一個更嚴格的標準,
image
基于上面的評估方法得到的一個準確率和效果,MSR資料集(分詞資料集)BERNIE-CRF效果最好,
最長匹配,準確率還可以,還是有很多地方在使用,高效簡單
image

image
image

image
image
image
image
image
image

轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/555367.html

標籤:其他

上一篇:做一個“20倍程式員”

下一篇:返回列表

標籤雲
其他(161133) Python(38236) JavaScript(25498) Java(18244) C(15237) 區塊鏈(8271) C#(7972) AI(7469) 爪哇(7425) MySQL(7254) html(6777) 基礎類(6313) sql(6102) 熊猫(6058) PHP(5875) 数组(5741) R(5409) Linux(5347) 反应(5209) 腳本語言(PerlPython)(5129) 非技術區(4971) Android(4599) 数据框(4311) css(4259) 节点.js(4032) C語言(3288) json(3245) 列表(3129) 扑(3119) C++語言(3117) 安卓(2998) 打字稿(2995) VBA(2789) Java相關(2746) 疑難問題(2699) 细绳(2522) 單片機工控(2479) iOS(2436) ASP.NET(2404) MongoDB(2323) 麻木的(2285) 正则表达式(2254) 字典(2211) 循环(2198) 迅速(2185) 擅长(2169) 镖(2155) .NET技术(1984) 功能(1967) HtmlCss(1967) Web開發(1951) C++(1941) python-3.x(1918) 弹簧靴(1913) xml(1889) PostgreSQL(1881) .NETCore(1863) 谷歌表格(1846) Unity3D(1843) for循环(1842)

熱門瀏覽
  • 網閘典型架構簡述

    網閘架構一般分為兩種:三主機的三系統架構網閘和雙主機的2+1架構網閘。 三主機架構分別為內端機、外端機和仲裁機。三機無論從軟體和硬體上均各自獨立。首先從硬體上來看,三機都用各自獨立的主板、記憶體及存盤設備。從軟體上來看,三機有各自獨立的作業系統。這樣能達到完全的三機獨立。對于“2+1”系統,“2”分為 ......

    uj5u.com 2020-09-10 02:00:44 more
  • 如何從xshell上傳檔案到centos linux虛擬機里

    如何從xshell上傳檔案到centos linux虛擬機里及:虛擬機CentOs下執行 yum -y install lrzsz命令,出現錯誤:鏡像無法找到軟體包 前言 一、安裝lrzsz步驟 二、上傳檔案 三、遇到的問題及解決方案 總結 前言 提示:其實很簡單,往虛擬機上安裝一個上傳檔案的工具 ......

    uj5u.com 2020-09-10 02:00:47 more
  • 一、SQLMAP入門

    一、SQLMAP入門 1、判斷是否存在注入 sqlmap.py -u 網址/id=1 id=1不可缺少。當注入點后面的引數大于兩個時。需要加雙引號, sqlmap.py -u "網址/id=1&uid=1" 2、判斷文本中的請求是否存在注入 從文本中加載http請求,SQLMAP可以從一個文本檔案中 ......

    uj5u.com 2020-09-10 02:00:50 more
  • Metasploit 簡單使用教程

    metasploit 簡單使用教程 浩先生, 2020-08-28 16:18:25 分類專欄: kail 網路安全 linux 文章標簽: linux資訊安全 編輯 著作權 metasploit 使用教程 前言 一、Metasploit是什么? 二、準備作業 三、具體步驟 前言 Msfconsole ......

    uj5u.com 2020-09-10 02:00:53 more
  • 游戲逆向之驅動層與用戶層通訊

    驅動層代碼: #pragma once #include <ntifs.h> #define add_code CTL_CODE(FILE_DEVICE_UNKNOWN,0x800,METHOD_BUFFERED,FILE_ANY_ACCESS) /* 更多游戲逆向視頻www.yxfzedu.com ......

    uj5u.com 2020-09-10 02:00:56 more
  • 北斗電力時鐘(北斗授時服務器)讓網路資料更精準

    北斗電力時鐘(北斗授時服務器)讓網路資料更精準 北斗電力時鐘(北斗授時服務器)讓網路資料更精準 京準電子科技官微——ahjzsz 近幾年,資訊技術的得了快速發展,互聯網在逐漸普及,其在人們生活和生產中都得到了廣泛應用,并且取得了不錯的應用效果。計算機網路資訊在電力系統中的應用,一方面使電力系統的運行 ......

    uj5u.com 2020-09-10 02:01:03 more
  • 【CTF】CTFHub 技能樹 彩蛋 writeup

    ?碎碎念 CTFHub:https://www.ctfhub.com/ 筆者入門CTF時時剛開始刷的是bugku的舊平臺,后來才有了CTFHub。 感覺不論是網頁UI設計,還是題目質量,賽事跟蹤,工具軟體都做得很不錯。 而且因為獨到的金幣制度的確讓人有一種想去刷題賺金幣的感覺。 個人還是非常喜歡這個 ......

    uj5u.com 2020-09-10 02:04:05 more
  • 02windows基礎操作

    我學到了一下幾點 Windows系統目錄結構與滲透的作用 常見Windows的服務詳解 Windows埠詳解 常用的Windows注冊表詳解 hacker DOS命令詳解(net user / type /md /rd/ dir /cd /net use copy、批處理 等) 利用dos命令制作 ......

    uj5u.com 2020-09-10 02:04:18 more
  • 03.Linux基礎操作

    我學到了以下幾點 01Linux系統介紹02系統安裝,密碼啊破解03Linux常用命令04LAMP 01LINUX windows: win03 8 12 16 19 配置不繁瑣 Linux:redhat,centos(紅帽社區版),Ubuntu server,suse unix:金融機構,證券,銀 ......

    uj5u.com 2020-09-10 02:04:30 more
  • 05HTML

    01HTML介紹 02頭部標簽講解03基礎標簽講解04表單標簽講解 HTML前段語言 js1.了解代碼2.根據代碼 懂得挖掘漏洞 (POST注入/XSS漏洞上傳)3.黑帽seo 白帽seo 客戶網站被黑帽植入劫持代碼如何處理4.熟悉html表單 <html><head><title>TDK標題,描述 ......

    uj5u.com 2020-09-10 02:04:36 more
最新发布
  • 自然語言處理 Paddle NLP - 詞法分析技術及其應用

    詞法分析就是利用計算機對自然語言的形態(morphology) 進行分析,判斷詞的結構和類別等。”簡單而言,就是分詞并對每個詞進行分類,包括:分詞、詞性標注、物體識別三個任務 ![image](https://img2023.cnblogs.com/blog/80824/202306/80824-2 ......

    uj5u.com 2023-06-17 07:32:57 more
  • 做一個“20倍程式員”

    以前有一個詞叫“十倍程式員”,形容一個程式員效率高,一個頂十個。 現在隨著ChatGPT的爆火,我覺得可以膽子大一點,改叫“二十倍程式員”。 我是一名十幾年的老程式員,最近在學習ChatGPT,也是ChatGPT的重度用戶,已經用上癮了。 接下來我分享一下的日常用法,大家看看是否能提高效率。 一、向 ......

    uj5u.com 2023-06-17 07:32:27 more
  • Node.js 開發常用到的庫和插件工具,同事看到后也悄悄收藏了……

    Node.js是一個功能強大,并且非常流行的 JavaScript 運行時環境,使開發人員能夠高效率的構建高性能應用程式。下面介紹了8個常見的應用程式開發中用到的庫和函式,可以用于快取資料、操作日期、處理影像、發送電子郵件、發出 HTTP 請求、記錄請求和回應、壓縮資料和哈希密碼等。通過使用這些庫, ......

    uj5u.com 2023-06-17 07:32:21 more
  • 5 Amazing AI Projects, Open Source !

    過去一周,AI大模型的快速演進仍然在繼續上演。今天繼續介紹GitHub上的一些實用的大模型開源專案。 **1. ChatGLM-6B:Open Source ChatGPT Alternative** ChatGLM-6B是一個基于GLM架構的開源對話語言模型,支持中英雙語,有62億引數。結合模型量 ......

    uj5u.com 2023-06-17 07:32:17 more
  • 視頻編碼耗時長、編碼幀發送失敗…DVPP視頻編碼問題典型案例分析

    摘要:本期就分享幾個關于DVPP視頻編碼問題的典型案例,并給出原因分析及解決方法 本文分享自華為云社區《DVPP媒體資料處理視頻編碼問題案例》,作者:昇騰CANN。 DVPP(Digital Vision Pre-Processing)是昇騰AI處理器內置的影像處理單元,通過AscendCL媒體資料 ......

    uj5u.com 2023-06-17 07:32:07 more
  • 安全可信 | 首批!天翼云邊緣安全加速平臺AccessOne通過信通院“軟

    近日,中國資訊通信研究院(以下簡稱“中國信通院”)公布“軟體自研創新能力”專項評估(簡稱“可信研創”)結果,天翼云邊緣安全加速平臺AccessOne順利通過評估,成為首批通過該項評估的云服務商。 “軟體自研創新能力”專項評估旨在通過原始碼級別的開源同源匹配技術,分析軟體產品的代碼組成成分,幫助用戶了解 ......

    uj5u.com 2023-06-17 07:31:49 more
  • OpenFunction v1.1.0 發布:新增 v1beta2 API,支持 Dapr 狀態管理

    OpenFunction 是一個開源的云原生 FaaS(Function as a Service,函式即服務)平臺,旨在幫助開發者專注于業務邏輯的研發。在過去的幾個月里,OpenFunction 社區一直在努力作業,為 OpenFunction 1.1.0 版本的發布做準備。今天,我們非常高興地宣 ......

    uj5u.com 2023-06-17 07:31:41 more
  • 程式員接單,哪些單子需要特別注意?

    眾所周知,國內各行各業都在卷,程式員更是卷王里的佼佼者!所以在接單這方面也是嚴重的僧多粥少,其中還有很大一部分是不靠譜的單子,那么那些單子需要特別注意呢?這里給大家分享一下我這幾年來總結的一些經驗,希望對大家有一點幫助。 ......

    uj5u.com 2023-06-17 07:31:29 more
  • 讀資料壓縮入門筆記06_背景關系轉換

    ![](https://img2023.cnblogs.com/blog/3076680/202306/3076680-20230616160541114-747303059.png) # 1. 壓縮演算法可歸為兩類 ## 1.1. 統計壓縮(即VLC) ## 1.2. 字典壓縮(如LZ78) ## ......

    uj5u.com 2023-06-17 07:31:11 more
  • LGV引理

    # LGV引理 定義 $A$ 是起點集合 $\{a_1,a_2,...,a_n\}$ 。 $B$ 是終點集合 $\{b_1,b_2,...,b_n\}$。 定義 $\omega(P)$ 為路徑 $P$ 每一條邊權值的乘積,即 : $$ \omega(P) = \prod_{e \in P}w_e $ ......

    uj5u.com 2023-06-17 07:31:04 more