主頁 >  其他 > 自然語言處理(NLP) - 前預訓練時代的自監督學習

自然語言處理(NLP) - 前預訓練時代的自監督學習

2023-06-03 08:30:00 其他

前預訓練時代的自監督學習自回歸、自編碼預訓練的前世
image
神經網路(Neural Network, NN)
image
image

損失函式,度量神經網路的預測結果真實結果相差多少

  • 平方差損失(歐式距離角度)預測概率分部和實際標簽概率的歐式距離
  • 交叉熵損失(資訊量角度)預測概率分部和真實概率分部的差異,指導神經網路學習時,更加穩定
    image
    對引數W更新損失的負梯度
    image
    One-hot 人為規定,不需要學習,在推薦里有非常多的用處,(可以理解成完全命中)
    image
    詞向量需要學習,可以很好的泛化結果,泛化性能比 one-hot 更好(可以理解成泛化關系的建模)
    評估模型的好壞:有全體指標,以及一些公開的資料集,去評估詞向量的相關性
    image

image

Skip-gram: 給定一個中間值,預測背景關系視窗中的一個詞
image
image
CBoW:給定一個背景關系詞,預測中間值
image

image

image

RNN 拋開馬爾科夫假設,
image

Self-Attention:每個單詞和整句所有話進行匹配,來獲取當前單詞對每個單詞的重視程度,利用這個重視程式,對整句話的每個單詞進行加權,加權的結果用于表示當前這個單詞
image
Self-Attention:也是非常流行的 Transformer 的核心模塊,
Seft-Attention 沒有考慮單詞的順序,所以為了更精裝的表示位置資訊,需要對句子的輸入加個位置的序號 Positional Embedding
image

殘差連接,很好的緩解梯度消失的問題,包括映射和直連接部分
image
image
image

https://aistudio.baidu.com/aistudio/education/lessonvideo/1451160

轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/554172.html

標籤:其他

上一篇:手把手實踐丨基于STM32+華為云設計的智慧煙感系統

下一篇:返回列表

標籤雲
其他(160246) Python(38199) JavaScript(25473) Java(18184) C(15236) 區塊鏈(8269) C#(7972) AI(7469) 爪哇(7425) MySQL(7223) html(6777) 基礎類(6313) sql(6102) 熊猫(6058) PHP(5873) 数组(5741) R(5409) Linux(5346) 反应(5209) 腳本語言(PerlPython)(5129) 非技術區(4971) Android(4581) 数据框(4311) css(4259) 节点.js(4032) C語言(3288) json(3245) 列表(3129) 扑(3119) C++語言(3117) 安卓(2998) 打字稿(2995) VBA(2789) Java相關(2746) 疑難問題(2699) 细绳(2522) 單片機工控(2479) iOS(2434) ASP.NET(2403) MongoDB(2323) 麻木的(2285) 正则表达式(2254) 字典(2211) 循环(2198) 迅速(2185) 擅长(2169) 镖(2155) .NET技术(1980) 功能(1967) Web開發(1951) HtmlCss(1951) C++(1928) python-3.x(1918) 弹簧靴(1913) xml(1889) PostgreSQL(1879) .NETCore(1863) 谷歌表格(1846) Unity3D(1843) for循环(1842)

熱門瀏覽
  • 網閘典型架構簡述

    網閘架構一般分為兩種:三主機的三系統架構網閘和雙主機的2+1架構網閘。 三主機架構分別為內端機、外端機和仲裁機。三機無論從軟體和硬體上均各自獨立。首先從硬體上來看,三機都用各自獨立的主板、記憶體及存盤設備。從軟體上來看,三機有各自獨立的作業系統。這樣能達到完全的三機獨立。對于“2+1”系統,“2”分為 ......

    uj5u.com 2020-09-10 02:00:44 more
  • 如何從xshell上傳檔案到centos linux虛擬機里

    如何從xshell上傳檔案到centos linux虛擬機里及:虛擬機CentOs下執行 yum -y install lrzsz命令,出現錯誤:鏡像無法找到軟體包 前言 一、安裝lrzsz步驟 二、上傳檔案 三、遇到的問題及解決方案 總結 前言 提示:其實很簡單,往虛擬機上安裝一個上傳檔案的工具 ......

    uj5u.com 2020-09-10 02:00:47 more
  • 一、SQLMAP入門

    一、SQLMAP入門 1、判斷是否存在注入 sqlmap.py -u 網址/id=1 id=1不可缺少。當注入點后面的引數大于兩個時。需要加雙引號, sqlmap.py -u "網址/id=1&uid=1" 2、判斷文本中的請求是否存在注入 從文本中加載http請求,SQLMAP可以從一個文本檔案中 ......

    uj5u.com 2020-09-10 02:00:50 more
  • Metasploit 簡單使用教程

    metasploit 簡單使用教程 浩先生, 2020-08-28 16:18:25 分類專欄: kail 網路安全 linux 文章標簽: linux資訊安全 編輯 著作權 metasploit 使用教程 前言 一、Metasploit是什么? 二、準備作業 三、具體步驟 前言 Msfconsole ......

    uj5u.com 2020-09-10 02:00:53 more
  • 游戲逆向之驅動層與用戶層通訊

    驅動層代碼: #pragma once #include <ntifs.h> #define add_code CTL_CODE(FILE_DEVICE_UNKNOWN,0x800,METHOD_BUFFERED,FILE_ANY_ACCESS) /* 更多游戲逆向視頻www.yxfzedu.com ......

    uj5u.com 2020-09-10 02:00:56 more
  • 北斗電力時鐘(北斗授時服務器)讓網路資料更精準

    北斗電力時鐘(北斗授時服務器)讓網路資料更精準 北斗電力時鐘(北斗授時服務器)讓網路資料更精準 京準電子科技官微——ahjzsz 近幾年,資訊技術的得了快速發展,互聯網在逐漸普及,其在人們生活和生產中都得到了廣泛應用,并且取得了不錯的應用效果。計算機網路資訊在電力系統中的應用,一方面使電力系統的運行 ......

    uj5u.com 2020-09-10 02:01:03 more
  • 【CTF】CTFHub 技能樹 彩蛋 writeup

    ?碎碎念 CTFHub:https://www.ctfhub.com/ 筆者入門CTF時時剛開始刷的是bugku的舊平臺,后來才有了CTFHub。 感覺不論是網頁UI設計,還是題目質量,賽事跟蹤,工具軟體都做得很不錯。 而且因為獨到的金幣制度的確讓人有一種想去刷題賺金幣的感覺。 個人還是非常喜歡這個 ......

    uj5u.com 2020-09-10 02:04:05 more
  • 02windows基礎操作

    我學到了一下幾點 Windows系統目錄結構與滲透的作用 常見Windows的服務詳解 Windows埠詳解 常用的Windows注冊表詳解 hacker DOS命令詳解(net user / type /md /rd/ dir /cd /net use copy、批處理 等) 利用dos命令制作 ......

    uj5u.com 2020-09-10 02:04:18 more
  • 03.Linux基礎操作

    我學到了以下幾點 01Linux系統介紹02系統安裝,密碼啊破解03Linux常用命令04LAMP 01LINUX windows: win03 8 12 16 19 配置不繁瑣 Linux:redhat,centos(紅帽社區版),Ubuntu server,suse unix:金融機構,證券,銀 ......

    uj5u.com 2020-09-10 02:04:30 more
  • 05HTML

    01HTML介紹 02頭部標簽講解03基礎標簽講解04表單標簽講解 HTML前段語言 js1.了解代碼2.根據代碼 懂得挖掘漏洞 (POST注入/XSS漏洞上傳)3.黑帽seo 白帽seo 客戶網站被黑帽植入劫持代碼如何處理4.熟悉html表單 <html><head><title>TDK標題,描述 ......

    uj5u.com 2020-09-10 02:04:36 more
最新发布
  • 自然語言處理(NLP) - 前預訓練時代的自監督學習

    前預訓練時代的自監督學習自回歸、自編碼預訓練的前世 ![image](https://img2023.cnblogs.com/blog/80824/202306/80824-20230602112233170-1798796623.png) 神經網路(Neural Network, NN) ![im ......

    uj5u.com 2023-06-03 08:30:00 more
  • 手把手實踐丨基于STM32+華為云設計的智慧煙感系統

    摘要:當前基于STM32和華為云,設計了一種智慧煙感系統,該系統可以檢測煙霧,同時將檢測到的資料上傳到云端進行處理和分析。 本文分享自華為云社區《基于STM32+華為云設計的智慧煙感系統》,作者:DS小龍哥 。 一、概述 當前基于STM32和華為云,設計了一種智慧煙感系統,該系統可以檢測煙霧,同時將 ......

    uj5u.com 2023-06-03 08:23:50 more
  • BFF層聚合查詢服務異步改造及治理實踐 | 京東云技術團隊

    最近在對穩健理財BFF層聚合查詢服務優化治理,針對文章內的串行改并行章節進行展開,分享下實踐經驗,主要涉及原同步改異步的程序、全異步化后衍生的問題以及治理方面的思考與改進。 ......

    uj5u.com 2023-06-03 08:23:42 more
  • 6.4. HttpClient

    **1. 什么是HttpClient?** HttpClient是Java 11中引入的一個新特性,用于支持同步和異步發送HTTP請求以及處理HTTP回應。它提供了簡單易用的API,使得發送HTTP請求變得非常簡單。 **2. HttpClient的主要組件** HttpClient由以下幾個主要組 ......

    uj5u.com 2023-06-03 08:23:35 more
  • 有沒有免費版的配音軟體?

    1.先說結論:完全免費的 剪映配音 可以滿足大部分需求 先不要著急去買付費的配音軟體。 (我就被忽悠過,買了付費配音軟體后,實際沒用幾次) 當你明確的知道,剪映配音的不足時,再考慮選付費的配音軟體。 剛開始做視頻的時候,總是擔心自己的普通話不夠標準,不會給視頻配音。 后來發現,有文本轉語音的配音軟體 ......

    uj5u.com 2023-06-03 08:23:22 more
  • ChatGPT 背后的英雄——AI芯片

    AI芯片能為人工智能應用提供所需的基礎算力;按技術架構主要分為GPU、FPGA和ASIC。ChatGPT 有著大量復雜計算需求的 AI 模型, AI 芯片專門用于處理人工智能應用中的大量計算任務,是不可或缺的底層硬體。隨著 AI 技術快速發展,AI 應用場景擴大至智能制造、家居、教育、醫療和金融等領... ......

    uj5u.com 2023-06-03 08:23:09 more
  • 又雙種草了新家裝風格?AI幫你家居換裝

    摘要:又雙叒叕種草了家裝新風格?想要嘗試卻又怕踩雷?如果能夠輕松Get量身定制的家裝風格圖,那該多好啊。現在,這一切都成為了可能! 本文分享自華為云社區《又雙叒叕種草了新家裝風格?AI幫你家居換裝!》,作者:Emma_Liu。 Control Stable Diffusion with M-LSD ......

    uj5u.com 2023-06-03 08:22:46 more
  • 自然語言處理(NLP) - 前預訓練時代的自監督學習

    前預訓練時代的自監督學習自回歸、自編碼預訓練的前世 ![image](https://img2023.cnblogs.com/blog/80824/202306/80824-20230602112233170-1798796623.png) 神經網路(Neural Network, NN) ![im ......

    uj5u.com 2023-06-03 08:21:48 more
  • 手把手實踐丨基于STM32+華為云設計的智慧煙感系統

    摘要:當前基于STM32和華為云,設計了一種智慧煙感系統,該系統可以檢測煙霧,同時將檢測到的資料上傳到云端進行處理和分析。 本文分享自華為云社區《基于STM32+華為云設計的智慧煙感系統》,作者:DS小龍哥 。 一、概述 當前基于STM32和華為云,設計了一種智慧煙感系統,該系統可以檢測煙霧,同時將 ......

    uj5u.com 2023-06-03 08:21:02 more
  • 柏林噪聲分形&幻想大陸地圖生成

    # 序言 之前介紹過perlin噪聲的實作,現在應用實踐一下——程式化生成幻想大陸 這里使用的是perlin噪聲倍頻技術(也稱分形噪聲),詳情傳送門:[柏林噪聲演算法](https://www.cnblogs.com/hggzhang/p/17269270.html "柏林噪聲演算法") 代碼示例使用的 ......

    uj5u.com 2023-06-03 08:14:44 more