主頁 >  其他 > ChatGPT淺析

ChatGPT淺析

2023-05-31 08:20:34 其他

ChatGPT是近期最火的概念了,和之前的AlphaGo不同,GPTAI和普通大眾如此接近,讓大家可以親自接觸到AI帶來的全新體驗,

不過,AI并不是魔法,ChatGPT也不是革命性的新技術,
目前我個人來看,ChatGPT要取代人類的作業還言之過早,不過,輔助人類提高作業效率卻已經綽綽有余,

ChatGPT如此熱門,相信很多人都對它能力的來源充滿好奇,本文是我個人查閱一些資料后對其原理的粗淺理解,
不足之處,還望不吝指正,

1. 核心概念

ChatGPT的背后肯定會涉及很多AI相關技術和概念,
其中,理解ChatGPT技術最核心的幾個概念是:

1.1. GPT

GPT是Generative Pre-trained Transformer的縮寫,是一種基于神經網路訓練AI模型的方法,
硬翻譯成中文的話叫生成式預訓練轉換器,很別扭,不如直接用簡稱GPT

ChatGPT之所以對話起來如此自然,與GPT技術密切相關,
GPT在訓練時使用了大量的資料,但不是簡單的在資料上建立規則,模板之類的,而是考慮了背景關系資訊,通過分析輸入的文本,來生成回答的內容,這也是神經網路擅長的地方,

而且,GPT還有自我糾錯的能力,當生成的內容出現錯誤時,GPT可以自動進行調整和改進,
這使得GPT生成的內容越來越可靠和正確,

1.2. LLM

LLM是Large Language Model的縮寫,中文叫大語言模型
這個模型可以理解成一個擬合函式,這個函式的引數非常之多,據說GPT-3就已經有大約 1750億引數,
可見語言模型有多么復雜,

1.3. embedding

簡單來說,embedding就是將某個東西映射為向量,然后就可以通過計算向量之間的關系(比如距離)來確定這些東西之間的關系,

所以embedding技術是關鍵,如果不能把語言通過embedding技術映射成向量,那么人類的各種語言是無法傳遞給演算法去運算的,

2. 程序

了解了上面三個核心概念之后,簡單繪制了一個訓練程序的圖,
image.png
每個步驟都是一個大工程,
第一步,將本文和一連串對應的token關聯起來,讓后用embedding技術(向量)表達這種關聯,
這一步就需要面對海量的文本,GPT-31750億個引數,那么訓練材料可能就超過17500億個詞元,
這大概什么規模呢,以小說《紅樓夢》為例的話,ChatGPT 的訓練材料相當于175萬本《紅樓夢》,

根據報道,ChatGPT 實際上用了 570 GB 的訓練材料,來自互聯網上各種資源,

第二步訓練時,面對如此龐大的資料,消耗的計算資源可想而知,這也是為什么人工智能只能大公司才有實力去做的主要原因,
不說技術上的人才儲備,只是硬體上的成本已不是一般公司所能承受的了,

最后生成一個LLM(大語言模型),這個LLM不是一成不變的,在使用的程序中也在不斷的完善自己,

3. 思考

整體看來,ChatGPT其實并沒有革命性的技術突破,只是隨著互聯網的普及和硬體的性能的極大提升,AI需要的資料算力都有了長足的發展,

所以,之前停留在理論上的AI演算法終于有了用武之地,
不過,在驚嘆ChatGPT能力,擔憂其取代人類的同時,也必須看到其局限性,

首先,ChatGPT的所有知識都來自于人類已有的知識,GPT并不能創造新的知識,只能重組已有的知識,
我看到很多文章把這個當成ChatGPT的一個局限性或者不及人類的地方,
不過,我覺得目前人類的知識總量早已不是一個人所能掌握的了,再也沒有古時候無所不知的圣人了(那時候知識總量有限),
所以,ChatGPT掌握的知識對個人來說,有很多很多就是認知之外的新知識,
由此也可看出,ChatGPT取代人類,尤其是取代已經探索到人類知識邊界的人們還為時尚早,

此外,人類突然冒出的新的想法和靈感,目前也不知道如何通過機器來模擬這種情況,

其次,GPT的訓練程序有不可約性
所謂不可約性,是指不能進一步簡化,或者不能由其他一些簡單的規則推匯出來,
也就是說,ChatGPT給我們什么樣的回答,不是由明確的數學證明推匯出來的,我們是無法預測回答結果的,

因此,在一些關鍵的地方,特別是涉及到人身安全的方面,完全交給ChatGPT,雖然知道ChatGPT也許會做的更好,心里總是有些擔心,

最后,ChatGPT要用的好也沒那么容易,要想得到好的答案,先得提出好的問題,這一點和搜索引擎的關鍵字類似,
不過,ChatGPT能夠關聯背景關系,每次的提問它都會考慮進去,不像搜索引擎每次都是獨立的搜索,所以對普通人來說更加友好,更加親切一些,

總之,ChatGPT還在發展完善之中,面對新的AI技術,我們既不要妄自菲薄,神話它,也不要妖魔化它,抵制它,
而是基于自己的知識水平和理解能力,盡可能的先去了解它,嘗試使用它,切實用好AI技術提高自己的作業學習效率,比爭論其優缺點更有意義,

轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/553851.html

標籤:其他

上一篇:Unity_Photon

下一篇:返回列表

標籤雲
其他(160015) Python(38189) JavaScript(25464) Java(18161) C(15234) 區塊鏈(8268) C#(7972) AI(7469) 爪哇(7425) MySQL(7217) html(6777) 基礎類(6313) sql(6102) 熊猫(6058) PHP(5873) 数组(5741) R(5409) Linux(5344) 反应(5209) 腳本語言(PerlPython)(5129) 非技術區(4971) Android(4579) 数据框(4311) css(4259) 节点.js(4032) C語言(3288) json(3245) 列表(3129) 扑(3119) C++語言(3117) 安卓(2998) 打字稿(2995) VBA(2789) Java相關(2746) 疑難問題(2699) 细绳(2522) 單片機工控(2479) iOS(2434) ASP.NET(2403) MongoDB(2323) 麻木的(2285) 正则表达式(2254) 字典(2211) 循环(2198) 迅速(2185) 擅长(2169) 镖(2155) .NET技术(1977) 功能(1967) Web開發(1951) HtmlCss(1950) C++(1927) python-3.x(1918) 弹簧靴(1913) xml(1889) PostgreSQL(1878) .NETCore(1862) 谷歌表格(1846) Unity3D(1843) for循环(1842)

熱門瀏覽
  • 網閘典型架構簡述

    網閘架構一般分為兩種:三主機的三系統架構網閘和雙主機的2+1架構網閘。 三主機架構分別為內端機、外端機和仲裁機。三機無論從軟體和硬體上均各自獨立。首先從硬體上來看,三機都用各自獨立的主板、記憶體及存盤設備。從軟體上來看,三機有各自獨立的作業系統。這樣能達到完全的三機獨立。對于“2+1”系統,“2”分為 ......

    uj5u.com 2020-09-10 02:00:44 more
  • 如何從xshell上傳檔案到centos linux虛擬機里

    如何從xshell上傳檔案到centos linux虛擬機里及:虛擬機CentOs下執行 yum -y install lrzsz命令,出現錯誤:鏡像無法找到軟體包 前言 一、安裝lrzsz步驟 二、上傳檔案 三、遇到的問題及解決方案 總結 前言 提示:其實很簡單,往虛擬機上安裝一個上傳檔案的工具 ......

    uj5u.com 2020-09-10 02:00:47 more
  • 一、SQLMAP入門

    一、SQLMAP入門 1、判斷是否存在注入 sqlmap.py -u 網址/id=1 id=1不可缺少。當注入點后面的引數大于兩個時。需要加雙引號, sqlmap.py -u "網址/id=1&uid=1" 2、判斷文本中的請求是否存在注入 從文本中加載http請求,SQLMAP可以從一個文本檔案中 ......

    uj5u.com 2020-09-10 02:00:50 more
  • Metasploit 簡單使用教程

    metasploit 簡單使用教程 浩先生, 2020-08-28 16:18:25 分類專欄: kail 網路安全 linux 文章標簽: linux資訊安全 編輯 著作權 metasploit 使用教程 前言 一、Metasploit是什么? 二、準備作業 三、具體步驟 前言 Msfconsole ......

    uj5u.com 2020-09-10 02:00:53 more
  • 游戲逆向之驅動層與用戶層通訊

    驅動層代碼: #pragma once #include <ntifs.h> #define add_code CTL_CODE(FILE_DEVICE_UNKNOWN,0x800,METHOD_BUFFERED,FILE_ANY_ACCESS) /* 更多游戲逆向視頻www.yxfzedu.com ......

    uj5u.com 2020-09-10 02:00:56 more
  • 北斗電力時鐘(北斗授時服務器)讓網路資料更精準

    北斗電力時鐘(北斗授時服務器)讓網路資料更精準 北斗電力時鐘(北斗授時服務器)讓網路資料更精準 京準電子科技官微——ahjzsz 近幾年,資訊技術的得了快速發展,互聯網在逐漸普及,其在人們生活和生產中都得到了廣泛應用,并且取得了不錯的應用效果。計算機網路資訊在電力系統中的應用,一方面使電力系統的運行 ......

    uj5u.com 2020-09-10 02:01:03 more
  • 【CTF】CTFHub 技能樹 彩蛋 writeup

    ?碎碎念 CTFHub:https://www.ctfhub.com/ 筆者入門CTF時時剛開始刷的是bugku的舊平臺,后來才有了CTFHub。 感覺不論是網頁UI設計,還是題目質量,賽事跟蹤,工具軟體都做得很不錯。 而且因為獨到的金幣制度的確讓人有一種想去刷題賺金幣的感覺。 個人還是非常喜歡這個 ......

    uj5u.com 2020-09-10 02:04:05 more
  • 02windows基礎操作

    我學到了一下幾點 Windows系統目錄結構與滲透的作用 常見Windows的服務詳解 Windows埠詳解 常用的Windows注冊表詳解 hacker DOS命令詳解(net user / type /md /rd/ dir /cd /net use copy、批處理 等) 利用dos命令制作 ......

    uj5u.com 2020-09-10 02:04:18 more
  • 03.Linux基礎操作

    我學到了以下幾點 01Linux系統介紹02系統安裝,密碼啊破解03Linux常用命令04LAMP 01LINUX windows: win03 8 12 16 19 配置不繁瑣 Linux:redhat,centos(紅帽社區版),Ubuntu server,suse unix:金融機構,證券,銀 ......

    uj5u.com 2020-09-10 02:04:30 more
  • 05HTML

    01HTML介紹 02頭部標簽講解03基礎標簽講解04表單標簽講解 HTML前段語言 js1.了解代碼2.根據代碼 懂得挖掘漏洞 (POST注入/XSS漏洞上傳)3.黑帽seo 白帽seo 客戶網站被黑帽植入劫持代碼如何處理4.熟悉html表單 <html><head><title>TDK標題,描述 ......

    uj5u.com 2020-09-10 02:04:36 more
最新发布
  • ChatGPT淺析

    `ChatGPT`是近期最火的概念了,和之前的`AlphaGo`不同,`GPT`讓`AI`和普通大眾如此接近,讓大家可以親自接觸到`AI`帶來的全新體驗。 不過,`AI`并不是魔法,`ChatGPT`也不是革命性的新技術。 目前我個人來看,`ChatGPT`要取代人類的作業還言之過早,不過,輔助人類 ......

    uj5u.com 2023-05-31 08:20:34 more
  • Unity_Photon

    # Photon ## Photon搭建 [(2條訊息) 【Unity3D】Photon環境搭建_photon框架_little_fat_sheep的博客-CSDN博客](https://blog.csdn.net/m0_37602827/article/details/127054963?ops_ ......

    uj5u.com 2023-05-31 08:20:13 more
  • 讀資料壓縮入門筆記03_VLC

    一種表示整數的方法,它用一個或多個位元組來表示一個整數,數值越小用的位元組數越少,數值越大用的位元組數越多 ......

    uj5u.com 2023-05-31 08:19:54 more
  • P9376 題解

    首先考慮怎么暴力。 考慮把每個數進行 $B$ 進制分解,然后我們驚奇的發現這兩個操作就是把最低位去掉和往最低位后面插入一個數。 然后我們順藤摸瓜,把每個數的分解扔到 Trie 樹上,我們發現我們要找到一個節點,使得所有單詞節點到其的距離之和最短,答案就是這個最短距離。 這里直接考慮一個 Trie 樹 ......

    uj5u.com 2023-05-31 08:19:48 more
  • AtCoder Beginner Contest 303

    ## [A - Similar String (abc303 a)](https://atcoder.jp/contests/abc303/tasks/abc303_a) ### 題目大意 給定兩個字串,問這兩個字串是否相似。 兩個字串相似,需要每個字母,要么完全相同,要么一個是`1`一個是` ......

    uj5u.com 2023-05-31 08:19:43 more
  • 牛客小白月賽73

    # A.最小的數字 ### 題目: ![](https://img2023.cnblogs.com/blog/2960080/202305/2960080-20230526220648535-777334559.png) ### 分析: 簡單列舉一下,找到第一個大于等于n的且是3的倍數的數 ### ......

    uj5u.com 2023-05-31 08:19:25 more
  • 基于ZigBee3.0技術的數傳電臺功能使用詳解

    一、ZigBee3.0數傳電臺功能簡介 1、4G DTU數傳電臺LINK燈詳解 基于zigbee3.0通信技術的4G DTU數傳電臺LINK燈用于指示模塊當前網路狀態,設備入網成功后LINK燈常亮,當設備沒有網路時LINK燈熄滅;在協調器模式下,該引腳指示zigbee模塊是否正常建立網路,協調器和路 ......

    uj5u.com 2023-05-31 08:18:54 more
  • 提高生產力的最佳免費開源終端:WindTerm

    WindTerm是一個免費的開源終端工具,旨在提高開發人員和系統管理員的生產力。它為使用命令列的用戶帶來了更好的終端體驗,使其能夠更快速、高效地完成操作。

    相比傳統終端,WindTerm具有多個優勢,如支持多標簽頁、自定義主題、自動補全等功能,這些功能都可以顯著提高開發人員的作業效率。此外,Win... ......

    uj5u.com 2023-05-31 08:18:39 more
  • Three.js教程:物件克隆、復制

    推薦:將NSDT場景編輯器加入你的3D工具鏈 其他系列工具:NSDT簡石數字孿生 物件克隆.clone()和復制.copy() Threejs大多數物件都有克隆.clone()和復制.copy()兩個方法,點模型Points、線模型Line、網格網格模型Mesh一樣具有這兩個方法。 復制方法.cop ......

    uj5u.com 2023-05-31 08:18:06 more
  • Java 集合類詳解(一)

    ## 為什么要使用集合 存盤多個資料可以使用陣列,但由于陣列在記憶體中是連續存盤的,所以會有一些限制。比如陣列在創建時就要指定長度,即可以容納的元素個數,且指定后無法更改;陣列在創建時需要指定元素的型別,并且所有元素都必須是該型別或其子類;添加或洗掉陣列中的元素需要創建一個新陣列再進行元素復制,比較麻 ......

    uj5u.com 2023-05-31 08:17:43 more