主頁 >  其他 > ChatGLM-6B第二代模型開源,拿下LLM模型中文能力評估榜單第一名

ChatGLM-6B第二代模型開源,拿下LLM模型中文能力評估榜單第一名

2023-06-28 10:47:45 其他

ChatGLM-6B 自3月14日發布以來,深受廣大開發者喜愛,截至 6 月24日,來自 Huggingface 上的下載量已經超過 300w,

為了更進一步促進大模型開源社區的發展,我們再次升級 ChatGLM-6B,發布 ChatGLM2-6B ,在主要評估LLM模型中文能力的 C-Eval 榜單中,截至6月25日 ChatGLM2 模型以 71.1 的分數位居 Rank 0 ,ChatGLM2-6B 模型以 51.7 的分數位居 Rank 6,是榜單上排名最高的開源模型,

file

  • CEval榜單,ChatGLM2暫時位居Rank 0,ChatGLM2-6B位居 Rank 6

ChatGLM2-6B 是開源中英雙語對話模型 ChatGLM-6B 的第二代版本,在保留了初代模型對話流暢、部署門檻較低等眾多優秀特性的基礎之上,ChatGLM2-6B 引入了如下新特性:

更強大的性能:基于 ChatGLM 初代模型的開發經驗,我們全面升級了 ChatGLM2-6B 的基座模型,ChatGLM2-6B 使用了 GLM 的混合目標函式,經過了 1.4T 中英識別符號的預訓練與人類偏好對齊訓練,評測結果顯示,相比于初代模型,ChatGLM2-6B 在 MMLU(+23%)、CEval(+33%)、GSM8K(+571%) 、BBH(+60%)等資料集上的性能取得了大幅度的提升,在同尺寸開源模型中具有較強的競爭力,

更長的背景關系:基于 FlashAttention 技術,我們將基座模型的背景關系長度(Context Length)由 ChatGLM-6B 的 2K 擴展到了 32K,并在對話階段使用 8K 的背景關系長度訓練,允許更多輪次的對話,但當前版本的 ChatGLM2-6B 對單輪超長檔案的理解能力有限,我們會在后續迭代升級中著重進行優化,

更高效的推理:基于 Multi-Query Attention 技術,ChatGLM2-6B 有更高效的推理速度和更低的顯存占用:在官方的模型實作下,推理速度相比初代提升了 42%,INT4 量化下,6G 顯存支持的對話長度由 1K 提升到了 8K,

更開放的協議:ChatGLM2-6B 權重對學術研究完全開放,在獲得官方的書面許可后,亦允許商業使用,如果您發現我們的開源模型對您的業務有用,我們歡迎您對下一代模型 ChatGLM3 研發的捐贈,

在關注ChatGLM第二代模型的同時,我們也看到了團隊的另一個大模型作品CodeGeeX,CodeGeeX 是一個具有130億引數的大規模多編程語言代碼預訓練模型,該預訓練模型支持二十多種主流編程語言,實作高精度的代碼生成,代碼翻譯和代碼注釋等功能,模型開源開放,目前在Github上已經獲得6000+ Star好評,

file

基于CodeGeeX模型的插件產品,支持多種主流IDE,如VS Code、IntelliJ IDEA、PyCharm、Vim等,目前CodeGeeX插件的安裝用戶超過100,000+,每天為開發者生成數百萬行代碼,

下載使用——CodeGeeX插件,在VSCode和JetBrains IDEs可以直接免費下載使用,CodeGeeX插件可以自動實作代碼生成,可以逐行為代碼添加注釋,也可以進行不同編程語言之間的代碼翻譯,特別值得點贊的功能“Ask CodeGeeX”,把類似chatGPT一樣的智能問答功能,與開發者編程環境IDE深度融合,開發者可以在IDE中,通過問答對話的方式解決技術問題,

在IDE中使用Ask CodeGeeX功能,使得開發程序中遇到的問題,都可以在IDE中沉浸式解決,不用跳出開發環境尋找解決代碼問題的答案,提升了代碼開發效率,同時,在這個新版本中,通過對話框區域常用命令“explain/解釋代碼”、“comment/生成注釋”、“fixbug/檢查bug”的快捷方式,可以直接操作代碼,實作代碼解釋,逐行添加代碼注釋,嘗試修復代碼片段潛在bug等功能,

“explain/解釋代碼”按鈕,獲得整段代碼解釋

當你撰寫代碼時,希望了解某一段生成的代碼作何解釋?那么你就可以在CodeGeeX插件的代碼生成區域中,選中該段代碼,左側邊欄的對話區會出現浮層,同時展示選中代碼,在對話區通過快捷按鈕:“解釋代碼”,在對話界面中就可以回復出整段的代碼解釋,

“comment/生成注釋”按鈕為代碼逐行添加注釋

同樣,當你希望為一段生成的代碼逐行添加注釋,你就可以在CodeGeeX代碼生成區域,選中該段代碼,側邊欄的對話區會出現浮層,同時展示選中代碼,在對話區通過快捷按鈕:“生成注釋”,在對話界面就可以直接為這段代碼逐行添加注釋,

“fixbug/檢查bug”修復代碼潛在bug

當你撰寫代碼遇到一個錯誤時,在CodeGeeX插件的代碼生成區域中選中該段代碼,左側邊欄的對話區會出現浮層,同時展示選中代碼,在對話區通過快捷按鈕:“檢查bug”,代碼編輯區就可以直接幫你找到這段代碼中的問題并進行錯誤修復,并且對修復代碼的區域做高亮標記,方便進行代碼對照,

本文由博客一文多發平臺 OpenWrite 發布!

轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/556192.html

標籤:其他

上一篇:自然語言處理 Paddle NLP - 機器同傳技術及應用-理論

下一篇:返回列表

標籤雲
其他(161775) Python(38255) JavaScript(25515) Java(18268) C(15238) 區塊鏈(8273) C#(7972) AI(7469) 爪哇(7425) MySQL(7271) html(6777) 基礎類(6313) sql(6102) 熊猫(6058) PHP(5875) 数组(5741) R(5409) Linux(5347) 反应(5209) 腳本語言(PerlPython)(5129) 非技術區(4971) Android(4607) 数据框(4311) css(4259) 节点.js(4032) C語言(3288) json(3245) 列表(3129) 扑(3119) C++語言(3117) 安卓(2998) 打字稿(2995) VBA(2789) Java相關(2746) 疑難問題(2699) 细绳(2522) 單片機工控(2479) iOS(2438) ASP.NET(2404) MongoDB(2323) 麻木的(2285) 正则表达式(2254) 字典(2211) 循环(2198) 迅速(2185) 擅长(2169) 镖(2155) .NET技术(1985) HtmlCss(1976) 功能(1967) Web開發(1951) C++(1942) python-3.x(1918) 弹簧靴(1913) xml(1889) PostgreSQL(1881) .NETCore(1863) 谷歌表格(1846) Unity3D(1843) for循环(1842)

熱門瀏覽
  • 網閘典型架構簡述

    網閘架構一般分為兩種:三主機的三系統架構網閘和雙主機的2+1架構網閘。 三主機架構分別為內端機、外端機和仲裁機。三機無論從軟體和硬體上均各自獨立。首先從硬體上來看,三機都用各自獨立的主板、記憶體及存盤設備。從軟體上來看,三機有各自獨立的作業系統。這樣能達到完全的三機獨立。對于“2+1”系統,“2”分為 ......

    uj5u.com 2020-09-10 02:00:44 more
  • 如何從xshell上傳檔案到centos linux虛擬機里

    如何從xshell上傳檔案到centos linux虛擬機里及:虛擬機CentOs下執行 yum -y install lrzsz命令,出現錯誤:鏡像無法找到軟體包 前言 一、安裝lrzsz步驟 二、上傳檔案 三、遇到的問題及解決方案 總結 前言 提示:其實很簡單,往虛擬機上安裝一個上傳檔案的工具 ......

    uj5u.com 2020-09-10 02:00:47 more
  • 一、SQLMAP入門

    一、SQLMAP入門 1、判斷是否存在注入 sqlmap.py -u 網址/id=1 id=1不可缺少。當注入點后面的引數大于兩個時。需要加雙引號, sqlmap.py -u "網址/id=1&uid=1" 2、判斷文本中的請求是否存在注入 從文本中加載http請求,SQLMAP可以從一個文本檔案中 ......

    uj5u.com 2020-09-10 02:00:50 more
  • Metasploit 簡單使用教程

    metasploit 簡單使用教程 浩先生, 2020-08-28 16:18:25 分類專欄: kail 網路安全 linux 文章標簽: linux資訊安全 編輯 著作權 metasploit 使用教程 前言 一、Metasploit是什么? 二、準備作業 三、具體步驟 前言 Msfconsole ......

    uj5u.com 2020-09-10 02:00:53 more
  • 游戲逆向之驅動層與用戶層通訊

    驅動層代碼: #pragma once #include <ntifs.h> #define add_code CTL_CODE(FILE_DEVICE_UNKNOWN,0x800,METHOD_BUFFERED,FILE_ANY_ACCESS) /* 更多游戲逆向視頻www.yxfzedu.com ......

    uj5u.com 2020-09-10 02:00:56 more
  • 北斗電力時鐘(北斗授時服務器)讓網路資料更精準

    北斗電力時鐘(北斗授時服務器)讓網路資料更精準 北斗電力時鐘(北斗授時服務器)讓網路資料更精準 京準電子科技官微——ahjzsz 近幾年,資訊技術的得了快速發展,互聯網在逐漸普及,其在人們生活和生產中都得到了廣泛應用,并且取得了不錯的應用效果。計算機網路資訊在電力系統中的應用,一方面使電力系統的運行 ......

    uj5u.com 2020-09-10 02:01:03 more
  • 【CTF】CTFHub 技能樹 彩蛋 writeup

    ?碎碎念 CTFHub:https://www.ctfhub.com/ 筆者入門CTF時時剛開始刷的是bugku的舊平臺,后來才有了CTFHub。 感覺不論是網頁UI設計,還是題目質量,賽事跟蹤,工具軟體都做得很不錯。 而且因為獨到的金幣制度的確讓人有一種想去刷題賺金幣的感覺。 個人還是非常喜歡這個 ......

    uj5u.com 2020-09-10 02:04:05 more
  • 02windows基礎操作

    我學到了一下幾點 Windows系統目錄結構與滲透的作用 常見Windows的服務詳解 Windows埠詳解 常用的Windows注冊表詳解 hacker DOS命令詳解(net user / type /md /rd/ dir /cd /net use copy、批處理 等) 利用dos命令制作 ......

    uj5u.com 2020-09-10 02:04:18 more
  • 03.Linux基礎操作

    我學到了以下幾點 01Linux系統介紹02系統安裝,密碼啊破解03Linux常用命令04LAMP 01LINUX windows: win03 8 12 16 19 配置不繁瑣 Linux:redhat,centos(紅帽社區版),Ubuntu server,suse unix:金融機構,證券,銀 ......

    uj5u.com 2020-09-10 02:04:30 more
  • 05HTML

    01HTML介紹 02頭部標簽講解03基礎標簽講解04表單標簽講解 HTML前段語言 js1.了解代碼2.根據代碼 懂得挖掘漏洞 (POST注入/XSS漏洞上傳)3.黑帽seo 白帽seo 客戶網站被黑帽植入劫持代碼如何處理4.熟悉html表單 <html><head><title>TDK標題,描述 ......

    uj5u.com 2020-09-10 02:04:36 more
最新发布
  • ChatGLM-6B第二代模型開源,拿下LLM模型中文能力評估榜單第一名

    ChatGLM-6B 自3月14日發布以來,深受廣大開發者喜愛。截至 6 月24日,來自 Huggingface 上的下載量已經超過 300w。 為了更進一步促進大模型開源社區的發展,我們再次升級 ChatGLM-6B,發布 ChatGLM2-6B 。在主要評估LLM模型中文能力的 C-Eval 榜 ......

    uj5u.com 2023-06-28 10:47:45 more
  • 自然語言處理 Paddle NLP - 機器同傳技術及應用-理論

    視頻:https://aistudio.baidu.com/aistudio/course/introduce/24177?sharedLesson=1490529&sharedType=2&sharedUserId=2631487&ts=1687144071539 課件:https://aistu ......

    uj5u.com 2023-06-28 09:53:40 more
  • 【面試實戰】面試官面試模擬訓練【一】

    博客推行版本更新,成果積累制度,已經寫過的博客還會再次更新,不斷地琢磨,高質量高數量都是要追求的,工匠精神是學習必不可少的精神。因此,大家有何建議歡迎在評論區踴躍發言,你們的支持是我最大的動力,你們敢投,我就敢肝 ......

    uj5u.com 2023-06-28 09:53:14 more
  • 【筆者感悟】筆者的學習心得【二】

    博客推行版本更新,成果積累制度,已經寫過的博客還會再次更新,不斷地琢磨,高質量高數量都是要追求的,工匠精神是學習必不可少的精神。因此,大家有何建議歡迎在評論區踴躍發言,你們的支持是我最大的動力,你們敢投,我就敢肝 ......

    uj5u.com 2023-06-28 09:53:08 more
  • Kubernetes安裝慢的解決方法

    在`Docker Desktop`里面直接去安裝啟用`Kubernetes`會一直處在`Starting...`狀態中,這是因為鏡像默認是從Kubernetes提供的官方地址下載,該地址在國內是被墻的,如果你沒有類似Vpn的翻墻工具的話,可以通過下面這種方式更快一點。 ### 準備好安裝鏡像 鏡像地 ......

    uj5u.com 2023-06-28 09:53:02 more
  • “面試造飛機,上崗擰螺絲“?2023軟體測驗崗面試真題超全面整理(最新

    軟體測驗這個崗位,想要找到一份高薪的作業,離不開繁雜的面試程式,這相信是很多準備應聘軟體測驗崗的朋友難題,很多已經在職多年的軟體測驗工程師對于這個崗位面試都談虎色變,那么,為什么軟體測驗崗位的面試這么難呢? 第一,軟體測驗屬于互聯網IT行業,可以說包羅萬象,雖然真正入職后,公司不會要求你運用很多很多 ......

    uj5u.com 2023-06-28 09:52:51 more
  • 性能_3 jmeter連接資料庫jdbc(sql server舉例)

    一、下載第三方工具包驅動資料庫 1. 因為JMeter本身沒有提供鏈接資料庫的功能,所以我們需要借助第三方的工具包來實作。 (有這個jar包之后,jmeter可以發起jdbc請求,沒有這個jar包,也有jdbc取樣器,但不能發起請求。) 2. 進入maven倉庫-http://mvnreposito ......

    uj5u.com 2023-06-28 09:52:29 more
  • 委派攻擊

    # 委派攻擊 [TOC] ## 一、委派概述 域委派是指將域內用戶的權限委派給服務賬戶,使得服務賬號能夠以用戶的權限在域內展開活動。在域內只有主機賬號和服務賬號才有委派屬性。 主機賬號:活動目錄中的computers組內的計算機,也被稱為機器賬號。 服務賬號:域內用戶的一種型別,是服務器運行服務時所 ......

    uj5u.com 2023-06-28 09:52:14 more
  • 如何高度優化適用于企業的AI (二) 資料準備

    我們先從快速瀏覽整個程序 1. 首先, 我們需要資料, 要盡可能使用CSV/Json格式, 基于這些資訊, 我們要讓AI獲取所有所需要的資訊來正確的完成它的作業 2. 準備資料, 微調程序需要很長的書劍才能運行, 我們肯定是不希望出現錯誤的, 所以我們使用OpenAI的資料準備工具(CLI tool ......

    uj5u.com 2023-06-28 09:52:04 more
  • (C#) IIS 回應標頭過濾敏感資訊(如:Server/X-Powered-By等) 運維知

    背景: 再一次凈網行動中,客戶要求安全改造發現了介面請求的header標頭中出現如圖中的敏感資訊。 說明: 其意義在于告知瀏網站是用什么語言或者框架撰寫的。解決辦法就是修改該回應頭為一個錯誤的值,將攻擊者導向一個錯誤的方向。 準備: 這里只說windows 的iis環境,不考慮其他服務器的環境。首先 ......

    uj5u.com 2023-06-28 09:51:49 more