主頁 >  其他 > AIGC的阿克琉斯之踵

AIGC的阿克琉斯之踵

2023-04-22 07:40:38 其他

摘要:現在,越來越多的企業和個人使用AIGC生成文章、圖片、音樂甚至視頻等內容,AIGC已經成為一種必備的工具,在游戲和原畫師行業,甚至已經出現了第一批因為AI而失業的人,

本文分享自華為云社區《GPT-4發布,AIGC時代的多模態還能走多遠?系列之二:AIGC的阿克琉斯之踵》,作者:ModelArts 開發 ,

AIGC是繼PGC(Professional Generated Content,專業生產內容)和UGC(User Generated Content,用戶生產內容)之后的一個新時代,它帶來了一種新的內容生產方式,并且還為內容注入了只有人類才具備的“創作”元素,開創了“模型”主導內容的時代,盡管AIGC技術已經有了相當大的提升,但仍然存在很多不足之處,

01 ChatGPT(包括GPT4)的諸多問題難以忽視

盡管ChatGPT(包括GPT4)是一個非常有用的工具,但它仍然存在許多問題,以下是一些經常出現的問題:

1) 強語言,弱知識,“一本正經地胡說八道”:在回答問題時,ChatGPT很容易“胡說八道”,因為它的回答通常是基于大量的文本資料而生成的,而不是真正的知識,比如下面的問題:

Q:紅樓夢中賈寶玉為什么要葬花?

A:據小說描寫,賈寶玉葬花的原因是因為他感到世間美好事物的短暫和凋零…

Q:魯迅和周樹人是同一個人嗎?

A:不是同一個人,魯迅和周樹人是兩個不同的人,魯 迅…而周樹人(1895年1月25日-1968年11月6日)也是中 國著名的現代作家和翻譯家,代表作品有《春蠶》、《子夜》等

2) 邏輯推理不靠譜:不論是數學邏輯還是專業邏輯,比如下面的問題:

Q:3個人3天用3桶水,9個人9天用幾桶水?

A:根據題目可知,3個人在三天內用了3桶水,

可以推算出每天每人用水量為:

3 桶 / 3 人 / 3 天 = 1 桶 / 人 / 天

因此,在9個人使用9天內需要的總用水量為:

1 桶 / 人 / 天 × 9 人 × 9 天 = 81 桶

所以,9個人在九天內需要用 81 桶的水,(正確答案27桶)

3) 實時資訊自更新慢,新舊知識難以區分,比如下面的問題:

Q:現任韓國總統是誰?

A:現任韓國總統是文在寅 ,

Q:gpt4是什么時候發布的?

A:抱歉,目前還沒有關于GPT-4的官方發布計劃和訊息

4) 無法真正為領域類問題提供專業、靠譜的答案,比如下面的問題:

Q:華為手機沒電了,請問能否使用蘋果手機的充電器充電?

A:可以的,蘋果手機和華為手機使用的充電器介面都是標準的USB介面,因此蘋果手機的充電器也可以用來給華為手機充電,不過,請注意使用符合標準的充電器,

02 多模態大模型的跨模態生成能力尚不完善

雖然AIGC跨模態生成技術的視覺效果令人驚嘆,但在實際應用程序中存在一些資訊不對稱的問題,目前,多模態大模型在跨模態生成方面仍然存在一些不完善之處,需要進一步研究和優化,從文本到影像的生成方向,Stable Diffusion的研究發現提示詞與輸出之間存在著顯著的組合泛化問題,例如,在輸入“紅草綠花”的情況下,輸出結果可能會是相反,這表明AI模型對于語意的理解存在錯誤,同樣,當輸入“一匹馬騎著宇航員的照片”時,輸出結果可能會是宇航員騎著馬的照片,這也暴露出模型在語意理解方面的不足之處,為了解決這些問題,需要進一步研究和優化多模態大模型,研究方向包括改進模型的組合泛化能力、提高模型對于語意的理解、以及優化跨模態生成結果的準確性等,以使得多模態大模型在實際應用中更加可靠和有效,

(以上文圖生成來自Stable Diffusion)

03 多模態大模型尚未完全理解多模態資料

GPT4大模型發布,加速了AIGC多模態的發展,當然多模態大模型的發展在近年來取得了令人矚目的進展,但是作為一項前沿技術,仍存在著一系列問題需要解決,其中一個重要問題就是對于多模態資料的理解還不夠充分,多模態資料是指來自不同感官或媒介的資料,如影像、音頻、文本等,雖然多模態大模型可以同時處理多種型別的資料,但是對于跨模態資料的融合、對齊等方面,仍需要進一步探索和優化,

首先,對于多模態資料中的事實知識的理解不足,在實際應用中,很多跨模態生成任務都需要豐富的知識庫和背景知識支撐,例如,文本描述和影像生成任務需要對具體事物的特征進行深入了解,而涉及到自然語言的任務,則需要對語言語意的理解更加準確,因此,建立更為完整準確的知識庫是非常重要的,

其次,常識儲備不足也是多模態大模型的瓶頸之一,常識是解決現實問題的基礎,而在跨模態生成任務中,常識更是不可或缺,例如,在利用AIGC中AI作畫的Stable Diffusion 作圖的一個影像描述中,描繪出“小狗在路邊玩耍”的情境更加符合日常生活的常識,而非描述為“四條腿的動物在道路上移動”,這說明常識缺失直接影響模型的表現效果,

最后,邏輯推理能力也是多模態大模型需要改進的地方,在實際場景中,有很多跨模態生成任務,需要通過邏輯推理進行相關內容的理解和生成,例如,基于文本的影像生成任務需要根據文本中的描述進行相應的推理,以便生成一張完整的影像,而當前多模態大模型的邏輯推理能力仍有待提高,未來的研究應該注重邏輯推理技術的研究和優化,以提高模型的綜合表現能力,

總之,多模態大模型的未來研究應該致力于處理多模態資料的全面理解,選取合適的知識庫和常識庫,探索邏輯推理技術等方向,以提高多模態大模型在跨模態生成領域的表現效果,

(以上圖來自視覺問答VQA)

04 多模態大模型PaLM-E離實用級還有多遠?

多模態大模型PaLM-E的出現,標志著計算語言學作為人工智能領域的重要分支進入了一個新的繁榮期,PaLM-E依賴于如此龐大的引數,初步實作了對機器人的操控,但其在實用性方面還有待提高,其中,空間范圍、物品種類和任務規劃復雜度等方面的限制是最為突出的,目前展示出來的演示,其空間范圍封閉有限,物品種類數量有限,規劃任務比較簡單,操作任務也相對簡單,這些限制的存在,讓人們對PaLM-E在真實復雜場景中的實用價值產生了質疑,

此外,PaLM-E在使用程序中還存在一些技術問題,例如需要耗費大量的時間來除錯和訓練,同時還需強大的計算資源才能支持其正常運行,這些問題在實際應用中都會給使用者帶來極大的不便和成本壓力,因此,需要從技術上不斷優化和改進PaLM-E,使它能夠更好地適應復雜的應用場景,并且讓成本更低、易用性更高,當然,盡管PaLM-E離實用級還有一定距離,但是可以相信,隨著技術的不斷發展和突破,PaLM-E將結合各種場景打破技術限制,真正走進人們的生活和作業中,發揮其巨大的實用價值,

(以上圖來自網路)

05 小結:多模態大模型的本質、前提與不足剖析

相比于傳統的統計模型,多模態大模型有很多優勢,它能夠利用多種不同的資訊源來進行學習和推理,從而更加全面地捕捉人類的知識、常識和邏輯推理能力;它也能夠以較低成本實作自然語言處理、計算機視覺和語音識別等多項任務,提高了模型的效率和普適性;最后,多模態大模型還能夠為人類提供更加直觀、易懂的互動體驗,讓人們更加方便地獲取資訊和進行決策,

然而,多模態大模型也存在一些不足之處,首先,由于不同模態資料之間的差異性,多模態大模型的建立和優化程序需要消耗大量的計算資源和時間,其次,該模型尚存在著一些挑戰和難點,例如如何對不同模態資料之間的關聯進行建模以及如何解決資料對齊和逆向推導等問題,此外,多模態大模型還需要克服資料質量、隱私保護和資料倫理等方面的挑戰,才能更好地應用于實際場景中,

因此,想要在AIGC領域發揮多模態大模型的優勢,需要在技術研究、資料質量管理、隱私保護和資料倫理等方面繼續深入研究和探索,只有在不斷完善和優化多模態大模型的同時,才能更好地應對現實世界中的復雜情境和問題,提高人類社會的智能化水平,

 

點擊關注,第一時間了解華為云新鮮技術~

轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/550790.html

標籤:其他

上一篇:如何向ChatGPT提問并獲得高質量的答案(轉)

下一篇:返回列表

標籤雲
其他(157803) Python(38089) JavaScript(25379) Java(17985) C(15215) 區塊鏈(8256) C#(7972) AI(7469) 爪哇(7425) MySQL(7135) html(6777) 基礎類(6313) sql(6102) 熊猫(6058) PHP(5869) 数组(5741) R(5409) Linux(5327) 反应(5209) 腳本語言(PerlPython)(5129) 非技術區(4971) Android(4555) 数据框(4311) css(4259) 节点.js(4032) C語言(3288) json(3245) 列表(3129) 扑(3119) C++語言(3117) 安卓(2998) 打字稿(2995) VBA(2789) Java相關(2746) 疑難問題(2699) 细绳(2522) 單片機工控(2479) iOS(2429) ASP.NET(2402) MongoDB(2323) 麻木的(2285) 正则表达式(2254) 字典(2211) 循环(2198) 迅速(2185) 擅长(2169) 镖(2155) 功能(1967) .NET技术(1959) Web開發(1951) python-3.x(1918) HtmlCss(1917) 弹簧靴(1913) C++(1910) xml(1889) PostgreSQL(1872) .NETCore(1854) 谷歌表格(1846) Unity3D(1843) for循环(1842)

熱門瀏覽
  • 網閘典型架構簡述

    網閘架構一般分為兩種:三主機的三系統架構網閘和雙主機的2+1架構網閘。 三主機架構分別為內端機、外端機和仲裁機。三機無論從軟體和硬體上均各自獨立。首先從硬體上來看,三機都用各自獨立的主板、記憶體及存盤設備。從軟體上來看,三機有各自獨立的作業系統。這樣能達到完全的三機獨立。對于“2+1”系統,“2”分為 ......

    uj5u.com 2020-09-10 02:00:44 more
  • 如何從xshell上傳檔案到centos linux虛擬機里

    如何從xshell上傳檔案到centos linux虛擬機里及:虛擬機CentOs下執行 yum -y install lrzsz命令,出現錯誤:鏡像無法找到軟體包 前言 一、安裝lrzsz步驟 二、上傳檔案 三、遇到的問題及解決方案 總結 前言 提示:其實很簡單,往虛擬機上安裝一個上傳檔案的工具 ......

    uj5u.com 2020-09-10 02:00:47 more
  • 一、SQLMAP入門

    一、SQLMAP入門 1、判斷是否存在注入 sqlmap.py -u 網址/id=1 id=1不可缺少。當注入點后面的引數大于兩個時。需要加雙引號, sqlmap.py -u "網址/id=1&uid=1" 2、判斷文本中的請求是否存在注入 從文本中加載http請求,SQLMAP可以從一個文本檔案中 ......

    uj5u.com 2020-09-10 02:00:50 more
  • Metasploit 簡單使用教程

    metasploit 簡單使用教程 浩先生, 2020-08-28 16:18:25 分類專欄: kail 網路安全 linux 文章標簽: linux資訊安全 編輯 著作權 metasploit 使用教程 前言 一、Metasploit是什么? 二、準備作業 三、具體步驟 前言 Msfconsole ......

    uj5u.com 2020-09-10 02:00:53 more
  • 游戲逆向之驅動層與用戶層通訊

    驅動層代碼: #pragma once #include <ntifs.h> #define add_code CTL_CODE(FILE_DEVICE_UNKNOWN,0x800,METHOD_BUFFERED,FILE_ANY_ACCESS) /* 更多游戲逆向視頻www.yxfzedu.com ......

    uj5u.com 2020-09-10 02:00:56 more
  • 北斗電力時鐘(北斗授時服務器)讓網路資料更精準

    北斗電力時鐘(北斗授時服務器)讓網路資料更精準 北斗電力時鐘(北斗授時服務器)讓網路資料更精準 京準電子科技官微——ahjzsz 近幾年,資訊技術的得了快速發展,互聯網在逐漸普及,其在人們生活和生產中都得到了廣泛應用,并且取得了不錯的應用效果。計算機網路資訊在電力系統中的應用,一方面使電力系統的運行 ......

    uj5u.com 2020-09-10 02:01:03 more
  • 【CTF】CTFHub 技能樹 彩蛋 writeup

    ?碎碎念 CTFHub:https://www.ctfhub.com/ 筆者入門CTF時時剛開始刷的是bugku的舊平臺,后來才有了CTFHub。 感覺不論是網頁UI設計,還是題目質量,賽事跟蹤,工具軟體都做得很不錯。 而且因為獨到的金幣制度的確讓人有一種想去刷題賺金幣的感覺。 個人還是非常喜歡這個 ......

    uj5u.com 2020-09-10 02:04:05 more
  • 02windows基礎操作

    我學到了一下幾點 Windows系統目錄結構與滲透的作用 常見Windows的服務詳解 Windows埠詳解 常用的Windows注冊表詳解 hacker DOS命令詳解(net user / type /md /rd/ dir /cd /net use copy、批處理 等) 利用dos命令制作 ......

    uj5u.com 2020-09-10 02:04:18 more
  • 03.Linux基礎操作

    我學到了以下幾點 01Linux系統介紹02系統安裝,密碼啊破解03Linux常用命令04LAMP 01LINUX windows: win03 8 12 16 19 配置不繁瑣 Linux:redhat,centos(紅帽社區版),Ubuntu server,suse unix:金融機構,證券,銀 ......

    uj5u.com 2020-09-10 02:04:30 more
  • 05HTML

    01HTML介紹 02頭部標簽講解03基礎標簽講解04表單標簽講解 HTML前段語言 js1.了解代碼2.根據代碼 懂得挖掘漏洞 (POST注入/XSS漏洞上傳)3.黑帽seo 白帽seo 客戶網站被黑帽植入劫持代碼如何處理4.熟悉html表單 <html><head><title>TDK標題,描述 ......

    uj5u.com 2020-09-10 02:04:36 more
最新发布
  • AIGC的阿克琉斯之踵

    摘要:現在,越來越多的企業和個人使用AIGC生成文章、圖片、音樂甚至視頻等內容,AIGC已經成為一種必備的工具。在游戲和原畫師行業,甚至已經出現了第一批因為AI而失業的人。 本文分享自華為云社區《GPT-4發布,AIGC時代的多模態還能走多遠?系列之二:AIGC的阿克琉斯之踵》,作者:ModelAr ......

    uj5u.com 2023-04-22 07:40:38 more
  • 如何向ChatGPT提問并獲得高質量的答案(轉)

    ——提示技術的完整指南 Art of Asking ChatGPT for High-Quality Answ Engineering Techniques, The – Ibrahim John 本書系統性地介紹了ChatGPT的提問方式,個人覺得,值得一讀。 文章目錄 [隱藏目錄] 簡介 第一章 ......

    uj5u.com 2023-04-22 07:40:11 more
  • Karmada 多云容器編排引擎支持多調度組,助力成本優化

    摘要:Karmada 社區也在持續關注云成本的管理,在最近發布的 v1.5 版本中,支持用戶在分發策略 PropagationPolicy/ClusterPropagationPolicy 中設定多個集群調度組,實作將業務調度到成本更低的集群組中去。 本文分享自華為云社區《Karmada 多云容器編 ......

    uj5u.com 2023-04-22 07:39:54 more
  • 物聯網常見協議之Amqp協議及使用場景決議

    摘要:本文圍繞AMQP協議,為大家詳細決議AMQP協議、核心技術亮點、多協議之間的對比以及使用實踐。 本文分享自華為云社區《物聯網常見協議之Amqp協議及使用場景決議》,作者:張儉。 引言 本文圍繞AMQP協議,為大家詳細決議AMQP協議、核心技術亮點、多協議之間的對比以及使用實踐,并介紹華為云Io ......

    uj5u.com 2023-04-22 07:39:02 more
  • Win10的VIM配置

    我的VIM配置 簡介 電腦重裝了個win10,想在wi10上用vim,所以配置了個NeoVim,下面是配置好的效果圖: 安裝步驟 1. 下載安裝vim 由于vim有點老舊,所以安裝NeoVim,下載后直接雙擊Neovim Qt運行,下載鏈接:https://github.com/neovim/neo ......

    uj5u.com 2023-04-22 07:38:31 more
  • toml格式組態檔介紹

    toml官方wik toml官方檔案 此次檔案是以v1.0.0為例,進行說明的。如果使用到的版本不同,直接去官方檔案中找對應的版本即可。 談到組態檔,大家都能說出來好幾種,比如常見的ini、xml、json、yaml、properties、toml等等,因為專案中用到了toml格式的組態檔,但是 ......

    uj5u.com 2023-04-22 07:37:46 more
  • 【ZeroMQ】zguide 第一章 部分翻譯

    為了更好的閱讀體驗,請點擊這里 本文大部分內容翻譯自 Chapter 1 - Basics,原因是之前翻譯的版本太老了,不得不親自披掛上陣~~拿機器翻譯一下~~。只截取了部分自己可能用得到的,所以如果有看不太懂的地方,去翻一下原網頁吧。QWQ 附贈 libzmq 的 api 介面函式說明 一份。 一 ......

    uj5u.com 2023-04-22 07:37:37 more
  • 10萬字干貨:《數字業務連續性提升最佳實踐》免費領取|TakinTalks社

    一分鐘精華速覽 首刊限版400本,沒有電子版下載。 100本作為社區福利,免費領取,領完即止!不加印。 為什么會有這本刊物? TakinTalks社區是由業內專家共同發起的、專注業務穩定性提升的技術交流平臺。面向技術管理者和一線從業者,定期探討行業前沿的技術,分享最新的、可參考的、可落地的實戰經驗。 ......

    uj5u.com 2023-04-22 07:36:24 more
  • Excel的列數如何用數字表示?

    本文介紹在Excel表格檔案中,用數字而非字母來表示列號的方法。 在日常生活、作業中,我們不免經常使用各種、各類Excel表格檔案;而在Excel表格檔案中,微軟Office是默認用數字表示行數,用字母表示列數的,如下圖所示: 而這樣就帶來一個問題:當一個Excel表格檔案的列數相對較多時(比如有幾 ......

    uj5u.com 2023-04-22 07:35:55 more
  • Docker基礎知識和命令使用入門

    本文介紹了 Docker 相關的基礎知識和命令的簡單使用。基礎知識部分包括 Docker 的用途和意義,Docker 的鏡像、容器、倉庫、Dockerfile 和 Docker Compose 的理解,以及 Docker 圖形管理工具 Portainer 的基礎功能。Docker 命令的使用包括鏡像... ......

    uj5u.com 2023-04-21 09:23:34 more