AIGC持續火爆大模型爭相推出，龐大市場造就算力供應模式演變-有解無憂

本圖由AI生成

黃仁勛說的AI發展迎來iPhone時刻，對NVIDIA有什么影響？

文/王吉偉

近期的AIGC領域仍舊火爆例外，

但火的不只是AIGC應用，還有巨頭之間的AI競賽，以及接連不斷上新的AI大模型（LLM，Large Language Model），

面對ChatGPT帶來的技術沖擊，為了研發谷歌多模態AI模型及應對微軟GPT-4版Security Copilot競爭，谷歌先是將谷歌大腦和DeepMind團隊合并為“Google DeepMind”部門，接著又推出了基于Sec-PaLM LLM大模型技術的谷歌云安全AI 作業臺（Security AI Workbench），

亞馬遜推出了AI大模型服務Amazon Bedrock，馬斯克成立了人工智能公司X.AI，并囤下萬張NVIDIA芯片，

有媒體將之比喻為圍剿ChatGPT，

但ChatGPT并不驚慌，仍然按照既有節奏新增了隱私功能使得用戶資料不再被用于模型訓練，并計劃在未來幾個月推出ChatGPT企業版，

對于谷歌、亞馬遜等的動作，ChatGPT似乎并不在意，反而是微軟總裁說了一句“中國將是 ChatGPT 的主要對手”，又將輿論目光引向國內，

國內市場則也迎來了“百模大戰”時代，從3月開始到現在，各科技大廠及科研機構已經陸續發布了百度文心一言、阿里通義千問、華為云盤古、京東言犀等30多個大模型，目前還在不斷上新，難怪微軟總裁會發出前面的感慨，

然而在AI競賽和“百模大戰”的身后，笑得最開心的應該是NVIDIA，

競爭越激烈，算力需求也就越大，NVIDIA GPU也就賣得越好，

生成式AI應用的爆發和大模型的爭相發布，讓NVIDIA的算力供應迎來更輝煌的時代，黃仁勛先生在NVIDIA GTC23說的金句“我們正處于AI的iPhone時刻”，到現在已經廣為流傳，以至于GTC23已經過去一個多月，仍有很多人念念不忘，

已經連續舉辦14年的GTC如今已是全球最重要的AI大會之一，GTC23舉辦會議更是達到650多場，超過25萬名注冊用戶深入參與到GTC各個主題的會議，

黃仁勛更是用長達78分鐘的時間，講述了NVIDIA及其合作伙伴如何提供訓練和部署尖端AI 服務所需的各種技術，

看完他的分享以及多個會議及合作發布之后，王吉偉頻道認為，AI大模型所帶來的多元化算力需求，正在造就算力供給形式的進一步演變，

為什么這么說？本文就跟大家探討一下，

AIGC應用持續爆發

這一輪AIGC技術帶來的AI火爆，主要體現在C端的AI應用上，與以往AI主要改進和優化B端不同，LLM所帶來ChatGPT、Midjourney等殺手級應用，在變革B端的同時，也讓億萬用戶對AI技術有了直觀且震撼的感受，

ChatGPT、Midjourney還在快速進化著，在文字、代碼、圖片生成等領域叱咤風云的同時，更多廠商所推出的同類應用也在快速發展，AI生成音樂、視頻、游戲的應用也正在雨后春筍般的出現，

現在，基于GPT-3\4、Dall-E等模型的AI應用越來越多，單是從GPT來看，GPT-3 DEMO網站統計的GPT-3應用程式已經超過800個，但這些程式并不包括企業推出的GPT應用，

隨著更多組織引入或者自身搭建AI大模型，他們將利用這些技術改造已有應用，并會以對話的方式生成更多AI應用，

同時更多LLM的API開放服務，讓創業變得更加簡單，創業者只需要接入API就能將LLM集成到產品之中，大大提升產品業務效率和使用體驗，

除了呼叫AI，創業者們也會基于Stable Diffusion、Meta AI等開源模型打造更多的生成式AI應用，滿足不同領域的用戶的需求，

Crunchbase資料顯示，2021年獲得投資的AIGC創業專案數量為291，2022年這一資料為211，經歷了從年初到現在的AI應用大爆發，預測2023年的創業專案同樣會迎來大爆發，

在諸多的AIGC工具中，有一類基于GPT的應用是用于生成程式的，可以讓用戶通過自然語言快速生成GPT應用，包括一些低代碼、RPA等工具也在借助GPT讓用戶簡單快速地打造需要的程式，這些AI工具的出現，直接讓生成式AI應用出現倍數級增長，

Gartner預計到2025年，生成式人工智能將占所有生成資料的10%，目前這一比例還不到1%，這個資料意味著，在未來AIGC從1%到10%的發展行程中，將會出現海量AI應用，

事實上，推出LLM的大型企業是生成式AI應用的主要推動者，他們首先會將AIGC應用在自身產品體系推廣，然后再服務更多客戶，

LLM成為云計算和AI服務的主要部分之后，每個云計算廠商和推出LLM的廠商都將用此技術服務其生態內成千上萬的客戶，這些客戶也會將生成式AI技術引入到企業內部軟體應用之中，

AI大模型層出不窮

在AIGC應用海量爆發背后，正是各大科技廠商不斷推出的AI大模型，在以OpenAI的GPT、Dall-E為代表的LLM出盡風頭后，出于應戰更出于商業生態所需，其他廠商陸續推出了各自的大模型，

在谷歌率先推出Bard并與NVIDIA聯合開發了引數量高達5300億的Megatron-Turing后，Meta發布了BlenderBot3、亞馬遜推出了自有的大型語言模型泰坦（Titan），OpenAI前元老創立的Anthropic發布了Claude，Stability AI擁有Stable Diffusion并于近期推出了開源大語言模型StableLM，

馬斯克也于近日啟動了基于自研大模型的“TruthGPT”聊天機器人，為此他已經成立了X.AI公司，招募工程師，并已在NVIDIA購入高性能GPU，

除了大型公司，美國還有LLM領域比較知名的初創企業，比如前谷歌研究人員創立的Character.AI、由前LinkedIn聯合創始人、DeepMind聯合創始人等聯合創立的Inflection AI、來自谷歌AI團隊成員創立的Cohere以及Adept.ai等，這些AI公司都有自研AI大模型，

美國的AI大模型先人一步，其他國家自然也不能落下，

很多國家的相關組織也陸續發布了AI大模型，目前已知的部分國家的行動包括：

俄羅斯Yandex研發了大模型YaLM；英國DeepMind推出了Gopher超大型語言模型，前幾天英國還宣布斥資1億英鎊建立新的“基礎模型作業組”（Foundation Model Taskforce），以開發能帶來“全球競爭力”的 AI 方案；韓國Naver研發了HyperCLOVA；以色列A21 Labs推出了Jurassic-1 Jumbo，

至于中國，更是開啟了“百模大戰”，

從3月16日百度基于文心大模型的“文心一言”發布后，國內就開啟了“百模大戰”模式，

廠商們的AI大模型發布都集中在了4月，目前華為的盤古、360的智腦、商湯的日日新、阿里的通義千問、京東的言犀、騰訊的混元、中科院的紫東太初、科大訊飛的1+N認知、浪潮的源1.0、昆侖萬維的天工3.5、云從科技的行業精靈、知乎的“知海圖AI”、第四范式的“式說3.0”、科大訊飛的“星火認知”等大模型都已發布，

此外美團的聯合創始人投訓文、搜狗創始人王小川，都創立新公司征戰AI大模型，亦有其他巨頭企業的AI專案負責人或者高管投身此領域，

目前而言，上述大模型再加上科研院系所公布的大模型，國內已有超過30個大模型亮相，可以肯定的是，后面還會繼續有大型科技公司發布自己的AI大模型，

除了各國多個組織發布的AI大模型，Stable Diffusion等開源大模型也是一股不可忽視的力量，越來越多的開源模型，正在以本地部署的形式進入更多企業成為其構建生成式AI應用的模型層，

在大模型之外，像斯坦福發布的52k資料的Alpaca、AI風險投資公司Age of AI開發的FreedomGPT等中小模型，同樣也是各大組織在安全及私有化部署層面關注的重點，

可以看到，所有大型企業都將推出自有大模型，同時很多組織已經意識到企業的應用程式都要構建于企業數字化架構的模型層之上，大模型將會成為所有企業的基礎設施，

那么問題來了，現在全球有這么多的大模型，那將需要多么龐大的算力？這些算力又該如何供應？

別著急，下一節就會講到，

算力需求的急劇攀升

AI大模型的快速發展，帶來全球算力市場需求的高速上漲，隨著AI技術的不斷突破以及各種開源架構的推進，演算法模型和資料反而成了最簡單的，倒是算力不足成了大模型廠商遇到的最大的問題，或者說它已經成了影響AI大模型能力的主要因素，

LLM對算力的需求到底有多大？以ChatGPT為例，GPT-3訓練成本預計在500萬美元/次，

為支持ChatGPT對于強大算力的需求，微軟于2019 年投資10億美元建造了一臺大型頂尖超級計算機，配備了數萬個NVIDIA Ampere架構GPU，還在60多個資料中心總共部署了幾十萬個NVIDIA GPU進行輔助，

一個殺手級AI應用ChatGPT，就需要這么大的算力支持，而OpenAI還有Dall-E等多個大模型，可見OpenAI這家公司對算力的需求有多大，

不僅如此，模型引數的增長也會導致算力需求猛增，比如華為云盤古大模型的預訓練引數規模達到2000億，而阿里達摩院的M6模型引數更是達到10萬億，這些大模型對算力的需求已然超過ChatGPT，

OpenAI僅是一個大模型公司，上述谷歌等國外大型企業以及創業公司，還有國內已經超過30家推出大模型的組織，不管是自建資料中心還是將模型托管，想要大模型快速迭代與發展，都離不開龐大算力，

所以，在解決了演算法模型和資料集后，為了讓自有大模型能夠快速落地商用，全球大模型廠商都把心思放到了算力之上，千方百計增加自身算力，

在算力打造方面，目前大模型廠商普遍采用的是GPU+CPU+NPU的異構方式，一般是以NVIDIA GPU為主，搭配自研或者其他廠商的小算力GPU、CPU及NPU，而想要在短期內獲得并保證超大算力，NVIDIA是不二之選，

與此同時，與NVIDIA合作打造定制化GPU集群，為模型訓練提供高效穩定可用的基礎算力系統，也成了大模型廠商的共同選擇，

為了滿足OpenAI多模型的算力需求，微軟基于NVIDIA最新旗艦芯片和NVIDIA Quantum-2 InfiniBand網路互連技術，推出Azure可大規模擴展的AI虛擬機系列以顯著加速AI模型的開發，

亞馬遜云科技和NVIDIA合作，構建全球最具可擴展性且按需付費的人工智能（AI）基礎設施，以訓練日益復雜的大語言模型（LLM）和開發生成式AI應用程式，

Meta與NVIDIA聯合打造了RSC，這是全球最快的AI超級計算機之一，

在國內，有資訊透露，百度在年初緊急下單3000臺8張芯片（2.4萬枚GPU）的服務器，百度全年會有5萬枚Hopper架構GPU的需求，

阿里云預計在今年需要1萬枚左右，其中6000枚也是該GPU，

近期騰訊所發布的新一代高性能計算集群HCC，同樣采用了國內首發的NVIDIA Hopper架構GPU，

相關資料統計，國內對NVIDIA新一代Hopper架構GPU的需求，至少是數十萬的級別，

當前階段的LLM大發展，算力源頭最終都指向了NVIDIA，這意味著，NVIDIA所提供的算力已經無處不在，

無處不在的NVIDIA算力

AI已經進入大模型時代，接下來所有領域所有行業都將進行一輪IT架構與應用程式的重大變革，所有組織都要引入大模型，所有AI應用都要建立在模型層之上，

NVIDIA自誕生以來一直致力于加速運算，尤其是2006年推出CUDA開發平臺（通用并行計算架構）至今，所有行業早已認知到CUDA的價值，擁有CUDA支持的NVIDIA GPU也早已成為AI訓練首選，

現在，幾乎每個廠商推出的大模型，都需要以NVIDIA GPU為主的算力解決方案做支撐，構建于這些大模型之上的生成式AI應用，將會在各個領域得到應用，從這個角度而言，NVIDIA的算力已經無處不在，

而為了滿足不同廠商的需求，NVIDIA也在不斷求變，

GTC23期間，NVIDIA發布了用于資料中心的 NVIDIA Hopper架構GPU、Grace Hopper和Grace，其中Hopper GPU NVL是一款帶有雙 GPU NVLink的GPU產品，用于支持像ChatGPT這樣的大型語言模型推理，

推出了搭載8個NVIDIA Hopper GPU的新版本DGX ，可以連接成為一個巨大的GPU，將成為全球大模型廠商構建AI基礎設施的藍圖，

為了加速把DGX能力帶給初創企業和其他各類企業，助力其快速打造新產品和制定AI戰略，NVIDIA發布了用于AI云計算平臺的NVIDIA DGX Cloud，

在加速生成式AI技術應用方面，NVIDIA還發布了NVIDIA AI Foundations云服務系列，為需要構建、完善和運行自定義大型語言模型及生成式AI的客戶提供服務，

同時為幫助企業部署處于快速發展的生成式AI模型，NVIDIA發布了用于AI視頻的NVIDIA L4 GPU、用于影像生成的NVIDIA L40 GPU、用于大型語言模型部署的NVIDIA H100 NVL 以及用于推薦模型的NVIDIA Grace Hopper，

這些產品、平臺和解決方案的發布，可以讓NVIDIA的算力以更強勁的動力傳輸到更多領域，

NVIDIA以算力助力多領域企業成長的案例已有太多，這里我們也來看幾個GTC23展示的案例，

比如在醫藥領域，三井物產株式會社正在與NVIDIA合作開展“Tokyo-1”專案，該專案旨在使用高解析度分子動力學模擬和用于藥物研發的生成式 AI 模型等技術，為日本制藥行業的領導者提供強大動力，

通過該專案，用戶將能夠訪問 NVIDIA DGX 節點，以支持其進行分子動力學模擬、大型語言模型訓練、量子化學、為潛在藥物創建新型分子結構的生成式 AI 模型等，Tokyo-1 用戶還可以通過NVIDIA BioNeMo 藥物研發軟體和服務，利用大型語言模型來處理化學、蛋白質、DNA 和 RNA 資料格式，

在汽車領域，NVIDIA與新能源汽車（NEV）制造商比亞迪將拓寬 NVIDIA DRIVE Orin? 中央計算平臺的應用范圍，將用于其更多新能源車型之中，DRIVE Orin的強大計算能力能夠實時處理各種冗余傳感器資訊，且這項技識訓能為汽車制造商提供充足的計算裕量，支持其在整個汽車生命周期內，開發和運行全新的軟體驅動型服務，

NVIDIA DRIVE Orin作為當前市面上性能最高的車規級處理器，自去年投產以來，已成為交通行業新一代新能源汽車、自動駕駛出租車和卡車的人工智能的首選引擎，

在通訊領域，AT&T和NVIDIA宣布了一項新合作，AT&T將通過使用NVIDIA驅動的AI來處理資料、優化服務車隊路線規劃并創建用于員工支持與培訓的數字虛擬形象，以持續轉變運營方式和增強可持續性，

AT&T是首個探索使用全套NVIDIA AI平臺的電信運營商，這些產品包括使用NVIDIA AI Enterprise軟體套件來提升其資料處理能力，這一套件包含NVIDIA RAPIDS Accelerator for Apache Spark；通過NVIDIA cuOpt，實作實時車輛路線規劃和優化；通過NVIDIA Omniverse Avatar Cloud Engine和NVIDIA Tokkio，打造數字虛擬形象；以及通過NVIDIA Riva更好地利用對話式AI，

隨著更多領域的客戶采用NVIDIA的算力解決方案，NVIDIA的算力也將跟隨合作伙伴為用戶提供的服務而遍及更多垂直細分領域，

后記：市場需求造就算力模式演變

為了加速算力賦能千行百業，NVIDIA持續推出更多解決方案以滿足更多客戶的需求，而隨著用戶對于算力需求的變化，NVIDIA也在不斷探索更加多元化的算力解決方案，

從GTC23所發布的一系列產品、技術及解決方案來看，NVIDIA已經從硬體算力供應商發展成為能夠提供軟硬體一體解決方案及AI云計算的多元化算力供應商，

這個改變一方面來自于NVIDIA對于全球客戶對算力需求變化的時刻洞悉與及時回應，另一方面也來自于NVIDIA對算力如何更好助力人工智能發展的持續探索，