最近看到一個好玩的開源專案:MiniGPT-4,
看名字像 GPT-4 的小老弟,其實沒啥關系,
簡單說,它可以識別影像,基于影像你可以和它對話,它能生成圖片描述、網站、詩歌,
先看看官方給出的例子截圖,
給圖寫一段廣告詞

還能教做飯

根據圖配上一段故事

臥槽,AI 長眼睛了!
除此之外,它還能找到圖中的笑點、生成詩歌…… 還有更牛的,可以根據一張設計草圖,生成站代碼

看的我是目瞪口呆…… 上一次這么目瞪口呆,還是看 GPT-4 的演示,
估計看到這里,你和我一樣都被驚到了,那接下來的內容,可以讓你壓壓驚了,
這么強的工具,說什么我也得試試啊,
首先我找了一張 911 撞大樓的圖片,試試 MiniGPT-4 的識圖和描述,
下面是我傳給它圖片,和我倆的問答,


嗯,它回答的看著還行,像模像樣的,
像模像樣也就到此為止了,接下來 MiniGPT-4 的表現就有點讓我失望,
我找了一個宮保雞丁的圖片,讓它教我做飯,


MiniGPT-4 看成了炸雞肉?!
蔥段、辣椒:我倆不配被識別?
我提示一下

經過提示,它倒是知道了是宮保雞丁了,但是做法沒改過來…… 還是芥末、香菜……
可能它不擅長中國菜吧,不難為它了,換一道題,據說它能 get 影像的笑點,
我用的這張圖

問它笑點在哪

沒有解釋笑點,只是單純的描述了圖,而且還描述錯了,把手機看成了電腦,
我換了問法,又進行了提示,結果還是不太行,

再換個題,來個簡單的,


哎,又逃避問題,沒回答電影名也就算了,圖的描述也有點胡說八道了,“白襯衣黑褲子”,“看起來很休閑”,
心累!每一次提問完等回答,都要等好幾分鐘,等了半天就等到了這么不正經的回答,
當初看完官方例子之后,我心里還竊喜,MiniGPT-4 可以幫我一個大忙:每次發朋友圈,給圖配文字我都費勁想半天,到底文字怎么寫才能顯得我有才華,
試了一下,結果你們自己看吧,



已經無力吐槽了……
不應該啊,是我的問題?用法不對?
那我用官方例子的圖片,試試圖片生成代碼,我就不信了,

還是老樣子,MiniGPT-4 還是無視問題,悶頭自己描述……

又問了一次,代碼總算寫出來了,

但是,這代碼看起來也不對啊,
這時候,和官方截圖一對比,我有一種的感覺:
紅燒牛肉面里沒看到牛肉,
以上就是我的體驗程序,
因為每次提問之后,等答案都要好久,再加上有點失望,有些想法就沒再嘗試了,
總的來說,這次體驗有點一言難盡:我帶著好奇心和不明覺厲玩了半天,結果感覺我被玩了,
但是,靜下來想想,MiniGPT-4 這種互動形式還是挺讓人眼前一亮的,或許我的用法不對,或許它需要時間來不斷迭代進化,或許我們應該給它更多耐心,
就沖著它的團隊里有好幾個華人名字,怎么著也得支持一下,
希望它以后能速度更快,功能更強大,MiniGPT-4 早日不 Mini,
最后,附上它的幾個地址,感興趣的小伙伴可以去看看,
官網和演示:https://minigpt-4.github.io/
github:https://github.com/Vision-CAIR/MiniGPT-4
論文:https://github.com/Vision-CAIR/MiniGPT-4/blob/main/MiniGPT_4.pdf
我建了一個免費 ChatGPT 學習群,在群里就可以免費使用 ChatGPT,入群掃碼:

如果上面的群二維碼過期了,你可以加我微信,我拉你入群:

轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/554981.html
標籤:其他
下一篇:返回列表
