主頁 >  其他 > AI 繪畫基礎 - 細數 Stable Diffusion 中的各種常用模型 【🧙 魔導士裝備圖鑒】

AI 繪畫基礎 - 細數 Stable Diffusion 中的各種常用模型 【🧙 魔導士裝備圖鑒】

2023-05-10 11:06:18 其他

AI 繪畫新手魔導士在剛開始玩 Stable Diffusion 時總會遇到各種新的概念,讓人困惑,其中就包括各種模型和他們之間的關系,

魔法師入門得先認識各種法師裝備(各種模型),讓我們遇到問題知道使用何種裝備來協助自己發揮更大的效果,

safetensors

在了解各種模型之前,有必須先了解下 safetensors,玩過的應該都認識,就是很多模型的后綴,然而各種模型的后綴五花八門,但是總是能看到 safetensors 的影子,讓人有些繚亂,

其實主要是因為 safetensors 支持各種 AI 模型,而在 safetensors 出現前,各種 AI 模型都有著自己獨特的后綴,這就導致每種模型既可以使用 safetensors 又可以使用自己原有的后綴,所以入門的時候就會讓人有點分不清,

其實 safetensors 是由 huggingface 研發的一種開源的模型格式,它有幾種優勢:

  • 足夠安全,可以防止 DOS 攻擊
  • 加載迅速
  • 支持懶加載
  • 通用性強

所以現在大部分的開源模型都會提供 safetensors 格式,

開源地址: https://github.com/huggingface/safetensors

模型分類

說完了 safetensors 我們進入正題,聊一聊在 Stable Diffusion 中常見的各種模型,

Checkpoint | Stable Diffusion

Checkpoint 是 Stable Diffusion 中最重要的模型,也是主模型,幾乎所有的操作都要依托于主模型進行,而所有的主模型都是基于 Stable Diffusion 模型訓練而來,所以有時會被稱為 Stable Diffusion 模型,

主模型后綴一般為 .ckpt 或者 .safetensors,并且體積比較龐大,一般在 2G - 7G 之間,而要管理模型我們需要進入 WebUI 目錄下的 models/Stable-diffusion 目錄下,

在使用 WebUI 時左上角切換的就是主模型了,

picture 1

LoRA 和 LyCORIS

LoRA 是除了主模型外最常用的模型,LoRA 和 LyCORIS 都屬于微調模型,一般用于控制畫風、控制生成的角色、控制角色的姿勢等等,

LoRA 和 LyCORIS 的后綴均為 .safetensors,體積較主模型要小得多,一般在 4M - 300M 之間,一般使用 LoRA 模型較多,而 LyCORIS 與 LoRA 相比可調節范圍更大,但是需要額外的擴展才可使用,需要管理模型時我們可以進入 WebUI 目錄下的 models/LoRA 目錄下,

在 WebUI 中使用時,可通過點擊左側的小紅燈,然后在 LoRA 選單中點擊使用,也可以直接使用 Prompt 呼叫,

picture 2

Textual Inversion

Textual Inversion 是文本編碼器模型,用于改變文字向量,可以將其理解為一組 Prompt,

Textual Inversion 后綴為 .pt 或者 .safetensors,體積非常小,一般只有幾 kb,模型所在的目錄不在 models 下,而是在 WebUI 中的 embeddings 目錄下,

在使用時同樣可以使用小紅燈中的 Textual Inversion,也可以使用 Prompt 呼叫,

picture 1

Hypernetworks

Hypernetworks 模型用于調整模型神經網路權重,進行風格的微調,

Hypernetworks 的后綴為 .pt 或者 .safetensors,體積一般在 20M - 200M 之間,模型的目錄為 WebUI 下的 models/hypernetworks

在使用時同樣可以使用小紅燈中的 Hypernetworks,

picture 2

ControlNet

ControlNet 是一個及其強大的控制模型,它可以做到畫面控制、動作控制、色深控制、色彩控制等等,使用時需要安裝相應的擴展才可,

ControlNet 類模型的后綴為 .safetensors,模型的目錄為 models/ControlNet

使用時我們需要先去 Extensions 頁面搜索 ControlNet 擴展,然后 Install 并 Reload UI,然后便可以在 txt2img 和 img2img 選單下找到:

picture 3

ControlNet 功能非常強大,還解決 AI 畫手的噩夢問題,

VAE

VAE 模型一般用于圖片亮度和飽和度的修正、畫面較正和以及補光等,一般在繪圖時如果出現圖片亮度過低、發灰等問題時就需要用到,

VAE 模型的后綴為 .pt 或 .safetensors,體積一般為 335M 或 823M,模型的目錄為 models/VAE

使用時需要到 Settings 頁面找到 SD VAE 選單切換,

picture 4

但是這樣使用過于繁瑣,所以如果使用到建議在 Quicksettings list 配置中添加 sd_vae,

picture 5

這樣就可以在 WebUI 的頂部進行切換,

picture 6

CodeFormer

CodeFormer 模型一般用于圖片的修復,比如提高圖片的解析度、將黑白照片修改成彩色照片、人臉修復等等,

CodeFormer 是一個開源專案,在 WebUI 中已經默認被整合,可以在 Extras 選單中使用,如果需要修改 CodeFormer 版本可以將模型放到 models/codeformer

picture 7

一覽表

模型名稱 作用 后綴名 大小 在 WebUI 中的檔案夾
Checkpoint 主模型 .ckpt 或 .safetensors 2G - 7G models/Stable-diffusion
LoRA 和 LyCORIS 微調模型,一般用于控制畫風、控制生成的角色、控制角色的姿勢等等 .safetensors 2G - 7G models/Stable-diffusion
Textual Inversion 文本編碼器模型 .pt 或 .safetensors KB 級別 embeddings
Hypernetworks 調整模型神經網路權重,進行風格的微調 .pt 或 .safetensors 20M - 200M models/hypernetworks
ControlNet 強大的控制模型,可以進行畫面控制、動作控制、色深控制、色彩控制等等 .safetensors KB 級別 models/ControlNet
VAE 圖片亮度和飽和度的修正、畫面較正和以及補光等 .pt 或 .safetensors 335M 或 823M models/VAE
CodeFormer 修復模型,修復人臉、提高解析度等 - - models/codeformer

最后

上面幾種模型就是 Stable Diffusion 中最常用的幾種,通過 Checkpoint 控制圖片的主要風格;通過 VAE 給圖片補光、調亮;通過 LoRA | LyCORIS 對模型進行風格、角色控制;通過 Textual Inversion 簡化 Prompt;通過 ControlNet 進行姿勢、色彩控制,修復手部,

不過這并不是 Stable Diffusion 中所有的模型,其它的一些模型如果有空再整理下,

轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/552089.html

標籤:其他

上一篇:ChatGPT 時代:閱讀會不會被取代?

下一篇:返回列表

標籤雲
其他(158763) Python(38125) JavaScript(25412) Java(18025) C(15225) 區塊鏈(8263) C#(7972) AI(7469) 爪哇(7425) MySQL(7175) html(6777) 基礎類(6313) sql(6102) 熊猫(6058) PHP(5871) 数组(5741) R(5409) Linux(5338) 反应(5209) 腳本語言(PerlPython)(5129) 非技術區(4971) Android(4570) 数据框(4311) css(4259) 节点.js(4032) C語言(3288) json(3245) 列表(3129) 扑(3119) C++語言(3117) 安卓(2998) 打字稿(2995) VBA(2789) Java相關(2746) 疑難問題(2699) 细绳(2522) 單片機工控(2479) iOS(2432) ASP.NET(2402) MongoDB(2323) 麻木的(2285) 正则表达式(2254) 字典(2211) 循环(2198) 迅速(2185) 擅长(2169) 镖(2155) .NET技术(1972) 功能(1967) Web開發(1951) HtmlCss(1934) python-3.x(1918) 弹簧靴(1913) C++(1913) xml(1889) PostgreSQL(1875) .NETCore(1860) 谷歌表格(1846) Unity3D(1843) for循环(1842)

熱門瀏覽
  • 網閘典型架構簡述

    網閘架構一般分為兩種:三主機的三系統架構網閘和雙主機的2+1架構網閘。 三主機架構分別為內端機、外端機和仲裁機。三機無論從軟體和硬體上均各自獨立。首先從硬體上來看,三機都用各自獨立的主板、記憶體及存盤設備。從軟體上來看,三機有各自獨立的作業系統。這樣能達到完全的三機獨立。對于“2+1”系統,“2”分為 ......

    uj5u.com 2020-09-10 02:00:44 more
  • 如何從xshell上傳檔案到centos linux虛擬機里

    如何從xshell上傳檔案到centos linux虛擬機里及:虛擬機CentOs下執行 yum -y install lrzsz命令,出現錯誤:鏡像無法找到軟體包 前言 一、安裝lrzsz步驟 二、上傳檔案 三、遇到的問題及解決方案 總結 前言 提示:其實很簡單,往虛擬機上安裝一個上傳檔案的工具 ......

    uj5u.com 2020-09-10 02:00:47 more
  • 一、SQLMAP入門

    一、SQLMAP入門 1、判斷是否存在注入 sqlmap.py -u 網址/id=1 id=1不可缺少。當注入點后面的引數大于兩個時。需要加雙引號, sqlmap.py -u "網址/id=1&uid=1" 2、判斷文本中的請求是否存在注入 從文本中加載http請求,SQLMAP可以從一個文本檔案中 ......

    uj5u.com 2020-09-10 02:00:50 more
  • Metasploit 簡單使用教程

    metasploit 簡單使用教程 浩先生, 2020-08-28 16:18:25 分類專欄: kail 網路安全 linux 文章標簽: linux資訊安全 編輯 著作權 metasploit 使用教程 前言 一、Metasploit是什么? 二、準備作業 三、具體步驟 前言 Msfconsole ......

    uj5u.com 2020-09-10 02:00:53 more
  • 游戲逆向之驅動層與用戶層通訊

    驅動層代碼: #pragma once #include <ntifs.h> #define add_code CTL_CODE(FILE_DEVICE_UNKNOWN,0x800,METHOD_BUFFERED,FILE_ANY_ACCESS) /* 更多游戲逆向視頻www.yxfzedu.com ......

    uj5u.com 2020-09-10 02:00:56 more
  • 北斗電力時鐘(北斗授時服務器)讓網路資料更精準

    北斗電力時鐘(北斗授時服務器)讓網路資料更精準 北斗電力時鐘(北斗授時服務器)讓網路資料更精準 京準電子科技官微——ahjzsz 近幾年,資訊技術的得了快速發展,互聯網在逐漸普及,其在人們生活和生產中都得到了廣泛應用,并且取得了不錯的應用效果。計算機網路資訊在電力系統中的應用,一方面使電力系統的運行 ......

    uj5u.com 2020-09-10 02:01:03 more
  • 【CTF】CTFHub 技能樹 彩蛋 writeup

    ?碎碎念 CTFHub:https://www.ctfhub.com/ 筆者入門CTF時時剛開始刷的是bugku的舊平臺,后來才有了CTFHub。 感覺不論是網頁UI設計,還是題目質量,賽事跟蹤,工具軟體都做得很不錯。 而且因為獨到的金幣制度的確讓人有一種想去刷題賺金幣的感覺。 個人還是非常喜歡這個 ......

    uj5u.com 2020-09-10 02:04:05 more
  • 02windows基礎操作

    我學到了一下幾點 Windows系統目錄結構與滲透的作用 常見Windows的服務詳解 Windows埠詳解 常用的Windows注冊表詳解 hacker DOS命令詳解(net user / type /md /rd/ dir /cd /net use copy、批處理 等) 利用dos命令制作 ......

    uj5u.com 2020-09-10 02:04:18 more
  • 03.Linux基礎操作

    我學到了以下幾點 01Linux系統介紹02系統安裝,密碼啊破解03Linux常用命令04LAMP 01LINUX windows: win03 8 12 16 19 配置不繁瑣 Linux:redhat,centos(紅帽社區版),Ubuntu server,suse unix:金融機構,證券,銀 ......

    uj5u.com 2020-09-10 02:04:30 more
  • 05HTML

    01HTML介紹 02頭部標簽講解03基礎標簽講解04表單標簽講解 HTML前段語言 js1.了解代碼2.根據代碼 懂得挖掘漏洞 (POST注入/XSS漏洞上傳)3.黑帽seo 白帽seo 客戶網站被黑帽植入劫持代碼如何處理4.熟悉html表單 <html><head><title>TDK標題,描述 ......

    uj5u.com 2020-09-10 02:04:36 more
最新发布
  • AI 繪畫基礎 - 細數 Stable Diffusion 中的各種常用模型 【&#129

    AI 繪畫新手魔導士在剛開始玩 Stable Diffusion 時總會遇到各種新的概念,讓人困惑,其中就包括各種模型和他們之間的關系。 魔法師入門得先認識各種法師裝備(各種模型),讓我們遇到問題知道使用何種裝備來協助自己發揮更大的效果。 safetensors 在了解各種模型之前,有必須先了解下 ......

    uj5u.com 2023-05-10 11:06:18 more
  • ChatGPT 時代:閱讀會不會被取代?

    在這AI 盛行的時代不禁會有人發出疑問,讀書對我們來說還有價值嗎?本文作者進行了解答并對 2022 年讀過的書籍進行了總結和分類,希望能對大家有一定的借鑒意義。文末有留言有禮活動! ......

    uj5u.com 2023-05-10 11:00:40 more
  • AI 繪畫基礎 - 細數 Stable Diffusion 中的各種常用模型 【&#129

    AI 繪畫新手魔導士在剛開始玩 Stable Diffusion 時總會遇到各種新的概念,讓人困惑,其中就包括各種模型和他們之間的關系。 魔法師入門得先認識各種法師裝備(各種模型),讓我們遇到問題知道使用何種裝備來協助自己發揮更大的效果。 safetensors 在了解各種模型之前,有必須先了解下 ......

    uj5u.com 2023-05-10 10:53:03 more
  • ChatGPT 時代:閱讀會不會被取代?

    在這AI 盛行的時代不禁會有人發出疑問,讀書對我們來說還有價值嗎?本文作者進行了解答并對 2022 年讀過的書籍進行了總結和分類,希望能對大家有一定的借鑒意義。文末有留言有禮活動! ......

    uj5u.com 2023-05-10 10:47:28 more
  • 別玩手機 影像分類比賽

    如今,手機已成為大眾離不開的生活工具,而且它的迅速發展使得它的功能不再以通訊為主,手機逐漸發展為可移動的大眾傳播媒體終端設備,甚至可以比作為第五媒體。當今的大學生群體是智能手機使用者中的一支巨大的的隊伍,零零后大學生在進入大學以來,學習生活中過度的依賴手機,甚至上課時忘記攜帶手機便會手足無措,神情恍... ......

    uj5u.com 2023-05-10 08:21:55 more
  • 【AIGC】Embedding與LLM的結合:長文本搜索與問答功能

    什么是Embedding? Embedding是一種多維向量陣列,由一系列數字組成,可以代表任何事物,如文本、音樂、視頻等。在這里我們將重點關注文本部分。Embedding之所以重要,是因為它讓我們可以進行語意搜索,也就是通過文本的含義進行相似性檢索。 為什么Embedding在AI中如此重要? E ......

    uj5u.com 2023-05-10 08:21:46 more
  • 百度飛槳(PaddlePaddle)-數字識別

    手寫數字識別任務 用于對 0 ~ 9 的十類數字進行分類,即輸入手寫數字的圖片,可識別出這個圖片中的數字。 使用 pip 工具安裝 matplotlib 和 numpy python -m pip install matplotlib numpy -i https://mirror.baidu.co ......

    uj5u.com 2023-05-10 08:21:35 more
  • LP三明治機器人

    2022 年 11 月 4 日,EigenPhi檢測到一種全新型別的三明治交易:一個三明治機器人擠壓了一筆增加流動性的交易,根據我們的常識,這很奇怪。這樣做有利可圖嗎?有什么限制嗎?與之前關于包括 37 筆交易的巨大三明治交易的文章不同,該機器人展示了一種截然不同的創新策略。而本文將帶你一探AMM旗 ......

    uj5u.com 2023-05-10 08:15:36 more
  • 你還在糾結怎么選IDE嗎?常用IDE工具分享

    近期有不少剛學編程的小伙伴來問我,市面上那么多IDE工具,該怎么選?今天在這里跟大家分享幾款個人比較鐘愛的IDE工具,供大家參考。 Visual Studio 優點:支持多種語言,包括C#, C++, Visual Basic等,可用于Web應用程式、桌面應用程式、移動應用程式等開發;集成了多種工具 ......

    uj5u.com 2023-05-10 08:10:08 more
  • 資料結構與演算法大作業:走迷宮程式(C語言,DFS)(代碼以及思路)

    好家伙,寫大作業,本篇為代碼的思路講解 1.大作業要求 走迷宮程式 問題描述: 以一個 m * n 的長方陣表示迷宮, 0和1分別表示迷宮的通路和障礙。 設計一個程式, 對任意設定的迷宮, 求出一條從入口到出口的通路, 或得出沒有通路的結論。 基本要求: (1) 實作一個以鏈表做存盤的堆疊型別, 然后 ......

    uj5u.com 2023-05-10 08:09:58 more