主頁 >  其他 > 又雙種草了新家裝風格?AI幫你家居換裝

又雙種草了新家裝風格?AI幫你家居換裝

2023-06-03 08:35:46 其他

摘要:又雙叒叕種草了家裝新風格?想要嘗試卻又怕踩雷?如果能夠輕松Get量身定制的家裝風格圖,那該多好啊,現在,這一切都成為了可能!

本文分享自華為云社區《又雙叒叕種草了新家裝風格?AI幫你家居換裝!》,作者:Emma_Liu,

Control Stable Diffusion with M-LSD 修改建筑及家居裝修風格

你是否曾經想過,如果能夠輕松地看到自己家居的不同風格,該有多好呢?現在,這一切都變得可能了!

讓你的眼睛仔細觀察這些圖片,你會發現它們展現了不同的風格和氛圍,從現代簡約到古典優雅,從溫馨舒適到時尚前衛,應有盡有,但是,你知道嗎?這些圖片都是由AI生成的!

它們看起來非常逼真,仿佛是真實的照片一樣,這就是人工智能的奇妙之處,讓我們可以輕松地預覽不同的家居風格,不必實際進行裝修,讓我們一起來感受AI技術的魅力吧!

裝修風格參考

現代極簡風臥室

圖一是原圖,我要基于圖一的裝修布局重新裝修一下,圖二是M-LSD線段檢測器的輸出影像,圖三是加入prompt為:現代極簡風臥室生成影像,圖四再補充一些prompt:現代極簡風臥室,床是黃色的,墻是淺咖色,不得不說效果真不錯!

衛生間

圖一這種簡單布局的衛生間我很是喜歡,康康其他風格的侘寂風衛生間 - 圖二、三

客廳

換裝ing——奶油風客廳——無名(不填prompt也可以生成不錯的圖片,很多驚喜誒)

別墅

我已經在幻想住上大別墅了?看看別墅的效果怎么樣

浪漫的海邊別墅、新中式別墅

我想嘗試用建筑設計圖來看看能不能生成…哇,絕絕子——簡約風,現代風

其他建筑

建模圖變——歐式建筑

廠房變辦公樓、大型超市、別墅(這樣式的別墅)

好神奇,它是怎么做到的呢,來看看模型的介紹,

0.模型介紹

建筑的穩定擴散 | ControlNet模型-MLSD,隨意創建建筑物、房間內部或外部以及獨特的場景

ControlNet 最早是在L.Zhang等人的論文《Adding Conditional Control to Text-to-Image Diffusion Model》中提出的,目的是提高預訓練的擴散模型的性能,它引入了一個框架,支持在擴散模型 (如 Stable Diffusion ) 上附加額外的多種空間語意條件來控制生成程序,為穩定擴散帶來了前所未有的控制水平,

Mobile LSD (M-LSD): 《Towards Light-weight and Real-time Line Segment Detection》是用于資源受限環境的實時和輕量級線段檢測器,M-LSD利用了極其高效的LSD體系結構和新的訓練方案,包括SoL增強和幾何學習方案,模型可以在GPU、CPU甚至移動設備上實時運行,

圖1 GPU上M-LSD和現有LSD方法的比較

圖2 移動設備上的推理速度和記憶體使用情況.

案例以分享至AI Gallery - AI建筑風格修改: ControlNet-MLSD,一起來運行代碼,實作你的新裝吧,

1.裝包

!pip install transformers==4.29.0
!pip install diffusers==0.16.1
!pip install accelerate==0.17.1
!pip install gradio==3.32.0
!pip install translate==3.6.1

2.下載模型

使用mlsd, sd-controlnet-mlsd, stable-diffusion-v1-5預訓練模型,為方便大家使用,已轉存到華為云OBS中,

import os
import moxing as mox
pretrained_models = ['mlsd', 'sd-controlnet-mlsd', 'stable-diffusion-v1-5']
for pretrained_model in pretrained_models:
 model_dir = os.path.join(os.getcwd(), pretrained_model)
 if not os.path.exists(model_dir):
 mox.file.copy_parallel(f'obs://modelarts-labs-bj4-v2/case_zoo/ControlNet/ControlNet_models/{pretrained_model}', model_dir)
 if os.path.exists(model_dir):
 print(f'{pretrained_model} download success')
 else:
 raise Exception(f'{pretrained_model} download Failed')
 else:
 print(f"{pretrained_model} already exists!")

3.加載模型

import torch
from PIL import Image
from mlsd import MLSDdetector
from translate import Translator
from diffusers.utils import load_image
from diffusers import StableDiffusionControlNetPipeline, ControlNetModel, UniPCMultistepScheduler
mlsd = MLSDdetector()
controlnet = ControlNetModel.from_pretrained("sd-controlnet-mlsd", torch_dtype=torch.float16)
pipe = StableDiffusionControlNetPipeline.from_pretrained("stable-diffusion-v1-5", controlnet=controlnet, safety_checker=None, torch_dtype=torch.float16)
pipe.scheduler = UniPCMultistepScheduler.from_config(pipe.scheduler.config)
pipe.enable_model_cpu_offload()

4.生成影像

首先,傳入的圖片會通過mlsd detector輸出黑白線條圖,然后基于此mlsd影像,通過controlnet和stable diffusion生成影像,

from PIL import Image
import matplotlib.pyplot as plt
import numpy as np
ori = Image.open("1920245540.jpg")
mlsd = MLSDdetector()
mlsd_img = mlsd(ori, thr_v=0.1, thr_d=0.1, detect_resolution=512, image_resolution=512, return_pil=True)
trans = Translator(from_lang="ZH",to_lang="EN-US")
prompt = "現代極簡風臥室,床是黃色的,墻是淺咖色"
en_prompt = trans.translate(prompt)
gen_img = pipe(en_prompt, mlsd_img, num_inference_steps=20).images[0]
fig = plt.figure(figsize=(25, 10))
ax1 = fig.add_subplot(1, 3, 1)
plt.title('Orignial image', fontsize=16)
ax1.axis('off')
ax1.imshow(ori)
ax2 = fig.add_subplot(1, 3, 2)
plt.title('ML Detector image', fontsize=16)
ax2.axis('off')
ax2.imshow(mlsd_img)
ax3 = fig.add_subplot(1, 3, 3)
plt.title('Generate image', fontsize=16)
ax3.axis('off')
ax3.imshow(gen_img)
plt.show()

5.Gradio可視化部署

Gradio應用啟動后可在下方頁面上傳圖片根據提示生成影像,您也可以分享public url在手機端,PC端進行訪問生成影像,

引數說明

img_path:輸入影像路徑

prompt:提示詞(建議填寫)

n_prompt: 負面提示(可選)

num_inference_steps: 采樣步數,一般15-30,值越大越精細,耗時越長

image_resolution: 對輸入的圖片進行最長邊等比resize

detect_resolution:Hough Resolution,檢測解析度,值越小-線條越粗糙
value_threshold: Hough value threshold (MLSD),值越大-檢測線條越多,越詳細

distance_threshold: Hough distance threshold (MLSD),值越大-距離越遠,檢測到的線條越少

對比一下引數value_threshold,distance_threshold,當value_threshold值變大時,如圖二所示,檢測到的線段越少,獲取到的資訊也就越少,對控制生成后的影像來說,會缺失掉很多的細節;當distance_threshold值變大時,如圖三所示,越遠處的物體,提取到的線段越少,影像會更專注于前面的部分,這對于來調整生成的影像是一個很好的參考,

thr_v=0.1, thr_d=0.1

thr_v=0.5, thr_d=0.1

thr_v=0.1, thr_d=20

import gradio as gr
def mlsd(img, prompt, num_inference_steps, thr_v, thr_d, n_prompt, detect_resolution, image_resolution):
    trans = Translator(from_lang="ZH",to_lang="EN-US")
    prompt = trans.translate(prompt)
 n_prompt = trans.translate(n_prompt)
 mlsd = MLSDdetector()
 mlsd_img = mlsd(img, thr_v=0.1, thr_d=0.1, detect_resolution=512, image_resolution=512, return_pil=True)
 gen_img = pipe(prompt, mlsd_img, num_inference_steps=20, negative_prompt=n_prompt).images[0]
    result = [mlsd_img, gen_img]
 return result 
block = gr.Blocks().queue()
with block:
 with gr.Row():
 gr.Markdown("##  Control Stable Diffusion with MLSD")
 with gr.Row():
 with gr.Column():
 input_image = gr.Image(source='upload', type="numpy")
            prompt = gr.Textbox(label="描述")
 run_button = gr.Button(label="Run")
 with gr.Accordion("高級選項", open=False):
 num_inference_steps = gr.Slider(label="影像生成步數", minimum=1, maximum=100, value=https://www.cnblogs.com/huaweiyun/archive/2023/06/02/20, step=1)
 value_threshold = gr.Slider(label="Hough value threshold (MLSD)", minimum=0.01, maximum=2.0, value=https://www.cnblogs.com/huaweiyun/archive/2023/06/02/0.1, step=0.01)
 distance_threshold = gr.Slider(label="Hough distance threshold (MLSD)", minimum=0.01, maximum=20.0, value=https://www.cnblogs.com/huaweiyun/archive/2023/06/02/0.1, step=0.01)
 n_prompt = gr.Textbox(label="否定提示",
                                      value='lowres, extra digit, fewer digits, cropped, worst quality, low quality')
 detect_resolution = gr.Slider(label="Hough Resolution", minimum=128, maximum=1024, value=https://www.cnblogs.com/huaweiyun/archive/2023/06/02/512, step=1)
 image_resolution = gr.Slider(label="Image Resolution", minimum=256, maximum=768, value=https://www.cnblogs.com/huaweiyun/archive/2023/06/02/512, step=64)
 with gr.Column():
 result_gallery = gr.Gallery(label='Output', show_label=False, elem_id="gallery").style(columns=2, height='auto')
 ips = [input_image, prompt, num_inference_steps, value_threshold, distance_threshold, n_prompt, detect_resolution, image_resolution]
 run_button.click(fn=mlsd, inputs=ips, outputs=[result_gallery])
block.launch(share=True)

參考文獻

  1. Paper: 《Adding Conditional Control to Text-to-Image Diffusion Model》
  2. Paper: 《Towards Light-weight and Real-time Line Segment Detection》
  3. Model:sd-controlnet-mlsd, stable-diffusion-v1-5
  4. 案例代碼地址:AI Gallery - AI建筑風格修改: ControlNet-MLSD 免費體驗

 

 

點擊關注,第一時間了解華為云新鮮技術~

轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/554173.html

標籤:其他

上一篇:自然語言處理(NLP) - 前預訓練時代的自監督學習

下一篇:返回列表

標籤雲
其他(160247) Python(38199) JavaScript(25473) Java(18184) C(15236) 區塊鏈(8269) C#(7972) AI(7469) 爪哇(7425) MySQL(7223) html(6777) 基礎類(6313) sql(6102) 熊猫(6058) PHP(5873) 数组(5741) R(5409) Linux(5346) 反应(5209) 腳本語言(PerlPython)(5129) 非技術區(4971) Android(4581) 数据框(4311) css(4259) 节点.js(4032) C語言(3288) json(3245) 列表(3129) 扑(3119) C++語言(3117) 安卓(2998) 打字稿(2995) VBA(2789) Java相關(2746) 疑難問題(2699) 细绳(2522) 單片機工控(2479) iOS(2434) ASP.NET(2403) MongoDB(2323) 麻木的(2285) 正则表达式(2254) 字典(2211) 循环(2198) 迅速(2185) 擅长(2169) 镖(2155) .NET技术(1980) 功能(1967) Web開發(1951) HtmlCss(1951) C++(1928) python-3.x(1918) 弹簧靴(1913) xml(1889) PostgreSQL(1879) .NETCore(1863) 谷歌表格(1846) Unity3D(1843) for循环(1842)

熱門瀏覽
  • 網閘典型架構簡述

    網閘架構一般分為兩種:三主機的三系統架構網閘和雙主機的2+1架構網閘。 三主機架構分別為內端機、外端機和仲裁機。三機無論從軟體和硬體上均各自獨立。首先從硬體上來看,三機都用各自獨立的主板、記憶體及存盤設備。從軟體上來看,三機有各自獨立的作業系統。這樣能達到完全的三機獨立。對于“2+1”系統,“2”分為 ......

    uj5u.com 2020-09-10 02:00:44 more
  • 如何從xshell上傳檔案到centos linux虛擬機里

    如何從xshell上傳檔案到centos linux虛擬機里及:虛擬機CentOs下執行 yum -y install lrzsz命令,出現錯誤:鏡像無法找到軟體包 前言 一、安裝lrzsz步驟 二、上傳檔案 三、遇到的問題及解決方案 總結 前言 提示:其實很簡單,往虛擬機上安裝一個上傳檔案的工具 ......

    uj5u.com 2020-09-10 02:00:47 more
  • 一、SQLMAP入門

    一、SQLMAP入門 1、判斷是否存在注入 sqlmap.py -u 網址/id=1 id=1不可缺少。當注入點后面的引數大于兩個時。需要加雙引號, sqlmap.py -u "網址/id=1&uid=1" 2、判斷文本中的請求是否存在注入 從文本中加載http請求,SQLMAP可以從一個文本檔案中 ......

    uj5u.com 2020-09-10 02:00:50 more
  • Metasploit 簡單使用教程

    metasploit 簡單使用教程 浩先生, 2020-08-28 16:18:25 分類專欄: kail 網路安全 linux 文章標簽: linux資訊安全 編輯 著作權 metasploit 使用教程 前言 一、Metasploit是什么? 二、準備作業 三、具體步驟 前言 Msfconsole ......

    uj5u.com 2020-09-10 02:00:53 more
  • 游戲逆向之驅動層與用戶層通訊

    驅動層代碼: #pragma once #include <ntifs.h> #define add_code CTL_CODE(FILE_DEVICE_UNKNOWN,0x800,METHOD_BUFFERED,FILE_ANY_ACCESS) /* 更多游戲逆向視頻www.yxfzedu.com ......

    uj5u.com 2020-09-10 02:00:56 more
  • 北斗電力時鐘(北斗授時服務器)讓網路資料更精準

    北斗電力時鐘(北斗授時服務器)讓網路資料更精準 北斗電力時鐘(北斗授時服務器)讓網路資料更精準 京準電子科技官微——ahjzsz 近幾年,資訊技術的得了快速發展,互聯網在逐漸普及,其在人們生活和生產中都得到了廣泛應用,并且取得了不錯的應用效果。計算機網路資訊在電力系統中的應用,一方面使電力系統的運行 ......

    uj5u.com 2020-09-10 02:01:03 more
  • 【CTF】CTFHub 技能樹 彩蛋 writeup

    ?碎碎念 CTFHub:https://www.ctfhub.com/ 筆者入門CTF時時剛開始刷的是bugku的舊平臺,后來才有了CTFHub。 感覺不論是網頁UI設計,還是題目質量,賽事跟蹤,工具軟體都做得很不錯。 而且因為獨到的金幣制度的確讓人有一種想去刷題賺金幣的感覺。 個人還是非常喜歡這個 ......

    uj5u.com 2020-09-10 02:04:05 more
  • 02windows基礎操作

    我學到了一下幾點 Windows系統目錄結構與滲透的作用 常見Windows的服務詳解 Windows埠詳解 常用的Windows注冊表詳解 hacker DOS命令詳解(net user / type /md /rd/ dir /cd /net use copy、批處理 等) 利用dos命令制作 ......

    uj5u.com 2020-09-10 02:04:18 more
  • 03.Linux基礎操作

    我學到了以下幾點 01Linux系統介紹02系統安裝,密碼啊破解03Linux常用命令04LAMP 01LINUX windows: win03 8 12 16 19 配置不繁瑣 Linux:redhat,centos(紅帽社區版),Ubuntu server,suse unix:金融機構,證券,銀 ......

    uj5u.com 2020-09-10 02:04:30 more
  • 05HTML

    01HTML介紹 02頭部標簽講解03基礎標簽講解04表單標簽講解 HTML前段語言 js1.了解代碼2.根據代碼 懂得挖掘漏洞 (POST注入/XSS漏洞上傳)3.黑帽seo 白帽seo 客戶網站被黑帽植入劫持代碼如何處理4.熟悉html表單 <html><head><title>TDK標題,描述 ......

    uj5u.com 2020-09-10 02:04:36 more
最新发布
  • 又雙種草了新家裝風格?AI幫你家居換裝

    摘要:又雙叒叕種草了家裝新風格?想要嘗試卻又怕踩雷?如果能夠輕松Get量身定制的家裝風格圖,那該多好啊。現在,這一切都成為了可能! 本文分享自華為云社區《又雙叒叕種草了新家裝風格?AI幫你家居換裝!》,作者:Emma_Liu。 Control Stable Diffusion with M-LSD ......

    uj5u.com 2023-06-03 08:35:46 more
  • 自然語言處理(NLP) - 前預訓練時代的自監督學習

    前預訓練時代的自監督學習自回歸、自編碼預訓練的前世 ![image](https://img2023.cnblogs.com/blog/80824/202306/80824-20230602112233170-1798796623.png) 神經網路(Neural Network, NN) ![im ......

    uj5u.com 2023-06-03 08:30:00 more
  • 手把手實踐丨基于STM32+華為云設計的智慧煙感系統

    摘要:當前基于STM32和華為云,設計了一種智慧煙感系統,該系統可以檢測煙霧,同時將檢測到的資料上傳到云端進行處理和分析。 本文分享自華為云社區《基于STM32+華為云設計的智慧煙感系統》,作者:DS小龍哥 。 一、概述 當前基于STM32和華為云,設計了一種智慧煙感系統,該系統可以檢測煙霧,同時將 ......

    uj5u.com 2023-06-03 08:23:50 more
  • BFF層聚合查詢服務異步改造及治理實踐 | 京東云技術團隊

    最近在對穩健理財BFF層聚合查詢服務優化治理,針對文章內的串行改并行章節進行展開,分享下實踐經驗,主要涉及原同步改異步的程序、全異步化后衍生的問題以及治理方面的思考與改進。 ......

    uj5u.com 2023-06-03 08:23:42 more
  • 6.4. HttpClient

    **1. 什么是HttpClient?** HttpClient是Java 11中引入的一個新特性,用于支持同步和異步發送HTTP請求以及處理HTTP回應。它提供了簡單易用的API,使得發送HTTP請求變得非常簡單。 **2. HttpClient的主要組件** HttpClient由以下幾個主要組 ......

    uj5u.com 2023-06-03 08:23:35 more
  • 有沒有免費版的配音軟體?

    1.先說結論:完全免費的 剪映配音 可以滿足大部分需求 先不要著急去買付費的配音軟體。 (我就被忽悠過,買了付費配音軟體后,實際沒用幾次) 當你明確的知道,剪映配音的不足時,再考慮選付費的配音軟體。 剛開始做視頻的時候,總是擔心自己的普通話不夠標準,不會給視頻配音。 后來發現,有文本轉語音的配音軟體 ......

    uj5u.com 2023-06-03 08:23:22 more
  • ChatGPT 背后的英雄——AI芯片

    AI芯片能為人工智能應用提供所需的基礎算力;按技術架構主要分為GPU、FPGA和ASIC。ChatGPT 有著大量復雜計算需求的 AI 模型, AI 芯片專門用于處理人工智能應用中的大量計算任務,是不可或缺的底層硬體。隨著 AI 技術快速發展,AI 應用場景擴大至智能制造、家居、教育、醫療和金融等領... ......

    uj5u.com 2023-06-03 08:23:09 more
  • 又雙種草了新家裝風格?AI幫你家居換裝

    摘要:又雙叒叕種草了家裝新風格?想要嘗試卻又怕踩雷?如果能夠輕松Get量身定制的家裝風格圖,那該多好啊。現在,這一切都成為了可能! 本文分享自華為云社區《又雙叒叕種草了新家裝風格?AI幫你家居換裝!》,作者:Emma_Liu。 Control Stable Diffusion with M-LSD ......

    uj5u.com 2023-06-03 08:22:46 more
  • 自然語言處理(NLP) - 前預訓練時代的自監督學習

    前預訓練時代的自監督學習自回歸、自編碼預訓練的前世 ![image](https://img2023.cnblogs.com/blog/80824/202306/80824-20230602112233170-1798796623.png) 神經網路(Neural Network, NN) ![im ......

    uj5u.com 2023-06-03 08:21:48 more
  • 手把手實踐丨基于STM32+華為云設計的智慧煙感系統

    摘要:當前基于STM32和華為云,設計了一種智慧煙感系統,該系統可以檢測煙霧,同時將檢測到的資料上傳到云端進行處理和分析。 本文分享自華為云社區《基于STM32+華為云設計的智慧煙感系統》,作者:DS小龍哥 。 一、概述 當前基于STM32和華為云,設計了一種智慧煙感系統,該系統可以檢測煙霧,同時將 ......

    uj5u.com 2023-06-03 08:21:02 more