由於這個「業界」一直有快速的變化,所以本文可能隨時間更新
VRAM 為顯示記憶體(顯示卡上的)的英文縮寫
本文以講Stable Diffusion為主。
硬體
由於需要用到cuda作GPU運算,所以目前只能用Nvidia家的顯示卡,我們只會提到Nvidia的卡,非Nvidia的卡,必須觀察 zluda這個相容cuda的開源軟體的發展。經過我們的測試來說可以分三個使用面向:
- 小格局圖:原始尺寸1024X768 以下的圖,8GB的顯示卡就夠了,小於512X512的尺寸有可能4GB勉強可以
- 大格局的圖片:建議至少要 10GB~ 12GB VRAM的顯示卡,例如 3060 12GB
- 動畫:動畫製作,如果結果目標是要1080p可以用的話,基本上VRAM需求直接就是 17GB,所以最少要3090
為什麼是說格局而不是大小呢?因為Stable Diffusion 相關的軟體都會內建 AI scale up X4 解析度的功能,所以希望出來的圖片大是可以辦到的。但是AI 在畫圖時,會根據原始大小來進行布局,比如說你要畫一個人物, 512X512的尺寸只會畫出上半身;512X1024可能就是全身, 1024X1024他就會給你畫兩個人 (即便你只要一個人物)2048X2048 可能畫8個人的半身像(而且黏在一起) 所以原始的圖片尺寸會決定畫圖的格局
顯示卡購買上,純粹看VRAM大小,其次才是看cuda(影響渲染時間),如果一個cuda數高但是vram少的,比方說3070 8gb,那在AI算圖的考量,它輸 3060 12GB。
如果用C/P值角度來看,渲染時間不差個幾分鐘,30系列還是很好的選擇,但是要非常留意。3090 、3090TI在撰文的現在市場已經非常稀少。可能需要去找在地的商家去詢問甚至從二手市場找了。
軟體
Stable Diffusion 純圖片筆跡渲染的話,目前有:
- Stable Diffusion UI:這個是我們使用的,安裝很簡單,使用瀏覽器的web界面來操作,更新很快速
- Stable Diffusion Web UI:這個較多人使用,也是以瀏覽器的web界面來操作,不過安裝會比較繁瑣,而且曾被發現有安全漏洞
雖然都是web界面,建議是在內網自己使用,如果要做成開放對外的網路渲染主機,資安的部份都要留意
用Stable Diffusion 作影片的部份,目前最有名的是Deforum Stable Diffusion,它只有 Python notebook的形式,最新版目前是0.5 ,本來是在Google colab主機上執行的,安裝/使用 到本機會有點繁瑣,要先熟悉一下python notebook的概念與使用,我們會建議先利用Google colab的免費或者低價會員先體驗熟悉一段時間,再考慮本機安裝。
本機安裝上,大致上你除了python(當然我們的系統已經內建)以外,可能還要準備 conda(我們測過conda-mini 版就夠用了),還有要準備 jupyter ,使在本機可以用 jupyter notebook 來在本機執行,不過所有的路徑本來是指向google drive主機,必須修改路徑,還有python的對應可能也要改版本(或者你想裝其對應的版本),其中最重要的Stable Diffusion AI 模型 sd-v-1-4.ckpt 的部份,你也可以指定到本來你的 S.D-UI或者S.D-WEBUI已經有的模型檔案