AI 生圖工具有個致命問題:這張圖很美,下一張風格又不一樣了。
對個人創作者來說,隨機性是驚喜。
但對品牌設計來說,隨機性是災難。
當你需要一套統一的 UI 圖示、簡報插畫或品牌素材時,你需要的是穩定、可控、風格嚴格統一的產出。
經過一系列測試,我們鎖定了 Leonardo.ai 搭配最新的 Flux 模型。
這篇文章分享我們背後的決策思路。
為什麼選 Leonardo.ai?不是 Midjourney?
Midjourney 畫質很好,但它比較像「藝術家」,很難精準控制參數。
Leonardo.ai 比較像「工程師的工作台」,它讓你做最重要的一件事:訓練自己的模型。
我們的目標很明確:建立一個「元件工廠」。
我們不需要 AI 畫完整的複雜場景。
我們需要它源源不絕地產出符合品牌規範的「樹」、「車子」、「雲朵」或「人物」。
這樣後續就能像拼樂高一樣使用。
關鍵決策:全模型微調 vs. LoRA
在訓練模型時,有兩種選擇:
- 全模型微調(Finetuned Model): 從頭訓練一整個模型
- LoRA(Element): 只訓練一層輕薄的「風格濾鏡」,掛在現有模型上
我們選了 LoRA。
這聽起來違反直覺。通常大家覺得全模型更強大。
但在「幾何元件生成」這個場景,LoRA 搭配 Flux 基底模型,才是最佳解。
原因是這樣的:
1. 「大腦」與「濾鏡」的組合
怎麼理解?
想像你在拍照。
Flux 模型是相機本身,它決定畫面清不清晰、結構準不準確。
LoRA 是濾鏡,它只負責調色調、改風格。
Flux 是目前理解力最強的 AI。
它知道「車子」由輪胎和車身組成,知道「人」的骨架結構。
如果選全模型微調,系統會強迫你降級用舊版架構。
AI 會變「笨」。
對幾何圖形來說,變笨意味著圓不夠圓、邊緣有鋸齒。
所以我們保留 Flux 聰明的大腦處理「結構」,只用 LoRA 規定「顏色與扁平質感」。
這是完美的平衡。
2. 可調整的彈性
LoRA 可以調整權重。
生成的風格太強烈,導致物體變形?
把權重從 1.0 調到 0.8 就能救回來。
這是全模型做不到的。
比較項目 | Element (LoRA) | Finetuned Model (全模型微調) |
這樣想 | 「濾鏡 / 外掛裝備」像是給 AI 大腦戴上一副有特殊功能的眼鏡。 | 「大腦重塑 / 新物種」像是重新教育一個 AI,改變它的思考方式。 |
Flux 模型支援度 | 完美支援目前要在 Leonardo 使用 Flux 強大的能力,這是唯一途徑。 | 支援度低 / 限制多通常會強制降級使用舊版 SDXL 或 SD 1.5 架構,畫質與理解力較差。 |
靈活性 (權重) | 極高 (可調整)使用時可調整 Strength (例如 0.8 或 1.2)。 | 固定訓練好是什麼樣子就是什麼樣子,無法在生成時微調風格強度。 |
混合使用 | 可以可以同時掛載「品牌風格」+「聖誕節裝飾」兩個 Element。 | 不可一次只能選擇一個模型基底。 |
訓練成本/速度 | 快 / 便宜消耗 Token 較少,訓練時間短。 | 慢 / 昂貴需要大量算力,消耗更多 Token。 |
適合場景 | 特定風格、角色、元件庫(您的需求:幾何 Flat 風格元件) | 全新的藝術流派或是需要徹底改變 AI 對世界的認知 (例如訓練醫學影像專用模型)。 |
訓練素材的三條鐵律
決定了工具,接下來是決勝點:訓練素材怎麼準備?
AI 是鏡子。你給它垃圾,它就還你垃圾。
為了訓練出乾淨的「幾何 FLAT 風格」,我們總結了三條鐵律:
1. 極致的純淨
我們只挑了 8 到 15 張最完美的圖片。
條件很嚴格:
- 絕對不能有陰影
- 絕對不能有漸層
- 邊緣必須像向量圖一樣銳利
如果混入一張帶陰影的圖,AI 就會誤以為陰影是隨機出現的特徵。
風格就崩了。
2. 不要手動「資料增強」
不要去旋轉、縮放或改變圖片飽和度。
對幾何風格來說,結構的邏輯性很重要。
旋轉圖片會讓 AI 搞混重力方向(例如樹長在牆上)。
改變飽和度會破壞品牌的色票規範。
我們寧願要 8 張完美的圖,也不要 50 張灌水的圖。
3. 標註的「減法哲學」
這是最關鍵的一步。
在告訴 AI 這些圖片是什麼時,我們採用**「只描述物體,不描述風格」**的策略。
舉個例子:
- 圖片內容: 一張幾何風格的紅色蘋果
- 我們的標註:
A red apple(不要寫 flat style、geometric)
為什麼?
AI 的學習邏輯是這樣:
圖片的全部 - 文字描述的部分 = 模型要學的東西
如果你在文字裡寫了「Geometric」,AI 會以為幾何特徵是文字帶來的。
它就不會把這個風格存進模型裡。
只有透過這種「減法」,才能把風格深深刻在 LoRA 模型中。
最後的成果
透過這個流程,我們把 Leonardo.ai 變成了團隊的「素材生成器」。
現在團隊成員只需要輸入簡單的 Prompt(例如
a laptop),掛上我們的品牌 LoRA,就能得到一張結構精準、風格符合品牌規範的平面插畫。這釋放了設計師繪製基礎素材的時間,也保證了全團隊產出的一致性。
AI 不會取代設計師的品味。
但懂得訓練 AI 的設計團隊,會有更強的規模化生產能力。