✈️ Gate 廣場【Gate Travel 旅行分享官召集令】
廣場家人們注意啦!Gate Travel 已經上線~ 機票+酒店一站式預訂,還能用加密貨幣直接付款 💸
所以說,你的錢包和你的旅行夢終於可以談戀愛了 😎 💕
現在廣場開啓 #GateTravel旅行分享官# 活動,邀你來秀旅行靈感 & 使用體驗!💡
🌴 參與方式:
1️⃣ 在【廣場】帶話題 #Gate Travel 旅行分享官# 發帖
2️⃣ 你可以:
你最想用 Gate Travel 去的目的地(私藏小島 or 網紅打卡點都行)
講講用 Gate Travel 訂票/訂酒店的奇妙體驗
放放省錢/使用攻略,讓大家省到笑出聲
或者直接寫一篇輕鬆的 Gate Travel 旅行小故事
📦 獎勵安排,走起:
🏆 優秀分享官(1 名):Gate 旅行露營套裝
🎖️ 熱門分享官(3 名):Gate 旅行速乾套裝
🎉 幸運參與獎(5 名):Gate 國際米蘭旅行小夜燈
*海外用戶 旅行露營套裝 以 $100 合約體驗券,旅行速乾套裝 以 $50 合約體驗券折算,國際米蘭旅行小夜燈以 $30合約體驗券折算。
📌 優質內容將有機會得到官方帳號轉發翻牌提升社區曝光!
📌 帖文將綜合互動量、內容豐富度和創意評分。禁止小號刷貼,原創分享更容易脫穎而出!
🕒 8月20 18:00 - 8月28日 24:00 UTC+
只需1%參數,效果超越ControlNet,新AI繪畫控制大師來襲
原文來源:量子位元
「新AI繪畫細節控制大師」ControlNet-XS來啦!
敲擊重點的是參數只要原始ControlNet的1%。
就能做到蛋糕口味隨意切換:
**
**###### △左圖為改前
改變一個人的行頭也輕輕鬆松:
但研究人員表示ControlNet-XSFID分數明顯優於ControlNet。
而控制Stable Diffusion-XL和Stable Diffusion 2.1的程式碼將在不久後開源。
新生代控制大師
研究人員在評估了不同大小的控制模型後發現,控制模型甚至不必和2.6B參數的StableDiffusion-XL基礎網路大小一樣。
400M、104M和48M參數的ControlNet-XS控制也很明顯。
深度圖給出了更直觀的展示,根據圖像內容的距離、深度,深度圖呈現出準確的顏色深淺度:
此外,還有Canny邊緣偵測圖,物體的邊界、輪廓都能清楚展現出來:
結果顯示1.6%的參數(865M)也能夠可靠地控制生成過程。
從頭開始訓練
原始ControlNet是StableDiffusion基礎模型(base model)中U-Net編碼器的副本,所以接收與基礎模型相同的輸入,並帶有額外的引導訊號,比如說邊緣圖。
然後,經過訓練的ControlNet的中間輸出被加入到基礎模型的解碼器層的輸入中。在ControlNet的整個訓練過程中,基礎模型的權重保持凍結狀態。
ControlNet-XS的研究者認為這種方法有問題,ControlNet不必這麼龐大。
首先是Stable Diffusion最終輸出影像,是在一系列步驟中迭代生成的。每個步驟會在U-Net網路結構的編碼器(Encoder)和解碼器(Decoder)兩部分中執行。
每次迭代基礎模型和控制模型的輸入是前一個步驟產生的圖像。控制模型也接收一個控制影像。
問題在於,在編碼器階段這兩個模型都獨立運行,而控制模型的回饋只在基礎模型的解碼階段輸入。
總之,結果就是一個延遲的校正/控制機制。
也就是說ControlNet必須執行兩項任務:一邊校正/控制,一邊還要事先預測基本模型的編碼器會犯哪些「錯誤」。
透過暗示影像產生和控制需要相似的模型容量,自然可以用基礎模型的權重初始化ControlNet的權重,然後微調。
如上圖所示,方法是從基礎模型的編碼器添加連接到控制編碼器(A),這樣校正過程可以更快地適應基礎模型的生成過程。但這並不能完全消除延遲,因為基礎模型的編碼器仍然沒有被引導。
因此,研究人員從ControlNet-XS添加額外的連接到基礎模型編碼器,直接影響整個生成過程(B)。
此外,他們還評估了在ControlNet設定中使用鏡像解碼架構是否有用(C)。
最終,研究人員在COCO2017驗證集上,針對Canny邊緣引導的三種不同變體(A、B、C)與原始的ControlNet進行了FID分數性能評估。
结果所有变体都有了显著提升,同时仅使用了原始ControlNet参数的一小部分。