全球知名的AI藝術(shù)生成工具,自2022年8月發(fā)布以來,憑借生成圖像速度快、對資源和內(nèi)存要求門檻低等特點而被廣泛應(yīng)用于藝術(shù)創(chuàng)作、程序開發(fā)等領(lǐng)域,Stable Diffusion目前主要提供圖像編輯、超分辨率、風(fēng)格遷移、修復(fù)、補全等功能,可支持在電腦端和手機端進行下載與運行
Stable Diffusion核心技術(shù)來源于AI視頻剪輯技術(shù)創(chuàng)業(yè)公司Runway的Patrick Esser,以及慕尼黑大學(xué)機器視覺學(xué)習(xí)組的Robin Romabach。該項目的技術(shù)基礎(chǔ)主要來自于這兩位開發(fā)者之前在計算機視覺大會CVPR22上合作發(fā)表的潛擴散模型(Latent Diffusion Model)研究。
相比較于DALL-E等大模型,Stable Diffusion讓用戶使用消費級的顯卡便能夠迅速實現(xiàn)文生圖。Stable Diffusion完全免費開源,所有代碼均在GitHub上公開,任何人都可以拷貝使用。
Stable Diffusion模型第一個版本訓(xùn)練耗資60萬美元,而提供資金支持正是Stability AI。該公司成立于2020年,最初資金都來自創(chuàng)始人兼CEO Emad Mostaque。