谷歌宣布可訓(xùn)練深度神經(jīng)網(wǎng)絡(luò)PHORHUM 可實現(xiàn)2D照片轉(zhuǎn)為3D模型
發(fā)布日期:2022/5/16 10:46:06 瀏覽量:
近日,谷歌宣布了一種端到端的可訓(xùn)練深度神經(jīng)網(wǎng)絡(luò)PHORHUM,該方案特點是基于單張2D RGB圖像,通過像素對齊、表面著色、場景照明等步驟實現(xiàn)逼真的3D建模。在準(zhǔn)確再現(xiàn)可見范圍的同時,圖像中不可見的地方(非可視區(qū)域)也可能再現(xiàn)。
關(guān)于PHORHUM,谷歌的論文指出:“我們的模型構(gòu)建可以通過虛擬試衣、照片的沉浸式可視化,改進(jìn)通信、用于人機(jī)交互或游戲的個人AR和VR等,將成為變革性的、身臨其境的3D應(yīng)用程序。”
據(jù)了解,PHORHUM采用像素對齊方法估計了詳細(xì)的3D幾何形狀,并且首次估計了未著色的表面顏色和場景照明。觀察到僅3D監(jiān)督不足以進(jìn)行高保真顏色重建,引入了基于補丁的渲染損失,可以對人類的可見部分進(jìn)行可靠的顏色重建,并對不可見部分進(jìn)行詳細(xì)和合理的顏色估計。
此外,PHORHUM專門解決了先前工作在表示幾何、反照率和照明效果方面的方法學(xué)和實際限制,在一個端到端模型中,因素可以被有效地解開。在廣泛的實驗中,證明了其多功能性和穩(wěn)健性。
其實谷歌雖然總是喜歡拿開發(fā)者當(dāng)小白鼠,但是前沿技術(shù)的探索也還是在推進(jìn)。未來的信息世界將全面3D化、擬真化,二次元和三次元的次元壁正在被打破。
馬上咨詢: 如果您有業(yè)務(wù)方面的問題或者需求,歡迎您咨詢!我們帶來的不僅僅是技術(shù),還有行業(yè)經(jīng)驗積累。
QQ: 39764417/308460098 Phone: 13 9800 1 9844 / 135 6887 9550 聯(lián)系人:石先生/雷先生