蜜桃av色欲a片精品一区,麻豆aⅴ精品无码一区二区,亚洲人成网站在线播放影院在线,亚洲 素人 字幕 在线 最新

微立頂科技

新聞資訊

創(chuàng)新 服務(wù) 價(jià)值

  Sora模型成本評(píng)估(基于GPT僅供參考)

發(fā)布日期:2024/2/21 15:34:08      瀏覽量:

Sora模型成本評(píng)估(基于GPT僅供參考)


省流結(jié)論:

預(yù)計(jì)生成一段60秒的Sora視頻的成本介于十幾至數(shù)十美元之間。

成本預(yù)估邏輯詳述:

一段60秒、每秒30幀、分辨率為1920x1280的視頻,根據(jù)計(jì)算需求總計(jì)需要4423680000個(gè)tokens,這遠(yuǎn)超過(guò)當(dāng)前大型模型能夠處理的數(shù)據(jù)量。為了解決這一挑戰(zhàn),Sora采用了一個(gè)編碼器(Encoder)將視頻內(nèi)容先壓縮到隱空間,然后以小塊(patch)的形式輸入到擴(kuò)散模型中。盡管采取了這種策略,一個(gè)大小為60*80的單個(gè)patch仍需要921600個(gè)tokens來(lái)完整表示一個(gè)視頻,表明訓(xùn)練Sora模型需要巨大的計(jì)算資源。

以當(dāng)前GPT-4的成本為例,每1000個(gè)tokens的成本為0.06美元,因此處理921600個(gè)tokens的成本大約為55美元。

關(guān)鍵參數(shù):

視頻生成的關(guān)鍵在于patch的大小。這涉及兩個(gè)轉(zhuǎn)換過(guò)程:視頻到patch和patch到token。如果patch到token的轉(zhuǎn)換比例是1:1,那么關(guān)鍵就在于視頻到patch的轉(zhuǎn)換效率。視頻到patch的轉(zhuǎn)換分為兩個(gè)步驟:首先是視頻到隱空間,然后是隱空間到patch。這可能是Sora模型核心技術(shù)之一。特別是視頻到隱空間的轉(zhuǎn)換步驟,OpenAI設(shè)計(jì)的tokenizer與傳統(tǒng)的每幀壓縮方法(如VAE)不同,它直接將視頻序列的幀壓縮到隱空間。文獻(xiàn)中提到的patch大小為60*80,但具體計(jì)算方法和依據(jù)不明。進(jìn)一步分析,patch作為一種"高度可擴(kuò)展且有效的"表示方法,可能意味著它實(shí)現(xiàn)了高效的壓縮率,這對(duì)于后續(xù)模型處理來(lái)說(shuō)至關(guān)重要,以便更有效地處理大規(guī)模數(shù)據(jù)。

其他考量:

1、從資源角度考慮,Sora項(xiàng)目的主要研究人員是剛完成博士學(xué)位的研究者,OpenAI通常會(huì)為此類團(tuán)隊(duì)提供一定資源。盡管初始模型的參數(shù)量可能不大,但模型的設(shè)計(jì)允許未來(lái)的擴(kuò)展。此外,考慮到即使在高效的壓縮下,視頻數(shù)據(jù)轉(zhuǎn)換成tokens的數(shù)量依然龐大,這從根本上影響了生成視頻的成本。因此,對(duì)于一段60秒的Sora視頻,成本估算在十幾至數(shù)十美元之間是合理的,考慮到所需的計(jì)算資源。

2、對(duì)比pika的視頻,從長(zhǎng)度到質(zhì)量,對(duì)比價(jià)格,十幾美元也更合理。

3、別忘了玩MJ和SD的你還需要抽卡,10個(gè)視頻能夠有一個(gè)視頻滿意就不錯(cuò)了。成本再乘以10倍。



  業(yè)務(wù)實(shí)施流程

需求調(diào)研 →

團(tuán)隊(duì)組建和動(dòng)員 →

數(shù)據(jù)初始化 →

調(diào)試完善 →

解決方案和選型 →

硬件網(wǎng)絡(luò)部署 →

系統(tǒng)部署試運(yùn)行 →

系統(tǒng)正式上線 →

合作協(xié)議

系統(tǒng)開(kāi)發(fā)/整合

制作文檔和員工培訓(xùn)

售后服務(wù)

馬上咨詢: 如果您有業(yè)務(wù)方面的問(wèn)題或者需求,歡迎您咨詢!我們帶來(lái)的不僅僅是技術(shù),還有行業(yè)經(jīng)驗(yàn)積累。
QQ: 39764417/308460098     Phone: 13 9800 1 9844 / 135 6887 9550     聯(lián)系人:石先生/雷先生