400-638-8808
|
微信公眾號




穩(wěn)定可靠 永不間斷

海外收發(fā) 暢通無阻

協(xié)同辦公 資源管理

超大郵件 超級功能

智能反垃圾郵件技術
易管理 免維護

最近OpenAI 就放出一個名為Sora 的文字到視頻 AI 模型,
Sora 能夠根據(jù)文本提示生成逼真的視頻。該模型能創(chuàng)造長達一分鐘的視頻,并且視頻分辨率高達 1080p。它在處理反射和陰影方面表現(xiàn)良好。
目前它還沒有向普通用戶開放,因為 OpenAI 正在與專家合作進行紅隊測試,以評估該模型可能存在的偏見、風險和危害。
本文分為兩部分,第一是 Sora 常識、體驗網(wǎng)站、效果展示,第二是如何注冊 Sora
一、常識
1.OpenAI 是一家什么公司?
答:OpenAI 是 AI 界的頂流公司,專注于開發(fā)大型語言模型
大型語言模型的江湖,有五大門派:
"南帝"(谷歌 Gemini)、"北丐"(亞馬遜 Claude),"東邪"(馬斯克 Grok)、"西毒"(Meta Llama)、"中神通" OpenAI 的 ChatGPT!
OpenAI 前身是一家非營利性的人工智能研究實驗室,由馬斯克、阿爾特曼發(fā)起設立。這家企業(yè)故事太多了,回頭給大家寫一個 OpenAI 大事記。
OpenAI 主要產品包括 GPT 系列,文生圖 DALL-E3
總之,縱觀全球 AI 界,OpenAI 算法第一、算力第一、產品口碑第一
2.Sora 是什么?
答:Sora 是 OpenAI 于 2024 年 2 月 16 日發(fā)布的一個 “文生視頻”AI 模型,它可以根據(jù)文本指令創(chuàng)建現(xiàn)實且富有想象力的場景視頻。
簡單講,想象一下,如果你能告訴一臺特別聰明的電腦“給我講個超級英雄的故事”,然后電腦就能制作出一整個視頻來,里面有超級英雄飛來飛去,救人的場景,甚至還有特效和背景音樂。這就是 OpenAI 的 SORA 能做的事情。
Sora 是一個很先進的工具,你只要給它一些文字,比如描述一下你想看的視頻內容,它就能根據(jù)你說的話創(chuàng)造出一個視頻。
上面的動圖是 Sora 主頁抓圖,請注意下面的那行小字“本頁所有視頻均由 Sora 直接生成,未經修改”
3.什么是“文生視頻”?
答:從文本創(chuàng)造視頻,簡稱文生視頻。
就像是有個小電影工作室,但是全部都是由電腦自動完成的,不需要真人演員或者真正的攝影機。
Sora 看過了很多視頻、圖片素材,可以根據(jù)用戶的提示詞,產生新的視頻
案例:寄居蟹使用白熾燈泡作為外殼的夜間鏡頭
4.有哪些文生視頻軟件?
答:在 Sora 之前,主流的有 Pika、Runway、moonvalley、DomoAI、leonard 等
相關評測見《文生視頻軟件合集》
用戶不需要了解具體的技術,你使用冰箱,你需要研究制冷技術么?
Sora 與其他文生視頻的優(yōu)勢在于,算法更優(yōu)!算力更強!其他視頻軟件只能生成幾秒,最多十秒的視頻。Sora 1次可以60秒
OpenAI 能夠在以前不可能的更廣泛的視覺數(shù)據(jù)上訓練擴散 Transformer ,包括不同的持續(xù)時間、分辨率和長寬比。更忠實地遵循用戶在生成的視頻中的文本指令
簡單說,其他軟件是圖片推測視頻,而 Sora 是理解后自動類似 3D 建模生成視頻!
不怕不識貨,就怕貨比貨啊
5.Sora 的定位是是"世界模擬器"
答:將 Sora 成為文生視頻模型,是小看了 OpenAI 的野心
從流出的視頻來看,Sora 有能力在一定程度上模擬現(xiàn)實世界中的人動物和環(huán)境。
不需要對三維空間,物體有任何特定的預設,純粹是 scale 之后的自然現(xiàn)象。
我甚至覺得 sora 有一定的智力,它可以根據(jù)場景自己推斷出周邊的場景。
Sora 的先進性在于它可以根據(jù)已有的知識推斷、生成新的東西,這是自我意識的雛形。
比如說一個你從來沒見過摩拜單車撞擊過坦克,但是你根據(jù)你的經驗知道肯定是以卵擊石,腦海里就會自動浮現(xiàn)出來慘不忍睹的畫面,
sora 也具備和你同樣的推斷能力。
Sora 它展現(xiàn)的不僅僅是一個視頻制作的能力,它展現(xiàn)的是大模型對真實世界有了理解和模擬之后,會帶來新的成果和突破
比如下面的視頻,僅一句話,AI 可以自己切換鏡頭,實現(xiàn)轉場
6.誰可以使用 Sora
答:目前僅“紅隊(red team)”可以使用 Sora
紅隊由最早期客戶,影視專業(yè)人士構成。
他們正在全面評測 Sora,確保它做出的視頻既酷炫又安全,不會有任何不好的內容
目前,網(wǎng)上流出的各種 Sora 視頻,只有兩個來源,官方 demo 和紅隊評測結果。
7.Sora 生成視頻效果
答:Sora 不但可以模擬真實的視頻,還能生成特效視頻,還可以在一個視頻中展現(xiàn)不同的鏡頭
案例1:輸入提示語“螞蟻在蟻巢內部移動的 POV 鏡頭”
你會得到一個動物世界的特效鏡頭
案例2:“一片葉子的微距照片,顯示微小的列車在葉脈中移動”
Sora 會生成以下視頻給你:
8.使用 Sora 需要編程技巧么?
答:不需要,直接用自然語言提示。
所謂自然語言就是人類的語言,俗稱“說人話”,看上面的提示詞。
9.Sora 支持中文么?
答:從 OpenAI 的風格來看,應該支持直接輸入中文提示詞
10.預計 Sora 什么時候正式發(fā)布?
答:預計 3 月底之前!
按照 OpenAI 發(fā)布 DELL-E(繪圖 AI)的路徑來看
應該分為兩個使用路徑,第一是獨立可用的版本、二是與 GPT4 或 GPT5 結合的版本!
11.使用 Sora 的途徑 ?
答:兩種方式,官方網(wǎng)頁版、API 版
官方網(wǎng)頁版直接在 OpenAI 的網(wǎng)站上生成,不需要用戶安裝到本機
API 版,是通過第三方調用官方的服務器資源
后期可能會有 APP 版
12.使用 Sora 需要支付費用么?
答:需要!目前 OpenAI PLUS 會員是 20 美元/月
Sora 開通后,應該 PLUS 會員可以使用一定限制(如時長)的 Sora
API 則是按流量,單獨計費!
13.現(xiàn)在可以使用 Sora 嗎?
答:目前少量用戶可用,未對大眾開放!
ChatGPT Plus 會員應該是下一批使用的用戶!
14.Sora 和 ChatGPT 如何結合?
答:結合有兩種方式
第一是界面結合,類似現(xiàn)在的 DALL-E
第二是功能結合,比如你才 Chatgpt 對話完成后,直接召喚 sara,說“根據(jù) XXX,生成一段類似的視頻”
15.不滿意生成的視頻,如何讓 Sora 修改?
答:直接輸入新的提示,舉例如下:
Sora 不僅可以從文本生成 AI 視頻,它還可以改變上傳視頻的風格和環(huán)境。
比如上傳一段賽車視頻后,只修改了提示詞,就生成了 12 個不同風格和環(huán)境的視頻。
讓它潛入水下
上天入地都可以!作者一口氣,同一輛車,弄了12個風格。
16.Sora用于影視行業(yè)版權算誰的
答:制作方的。根據(jù)現(xiàn)在的案例來看,只要不是赤裸裸的全盤 copy,法律上是認可的,尤其是日本等國家,鼓勵 AI 發(fā)展
我查了一下,我發(fā)現(xiàn)各個國家的法律尺度不一樣,大部分國家的法律是只要你不完全抄襲,可以借鑒風格,對原內容重新整理組合,這個是允許的,比如日本。
17、Sora 的底層技術?
答:Sora 的核心技術源自 Diffusion Transformers (DiT)模型
這是一個 2022 年 12 月由伯克利和紐約大學兩位研究人員提出的模型,目前這兩位一個在 Meta AI,一個在 OpenAI
都是基于谷歌的開放論文
谷歌自己的論文,但實踐下來,OpenAI 最佳,谷歌人才濟濟但是有大公司病啊
業(yè)內梗,OpenAI 摸著谷歌過河,大家摸著 OpenAI 過河
18.我在國內如何使用 Sora?
答:等 API 開發(fā)版,應該可以直接用
可以關注本公眾號,有資源,第一時間推送!
19.Sora 有 APP 嗎?
答:早期不會有,預計后期會集成到 GPT APP
20.Sora 只能生成 視頻嗎?
答:還可以生成圖片
Sora 定位在真實世界的模擬器,做視頻只是順手為之
就像歌者文明,做個視頻只是“二向箔”常規(guī)武器,GPT5 才是降維大殺器
21.如何讓 Sora 生成高質量的視頻?
答:高質量的提示詞,
這需要第一美感、第二想象力!第三,攝影、攝像經驗
案例:有人看到一只白色和橙色的虎斑貓在大雨中飛快地穿過后街小巷,尋找庇護所……”(查德·尼爾森提示)
22.如何讓 Sora 有聲音?
答:目前官方沒有配音,估計快了
另外,ElevenLabs 即將推出半自動 AI 配音測試,預計是 Prompt 形式
現(xiàn)在測試名單需要申請 https://form.typeform.com/to/gg0xzZW4
23.Sora 會讓影視人員實業(yè)么?
答:不會。Sora 會成為影視人員的工具。
Sora 能夠“無縫”混合兩個視頻,視頻 1 是一個 Sora 生成我的世界(Minecraft)視頻,然后將它跟一個騎摩托車的視頻混合起來就變成了第二個視頻。
可以預見未來這個功能擁有巨大的創(chuàng)造潛力。
24.為什么我要使用 Sora?
答:縱觀人類歷史,每一次能源,生產工具的提升,都會帶來社會的變革。
20 多年前,PC 普及,互聯(lián)網(wǎng)興起,人人都在說信息化;10 多年前,手機興起,處處討論移動辦公。
但是,現(xiàn)在的人已經不提信息化,不強調移動辦公了。因為 IT、移動辦公已經成為基礎資源,類似水一樣,無處不在。AI 未來也是這樣。
目前 AI 的應用,只是一個開始。不僅國外,國內的各個 AI 產品也在日新月異。
工具都大同小異,掌握了 ChatGPT,使用其他 AI,輕松上手。越早掌握,越早上車。
25.Sora 會取代哪些崗位?
答:故步自封,工作場景比較固定,與視頻有關的崗位
26.哪些人適合學些 Sora
答:很多人以為是程序員,其實不是。傳統(tǒng)程序員思維有了定式。
影視專業(yè),文學+IT青年 很適合!
27.教育應該如何發(fā)展?
答:我建議國內影視專業(yè),盡快開通相關選修課程。提前為大家做好置業(yè)規(guī)劃和知識儲備
再來看一個案例,Sora 可以同時并排生成多個視頻。
這是 Sora 的單個視頻樣本。我們沒有把這一切拼湊在一起;空決定要同時擁有五個不同的視點!
二、Sora 體驗網(wǎng)址和注冊
機會是留給有準備的人的,雖然 Sora 還沒有正式發(fā)布,但我們完全可以做好前期準備,進入教父的“睡床墊”戰(zhàn)斗狀態(tài),迎接它發(fā)布的那一天
1.Sora 資源
官方網(wǎng)址:openai.com/sora
官網(wǎng)技術報告:
原文:https://openai.com/research/video-generation-models-as-world-simulators
譯文:https://baoyu.io/translations/openai/video-generation-models-as-world-simulators
2、如何注冊 Sora
答:按 OpenAI 慣例
Sora 應該優(yōu)先提供給 Plus 用戶使用
為了優(yōu)先用上 Sora,你要先注冊為 GPT,然后升級為 PLUS 會員,坐等 Sora 發(fā)布
按照慣例,Sora 發(fā)布后,在 ChatGPT 的界面上,就會多一個子欄目
3、如何注冊 Sora 的 API
暫時未放出 API 接口,但是 OpenAI 的所有 API 都是一個賬號
天下數(shù)據(jù)手機站 關于天下數(shù)據(jù) 聯(lián)系我們 誠聘英才 付款方式 幫助中心 網(wǎng)站備案 解決方案 域名注冊 網(wǎng)站地圖
天下數(shù)據(jù)18年專注海外香港服務器、美國服務器、海外云主機、海外vps主機租用托管以及服務器解決方案-做天下最好的IDC服務商
《中華人民共和國增值電信業(yè)務經營許可證》 ISP證:粵ICP備07026347號
朗信天下發(fā)展有限公司(控股)深圳市朗玥科技有限公司(運營)聯(lián)合版權
深圳總部:中國.深圳市南山區(qū)深圳國際創(chuàng)新谷6棟B座10層 香港總部:香港上環(huán)蘇杭街49-51號建安商業(yè)大廈7樓
7×24小時服務熱線:4006388808香港服務電話:+852 67031102
本網(wǎng)站的域名注冊業(yè)務代理北京新網(wǎng)數(shù)碼信息技術有限公司的產品