5分钟阅读
OpenAI发布Sora 2:视频生成模型新高峰?文末附上邀请码

前言
为了庆祝国庆,最近AI圈又又又精彩呈现,各种模型又刷屏了!前有DeepSeek V3.2、GLM-4.6、Claude 4.5。而就在昨天,OpenAI放出了Sora2,比起当前最强的闭源模型veo3,从效果上看更上一筹!我们赶紧看看~👀
官方核心介绍:Sora 2 正式登场
OpenAI于今日推出旗舰级视频与音频生成模型Sora 2。相较于前代系统,这款最新模型在物理准确性、真实感与可控性上实现全面升级,同时新增同步对话与音效生成功能,并可通过全新Sora应用体验创作。
2024年2月发布的初代Sora模型,在视频生成领域相当于“GPT-1时刻”——它首次让视频生成技术展现出实用潜力,物体恒存性等基础物理规律通过扩大预训练算力得以初步实现。此后,Sora团队始终聚焦于“提升模型世界模拟能力”,因为这类系统是训练AI深度理解物理世界的关键支撑。
而视频数据的大规模预训练与后训练技术,目前仍处于发展初期(远落后于语言模型),Sora 2的推出则标志着这一领域的重大突破——OpenAI将其定义为视频生成的“GPT-3.5时刻”。
Sora 2的核心能力突破:从“生成视频”到“模拟世界”
前代视频模型常存在“过度优化”问题:为贴合文本提示,可能出现物体形态突变、物理规律失效的情况(例如篮球未投中却“瞬移”进篮筐)。而Sora 2能精准模拟物理动态,甚至可生成前代模型难以实现的复杂场景:
- 奥运会体操全套动作
- 桨板上的后空翻(精准还原浮力与刚体动力学)
- 猫咪紧抓物体完成三周半跳
更重要的是,Sora 2能模拟“失败场景”——如篮球未投中时会从篮板反弹。这种对“非理想结果”的建模能力,是世界模拟器的核心价值:不仅要生成“成功”,更要符合真实世界的物理逻辑。
此外,Sora 2在可控性上实现飞跃:
- 可遵循跨多镜头的复杂指令,同时精准保持世界状态一致性
- 擅长真实风格、电影级质感与动漫风格内容生成
- 作为通用音视频生成系统,能创建高真实度的背景音景、语音与音效
能力实例:从文本到视频的精准落地
以下为Sora 2的典型生成案例,包含原始提示词(Prompt)与模型实现效果说明:
实例1:跨场景的细节化生成
提示词:一只名为Sora的“宇航员金毛犬”,戴着小型喷气背包在以狗狗为主题的星际空间站周围悬浮。画面需有华丽的镜面光效,彗星划过天空,背景播放复古未来风格的太空主题音乐。狗狗的眼睛闪烁着光芒,起初它朝着空间站推进,空间站舱门打开让它进入;镜头切换至空间站内部,许多网球在失重环境下漂浮,狗狗的宇航头盔打开,它衔住了一颗网球。整体采用35mm胶片质感,狗狗毛发的复杂细节与纹理清晰可见,彗星的光芒在毛发上闪烁。
实例2:真实场景的动态还原
提示词:一群人打排球
(模型可还原排球运动中的真实物理轨迹,如球落地反弹、球员肢体碰撞的自然动态,无前代模型的“形态突变”问题)
实例3:风格化内容的表现力
提示词:日式动漫风格,白发主角觉醒潜藏力量。他的身体被蓝黑色火焰 aura(灵压)包裹,纹路逐渐蔓延至面部与全身,古老的强大力量最终觉醒……
实例4:特定场景的物理![[sora-sample-3.mp4]]与动作融合
提示词:武术家在齐腰深的锦鲤池中演练棍术
(模型精准还原池水的波动、棍体与水面的交互效果,以及武术家动作的连贯性)
实例5:真实元素的“植入”能力
Sora 2支持将真实世界元素融入生成内容:例如拍摄一段团队成员的视频,模型可将该成员“植入”任意Sora生成的场景中,并精准还原其外貌与声音。这一能力具有通用性,适用于人类、动物或物体。
实例6:专业级影视化生成(含完整技术参数)
核心目标与视觉效果
初读:巨龙掠过锯齿状冰塔,翼尖涡流卷起雪雾;再读:冰川破裂的冰层向钴蓝色峡湾坠落,琥珀色阳光勾勒出鳞片上的霜花;整体氛围需体现“掠食者的冷静/不费力的力量”。
格式与视觉风格
时长5.0秒;分辨率4K;快门角度180°;模拟大画幅数字传感器质感,微对比度锐利;极细颗粒感;雪地反光处克制的光晕效果;无胶片门晃动(gate weave)。
镜头与滤镜配置
主镜头:50mm球面镜头,搭载机头防抖航拍平台(平行追踪,带轻微向内弧线运动)。滤镜:Black Pro-Mist 1/8(柔化高光);圆形偏振镜(抑制雪地眩光,保留镜面反光)。
调色与色彩基调
高光:纯净冰白色,冷调过渡;中间调:钢蓝色冰川与淡青色空气;阴影:板岩灰/青绿色,保留冰裂缝细节;巨龙边缘添加暖琥珀色轮廓光以突出主体;霜花/鳞片上的镜面反光清晰锐利。
光影与氛围
傍晚低角度侧逆光;下降风卷起雪雾;稀薄的冻雾增强纵深感;巨龙飞行轨迹中偶尔出现冰尘爆发;巨龙发力时呼出微弱雾气(时长<1秒)。无配乐,仅保留环境音(增强沉浸感)。
场景与构图
高耸的冰塔群与刀锋状山脊;镜头与巨龙在中等高度同速追踪,冰川对角线延伸至峡湾;前景冰鳍近距离掠过,形成视差效果;画面中无人类建筑。
服饰/道具/载具说明
无(主体为生物)。表面细节:哑光质感的角状突起,半虹彩鳞片,鳞片前缘覆盖微霜。
音效设计
高空风切声,翼膜每一次下拍的雷鸣声,冰塔的晶体碰撞/碎裂声,远处冰川崩裂的轰鸣声;巨龙的短促呼气/低吼:“Rrhh—”(时长<1秒)。无配乐,仅保留真实环境音以营造“敬畏感”。
优化分镜表(1个镜头/5.0秒)
0.0–5.0 — “平行山脊穿梭”(50mm镜头,机头航拍,带轻微向内弧线与微推进)
镜头跟随巨龙穿越冰塔走廊;翼尖涡流将雪雾卷成丝带;远处一块崩裂的冰体坠落,扬起雪尘;镜头缓缓靠近——鳞片细节清晰,琥珀色轮廓光闪烁——随后巨龙向峡湾倾斜转弯,尾部摆动,在冰川上投下悠长阴影。
核心目的:通过一个连贯镜头展现“神话级尺度”与“触觉级真实感”——速度、质量与极致寒冷的融合。
镜头设计逻辑(为何如此呈现)
50mm焦段平衡生物存在感与场景尺度,避免“微型化”视觉错觉;平行追踪+向内弧线增强速度感与形态表现力;微推进动作与翼膜下拍最强时刻同步,突出力量感;偏振镜控制眩光同时保留雪地反光;逆光/轮廓光塑造剪影;近景冰鳍提供视差速度参照。
后期处理
极细颗粒感(约15%);雪地反光处光晕最小化;轻度胶片模拟,确保蓝色真实、黑色浓郁;多频段动态处理,保留翼膜拍击声同时不掩盖冰川崩裂声;海报帧:巨龙斜跨光照冰塔,雪雾飘动,峡湾泛着深蓝色光芒。
官方介绍视频
Sora 2的部署:以社交属性重构创作体验
OpenAI推出全新iOS社交应用“Sora”(由Sora 2驱动),核心功能包括:
- 内容创作与二次创作:用户可生成视频,也可对他人作品进行“再创作”
- 个性化内容流:自定义Sora动态 feed,发现感兴趣的视频
- “客串”(Cameos)功能:通过应用内一次简短的音视频录制(验证身份+捕捉形象),用户可将自己或朋友“植入”任意Sora生成场景,且还原度极高
此前该应用已在OpenAI内部测试,员工反馈“因这一功能结识了更多同事”。OpenAI认为,围绕“客串”功能构建的社交应用,是体验Sora 2魔力的最佳方式——它重新定义了人与人的沟通形式:从文字消息、表情包、语音笔记,进化到“沉浸式共现”。
负责任的发布:以用户福祉为核心原则
针对“信息过载、成瘾、孤立感、强化学习优化内容流”等常见平台问题,Sora应用从设计之初便加入多重保障:
1. 用户主导内容流
- 基于OpenAI现有大语言模型,开发“自然语言指令推荐算法”:用户可通过文字直接定义想看到的内容
- 定期询问用户“使用感受”,主动提供内容流调整选项
- 默认内容流优先展示“关注对象/互动对象的作品”,以及“可能激发用户创作灵感的视频”
- 核心目标:最大化创作行为,而非消费时长(不以“用户停留时间”为优化指标),详见《Sora内容流理念》[https://openai.com/index/sora-feed-philosophy/]
2. 强化社交连接属性
“客串”功能的核心是“与朋友共同使用”——测试反馈显示,这一功能是Sora应用的独特价值所在,它创造了全新的沟通方式。目前应用采用“邀请制”,确保用户可与朋友一同体验。在主流平台逐渐弱化“社交关系链”的趋势下,Sora希望通过“客串”强化社区连接。
3. 青少年保护机制
- 默认限制青少年每日在内容流中可查看的生成内容数量
- 收紧青少年“客串”功能的权限
- 除自动化安全系统外,扩充人工审核团队,快速处理霸凌等问题
- 支持通过ChatGPT设置“Sora家长控制”[https://openai.com/index/introducing-parental-controls/]:家长可调整“无限滚动限制”、关闭算法个性化、管理私信设置
4. 肖像权全周期控制
用户对自己的“客串形象”拥有完全控制权:
- 仅用户可决定谁能使用自己的“客串形象”
- 可随时撤销授权,或删除包含自己“客串形象”的视频
- 包含自己“客串形象”的视频(包括他人创建的草稿),用户可随时查看
5. 透明的商业模式
其他平台的许多问题源于“商业模式与用户福祉相悖”。OpenAI明确:
- 目前仅计划在“算力需求超过供给”时,提供“付费生成额外视频”的选项
- 未来若调整商业模式,将提前向用户公开说明,始终以“用户福祉”为首要目标
OpenAI表示,Sora 2开启了“共创式体验”的新纪元,有望成为更健康的娱乐与创作平台。
实际测试
我使用sora的app进行了浅浅的测试,效果还是可以的。生成了两个应景中秋的视频,感觉没有官方的好,估计是这类幻想题材缺乏训练数据?😂
Prompt: In the style of a blend of Chinese ink wash painting and soft realism, a serene night scene unfolds where the full moon rises gently from the calm sea—its silvery glow spilling across the water’s surface, painting long, rippling light trails that stretch toward the shore. The sky is a deep indigo, dotted with a handful of faint, twinkling stars that complement the moon’s brilliance without overshadowing it. Along the distant coast, a few traditional Chinese pavilions with curved eaves stand quietly, their wooden structures faintly illuminated by warm, amber lantern light that glows softly through paper windows. Near the water’s edge, a lone figure in a flowing, muted-blue hanfu sits on a smooth stone, hands resting lightly on their lap, gazing at the moon; their hair, tied loosely with a white ribbon, sways gently in the soft sea breeze. In another corner of the frame, across the vast expanse of the sea, a small fishing boat with a single dim lantern bobs on the waves, its silhouette tiny yet distinct against the moonlit water—echoing the "far ends of the earth" sentiment. The air feels calm and still, with only the faint sound of waves lapping at the shore and the distant rustle of bamboo leaves in the breeze implied. The color palette is soft and harmonious: deep blues and purples for the night sky and sea, silvery whites for the moon and its reflections, warm ambers for the lanterns, and muted earth tones for the pavilions and shore. The brushwork retains the ethereal lightness of ink wash painting, especially in the blending of sky and sea, while adding fine, realistic details—like the texture of the hanfu’s fabric, the glint of moonlight on the water’s ripples, and the subtle expression of tranquility on the figure’s face. The overall mood is peaceful, nostalgic, and tender, capturing the quiet connection between all beings under the same moon, as conveyed by the poetic line "The moon rises above the sea, and all corners of the world share this moment."
⬇️ 来段中英文混合的
The fairy Chang'e, clad in a flowing gown adorned with starlit patterns that shimmer like scattered silver, holds a sprig of osmanthus as she glides toward the full moon suspended in the deep void of space.皎洁的月华如液态银般漫过她的衣袖,在发间凝结成细碎的光晕,身后是缀满星辰的墨蓝色天幕,几颗流星拖着淡金色尾迹划破寂静。 Her footsteps stir ripples of iridescent light, as if she walks upon invisible clouds, while occasional petals drifting from her osmanthus sprig spiral slowly through the void, catching moonlight to become flickering points of brilliance. The camera advances steadily with her movement, revealing intricate details: the镂空 carvings on the jade hairpin at her temple, the embroidered osmanthus motifs on her skirt shifting subtly in the light. As she draws near the lunar surface, the shadows of craters spread like ancient etchings across the moon's face, and the silhouette of a cassia tree flickers faintly within the lunar glow. With a gentle wave of her hand, an arc of soft light emanates from her fingertips, and vague palace outlines materialize on the moon's surface—gates slowly opening amid the radiance, accompanied by the ethereal chime of jade bells and the fragrance of osmanthus. The entire scene carries the textured quality of an ancient scroll painting, with the silk sheen of her garments creating delicate contrast against the moon's cool, crisp radiance. Every strand of hair moves with a weightless rhythm, as if dancing to an unheard celestial melody.
Sora 2的可用性与未来规划
当前可用渠道
- iOS应用:可在App Store下载(链接:https://apps.apple.com/app/id6744034028)
- 初期覆盖范围:今日起在美国、加拿大启动首批推送,后续将逐步扩展至更多国家
- 访问方式:
- 下载应用后可注册,开通时会收到推送通知
- 获得邀请后,也可通过官网(sora. com)使用Sora 2
- 初期权益:免费使用,提供充足的生成额度(受算力限制可能调整)
- Pro用户专属:ChatGPT Pro用户可在sora. com使用实验性的“高画质Sora 2 Pro模型”,后续将同步至Sora应用
后续规划
- 计划推出Sora 2 API
- 初代模型Sora 1 Turbo将继续可用,用户过往创作内容将保留在sora. com账户库中
使用说明:目前的限制与操作指引
当前Sora应用仅支持iOS系统,下载链接为美区App Store(https://apps.apple.com/us/app/sora-by-openai/id6744034028),且需**邀请码**才能激活使用。
邀请码
文章先放出一个激活码,先到先得。
8YDNA4
更多 AI 前沿技术与设计灵感,欢迎关注「设计小站」公众号(ID:sjxz00),一起探索科技与设计的融合创新。