首页 > 传媒 > 关键词  > 正文

傅盛:16条Sora金句 - 文生视频的技术底层并没有重大突破

2024-02-22 14:35 · 稿源: 站长之家用户

2月20日(昨晚)8点,澎湃新闻龙年首场谈Sora的直播圆满结束,主持人澎湃新闻记者王瑞,傅盛和另两位嘉宾:复旦大学教授、上海市数据科学重点实验室主任肖仰华,全国政协委员、民进上海市委副主委、上海科技馆馆长倪闽景,一起展开深度探讨,直播共吸引126万人次观看。

“特殊观众”GPT帮助傅盛记录了访谈中的金句:

1.人工智能和人类是互补的,拥抱变化的同时保持自身特质,学习并利用人工智能的工具,同时培养好奇心、探险精神和独特思考能力。

2.AI正在改变人们的工作方式和技能需求,过去的经验和能力在AI时代可能不再重要,需要培养想象力、对世界的认知和好奇心。

3.教育领域需要率先变革,注重培养适应AI时代的技能和思维方式。

4.AI是一个平权工具,让更多原本远离技术的人能够利用技术成果。即使没有相关经验的人也可以利用AI工具创作出优秀的视频作品。预测未来会出现成本低、功能强大的AI工具,AI时代将带来机会的百花齐放,让用户有更多选择,机会非常广阔。

5.文生图和文生视频引擎,目前对世界的理解还停留在初级水平,可能只是通过生成符合人类感官的图像来表现,而不是真正的理解。

6.OpenAl作为一家科技企业,在市场宣传方面的能力也是超知名的,他们放出的每个视频几乎都是行业内的难点和热点。

7.OpenAl的技术基于大规模的语言模型,而文生视频也借助这种技术实现了重大突破。从底层技术来看,两者并没有本质的区别。

8.OpenAl靠技术信仰做到全力以赴,投入大量资源,并不计成本地推动技术发展。这种信仰和努力造就了产品级的突破。

9.文生视频,技术底层并没有发生重大突破,但通过巨大的算力和尝试成本,取得了显著的进展。

10.与传统的建模方法相比,文生视频的成本会大幅降低。即使目前的 Demo 成本还相对较高,但随着时间的推移,成本将快速下降。

11.大语言模型通过对语言的理解,为文生视频提供了能力和可能性。

12.英伟达的ChatwithRTX我当天就下载和试用了,雷声大雨点小,和实际的体验有差距。但我看到Sora放出的Demo视频的效果,还是非常震惊的。

13.Sora这次的重大突破并不代表技术上的重大升级,你更可以理解成是一个暴力美学。

14.AI既然是一场底层革命,社会的每一个层面,包括我们公司,如果不能成为AI原住民,就会被淘汰。

15.AI技术的进步是不以哪个人的意志为转移的,按暂停键是按不住了,只能是跟着技术的变化去适应技术。

16.我一直有个观点,就是如果没有大语言模型作为基座,今天视频领域不会产生这么大的突破。


推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 重大突破!我国鄂尔多斯盆地发现特大型铀矿

    据报道,我国在鄂尔多斯盆地泾川地区取得了铀矿勘探的重大成就,成功探明一座特大型铀矿床。这一发现不仅预示着我国铀资源储量的显著提升极大地增强了我国铀资源供应的安全保障能力。这些地质特征为我国铀矿勘探提供了丰富的潜在资源。

  • 重大突破!微软发布“自我进化”,帮小模型超OpenAI-o1

    微软亚洲研究院发布了一种创新算法——rStar-Math。rStar-Math通过代码增强CoT、蒙特卡洛树搜索等,可以帮助小参数模型在不依赖老师模型蒸馏的情况下,实现多轮自我思维深度进化,极大增强模型的数学推理能力。代码地址:https://github.com/microsoft/rStar论文地址:https://arxiv.org/abs/2501.04519从昨天微软开源的最强小模型Phi-4,以及最新推出创新算法rStar-Math来看,未来小模型的性能和效�

  • 底层技术新突破!万象分区、绚彩XDR才是 Mini LED电视的正确答案!

    心心念的新房终于要装修完毕啦,想着新年就要入住了我心里那个激动啊!但客厅电视的选择却让我犯了难,我平时周末就喜欢赖在家追剧看电影,加上客厅留的尺寸比较大,因此,MiniLED大屏电视也成了我的首选,但是市面上的MiniLED电视品牌、型号、功能多得让人眼花缭乱,选起来真是让人头疼。如果你不想浪费时间,可以和我一样直接入手C11K。

  • 明年Galaxy S26影像有望大突破!曝三星正开发5亿像素感光元件

    根据爆料,三星正为苹果开发一款三层堆叠式感光元件,这一技术相比SonyExmorRS系列更为先进,有望进入iPhone相机供应链。同时三星也在为未来的Galaxy旗舰打造一款5亿像素的相机感光元件,同样采用三层堆叠式设计。目前尚不清楚三星会在何时推出传言的新型5亿像素相机感光元件,但三星用户或许能期待出现在明年的S26Ultra。

  • Sora带飞剪映?

    年初Sora内测版出现之际,外界一度担心视频生成工具的普及,可能会杀死剪映这类视频剪辑工具的发展空间。10个月过去,事实证明,剪映们不仅没有被Sora杀死,反还愈发得到了公司内部的重视。对大模型的大举投入,成了验证字节大力出奇迹方法论的一次新考验。

  • RTX 5090公版太奢华了!16+6+7相供电、14PCB

    RTX5090显卡的PCB电路板、GPU核心先后曝光,现在又得到了更多细节,尤其是供电、功耗等。RTX5090公版将会配备1667相供电电路,一共多达29相,PCB电路板也将有多达14层。但由于1月底是中国春节,涉及工厂放假,仍然存在很大变数。

  • 突破算力限制!Meta开源“记忆”,重塑Transformer架构大模型

    今天凌晨3点,全球社交巨头Meta分享了一个创新研究——Memorylayers。Transformer架构的预训练大模型在存储、查询数据时,随着参数的变大对算力的需求呈指数级增长。这样的设计既简化了维护流程,又提高了系统的灵活性和适应性。

  • 力压Sora!谷歌第二代AI视频生成模型Veo 2发布:分辨率可达4K

    据报道,谷歌发布了最新的AI视频生成模型Veo2。Veo2模型能够生成最高4K分辨率、时长达到2分钟的视频片段,相较于OpenAI的Sora模型,分辨率提升了4倍,视频时长增加了6倍。除了Veo2之外,Google这波还推出了改进版的AI绘图Imagen3模型,生图细节更好、光照更丰富、干扰更少。

  • 谷歌发力世界模型:从OpenAI挖来Sora核心负责人!

    谷歌正在组建一个新的团队,专注于开发可以模拟物理世界的人工智能模型。该团队的负责人是蒂姆布鲁克斯,他此前是OpenAI视频生成器Sora的联合负责人之一,后于2024年10月离开OpenAI,跳槽至谷歌的人工智能研究实验室谷歌DeepMind。Gemini是谷歌的旗舰AI模型系列,用于图像分析和文本生成等任务;Veo是谷歌的视频生成模型;Genie则是谷歌的基础世界模型,它支持用户通过文本、合成图像、照片甚至草图等方式,创造出具有高度可玩性的交互式环境和可控的虚拟世界。

  • 你还说这是AI?我们体验了一波生成亚洲人最好看的文生图大模型

    打开社交媒体平台,很多人正在热烈讨论一个叫做「AI模特」的玩法。点开几个Demo,确实惊艳。在即将到来的2025年,你对国产AI以及可灵AI有怎样的期许呢?欢迎在评论区讨论。