首页 > 业界 > 关键词  > Sora最新资讯  > 正文

强大到不敢给普通人用!史诗级大模型 Sora 如何让众行业一夜变天?

2024-05-01 11:16 · 稿源: InfoQ公众号

1视频生成模型“新王登基”,Sora 何以成为全球焦点?2023年以来,多模态视频生成技术取得了显著的进展和突破,从 Runway 到 Pika 再到年末的 VideoPoet,视频生成模型进入到加速阶段。2024年2月,OpenAI 旗下视频生成模型 Sora 正式对外发布。Sora 一名源于日文“空”(そら sora

......

本文由站长之家合作伙伴自媒体作者“InfoQ公众号”授权发布于站长之家平台,本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间,为了保证文章信息的及时性,内容观点的准确性,平台将不提供完全的内容展现,本页面内容仅为平台搜索索引使用。需阅读完整内容的用户,请查看原文,获取内容详情。

举报

  • 相关推荐
  • 红米年度旗舰!博主称REDMI K90 Pro影像史诗级加强

    博主数码闲聊站称,REDMI K90 Pro影像迎来史诗级加强,很给面。 根据爆料的消息,REDMI K90 Pro虽然没有徕卡联名,但是依然给到了旗舰级影像系统,同时配备了一颗潜望长焦,这是REDMI K系列首款潜望长焦旗舰。 相比于直立长焦,潜望式长焦结构更复杂也更先进,它运用了光学反射的原理,通过内部的反光镜或棱镜将光路弯折,使得光线可以在手机机身内部形成更长的焦距。 �

  • iPhone 17 Pro放弃钛金属回归全铝机身 李楠:已经是史诗级升级了

    iPhone17Pro模具在社交平台上被曝光,和之前爆料的渲染图一致,iPhone17Pro采用横向矩阵相机DECO,闪光灯和LIDAR激光雷达扫描仪位于矩阵相机右侧。 值得一提的是,iPhone17Pro全面放弃钛金属,采用全铝合金机身,中框和后盖为一体化设计,不过苹果Logo区域为玻璃材质,用来支持无线充电。怒喵科技创始人李楠指出,iPhone17Pro系列放弃沿用很久的三明治结构,回归全铝合金Unibody,�

  • 广东夫妇开团播:31万人同时在线、新主播一夜涨粉6万......

    ​继爱豆、主持人等纷纷转型团播之后,头部带货主播也下场了。 7月3日晚,广东夫妇与无忧传媒旗下的两个男团直播间进行了梦幻联动,带来了一场近4个小时的才艺表演直播。数据显示,当晚的直播间在线人数峰值达到31.1万,观看人次达2429万。 团播是近两年最为火热的娱乐直播赛道。如今,无忧传媒让旗下头部主播与自家男团进行联动,无疑把团播赛道的竞争抬上了新�

  • “晓妙”产业大模型——AI驱动的产业变革

    7月4日,安徽数智建材研究院在长城工程科技会议上发布"晓秒"产业大模型。该模型由傲林科技投资支持,采用"1+1+N"架构,融合数据、机理和业务模型,实现生产运营全流程实时闭环优化。中国建材集团董事长周育先表示,该模型已在水泥板块试点应用,吨水泥成本降低1%以上,能耗电耗下降2%以上。会议指出,AI落地制造业需突破三大关键:建立数字化体系、夯实数据基础、实现工艺与数据融合。未来将拓展至新能源、钢铁等十余个行业,推动产业智能化升级。

  • 马斯克旗xAI推出Grok 4 宣称世界上最强大的AI模型

    据媒体报道,马斯克旗下人工智能公司xAI正式推出新一代旗舰模型Grok 4,并宣称其为世界上最强大的AI模型”。 该模型基于xAI的Colossus超级计算机训练,核心优势在于其深度推理能力,承诺带来显著增强的逻辑推理和文本生成水平。 此外,Grok 4还具备自然的人类对话风格、实时网络访问能力,以及对互联网文化(包括梗、俚语和幽默)的高精度理解。

  • 小鹏G7 Ultra行业首发本地端VLA+VLM大模型 9月起推送上车

    小鹏G7 Ultra今日上市,行业首发本地端VLA VLM”大模型。 搭载了VLA大模型,也就拥有了主动思考、迅速决策能力。 在VLA大模型的加持下,小鹏G7能够解决多种行驶场景,如遇上拥堵路线不傻等,主动绕行最佳路线;途遇积水路面主动减速,安全涉水礼貌避让。

  • 国内有哪些ai大模型?一文看懂中国核心AI大模型全景

    近两年中国AI大模型发展迅猛,已形成"通用+行业"双轨并进的生态格局。百度文心一言、阿里通义千问等通用大模型在中文理解、多模态生成等方面表现突出;深度求索DeepSeek以1/10参数实现GPT-4级推理能力;月之暗面Kimi以20万汉字上下文窗口领跑长文本处理;智谱AI的GLM-4成为首个支持视频对话的国产千亿模型。医疗、金融等垂直领域涌现出百川智能等专业模型,覆盖超1000家医院。开源生态加速国产芯片适配,15家厂商完成深度优化。行业应用方面,工程文档效率提升60%,24小时拟人化客服等案例凸显价值。未来趋势呈现模型蒸馏、端侧部署和开源生态三大方向,中国AI正从实验室走向产业变革前沿。

  • 主流AI多模态大模型有哪些?超全的多模态大模型指南分享

    2024年多模态大模型成为AI领域最具前景的技术方向之一。文章全面分析了主流多模态大模型的特点、应用场景和发展趋势。多模态大模型能同时处理文本、图像、音频、视频等多种数据,实现更智能的人机交互。重点介绍了GPT-4V、Claude3.5、Gemini、通义千问等代表性模型,对比了它们在视觉理解、编程能力、中文处理等方面的优势。应用场景涵盖智能客服、内容创作、教育医疗等领域。未来发展趋势包括模型规模扩大、支持更多模态、实时交互能力提升等。选择模型需考虑应用需求、语言支持、性能成本等因素。

  • 深耕垂直物联场景,萤石蓝海大模型2.0 升级引领行业再跃迁

    萤石网络发布蓝海大模型2.0,聚焦智能家居垂直领域。该模型具备三大核心能力升级:1)感知能力实现1200种目标识别,支持动物种类精细分类;2)理解能力支持多模态分析,包括视频、听觉及混合理解;3)记忆能力构建目标/设备/用户三维画像体系。作为行业首个家居专用大模型,已落地65款产品,服务调用量半年增长400%。同时推出EZVIZ HomePlay OS系统,开放软硬件能力,构建混合算力中心等基础设施,推动智能家居场景创新。在开发者大会上,萤石还展示了养老看护等碎片化场景解决方案,通过垂直领域深度优化实现低成本高效应用。

  • 文生图大模型有哪些?探索AI绘画的核心引擎与选择利器

    本文探讨了当前主流的AI文生图技术及其应用场景。国际阵营中,OpenAI的DALL·E3擅长复杂语义理解,MidJourney以艺术风格见长,Stable Diffusion则以开源生态支持深度定制。中国力量方面,百度文心一格在中文语义和国风创作表现突出,阿里通义万相侧重商业化应用,昆仑万维天工支持长文本生成连贯图像。垂直领域工具如Adobe Firefly深度集成设计流程,Runway ML革新视频创作。文章建议通过聚合平台高效对比模型特性,并指出下一代技术将突破分辨率限制,实现跨模态生成。从精准语义到无限可能,AI文生图正在重塑视觉创作边界。