2023 年最重要的 3 项人工智能创新：多模态 AI、宪法 AI 和文本转视频技术

2023-12-22 11:39 · 稿源：站长之家

站长之家(ChinaZ.com) 12 月 22 日消息:2023 年，人工智能（AI）领域见证了重大进展，不仅公众对 AI 有了更深的理解，政府也开始认真对待 AI 风险。本年度的发展不仅是新技术和理念的出现，更是长期孕育后的集中爆发。

OpenAI ChatGPT，人工智能，AI

以下是过去一年中人工智能领域最重要的三项创新：

多模态 AI（Multimodality）多模态 AI 指的是 AI 系统处理各种不同类型数据的能力，不仅包括文本，还包括图像、视频、音频等。今年，公众首次获得了强大的多模态 AI 模型的访问权限。OpenAI 的 GPT-4 是其中的先锋，允许用户上传图像以及文本输入。例如，用户可以基于冰箱内容的照片询问 GPT-4 晚餐应该做什么。9 月，OpenAI 推出了用户通过语音以及文本与 ChatGPT 互动的功能。
宪法 AI（Constitutional AI）宪法 AI 尝试解决如何使 AI 符合人类价值观的难题。2022 年 12 月，顶尖 AI 实验室 Anthropic 的研究人员首次描述了宪法 AI，并在其 2023 年推出的聊天机器人 Claude 中使用了这一技术。该技术的核心是先撰写一份表达期望 AI 遵循的价值观的「宪法」，然后训练 AI 根据宪法评分响应，并激励模型输出得分更高的响应。这是一种 AI 反馈的强化学习方法，与人类反馈的强化学习相比，更精确控制 AI 行为，且需更少的人类标签。
文本转视频技术文本转视频工具的迅速崛起是今年投入 AI 领域的数十亿美元资金的显著成果。布鲁克林的 AI 视频初创公司 Runway 的最新模型 Gen-2 允许用户不仅根据文本生成视频，还能根据文本提示改变现有视频的风格。此外，另一家初创公司 Pika AI 正在使用其技术每周创建数百万新视频。这些免费工具试图改变用户生成内容的格局，可能在 2024 年发生，但由于文本转视频工具计算成本高，一旦风险资本用尽，它们可能开始收费。

（举报）

相关推荐

关键词：

荐AI日报：李飞飞Marble 3D世界模型公测；OpenAI首次推出ChatGPT群聊功能；百度发布多模态 AI助手超能小度

本期AI日报聚焦多项技术突破：World Labs推出Marble 3D模型，实现多模态生成可交互虚拟世界；OpenAI在韩新试点ChatGPT群聊功能，支持多人协作互动；苹果更新隐私政策，要求第三方AI调用需明示授权；百度发布多模态助手“超能小度”，支持空间感知与设备免费升级；LinkedIn推出AI人脉搜索，通过自然语言精准匹配专业人士；Cursor完成23亿美元融资，估值达293亿；Character AI与耶鲁合作实现音画同步技术Ovi；Google NotebookLM上线深度研究工具，支持多格式文件分析与知识库构建。

AI 3D虚拟世界多模态输入
AI全面落地双11，淘宝走出一条和OpenAI不同的路

今年的双11已经进入最后阶段，消费者和商家都有一个明显的感受是，AI的浓度真的很高，并且AI的全面落地应用，真的在改变传统用户购物、商家经营的链路。消费者能感受到两个比较明显的变化:一个是AI导购开始走进真实的购物场景。淘宝为双11投入了六款AI导购类产品，其公布的数据显示，AI万能搜已经帮助消费者解决了5000万个消费需求。另一个则是平台推荐的商品越

AI导购双11购物淘宝AI
荐OpenAI和微软的关系没那么糟，跟英伟达也没那么好

OpenAI的动作比所有人想象的都要快。上周二，OpenAI完成重组。其中一个重要变化是:彻底取消了与微软的排他性协议，结束了Azure长达六年的云服务独占模式。此前，OpenAI所有模型的训练、推理与部署都必须优先选择Azure，微软还享有优先购买权。宣布与Azure“分手”后不到一周，OpenAI便火速宣布了与AWS的战略合作——双方达成一项价值380亿美元的云计算协议，OpenAI将全面接入

OpenAI 云计算战略合作
荐OpenAI也来了，巨头为何决战AI浏览器？

AI浏览器赛道再添一位重量级玩家——ChatGPT Atlas，这是OpenAI推出的首款人工智能驱动的网页浏览器。这也被外界认为OpenAI要向谷歌宣战，挑战Chrome一直以来的浏览器霸王地位。ChatGPT Atlas发布当天，谷歌母公司Alphabet股价应声下挫，盘中最大跌幅接近5%，足见市场对这一新品的敏感度。近一年来，AI浏览器的战略价值成为行业共识，从业者更是将其与智能代理（Agent）、搜索引�

AI浏览器 ChatGPT Atlas
登榜LMArena！文心大模型5.0-Preview文本能力国内第一

11月8日，文心全新模型ERNIE-5.0-Preview-1022在LMArena大模型竞技场排名中位列全球第二、中国第一。该模型在创意写作、复杂长问题理解和指令遵循方面表现突出，超越多款国内外主流模型。创意写作可高效生成文章、营销文案等内容；复杂长问题理解适用于学术问答、报告分析等任务；指令遵循能力支持智能助理、代码生成等场景，为多领域内容生产提供高效支撑。

文心模型 ERNIE-5.0 创意写作
OpenAI发布GPT-5.1：情商大涨本周开始推送

OpenAI正式推出GPT-5.1模型，以“智商与情商深度融合”为核心亮点。新模型优化推理能力，强化情绪价值与个性化交互，包含Instant与Thinking两大核心版本：Instant首次引入自适应推理功能，针对复杂任务延长思考时间，简单问题保持极速响应；Thinking版本智能分配思考时长，提升回答透彻度与通俗性。新增Auto功能自动匹配最佳模型，支持六种官方预设风格及精准微调。安全评估首次纳入心理健康与情感依赖维度，防范拟人化风险。付费用户可保留旧版三个月过渡期。

GPT-5.1模型智商与情商自适应推理
荣耀Magic 8系列上新，火山引擎助力“YOYO助理”多模态升级

10月15日，荣耀发布搭载全新MagicOS 10系统的Magic8系列手机、MagicPad3 Pro平板及荣耀手表5 Pro等年度旗舰新品。智能语音助手“YOYO助理”升级多模态交互能力，结合火山引擎与豆包大模型技术，支持联网问答、识图、修图、闲陪伴、口语练习、出行规划等场景，提供图文、语音、视频等多种输入输出形式，实现秒级响应与沉浸式交互体验，成为用户“口袋里的万能管家”。

荣耀Magic8系列 MagicOS10操作系统 YOYO助理
荐Sora App的AI视频社交，给了百度们新希望

Sora2发布两周后，百度的蒸汽机AI视频模型，和谷歌Veo3.1撞了档期。两家公司选择同期发布并非有多默契，而是Sora2带来的压迫感促使它们不得不加快脚步。奥尔特曼将形容Sora2为“创意领域的ChatGPT3.5时刻”，不仅在物理逻辑、画面连贯性、真实感和音画同步等方面实现了质的飞跃，还把Sora从一个“文本到视频”的工具进化成一个“创意到生态”的平台。这无疑是扔在AI视�

文章搜索核心标签 AI视频模型
荐长视频，要MCN化？

过去十多年，长视频平台习惯用头部综艺与大剧撬动增长:内容够强，自然破圈，声量带动会员与广告。这套“内容中心逻辑”曾行之有效。但短视频重写了注意力分配。用户不再愿意投入整段时间追一个叙事，三十秒的情绪刺激就足以满足娱乐需求。内容生命周期被压缩，哪怕是重金制作，也可能上线当周见顶、难以延展。在这种环境下，平台不得不寻找新的增长方式。�

文章搜索核心标签长视频平台
荐AI日报：Sora正式登陆Android；网易云音乐推AI调音大师；谷歌将推Nano Banana2

本期AI日报聚焦多领域突破：OpenAI视频应用Sora登陆安卓平台并引入付费角色功能；网易云音乐推出AI调音大师实现智能音效适配；字节跳动高薪布局人形机器人赛道；谷歌Gemini平台将升级图像生成技术；llama.cpp实现多模态革命；特斯拉秘密实验室通过行为数据训练机器人；上海首例AI著作权案宣判保护原创；微软推出自研图像生成器MAI-Image-1，在创意效率与质量间取得平衡。

OpenAI Sora Android

今日大家都在搜的词：

热文

3 天
7天

2023 年最重要的 3 项人工智能创新：多模态 AI、宪法 AI 和文本转视频技术

以下是过去一年中人工智能领域最重要的三项创新：

荐AI日报：李飞飞Marble 3D世界模型公测；OpenAI首次推出ChatGPT群聊功能；百度发布多模态 AI助手超能小度

AI全面落地双11，淘宝走出一条和OpenAI不同的路

荐OpenAI和微软的关系没那么糟，跟英伟达也没那么好

荐OpenAI也来了，巨头为何决战AI浏览器？

登榜LMArena！文心大模型5.0-Preview文本能力国内第一

OpenAI发布GPT-5.1：情商大涨本周开始推送

荣耀Magic 8系列上新，火山引擎助力“YOYO助理”多模态升级

荐Sora App的AI视频社交，给了百度们新希望

荐长视频，要MCN化？

荐AI日报：Sora正式登陆Android；网易云音乐推AI调音大师；谷歌将推Nano Banana2

今日大家都在搜的词：

热文

iPhone Pocket被吐槽像保温水瓶套网友：韭菜太好割

影视飓风CEO在相亲角被大妈吐槽网友：大妈不识货

腾讯发布2025第三季度财报：营收1928.69亿元同比增长 15%

雷军回应小米双11战绩：谢谢大家支持

小米澎湃OS 3第三批正式版推送：支持小米14、K70系列等

卢伟冰：小米手机双11连续三年国产销量第一

95岁巴菲特每周还上5天班此前计划年底退休

京东发布双11战报：订单总量增长近60% 下单用户同比增长40%

荣耀500系列官宣：超级标准版+超级Pro版

荣耀500系列开启预约：Pro版外观首次亮相

站长商机