AI日报：ChatGPT AI搜索免费开放；谷歌AI视频模型Veo2优于Sora；Midjourney重磅上新个性化模型与情绪板

2024-12-17 15:19 · 稿源：站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、OpenAI宣布ChatGPT搜索升级支持地图、高级语音等功能

OpenAI在最新的直播中宣布了ChatGPT平台的重大技术更新，推出了实时搜索和高级语音交互模式，极大提升了用户体验。通过优化搜索算法，用户能够快速获取实时信息，并直接查看源链接，增强了信息的便捷性。此外，新增的视频播放和地图集成功能，为用户提供了更直观的搜索体验，提升了移动端的搜索效率。

微信截图_20241217081801.png

【AiBase提要:】
📈 更新后的ChatGPT引入了实时搜索功能，优化了搜索算法，使用户能够快速获取股票和新闻等实时信息。
🗣️ 新增的高级语音交互模式允许用户通过语音进行多轮搜索，提供个性化的语音助手体验。
🗺️ ChatGPT现在支持地图集成功能，用户可以直接查看地理位置信息，进行路线规划和地点探索。

2、谷歌升级AI视频生成模型 Veo2，4K分辨率、人类偏好评分优于Sora

谷歌最近发布了其新一代视频生成模型Veo2，旨在与OpenAI的Sora竞争。Veo2在视频生成方面展现了更高的真实感和细腻度，用户可以通过Google Labs的VideoFX平台申请使用。此外，谷歌还更新了图像生成模型Imagen3，进一步提升了生成图像的真实感和色彩表现。

【AiBase提要:】
🎥 Veo2视频生成模型质量优于OpenAI的Sora，用户可申请使用。
🚀 用户可以选择视频风格和效果，生成最高可达4K分辨率的视频。
🎨 更新的Imagen3图像生成模型表现出更好的艺术风格和用户体验。
详情链接:https://labs.google/fx/tools/video-fx

3、Midjourney推出个性化模型与情绪板，可上传图像训练模型了

2024年12月16日，Midjourney公司推出了备受期待的“情绪版板”功能，允许用户上传灵感图像集以生成新艺术作品。配合最新的AI模型，用户可以更轻松地创建个性化资料，简化了模型建立过程，降低了新用户的入门门槛。此外，增强的组织功能使得用户能够更好地管理多个项目。

【AiBase提要:】
🌟 Midjourney推出心情板功能，用户可上传灵感图像集。
🚀 个性化资料的创建变得更简单，用户只需40个评分即可开始。
🛠️ 组织功能增强，用户可命名资料并追踪相关图像。
详情链接:https://www.midjourney.com/personalize

4、谷歌推出全新AI工具Whisk无需提示词，可多张图片混合生成新风格图像

谷歌最新推出的AI工具Whisk，显著改变了传统的图像生成方式，允许用户通过上传多张图片来生成新图像，而不再依赖于冗长的文字描述。Whisk的设计旨在快速进行视觉探索，用户可以轻松地将不同风格和主题的图像融合，创造出独特的视觉作品。尽管生成图像的过程可能需要几秒钟，并且有时结果会略显奇怪，但整体体验非常有趣。

【AiBase提要:】
🎨 Whisk允许用户通过多张图片生成新风格图像，颠覆了传统的文字提示方式。
✨ 用户可以上传不同主题的图片，自动融合生成有趣的视觉效果。
🚀 谷歌还发布了Imagen3和Veo2模型，进一步提升了图像和视频生成的能力。
详情链接:https://top.aibase.com/tool/whisk

5、YouTube新功能上线:允许创作者授权第三方使用视频训练AI

YouTube最近推出了一项新功能，允许创作者选择是否授权第三方公司使用他们的视频进行人工智能模型的训练。这一功能的默认设置为关闭，创作者如果不希望第三方使用他们的视频，无需采取任何行动。

【AiBase提要:】
🔒 默认设置为关闭，创作者需主动选择允许第三方使用其视频进行AI训练。
🤝 允许的第三方公司包括知名AI企业，如OpenAI、苹果和微软等。
📈 此功能旨在帮助创作者在AI时代实现内容的新价值。

6、图森未来发布图生视频模型“Ruyi” 并开源Ruyi-Mini-7B

北京图森未来科技有限公司于2024年12月17日发布了其首款“图生视频”大模型“Ruyi”，并开源了Ruyi-Mini-7B版本，供用户在huggingface平台下载使用。该模型专为消费级显卡设计，具备多种生成能力，尤其在动漫和游戏领域展现出色的视觉叙事潜力。尽管技术上取得进展，但仍需解决一些缺陷。

微信截图_20241217140324.png

【AiBase提要:】
🚀 Ruyi大模型专为消费级显卡设计，支持多分辨率和多时长的视频生成，能够处理384×384到1024×1024的分辨率。
🎨 模型在帧间一致性、动作流畅性和色彩呈现方面表现卓越，成为ACG爱好者的理想创意伙伴。
🔧 尽管技术上取得进展，Ruyi仍存在一些缺陷，如手部畸形和面部细节崩坏，图森未来正在努力改进。
详情链接:https://huggingface.co/IamCreateAI/Ruyi-Mini-7B

7、智谱AI完成30亿元融资推动大模型技术研发与商业化

智谱公司近期成功完成30亿元人民币的新一轮融资，吸引了众多战略投资者和国资机构的参与。这笔资金将用于智谱基座大模型的研发升级，进一步提升其在复杂推理和多模态任务解决方面的能力。尽管面临市场竞争和技术进展放缓的挑战，智谱依然在AI行业中保持领先地位，并在全球范围内产生显著影响。【AiBase提要:】

🚀 智谱公司完成30亿元融资，资金将用于基座大模型的研发和升级，推动行业创新。
📈 今年智谱在B端市场实现逆势增长，API收入同比增长超过30倍，付费客户数增长20倍。
🌍 智谱的C端产品“智谱清言”吸引超过2500万用户，预计付费功能将带来千万级收入。

8、Meta 推出开源AI试衣模型 Leffa:保留更多细节

Meta最近推出了Leffa，一个开源的AI虚拟试穿框架，旨在通过生成新图像提升用户的穿衣体验。用户只需上传一张参考图片，系统便能生成新的穿搭效果，减少了因不合适而退换货的麻烦。Leffa在保留细节和减少图像失真方面表现出色，提供了更自然的试穿效果。

【AiBase提要:】
🌟 Leffa 是 Meta 推出的开源虚拟试穿框架，可以根据参考图像生成新图像。
👗 该框架能有效减少图像失真，保留更多细节，提高虚拟试穿体验。
💻 用户可在 Hugging Face 平台上试用 Leffa，同时 Meta 提供了完整的项目代码。
详情链接:https://github.com/franciszzj/Leffa

9、Diffusion-Vas:追踪视频目标，可补全遮挡部分

在视频分析领域，物体的持久性是理解物体存在的重要线索。研究者提出的Diffusion-Vas方法，基于扩散先验，旨在提升视频无模态分割和内容补全的效果。该方法分为两个阶段，首先生成无模态掩码，然后利用条件生成模型对遮挡区域进行内容补全。经过多项基准测试，该方法在复杂场景下表现优异，准确率提高了13%。

【AiBase提要:】
🌟 研究提出了一种新方法，通过扩散先验实现视频中的无模态分割和内容补全。
🖼️ 方法分为两阶段，首先生成无模态掩码，然后进行遮挡区域的内容补全。
📊 在多项基准测试中，该方法显著提高了无模态分割的准确性，尤其在复杂场景下表现优异。
详情链接:https://diffusion-vas.github.io/

10、Meta智能眼镜Ray-Ban Meta升级:实时AI视频与翻译功能

Meta公司对Ray-Ban Meta智能眼镜进行了重要更新，推出了多项基于人工智能的新功能，包括实时对话和语言翻译。这些功能使用户能够与AI助手进行更自然的交流，无需频繁唤醒助手，同时也支持多语言即时翻译，极大提升了用户的沟通便利性。此外，眼镜还新增了Shazam功能，用户可以通过语音识别音乐。

【AiBase提要:】
🌟 Ray-Ban Meta智能眼镜推出实时AI视频和翻译功能，用户可随时与AI助手对话。
🌍 新增的实时翻译功能支持多种语言之间的即时翻译，提升了用户交流的便利性。
🎵 眼镜还支持Shazam功能，用户可通过语音识别当前播放的音乐。

11、博通CEO预测AI市场大爆发公司市值突破1万亿美元

博通公司首席执行官Hock Tan在最近的财报电话会议上对AI芯片市场表达了乐观的展望，预计到2027年，博通在这一领域的收入将显著增长，服务可寻址市场预计在600亿至900亿美元之间。公司市值因AI芯片需求激增首次突破1万亿美元。

【AiBase提要:】
🌟 博通预计到2027年AI市场服务可寻址市场将达到600亿至900亿美元。
📈 博通市值因AI芯片需求激增首次突破1万亿美元。
💰 通过收购VMware，博通整体收入增长达51%，且运营成本大幅降低。

12、金山办公:WPS AI将免费解锁AI生成PPT等四大功能

金山办公宣布WPS AI将在年终期间为用户提供四项免费功能，旨在提升工作效率和创意。用户可以使用AI生成PPT、风格克隆、滤镜等功能，快速制作专业的年终总结PPT。此外，WPS还提供多样化的PPT模板，满足不同用户需求。

【AiBase提要:】
🎉 WPS AI将免费解锁AI生成PPT、风格克隆、滤镜和模板功能，提升用户工作效率。
🖼️ AI生成PPT功能可快速生成专业PPT，智能润色内容，保持逻辑和设计美感。
📋 用户可通过“AI总结季”参与活动，获取丰富的年终总结PPT模板，满足不同行业需求。

（举报）

相关推荐

关键词：

共建·共智·共享--新一代AtomGit平台暨人工智能开源社区发布

10月28日，AtomGit平台在北京国家会议中心举行升级发布会，正式推出"开源+AI"一体化平台及人工智能开源社区。工信部副部长熊继军出席并致辞，强调建设AI开源社区对汇聚创新资源、把握科技革命机遇的重要意义。平台将整合开源模型、数据集及算力资源，打造开放中立的基础设施，计划于11月21日正式上线。华为、百度等企业代表分享了开源实践，多所高校签署了共建AI生态倡议。此举标志着我国开源生态迈向智能化时代的重要一步。

开源社区人工智能 AtomGit
GEO如何改变ChatGPT搜索和Perplexity的游戏规则

本文对比ChatGPT与Perplexity两大AI搜索平台：ChatGPT作为全能型助手，整合搜索与多任务处理，但存在信息时效性不足；Perplexity专注垂直搜索，强调引用透明与权威来源。针对AI搜索优化（GEO），提出差异化策略：面向ChatGPT需构建结构化知识库、强化品牌实体识别；面向Perplexity需注重权威数据引用和元数据优化。文章还介绍了AIBase的GEO监测工具，通过曝光率等指标量化内容在AI生态中的可见度，并给出可落地的优化行动方案。
荐谁能成为中国的ChatGPT？夸克抢先交卷

在OpenAI上线自己家AI浏览器ChatGPT Atlas的同一周，微软在海外发布了新的AI助手Mico和更AI化的Edge浏览器，夸克则在国内推出了新的「对话助手」功能。这一系列消息背后，新旧巨头、两个市场产生了两个确定的共识:一个是AI助理与AI浏览器的融合会进一步深化，入口之争就是系统之争;另一个是对话会成为人与AI交互的主要方式，自然语言就是未来的编程语言。在海外市场，OpenA

AI浏览器 ChatGPT Atlas
人工智能巨头OpenAI拟上市估值或高达1万亿美元

OpenAI正积极推进上市计划，据知情人士透露，该公司可能最早于2026年下半年向证券监管机构提交上市申请，目标在2027年正式上市。此次IPO的估值有望达到约1万亿美元，或将跻身全球规模最大的IPO之列。在初步讨论中，OpenAI曾考虑通过上市筹集至少600亿美元资金，实际融资规模可能进一步扩大。

OpenAI IPO 上市计划
卖家精灵加入中国人工智能产业发展联盟（AIIA），加速AI赋能跨境电商

卖家精灵凭借在跨境电商智能化运营与AI大数据应用领域的领先实力，近日正式加入中国人工智能产业发展联盟（AIIA），成为该国家级AI产业生态重要成员。此次加入标志着其AI技术实力获权威认可，未来将携手联盟推动AI技术研发与产业化，助力中国品牌全球化。依托八年积累的海量电商数据与算法体系，卖家精灵已构建覆盖选品决策、市场分析等全链路AI解决方案，服务超百万跨境卖家，显著提升运营效率与决策精准度。

人工智能跨境电商 AI大数据
如何提升品牌在AI回答中的提及率？GEO优化3招，让ChatGPT主动提及你的品牌

本文探讨AI搜索时代品牌面临的"隐身危机"，指出AI搜索用户年增538.7%，但品牌在AI回答中提及率不足20%。提出三大核心策略：1）构建权威背书矩阵，通过知乎等高权重平台获取自然提及；2）优化AI友好内容，采用对话式标题和结构化数据；3）建立数据监测闭环，通过A/B测试持续迭代。强调需善用监测工具实时追踪品牌在豆包、文心一言等AI模型的曝光表现，避免内容"注水"。最终实现从"被动等待"到主动抢占AI"第一屏"的转变。

文章搜索核心标签 SEO优化
人工智能产业决胜与 Data&AI 数据基础设施建设——科杰科技于洋中国国际数字经济博览会主题演讲

科杰科技董事善于洋在2025中国国际数字经济博览会发表演讲，强调高质量数据集是人工智能产业决胜关键。他指出，算力、算法和数据构成AI三大要素，而数据决定模型认知边界与输出可靠性。当前需构建Data&AI一体化平台作为核心基础设施，通过集中管理、分散赋能模式，打通数据采集、治理到AI训练全链路，推动产业智能化升级。该平台已在制造、金融等领域落地，助力企业释放数据要素价值，实现弯道超车。

人工智能数据基础设施数字经济
厚植AI创新沃土！麒麟信安打造人工智能孵化器，赋能创业梦想

10月28日，麒麟信安人工智能孵化器在长沙启动，旨在汇聚AI领域人才、技术与资本，构建开放协同的创新生态。该项目获湖南省多部门支持，已吸引60余个项目入围，组建了首批30余位专家导师团，并与多家顶尖机构共建联合体，通过政策扶持、资本对接等多维度赋能，培育优质AI项目在湘落地发展，助力区域打造人工智能产业创新高地。

人工智能孵化器麒麟信安创新创业
行业首个！海尔冰箱获ISO/IEC 42001人工智能管理体系认证

2025年10月，海尔冰箱成为全球首个通过ISO/IEC42001人工智能管理体系认证的家电企业，标志着其AI技术研发与管理达国际领先水平。该认证覆盖语音交互、视觉识别、健康保鲜等核心功能全流程，确保用户数据安全与隐私保护。目前AI系统已应用于博观、麦浪等高端产品，推动智能冰箱行业规范化发展。未来海尔将持续优化AI技术，为用户提供更安全、智能的健康饮食体验。

冰箱品牌人工智能技术海尔冰箱
OpenAI推出AI浏览器ChatGPT Atlas 开启个性化上网新体验

OpenAI于10月22日推出首款AI驱动浏览器ChatGPT Atlas，以个性化上网体验为核心。用户点击“Ask ChatGPT”即可在侧边栏实时互动，实现网页摘要生成、航班预订、文档编辑等多样化任务。目前仅支持macOS，未来将扩展至Windows和移动端。高级代理功能暂限付费用户使用，其特色包括自动捕捉页面上下文、分屏浏览及记忆用户操作历史，旨在通过自然对话提升网络使用效率。

ChatGPT Atlas 人工智能浏览器

今日大家都在搜的词：

热文

3 天
7天

AI日报：ChatGPT AI搜索免费开放；谷歌AI视频模型Veo2优于Sora；Midjourney重磅上新个性化模型与情绪板

共建·共智·共享--新一代AtomGit平台暨人工智能开源社区发布

GEO如何改变ChatGPT搜索和Perplexity的游戏规则

荐谁能成为中国的ChatGPT？夸克抢先交卷

人工智能巨头OpenAI拟上市估值或高达1万亿美元

卖家精灵加入中国人工智能产业发展联盟（AIIA），加速AI赋能跨境电商

如何提升品牌在AI回答中的提及率？GEO优化3招，让ChatGPT主动提及你的品牌

人工智能产业决胜与 Data&AI 数据基础设施建设——科杰科技于洋中国国际数字经济博览会主题演讲

厚植AI创新沃土！麒麟信安打造人工智能孵化器，赋能创业梦想

行业首个！海尔冰箱获ISO/IEC 42001人工智能管理体系认证

OpenAI推出AI浏览器ChatGPT Atlas 开启个性化上网新体验

今日大家都在搜的词：

热文

OPPO ColorOS 16正式版推送：首批适配11款机型

AI日报：可复刻音色的MiniMax Speech 2.6发布；TikTok推AI剪辑

微信升级：支持一次撤回全部消息、删好友能保留聊天记录等功能

vivo OriginOS 6启动公测招募：支持10款机型

魅族22月白天青配色发布：2999元起

REDMI官方：REDMI K90超级像素新国屏比2K屏更强

AI日报：Sora免费额度要缩水；月之暗面发布Kimi Linear架构；C

苹果客服回应iPhone或自动拨号：设置或其他问题

iQOO Neo11开售2小时销量超前代全天

小米随身蓝牙音箱曜石黑配色版本开售：售价299元

iPhone锁屏滑动相机能关闭了苹果iOS 26.1 RC准正式版发布

一加15今晚发布定位全能水桶机

AI日报：豆包视频1.0pro fast发布；谷歌Gemini新功能上线；百度

AI日报：豆包推全自动多人配音系统；Adobe Firefly Image 5重磅

AI日报：Hailuo 2.3发布；豆包AI编程史诗级升级；马斯克推出AI

红米REDMI K90全方位提升雷军：是不是越来越有旗舰气质

鸿蒙智行：全新问界M7上市36天交付破20000台

iPhone18发布或推迟苹果明年9月只发Pro系列和Fold折叠屏

余承东曝鸿蒙智行新款享界S9将于11月上市

华为余承东：鸿蒙智行全系交付突破100万台仅用43个月

站长商机