AI日报：百川智能金融大模型发布；ChatGPT新增跨对话记忆功能；DeepSeek大模型一开发者将加盟小米；OpenAI推理模型o3

2024-12-23 15:20 · 稿源：站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、OpenAI发布o3:AI 推理能力的重大突破，得分高达87.5%

OpenAI最近推出了其最新的o-Model推理系列模型o3，标志着在数学和科学推理领域的重大进展。o3在ARC AGI基准测试中得分87.5%，显示出其在解决复杂逻辑和数学问题方面的显著能力提升。该模型结合了神经符号学习与概率逻辑，能够有效处理多步推理挑战，展现出在教育、医疗和软件开发等多个领域的广泛应用潜力。

【AiBase提要:】
🧠 o3在ARC AGI基准测试中得分87.5%，展现出显著的推理能力提升。
🔍 在高级数学测试中，o3的成功率达到96.7%，科学推理准确率提升10%。
💻 o3的应用潜力广泛，能够在教育、医疗和软件开发等领域提供实际支持。

2、Adobe推新AI音频具Sketch2Sound ，只需哼唱和模仿声音就能创建音效

Adobe Research与西北大学联合推出的Sketch2Sound是一款创新的人工智能工具，旨在革新声音设计师的工作流程。用户可以通过哼唱、模仿声音和简单文本描述来生成专业音效。该系统分析音量、音色和音高，并结合文本生成所需声音，特别适合Foley艺术家，提升影视音效的制作效率。

【AiBase提要:】
🎵 Sketch2Sound是一个新开发的AI工具，能通过哼唱和文本描述来创建音效。
🔊 该系统分析音量、音色和音高，将用户的声音输入与文本结合生成目标音效。
🎬 特别适合Foley艺术家使用，能够快速生成影视音效，提升工作效率。
详情链接:https://hugofloresgarcia.art/sketch2sound/

3、百川智能发布金融大模型Baichuan4-Finance

百川智能最近发布了其全新的金融大模型Baichuan4-Finance，该模型通过创新的领域自约束训练方案，在金融能力和通用能力上实现了双重提升，显著增强了在金融场景中的适用性。根据评测数据，Baichuan4-Finance在多个金融领域的准确率均超越了竞争对手GPT-4o。

【AiBase提要:】
🚀 Baichuan4-Finance通过领域自约束训练方案，提升金融和通用能力。
🏆 在多个评测中，Baichuan4-Finance的整体准确率达到93.62%，领先GPT-4o近20%。
📊 该模型在银行、保险、基金和证券等领域的准确率均突破95%。
详情链接:https://platform.baichuan-ai.com/finPage

4、清华大学联合腾讯出品!ColorFlow:自动给黑白漫画上色，保持角色一致性

ColorFlow是清华大学与腾讯ARC实验室联合研发的新型图像序列上色模型，旨在解决黑白图像上色时角色身份一致性的问题。该模型通过双分支设计和创新的检索增强上色管道，显著提升了上色效果与效率。ColorFlow在多个指标上超越了现有先进模型，展现出更高的美学质量，适用于黑白漫画、线条艺术等多种艺术场景。

【AiBase提要:】
🌟 ColorFlow是创新的黑白图像序列上色模型，能够保持角色身份一致性。
🎨 该模型采用双分支设计，分别用于色彩身份提取和实际上色，提升了上色的效果和效率。
🏆 ColorFlow在多项指标上超越了现有的先进模型，展现出更高的美学质量和实用性。
详情链接:https://zhuang2002.github.io/ColorFlow/

5、CAP4D:上传参考图即可生成高质量4D角色头像

CAP4D模型是一项革命性的技术，能够通过任意数量的参考图像生成高质量的4D头像。该模型采用双阶段工作流程，首先生成不同视角和表情的图像，然后结合参考图像重建可实时控制的4D头像。通过使用先进的面部追踪技术和随机采样的方式，CAP4D显著提升了图像重建效果和细节呈现。

【AiBase提要:】
🌟 CAP4D模型通过任意数量的参考图像生成高质量的4D头像，采用双阶段工作流程。
🖼️ 该技术可以生成多种不同视角的头像，显著提高了图像重建效果和细节呈现。
🎤 CAP4D与语音驱动动画模型相结合，实现音频驱动的动态头像，拓展了虚拟头像的应用场景。

6、OpenAI推出ChatGPT新记忆功能:能跨对话回忆用户交流

OpenAI最近推出了一项全新的记忆功能，使得其AI助手ChatGPT能够在用户开启新对话时回忆起以往的交流内容。这一更新旨在提升用户体验，允许用户全面管理自己的记忆设置，包括删除或归档特定信息。与此类似，谷歌也加快了其聊天机器人Gemini的记忆功能的推出，显示出AI行业在个性化服务方面的持续努力。

【AiBase提要:】
🔍 OpenAI推出新记忆功能，ChatGPT可跨对话回忆用户过往交流。
🔒 用户可随时管理记忆设置，删除或归档特定信息。
🤖 谷歌也推出类似功能，旨在提升AI助手的个性化服务。

7、震惊!你的AI聊天对象竟然偷偷学会了“读心术”!—— INFP带你解锁双人对话新姿势

INFP技术的出现，标志着AI虚拟头像在双人对话中的互动能力得到了质的飞跃。通过模仿人类的表情和动作，INFP使得虚拟角色能够在对话中展现出真实的互动，仿佛与真人交流。其背后的技术创新，不仅提升了用户体验，也为未来的AI对话系统提供了新的可能性。

【AiBase提要:】
🤖 INFP技术通过模仿人类的表情和动作，提升了AI虚拟头像的互动能力。
🎤 该技术利用音频分析，动态调整AI头像的状态，实现自然流畅的对话。
📊 DyConv数据集为INFP提供了丰富的对话素材，确保学习效果和表现的优越性。
详情链接:https://grisoon.github.io/INFP/

8、DeepSeek开源大模型开发者之一罗福莉将加盟小米

罗福莉，DeepSeek-V2的关键开发者，近期宣布加入小米，担任AI实验室的领导，负责大模型团队的建设。此举引发广泛关注，尤其是在小米加大大模型领域布局的背景下。罗福莉拥有北京大学的硕士学位，并在自然语言处理领域表现突出，曾在阿里巴巴达摩院任职，参与多语言预训练模型的开发。

【AiBase提要:】
🌟 罗福莉将加盟小米，领导AI实验室的大模型团队。
💰 雷军对小米在AI大模型领域的发展表示担忧，并高薪挖人。
📈 小米AI实验室已经设立专门团队，致力于推动大模型技术的发展。

9、AI终于迈过这道槛!Livekit 开源模型精准识别“你是否说完”!

在语音助手和客服机器人领域，如何准确判断用户是否说完一直是个难题。Livekit推出的开源精准语音轮次检测模型，通过结合Transformer模型与传统语音活动检测，显著提升了人机对话的自然度与流畅性。该模型能够减少AI的错误打断，提升用户体验，未来有望使人机对话更加智能和自然。

【AiBase提要:】
🔍 结合Transformer和传统VAD技术，提升语音轮次检测的准确性。
💬 新模型减少AI的错误打断率达85%，使人机对话更加自然。
🎥 演示视频展示AI耐心等待用户说完，提升交互体验。
详情链接:https://github.com/livekit/agents/tree/main/livekit-plugins/livekit-plugins-turn-detector

10、李飞飞团队前瞻性研究多模态AI模型初显空间智能

斯坦福大学教授李飞飞及其团队的研究揭示了多模态大模型在空间智能方面的初步能力，展示了它们在记忆和回忆空间的潜力。研究开发了VSI-Bench工具，评估视觉空间智能，尽管模型表现仍低于人类，但在某些任务上已接近人类水平。

【AiBase提要:】
🛠️ 研究团队推出VSI-Bench工具，评估视觉空间智能，包含5000多个高质量问答对。
📈 多模态模型在某些任务上已接近人类水平，Gemini-1.5Pro在房间大小估计任务中表现突出。
🌍 李飞飞创办的World Labs专注于开发具备空间智能的AI模型，已获得多家知名机构投资。

11、特朗普正式任命白宫AI政策高级顾问

近日，美国前总统唐纳德・特朗普确认Sriram Krishnan担任白宫科技政策办公室的人工智能高级政策顾问。Krishnan曾是Andreessen Horowitz的合伙人，将负责协调政府的AI政策，并与前PayPal首席运营官David Sacks合作。

【AiBase提要:】
🌟 Sriram Krishnan被任命为特朗普的人工智能政策高级顾问，负责协调政府的AI政策。
🤝 他将与前PayPal首席运营官David Sacks合作，共同推动AI和加密货币相关政策。
💼 Krishnan曾在多家知名科技公司担任领导职务，并在《纽约时报》中分享了对AI趋势的看法。

12、闪极AI拍拍镜宣布预售售罄:999元5万台一天抢光

闪极科技最近推出了其首款AI拍拍镜，标志着国内AI拍摄眼镜领域的重要进展。该产品以1499元的价格上市，首批5万台以999元的优惠价迅速售罄，显示出市场的热烈反响。此外，闪极还推出了一个吸引人的促销活动，用户在300天内打卡200天可获得全额退款。

【AiBase提要:】
📸 这款AI拍拍镜售价1499元，首批5万台以999元的优惠价售罄，显示出强劲的市场需求。
🎉 用户在300天内打卡200天可获得全额退款，增加了产品的吸引力。
🔍 该眼镜搭载索尼1600万像素摄像头，支持多种智能功能，提供丰富的用户体验。

（举报）

相关推荐

关键词：

人工智能巨头OpenAI拟上市估值或高达1万亿美元

OpenAI正积极推进上市计划，据知情人士透露，该公司可能最早于2026年下半年向证券监管机构提交上市申请，目标在2027年正式上市。此次IPO的估值有望达到约1万亿美元，或将跻身全球规模最大的IPO之列。在初步讨论中，OpenAI曾考虑通过上市筹集至少600亿美元资金，实际融资规模可能进一步扩大。

OpenAI IPO 上市计划
卖家精灵加入中国人工智能产业发展联盟（AIIA），加速AI赋能跨境电商

卖家精灵凭借在跨境电商智能化运营与AI大数据应用领域的领先实力，近日正式加入中国人工智能产业发展联盟（AIIA），成为该国家级AI产业生态重要成员。此次加入标志着其AI技术实力获权威认可，未来将携手联盟推动AI技术研发与产业化，助力中国品牌全球化。依托八年积累的海量电商数据与算法体系，卖家精灵已构建覆盖选品决策、市场分析等全链路AI解决方案，服务超百万跨境卖家，显著提升运营效率与决策精准度。

人工智能跨境电商 AI大数据
共建·共智·共享--新一代AtomGit平台暨人工智能开源社区发布

10月28日，AtomGit平台在北京国家会议中心举行升级发布会，正式推出"开源+AI"一体化平台及人工智能开源社区。工信部副部长熊继军出席并致辞，强调建设AI开源社区对汇聚创新资源、把握科技革命机遇的重要意义。平台将整合开源模型、数据集及算力资源，打造开放中立的基础设施，计划于11月21日正式上线。华为、百度等企业代表分享了开源实践，多所高校签署了共建AI生态倡议。此举标志着我国开源生态迈向智能化时代的重要一步。

开源社区人工智能 AtomGit
厚植AI创新沃土！麒麟信安打造人工智能孵化器，赋能创业梦想

10月28日，麒麟信安人工智能孵化器在长沙启动，旨在汇聚AI领域人才、技术与资本，构建开放协同的创新生态。该项目获湖南省多部门支持，已吸引60余个项目入围，组建了首批30余位专家导师团，并与多家顶尖机构共建联合体，通过政策扶持、资本对接等多维度赋能，培育优质AI项目在湘落地发展，助力区域打造人工智能产业创新高地。

人工智能孵化器麒麟信安创新创业
行业首个！海尔冰箱获ISO/IEC 42001人工智能管理体系认证

2025年10月，海尔冰箱成为全球首个通过ISO/IEC42001人工智能管理体系认证的家电企业，标志着其AI技术研发与管理达国际领先水平。该认证覆盖语音交互、视觉识别、健康保鲜等核心功能全流程，确保用户数据安全与隐私保护。目前AI系统已应用于博观、麦浪等高端产品，推动智能冰箱行业规范化发展。未来海尔将持续优化AI技术，为用户提供更安全、智能的健康饮食体验。

冰箱品牌人工智能技术海尔冰箱
微算法科技（NASDAQ MLGO）研发基于AI的动态权重学习模型，开启区块链账户关联分析智能新时代

微算法科技（NASDAQ MLGO）推出基于AI的动态权重学习模型，解决区块链账户关联分析中传统静态模型难以适应业务快速变化的问题。该模型采用分层架构，结合注意力机制LSTM、联邦学习等技术，实时捕捉交易模式演变，动态调整账户关联权重。在分片效率、风险控制、DeFi资源分配等领域应用效果显著，提升交易处理速度与欺诈识别率。未来计划融合多模态数据，探索量子机器学习，打造自适应区块链网络的智能图谱引擎。

区块链技术账户关联分析动态权重学习模型
人工智能产业决胜与 Data&AI 数据基础设施建设——科杰科技于洋中国国际数字经济博览会主题演讲

科杰科技董事善于洋在2025中国国际数字经济博览会发表演讲，强调高质量数据集是人工智能产业决胜关键。他指出，算力、算法和数据构成AI三大要素，而数据决定模型认知边界与输出可靠性。当前需构建Data&AI一体化平台作为核心基础设施，通过集中管理、分散赋能模式，打通数据采集、治理到AI训练全链路，推动产业智能化升级。该平台已在制造、金融等领域落地，助力企业释放数据要素价值，实现弯道超车。

人工智能数据基础设施数字经济
微算法科技（NASDAQ:MLGO）开发延迟和隐私感知卷积神经网络分布式推理，助力可靠人工智能系统技术

微算科技开发了延迟和隐私感知卷积神经网络分布式推理技术，通过创新队列机制和深度强化学习优化CNN推理过程，结合分布式计算与隐私保护机制，在降低边缘设备计算延迟的同时强化数据隐私。该技术将推理任务智能分配到不同节点，减少数据传输范围，实现高效推理与隐私安全的平衡，为智能医疗、交通等领域提供可靠解决方案。

人工智能深度学习隐私保护
OpenAI也来了，巨头为何决战AI浏览器？

AI浏览器赛道再添一位重量级玩家——ChatGPT Atlas，这是OpenAI推出的首款人工智能驱动的网页浏览器。这也被外界认为OpenAI要向谷歌宣战，挑战Chrome一直以来的浏览器霸王地位。ChatGPT Atlas发布当天，谷歌母公司Alphabet股价应声下挫，盘中最大跌幅接近5%，足见市场对这一新品的敏感度。近一年来，AI浏览器的战略价值成为行业共识，从业者更是将其与智能代理（Agent）、搜索引�

AI浏览器 ChatGPT Atlas
AI日报：OpenAI发布浏览器Atlas；通义Qwen3-VL新增2B、32B两个模型尺寸；百川发布循环证据增强大模型

本文汇总AI领域最新动态：OpenAI推出集成ChatGPT的Atlas浏览器，实现多任务自主处理；阿里通义千问新增2B/32B视觉语言模型，手机可流畅运行；谷歌AI Studio升级Vibe Coding功能，简化应用开发流程；百川发布医疗大模型M2Plus，通过循证推理降低误诊率；奇瑞墨甲机器人实现L3级技术突破，计划多行业应用；YouTube推出AI肖像识别工具，打击虚假内容；三星宣布2026年推出AI眼镜，融合AR与语音助手；Claude客户端更新，支持截图分析和语音交互功能。

AI OpenAI ChatGPT

今日大家都在搜的词：

热文

3 天
7天

AI日报：百川智能金融大模型发布；ChatGPT新增跨对话记忆功能；DeepSeek大模型一开发者将加盟小米；OpenAI推理模型o3

人工智能巨头OpenAI拟上市估值或高达1万亿美元

卖家精灵加入中国人工智能产业发展联盟（AIIA），加速AI赋能跨境电商

共建·共智·共享--新一代AtomGit平台暨人工智能开源社区发布

厚植AI创新沃土！麒麟信安打造人工智能孵化器，赋能创业梦想

行业首个！海尔冰箱获ISO/IEC 42001人工智能管理体系认证

微算法科技（NASDAQ MLGO）研发基于AI的动态权重学习模型，开启区块链账户关联分析智能新时代

人工智能产业决胜与 Data&AI 数据基础设施建设——科杰科技于洋中国国际数字经济博览会主题演讲

微算法科技（NASDAQ:MLGO）开发延迟和隐私感知卷积神经网络分布式推理，助力可靠人工智能系统技术

OpenAI也来了，巨头为何决战AI浏览器？

AI日报：OpenAI发布浏览器Atlas；通义Qwen3-VL新增2B、32B两个模型尺寸；百川发布循环证据增强大模型

今日大家都在搜的词：

热文

OPPO ColorOS 16正式版推送：首批适配11款机型

微信升级：支持一次撤回全部消息、删好友能保留聊天记录等功能

AI日报：可复刻音色的MiniMax Speech 2.6发布；TikTok推AI剪辑

vivo OriginOS 6启动公测招募：支持10款机型

AI日报：Sora免费额度要缩水；月之暗面发布Kimi Linear架构；C

苹果客服回应iPhone或自动拨号：设置或其他问题

魅族22月白天青配色发布：2999元起

REDMI官方：REDMI K90超级像素新国屏比2K屏更强

iQOO Neo11开售2小时销量超前代全天

小米随身蓝牙音箱曜石黑配色版本开售：售价299元

iPhone锁屏滑动相机能关闭了苹果iOS 26.1 RC准正式版发布

一加15今晚发布定位全能水桶机

AI日报：豆包视频1.0pro fast发布；谷歌Gemini新功能上线；百度

AI日报：豆包推全自动多人配音系统；Adobe Firefly Image 5重磅

AI日报：Hailuo 2.3发布；豆包AI编程史诗级升级；马斯克推出AI

红米REDMI K90全方位提升雷军：是不是越来越有旗舰气质

OPPO ColorOS 16正式版推送：首批适配11款机型

鸿蒙智行：全新问界M7上市36天交付破20000台

iPhone18发布或推迟苹果明年9月只发Pro系列和Fold折叠屏

微信升级：支持一次撤回全部消息、删好友能保留聊天记录等功能

站长商机