AI日报：昆仑万维天工版o1、4o同时上线；罗永浩新项目发布AI助理 “J1 Assistant” ；爱奇艺起诉MiniMax的AI模型侵权

2025-01-06 15:28 · 稿源：站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、昆仑万维天工大模型4.0o1版和4o版正式上线

2025年1月6日，昆仑万维集团推出了其最新的「天工大模型4.0」o1版和4o版，标志着在人工智能领域的一次重大进展。o1版是国内首款具备中文逻辑推理能力的模型，经过技术升级，能够处理多种推理挑战。而4o版则是一款多模态模型，拥有情感表达和多语言能力，为用户提供了更自然的对话体验。。

【AiBase提要:】
🧠 o1版具备中文逻辑推理能力，经过技术升级，能处理数学、代码等多种推理挑战。
💬4o版是一款多模态模型，提供情感表达和快速响应的实时语音对话助手Skyo。
🌐 两款模型的发布推动了昆仑万维在AI领域的技术进步和应用拓展。
详情链接:https://www.tiangong.cn/

2、罗永浩新 AI 助理 “J1Assistant” 正式上线，语音交互引领智能新时代

罗永浩的人工智能项目Jarvis推出了名为“J1Assistant”的AI助理软件，现仅在海外提供安卓版本。该软件的亮点在于其音频输入功能，用户可以通过语音轻松发送消息、搜索信息或与AI模型互动。J1Assistant集成了Jarvis自家AI模型，具备备忘录功能，帮助用户管理日常事务。

【AiBase提要:】
🎤 J1Assistant推出音频输入功能，用户可通过语音进行操作，提升交互体验。
📅 集成Jarvis自家AI模型，提供实用答案及备忘录功能，帮助用户管理事务。
🌍 目前仅支持安卓版本，未来有望推出更多功能和平台，满足用户需求。

3、爱奇艺起诉MiniMax:AI模型涉嫌侵犯版权，要求赔偿10万元

有媒体报道称爱奇艺向法院提起诉讼，指控AI初创企业MiniMax在模型训练中侵犯其版权。MiniMax被指未经授权使用爱奇艺的素材，生成侵权内容。爱奇艺要求MiniMax立即停止侵权并索赔10万元。MiniMax可能会以素材为公开资源或用户输入为由进行抗辩，争取法律免责。此事件尚未有双方公开回应，法律争议仍在发展中。

【AiBase提要:】
⚖️ 爱奇艺已向法院起诉MiniMax，指控其侵犯版权。
📜 MiniMax被指未经授权使用爱奇艺的版权素材进行模型训练。
💰 爱奇艺要求MiniMax停止侵权并索赔约10万元人民币。

4、阿里团队出品!妆容迁移技术SHMT:提供化妆参考图就能给你上妆

阿里巴巴达摩院最近推出的SHMT模型，利用潜在扩散模型实现化妆效果的精准转移，已被国际顶级学术会议NeurIPS2024接收。该技术通过简单的化妆参考图和目标角色照片，能够快速生成妆容效果，极大地推动了化妆应用和图像处理领域的发展。

【AiBase提要:】
🎓 SHMT模型利用潜在扩散模型实现化妆效果转移，已被NeurIPS2024接收。
🔧 团队提供完整的开源代码和预训练模型，便于研究人员进行应用与改进。
📂 数据准备和参数调整至关重要，研究中详细指导了操作流程和目录结构。
详情链接:https://github.com/Snowfallingplum/SHMT

5、字节跳动开源全新AI模型LatentSync 精准控制唇形同步

字节跳动推出的LatentSync是一项先进的端到端唇同步技术，利用音频条件的潜在扩散模型，实现了视频中人物唇部动作与音频的精确匹配。该技术通过引入TREPA技术，增强了时间一致性，同时优化了SyncNet的收敛性，显著提升了唇同步的准确性。

【AiBase提要:】
🎤 端到端框架:LatentSync无需中间运动表示，直接从音频生成唇部动作。
🌟 高质量生成:利用Stable Diffusion生成动态逼真的说话视频，提升视觉效果。
⏱️ 时间一致性:通过TREPA技术增强视频帧之间的时间一致性，确保唇同步的准确性。
详情链接:https://github.com/bytedance/LatentSync

6、Meta 发布新型记忆层技术:突破参数限制，大幅提升 AI 事实准确性

Meta 公司近日推出了一项创新的记忆层技术，旨在提升大型语言模型的事实准确性并扩展参数规模。这项技术通过可训练的键值查找机制，显著提高了模型的信息存储和检索能力。实验结果表明，配备记忆层的模型在多个任务中表现优异，尤其在事实性任务上，性能提升显著。

【AiBase提要:】
🧩 记忆层技术通过稀疏激活机制提升事实准确性，达到1280亿参数的规模。
🚀 实验显示，配备记忆层的模型在事实性问答等任务中表现优于传统稠密模型。
🔧 研究人员对记忆层进行了多项优化，提升了性能和稳定性，展示出强大的可扩展性。
详情链接:https://arxiv.org/pdf/2412.09764

7、Yukai推出陪伴型机器人“Mirumi”:毛茸茸的带给你婴儿般的情感体验

Yukai Engineering以其创新的机器人产品而闻名，最新推出的Mirumi是一款装在钱包上的毛茸茸小球，能够自发转头观察周围的人。这款机器人旨在模仿婴儿的天真与愉快，带给人们愉悦的互动体验。Mirumi的设计灵感源自日本妖怪，结合运动感应技术，展现多种情感，如好奇、害羞等，进一步彰显了Yukai在奇特机器人领域的独特地位。

【AiBase提要:】
👶 Mirumi是一款毛茸茸的小球，能自发转头观察周围，带来愉悦感。
🤔 该机器人通过运动感应表达情感，模仿婴儿的天真与互动。
🎉 Mirumi的设计灵感源自日本妖怪，旨在重现与婴儿互动的快乐体验。

8、OpenAI 开始将目标转向“超级智能”

OpenAI CEO 山姆・奥特曼在其博客中宣布，公司已掌握构建人工智能（AGI）的核心技术，并将目标转向超智能。他认为，超智能将显著提升科学发现和创新速度，推动社会繁荣。尽管当前技术存在限制，如“幻觉”现象和高运行成本，奥特曼对未来充满信心，认为技术进步将改变时间线。

【AiBase提要:】
🌟 OpenAI CEO 山姆・奥特曼表示，公司已经掌握了构建 AGI 的技术，并将目标转向超智能。
🔍 AGI 被定义为在经济上超越人类的高度自主系统，OpenAI 与微软的协议对其有明确约定。
🚀 尽管当前技术仍有限制，奥特曼对未来发展充满信心，认为时间线会随着技术进步而变化。

9、哈佛大学华人研究员Jeffrey Wang加盟OpenAI 专注模型预训练和推理工作

Jeffrey Wang，哈佛大学的华人研究员，最近加入OpenAI，专注于模型预训练和推理工作。他的学术成就和研究背景引起了广泛关注，尤其是在机器学习和隐私性领域的贡献。Jeffrey的加入不仅是他个人职业生涯的重要一步，也展示了OpenAI对顶尖人才的吸引力，预示着未来AI研究的蓬勃发展。

【AiBase提要:】
🎓 Jeffrey Wang在哈佛大学期间积极参与机器学习和统计学的研究，并教授相关课程。
📄 他的研究成果在多个国际会议上发表，探讨了语言模型隐私和扩散模型的公平性问题。
🌟 Jeffrey Wang的加入标志着OpenAI吸引顶尖人才的能力，推动AI领域的发展。

10、微软计划在2025财年投入800亿美元建设人工智能数据中心

微软公司在2025财年计划投入800亿美元用于建设专门处理人工智能工作负载的数据中心。这一投资旨在加速AI模型的训练和云应用的全球部署，展现了美国在新技术浪潮中的重要地位。随着AI技术的迅速发展，微软的投资不仅是对自身业务的扩展，也反映了对基础设施的迫切需求，未来将为更多行业的数字化转型提供强大支持。

【AiBase提要:】
💰 超过一半的资金将用于美国建设，彰显其在AI技术中的重要地位。
🌐 微软与OpenAI的竞争关系日益紧张，未来可能影响行业格局。
⚡ 随着AI技术需求增加，电力需求也在急剧上升，数据中心面临电力短缺风险。

11、这能力绝了!AI 可以“听出”锂电池即将起火的信号

锂离子电池在我们的日常生活中无处不在，但其过热或损坏可能引发严重火灾。2023年，纽约市因电动自行车电池引发的火灾事件频发，造成多起伤亡。为应对这一风险，NIST研究团队开发了一种基于声音的火灾预警技术，能够通过AI算法识别电池安全阀破裂声，提前约两分钟发出警告。

【AiBase提要:】
🔥 NIST研究团队开发基于声音的锂电池火灾预警技术，利用AI识别安全阀破裂声。
🔊 经过训练的算法识别率高达94%，在多种噪音干扰下仍能保持高效检测。
⏳ 新型火灾警报器预计提供约两分钟的提前预警，帮助人们及时逃生。

12、马斯克宣布 Grok3即将上线，实力提升十倍!

在人工智能领域，埃隆·马斯克再次成为焦点，他在社交媒体上透露，备受期待的Grok3模型即将推出，计算能力较Grok2提升十倍。Grok系列自发布以来备受关注，尽管Grok3的推出经历了一些延迟，但马斯克的最新消息无疑令期待已久的用户振奋。

【AiBase提要:】
⚙️ Grok3模型即将推出，计算能力提升十倍，使用了10万块英伟达H100芯片。
📈 尽管Grok3原定去年底发布，但由于多种原因推迟，马斯克确认预训练工作已完成。
🌍 全球对AI技术的需求增长，Grok3的发布将为开发者和企业带来新的机遇和挑战。

（举报）

相关推荐

关键词：

“人工智能+”时代，企业做对什么才能抢占先机？

国务院8月26日发布《关于深入实施“人工智能+”行动的意见》，提出加快AI技术与实体经济深度融合，推动产业智能化升级。到2035年，我国将全面步入智能经济和社会新阶段。金蝶集团作为企业数字化服务商，以“AI优先”为战略，将AI技术深度融入SaaS产品与服务，推出金蝶云·星空EMA平台及多款智能产品，覆盖财务、供应链、差旅等场景，助力企业构建“AI+业务”新能力，实现高效管理与创新发展。

人工智能数字化转型产业智能化
马斯克：Grok 5模型有望实现通用人工智能的突破

马斯克旗下xAI公司正研发Grok 5模型，有望实现通用人工智能（AGI）重大突破。该模型采用全新架构设计，预计未来几周启动训练。若成功将代表AI从专用领域向通用认知能力的质的飞跃，被视为人工智能发展的终极目标。科技界密切关注xAI能否在激烈竞争的大模型赛道实现突破。

Grok 5 AGI
腾讯云安全发布人工智能风险评估框架，助企业构建可信智能体

9月17日，腾讯云在2025全球数字生态大会上发布人工智能风险控制框架及多款安全产品。该框架涵盖六大风险模块、七层级、130余项措施，系统性应对AI应用全生命周期的安全挑战，包括数据泄露、供应链隐患及权限滥用等核心问题。同时推出LLM-WAF防火墙、AI-SPM态势管理等产品，构建覆盖研发、部署、运维的全链路防护体系，助力企业建立可信、稳定的AI服务生态。

AI安全智能体安全风险评估
市值一日暴增近3000亿港元，阿里迈向超级人工智能之路

9月24日，阿里巴巴股价创下四年新高，单日涨超9%，市值达到约3.32万亿港元，一日增加近3000亿港元。引爆股价的，是阿里集团每年一度的云栖大会。在会上，阿里释放多条重磅消息，尤其是在阿里集团CEO、阿里云智能集团董事长兼CEO吴泳铭的演讲结束后，阿里的股价表现就出现了明显的拉升。

阿里巴巴云栖大会股价
荐没想到，音频大模型开源最彻底的，居然是小红书

不难发现，近几个月，开源频频成为 AI 社区热议的焦点。尤其是对于国内科技公司来说，开源成为主旋律。根据 Hugging Face 中文 AI 模型与资源社区的数据显示，国内厂商在七八月接连开源33款、31款各类型大模型。这些开源成果大多落在了文本、图像、视频、推理、智能体以及世界模型领域，而音频生成占比很小。

开源 AI社区音频生成
GEO排名查询工具推荐:霸屏AI大模型答案的核心方法，做好AI大模型排名优化

随着AI大模型成为用户获取信息的主要入口，AIBase推出GEO排名查询工具，帮助品牌监测在豆包、DeepSeek、文心一言等主流AI平台中的曝光情况。该工具支持多平台检测、关键词追踪、可视化数据展示，可精准分析品牌是否被推荐、出现频次及具体场景，为制定AI大模型排名优化策略提供数据支撑。在GEO时代，抢占AI回答推荐位意味着获得全新流量入口。

AI大模型 GEO排名查询生成引擎优化
2025 世界设计之都大会“创意可计算性：设计人工智能”，特赞升级五大内容+AI解决方案

2025年9月25日至28日，上海将举办世界设计之都大会（WDCC2025），主题为“设计无界，生生不息”。大会聚焦人工智能赋能设计创新，探讨设计如何驱动产业与城市可持续发展。特赞科技作为内容与AI领域代表企业，将展示“计算×创意”如何拓展设计生命力，包括跨行业赋能、产教融合及人机协作三大板块，呈现AI在打破学科边界、推动产业创新中的实践。WDCC2025旨在为全球设计领域注入新动能，构建“设计×科技×可持续”的新想象空间。

世界设计之都大会设计无界设计人工智能
荐AI日报：阿里推多模态模型Qwen3-Omni；谷歌推出AP2协议；百度推出Qianfan-VL 模型

本期AI日报聚焦多领域技术突破：阿里云推出全球首个全模态AI模型Qwen3-Omni，支持文本、图像、音频和视频统一处理；百度发布多尺寸视觉理解模型Qianfan-VL，优化企业级应用。苹果扩展Image Playground平台，引入ChatGPT等第三方模型。谷歌与PayPal合作推出AP2协议，推动AI支付安全创新。钉钉上线AI表格助手，支持自然语言生成表格。DeepSeek开源V3.1-Terminus模型，性能显著提升。Kimi推出Agent会员服务，智元机器人开源全球首个通用具身智能模型GO-1，降低技术门槛促进行业创新。

AI模型全模态阿里云
每日互动参与发起《人工智能安全行业自律倡议》守护人工智能产业可持续发展

9月17日，2025年国家网络安全宣传周人工智能安全治理分论坛在昆明召开，会上正式发布《人工智能安全行业自律倡议》。该倡议由中国网络空间安全协会联合多家科研院所、互联网头部企业、网络安全厂商及人工智能企业共同发起，提出筑牢安全根基、强化技管结合、深化协同共治等七方面共识，旨在推动构建可控、可信、可靠的人工智能产业生态，为全球人工智能治理贡献中国智慧。

人工智能安全行业自律倡议网络安全
云栖大会智舱黑科技：全球首个全模态端侧大模型解决方案，斑马智行首发

9月24日，2025云栖大会在杭州开幕，主题为“云智一体·碳硅共生”，汇聚全球50多国2000余位嘉宾探讨AI、云计算与产业应用趋势。阿里云发布7款通义大模型，其中Qwen3-Omni作为行业首个端到端全模态AI大模型，在36项基准测试中实现22项SOTA，性能全面突破。大会聚焦多模态技术，斑马智行宣布率先接入Qwen3-Omni，并与阿里云、高通联合推出端到端全模态端侧大模型方案Auto+Omni，具备主动智能、断网可用、隐私无忧三大特点，推动汽车智能座舱从指令交互向Always-on主动服务升级。首批搭载方案车型将于2026年量产，标志着汽车智能化迈入“自主行动”新阶段。大会将持续至26日，预计更多创新技术将亮相。

云栖大会通义大模型 AI技术

今日大家都在搜的词：

热文

3 天
7天

AI日报：昆仑万维天工版o1、4o同时上线；罗永浩新项目发布AI助理 “J1 Assistant” ；爱奇艺起诉MiniMax的AI模型侵权

“人工智能+”时代，企业做对什么才能抢占先机？

马斯克：Grok 5模型有望实现通用人工智能的突破

腾讯云安全发布人工智能风险评估框架，助企业构建可信智能体

市值一日暴增近3000亿港元，阿里迈向超级人工智能之路

荐没想到，音频大模型开源最彻底的，居然是小红书

GEO排名查询工具推荐:霸屏AI大模型答案的核心方法，做好AI大模型排名优化

2025 世界设计之都大会“创意可计算性：设计人工智能”，特赞升级五大内容+AI解决方案

荐AI日报：阿里推多模态模型Qwen3-Omni；谷歌推出AP2协议；百度推出Qianfan-VL 模型

每日互动参与发起《人工智能安全行业自律倡议》守护人工智能产业可持续发展

云栖大会智舱黑科技：全球首个全模态端侧大模型解决方案，斑马智行首发

今日大家都在搜的词：

热文

雷军：小米17系列开售仅5天销量破100万台

微信又更新了撤回消息有大变化：可撤回本次发送的全部消息

雷军：小米17系列首销权益延续至10月31日

理想汽车推出焕新版L系限时优惠 10 月 8 日前享1.5万置换补贴

比特币价格突破12.5万美元刷新历史最高纪录

小米回应“小米汽车突然自己开走”：排除车辆质量问题

小米17 1TB版明日开售售价5299元

雷军：小米17系列开售仅5天销量破100万台

腾讯混元图像3.0登顶LMArena榜一

乔布斯逝世14周年库克发文缅怀：我们深切怀念你

小米 17 标准版1TB版本 5299 元开售全系列销量同比增超20%

微信又更新了撤回消息有大变化：可撤回本次发送的全部消息

雷军：小米17系列首销权益延续至10月31日

站长商机