首页 > 原创 > 关键词  > 人工智能最新资讯  > 正文

AI日报:昆仑万维天工版o1、4o同时上线;罗永浩新项目发布AI助理 “J1 Assistant” ;爱奇艺起诉MiniMax的AI模型侵权

2025-01-06 15:28 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、昆仑万维天工大模型4.0o1版和4o版正式上线

2025年1月6日,昆仑万维集团推出了其最新的「天工大模型4.0」o1版和4o版,标志着在人工智能领域的一次重大进展。o1版是国内首款具备中文逻辑推理能力的模型,经过技术升级,能够处理多种推理挑战。而4o版则是一款多模态模型,拥有情感表达和多语言能力,为用户提供了更自然的对话体验。。

image.png

【AiBase提要:】

🧠 o1版具备中文逻辑推理能力,经过技术升级,能处理数学、代码等多种推理挑战。

💬4o版是一款多模态模型,提供情感表达和快速响应的实时语音对话助手Skyo。

🌐 两款模型的发布推动了昆仑万维在AI领域的技术进步和应用拓展。

详情链接:https://www.tiangong.cn/

2、罗永浩新 AI 助理 “J1Assistant” 正式上线,语音交互引领智能新时代

罗永浩的人工智能项目Jarvis推出了名为“J1Assistant”的AI助理软件,现仅在海外提供安卓版本。该软件的亮点在于其音频输入功能,用户可以通过语音轻松发送消息、搜索信息或与AI模型互动。J1Assistant集成了Jarvis自家AI模型,具备备忘录功能,帮助用户管理日常事务。

【AiBase提要:】

🎤 J1Assistant推出音频输入功能,用户可通过语音进行操作,提升交互体验。

📅 集成Jarvis自家AI模型,提供实用答案及备忘录功能,帮助用户管理事务。

🌍 目前仅支持安卓版本,未来有望推出更多功能和平台,满足用户需求。

3、爱奇艺起诉MiniMax:AI模型涉嫌侵犯版权,要求赔偿10万元

有媒体报道称爱奇艺向法院提起诉讼,指控AI初创企业MiniMax在模型训练中侵犯其版权。MiniMax被指未经授权使用爱奇艺的素材,生成侵权内容。爱奇艺要求MiniMax立即停止侵权并索赔10万元。MiniMax可能会以素材为公开资源或用户输入为由进行抗辩,争取法律免责。此事件尚未有双方公开回应,法律争议仍在发展中。

【AiBase提要:】

⚖️ 爱奇艺已向法院起诉MiniMax,指控其侵犯版权。

📜 MiniMax被指未经授权使用爱奇艺的版权素材进行模型训练。

💰 爱奇艺要求MiniMax停止侵权并索赔约10万元人民币。

4、阿里团队出品!妆容迁移技术SHMT:提供化妆参考图就能给你上妆

阿里巴巴达摩院最近推出的SHMT模型,利用潜在扩散模型实现化妆效果的精准转移,已被国际顶级学术会议NeurIPS2024接收。该技术通过简单的化妆参考图和目标角色照片,能够快速生成妆容效果,极大地推动了化妆应用和图像处理领域的发展。

image.png

【AiBase提要:】

🎓 SHMT模型利用潜在扩散模型实现化妆效果转移,已被NeurIPS2024接收。

🔧 团队提供完整的开源代码和预训练模型,便于研究人员进行应用与改进。

📂 数据准备和参数调整至关重要,研究中详细指导了操作流程和目录结构。

详情链接:https://github.com/Snowfallingplum/SHMT

5、字节跳动开源全新AI模型LatentSync 精准控制唇形同步

字节跳动推出的LatentSync是一项先进的端到端唇同步技术,利用音频条件的潜在扩散模型,实现了视频中人物唇部动作与音频的精确匹配。该技术通过引入TREPA技术,增强了时间一致性,同时优化了SyncNet的收敛性,显著提升了唇同步的准确性。

【AiBase提要:】

🎤 端到端框架:LatentSync无需中间运动表示,直接从音频生成唇部动作。

🌟 高质量生成:利用Stable Diffusion生成动态逼真的说话视频,提升视觉效果。

⏱️ 时间一致性:通过TREPA技术增强视频帧之间的时间一致性,确保唇同步的准确性。

详情链接:https://github.com/bytedance/LatentSync

6、Meta 发布新型记忆层技术:突破参数限制,大幅提升 AI 事实准确性

Meta 公司近日推出了一项创新的记忆层技术,旨在提升大型语言模型的事实准确性并扩展参数规模。这项技术通过可训练的键值查找机制,显著提高了模型的信息存储和检索能力。实验结果表明,配备记忆层的模型在多个任务中表现优异,尤其在事实性任务上,性能提升显著。

image.png

【AiBase提要:】

🧩 记忆层技术通过稀疏激活机制提升事实准确性,达到1280亿参数的规模。

🚀 实验显示,配备记忆层的模型在事实性问答等任务中表现优于传统稠密模型。

🔧 研究人员对记忆层进行了多项优化,提升了性能和稳定性,展示出强大的可扩展性。

详情链接:https://arxiv.org/pdf/2412.09764

7、Yukai推出陪伴型机器人“Mirumi”:毛茸茸的带给你婴儿般的情感体验

Yukai Engineering以其创新的机器人产品而闻名,最新推出的Mirumi是一款装在钱包上的毛茸茸小球,能够自发转头观察周围的人。这款机器人旨在模仿婴儿的天真与愉快,带给人们愉悦的互动体验。Mirumi的设计灵感源自日本妖怪,结合运动感应技术,展现多种情感,如好奇、害羞等,进一步彰显了Yukai在奇特机器人领域的独特地位。

【AiBase提要:】

👶 Mirumi是一款毛茸茸的小球,能自发转头观察周围,带来愉悦感。

🤔 该机器人通过运动感应表达情感,模仿婴儿的天真与互动。

🎉 Mirumi的设计灵感源自日本妖怪,旨在重现与婴儿互动的快乐体验。

8、OpenAI 开始将目标转向“超级智能”

OpenAI CEO 山姆・奥特曼在其博客中宣布,公司已掌握构建人工智能(AGI)的核心技术,并将目标转向超智能。他认为,超智能将显著提升科学发现和创新速度,推动社会繁荣。尽管当前技术存在限制,如“幻觉”现象和高运行成本,奥特曼对未来充满信心,认为技术进步将改变时间线。

【AiBase提要:】

🌟 OpenAI CEO 山姆・奥特曼表示,公司已经掌握了构建 AGI 的技术,并将目标转向超智能。

🔍 AGI 被定义为在经济上超越人类的高度自主系统,OpenAI 与微软的协议对其有明确约定。

🚀 尽管当前技术仍有限制,奥特曼对未来发展充满信心,认为时间线会随着技术进步而变化。

9、哈佛大学华人研究员Jeffrey Wang加盟OpenAI 专注模型预训练和推理工作

Jeffrey Wang,哈佛大学的华人研究员,最近加入OpenAI,专注于模型预训练和推理工作。他的学术成就和研究背景引起了广泛关注,尤其是在机器学习和隐私性领域的贡献。Jeffrey的加入不仅是他个人职业生涯的重要一步,也展示了OpenAI对顶尖人才的吸引力,预示着未来AI研究的蓬勃发展。

image.png

【AiBase提要:】

🎓 Jeffrey Wang在哈佛大学期间积极参与机器学习和统计学的研究,并教授相关课程。

📄 他的研究成果在多个国际会议上发表,探讨了语言模型隐私和扩散模型的公平性问题。

🌟 Jeffrey Wang的加入标志着OpenAI吸引顶尖人才的能力,推动AI领域的发展。

10、微软计划在2025财年投入800亿美元建设人工智能数据中心

微软公司在2025财年计划投入800亿美元用于建设专门处理人工智能工作负载的数据中心。这一投资旨在加速AI模型的训练和云应用的全球部署,展现了美国在新技术浪潮中的重要地位。随着AI技术的迅速发展,微软的投资不仅是对自身业务的扩展,也反映了对基础设施的迫切需求,未来将为更多行业的数字化转型提供强大支持。

【AiBase提要:】

💰 超过一半的资金将用于美国建设,彰显其在AI技术中的重要地位。

🌐 微软与OpenAI的竞争关系日益紧张,未来可能影响行业格局。

⚡ 随着AI技术需求增加,电力需求也在急剧上升,数据中心面临电力短缺风险。

11、这能力绝了!AI 可以“听出”锂电池即将起火的信号

锂离子电池在我们的日常生活中无处不在,但其过热或损坏可能引发严重火灾。2023年,纽约市因电动自行车电池引发的火灾事件频发,造成多起伤亡。为应对这一风险,NIST研究团队开发了一种基于声音的火灾预警技术,能够通过AI算法识别电池安全阀破裂声,提前约两分钟发出警告。

image.png

【AiBase提要:】

🔥 NIST研究团队开发基于声音的锂电池火灾预警技术,利用AI识别安全阀破裂声。

🔊 经过训练的算法识别率高达94%,在多种噪音干扰下仍能保持高效检测。

⏳ 新型火灾警报器预计提供约两分钟的提前预警,帮助人们及时逃生。

12、马斯克宣布 Grok3即将上线,实力提升十倍!

在人工智能领域,埃隆·马斯克再次成为焦点,他在社交媒体上透露,备受期待的Grok3模型即将推出,计算能力较Grok2提升十倍。Grok系列自发布以来备受关注,尽管Grok3的推出经历了一些延迟,但马斯克的最新消息无疑令期待已久的用户振奋。

【AiBase提要:】

⚙️ Grok3模型即将推出,计算能力提升十倍,使用了10万块英伟达H100芯片。

📈 尽管Grok3原定去年底发布,但由于多种原因推迟,马斯克确认预训练工作已完成。

🌍 全球对AI技术的需求增长,Grok3的发布将为开发者和企业带来新的机遇和挑战。

举报

  • 相关推荐
  • 昆仑万维UniPic 2.0“小钢炮”模型炸场,一个模型搞定理解+生成+编辑

    大模型又迎来新一波的迭代周期。 近日,从Open AI发布GPT-5,到国内的昆仑万维、商汤、百川智能、智谱等都陆续发布了自己的新模型。其中昆仑万维更是一口气开启了技术周,连续5天每天发布一个新模型,而8月13日发布的,正是其本周发布的第三款模型——多模态统一模型UniPic2.0。 UniPic2.0主打的是,在单一模型中深度融合图像理解、文本到图像生成、图像编辑三大核心能力

  • 寒武纪智能芯片赋能多模态大模型应用

    大模型快速发展推动人工智能技术迈向新阶段,从解决特定任务的弱人工智能向处理通用复杂任务的强人工智能演进。IDC报告显示,2024年中国大模型开发平台市场规模达16.9亿元,人工智能算力市场约190亿美元,预计2025年将达259亿美元。寒武纪等企业专注AI芯片研发,推出多款处理器及加速卡产品,支持大模型训练推理及多模态任务,并与产业链合作共同推进人工智能产业发展。

  • AI日报:B站测试AI视频工具花生AI;腾讯发布多模态模型Large-Vision;昆仑万维开源Skywork UniPic 2.0

    【AI日报】主要内容: 1. B站测试"花生AI"视频工具,3分钟可成片,同时推进自研大模型和多语言翻译功能 2. 昆仑万维开源多模态模型Skywork UniPic 2.0,实现高效统一的多模态生成能力 3. 马斯克指责苹果偏袒OpenAI,苹果回应称平台设计公平公正 4. 腾讯混元发布52B参数多模态理解模型Large-Vision,支持任意分辨率输入 5. DeepSeek官方否认8月发布R2模型的传闻 6. OpenAI推出超值ChatGPT Go套餐,仅399卢比降低使用门槛 7. AI新贵Perplexity豪掷345亿美元收购谷歌Chrome 8. Anthropic的Claude Sonnet 4模型支持100万token上下文 9. ChatGPT重大更新:恢复GPT-4o默认模式,为GPT-5引入多模式选择,优化交互体验

  • 昆仑万维技术周启幕:SkyReels模型重塑内容创作基建

    2025年8月11日,昆仑万维启动SkyWork+AI技术发布周,将连续五天发布五大领域AI模型:视频生成模型Skyreels、世界模型、生图一体化模型、智能体(Agent)模型和AI音乐创作模型Mureka。首日发布的Skyreels-A3是全球首个支持分钟级长视频生成的模型,通过四大技术创新解决直播电商等场景痛点,可实现180秒连贯视频生成、影视级运镜控制与自然动作交互。该模型采用多模态协同生成范式,突破传统视频生成技术误差累积限制,并通过Step蒸馏技术将推理步数压缩至4步,生成时间缩短至80秒。商业化方面,昆仑万维已形成"研发-产品变现-现金流反哺"闭环,2025年Q1经营性现金流净额增长58.3%,旗下DramaWave、Mureka等产品年化流水分别达1.2亿和1200万美元。此次技术周标志着中国AI企业首次跑通规模化盈利路径。

  • 海尔冰箱唯一获批“制冷家电人工智能技术山东省工程研究中心”

    海尔冰箱在人工智能领域取得新突破,主导建设的"制冷家电人工智能技术山东省工程研究中心"成为2025年山东省工程研究中心认定名单中唯一入选的冰箱品牌。该中心聚焦人工智能、物联网、大数据等技术方向,开发了全空间智慧保鲜舱冰箱等140多项行业首创产品,近三年获授权发明专利803件。海尔冰箱还推出行业首款接入DeepSeek的AI全空间保鲜冰箱,具备方言识别、降噪技术等功能,显著提升用户体验。市场数据显示,2023年1-7月海尔冰箱以47%市场份额稳居行业第一。通过AI技术赋能,海尔冰箱正引领行业向精准、智能保鲜时代跨越。

  • AI日报:昆仑万维发布SkyReels-A3模型;百度搜索PC端全面上线AI搜索;Grok 4 AI模型永久免费开放

    AI日报栏目聚焦人工智能领域最新动态:1)昆仑万维发布SkyReels-A3模型,实现语音驱动数字人生成;2)xAI宣布Grok4模型永久免费开放;3)OpenAI发布GPT-5提示词指南;4)百度PC端上线AI搜索功能;5)微软Windows Co pilot接入GPT-5;6)百川智能开源医疗大模型Baichuan-M2性能超越GPT-oss120b;7)苹果iOS26将集成ChatGPT-5;8)谷歌推出3D视觉编辑框架BlenderFusion;9)轻量级TTS模型Kitten TTS参数仅1500万;10)MiniCPM-V

  • 下一个爆款在哪儿?2025英特尔人工智能创新应用大赛获奖名单揭晓

    8月16日,2025英特尔人工智能创新应用大赛总决赛在深圳落幕。40支优秀团队从2817支队伍中脱颖而出,围绕工业、教育、心理健康、游戏等领域展开对决。大赛展示了AI从云端走向边缘的趋势,依托酷睿Ultra处理器和低代码开发工具,推动AI应用本地化落地。获奖作品包括动力电池机器人协作拆卸系统和AI生成PPT服务,体现AI与产业需求的深度融合。英特尔与联想、惠普等合作伙伴共同为开发者提供全栈支持,加速AI技术普及和商业化进程。

  • 昇腾助力中科大团队实现MoE 稀疏大模型并行推理提速超30%

    中国科学技术大学张燕咏团队在昇腾算力支持下,成功研发出基于专家选择分布预测的专家负载均衡和all2all通信均衡框架。该框架通过“三步走”策略,有效解决了MoE稀疏大模型推理中的专家负载不均和通信开销大两大难题,显著提升推理性能。实验显示,该方案在多项指标上较主流方案提升超30%,为昇腾技术优化MoE模型推理提供了宝贵借鉴,将加速其在各领域的落地应用。

  • 如何精准计算AI大模型调用成本?复杂参数太多,预算总超支怎么办?

    文章探讨了AI模型调用成本管理的痛点,包括GPT-4等模型复杂的计费规则(如Token分级、上下文溢价、多模态叠加收费)导致实际成本常超预算40%。提出AIbase计算器三步解决方案:自动匹配场景参数、实时联动报价、明细成本拆解。通过跨境电商客服和高校实验室案例验证工具有效性,强调数据溯源、用量预警和预算缓冲功能,帮助开发者实现精准成本控制,告别手动制表与定�

  • AI日报:即梦上线智能多帧功能;可灵2.1首尾帧升级;钉钉推语音识别大模型Fun-ASR

    AI日报栏目汇总近期AI领域重要进展:腾讯元宝接入DeepSeek V3.1提升智能助手能力;即梦AI推出多帧功能简化视频制作;可灵AI首尾帧功能升级效果提升235%;钉钉与通义实验室联合发布Fun-ASR语音识别大模型;腾讯CodeBuddy IDE国内版公测;Vercel发布AI Gateway简化模型调用;Anthropic整合Claude Code强化企业开发;阿里发布Mobile-Agent-v3突破GUI自动化;Qoder平台革新编程模式;清华团队GUAVA框架实现0.1秒3D化身生成;谷歌搜索新增AI Agent功能;VAST推出Tripo 3.0推动3D内容创作。

今日大家都在搜的词: