11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
AI日报主要内容: 1. 腾讯开源混元A13B模型,采用MoE架构,总参数量800亿,激活参数130亿,支持低端GPU部署 2. 可灵AI推出"视频音效"功能,实现所见即所听的沉浸体验 3. Black Forest开源图像编辑模型FLUX.1Kontext,支持消费级硬件运行 4. OpenAI发布Deep Research API新模型o3/o4-mini,支持自动化网页搜索和数据分析 5. 小米推出1999元起AI眼镜,集成拍摄、支付、音乐等功能 6. 迅雷推出下载MCP服务,一句话指令让AI自动完成下载任务 7. HeyGen推出AI视频Agent,几分钟内生成专业级视频内容 8. 谷歌开源端侧多模态大模型Gemma3n,手机也能运行云端AI性能
本文介绍了AI领域最新动态:1)腾讯开源混元3D2.1大模型,提升3D生成质量;2)OpenAI Codex升级,优化代码生成功能;3)字节跳动AI Lab负责人李航卸任;4)微软发布700个AI应用案例;5)微软推出Code Researcher工具,解决58%系统崩溃问题;6)Observer AI实现屏幕操作自动化;7)Genspark发布AI浏览器;8)麻省理工用AI技术3.5小时修复15世纪名画;9)蚂蚁集团推出开源多模态GPT-4o模型Ming-Omni;10)MagicTryOn视频换衣框架;11)字节跳动发布实时互动AI视频生成模型Seaweed APT2;12)ChatGPT搜索功能升级;13)字节跳动与老凤祥合作开发AI智能眼镜。
虽然尚未掌握实质控制权,但其角色已从“财务投资者”悄然向“战略伙伴”过渡。未来一旦行业格局变动,腾讯或许将在韩国娱乐产业中扮演更加活跃的角色……
腾讯QQ近日发布Windows 9.9.19和Mac 6.9.73版本更新,新增文件闪传功能。用户可通过聊天列表右上角入口或右击托盘图标使用该功能,支持快速分享文件、查看传输历史。单文件最大支持10GB闪传,分享链接7天有效,支持跨应用全网分享,视频、文档、压缩包等文件类型均可秒开且无需登录。目前该功能免费开放,暂未推出VIP相关权益。
《AI日报》今日聚焦多项AI领域突破:腾讯推出CodeBuddy 3.0编程助手,深度整合微信小程序开发工具;字节跳动发布仅20B参数的Seed1.5-VL多模态模型,性能达行业领先;通义千问上线"Deep Research"智能研究系统,免费开放体验。此外,苹果推出革命性3D建模工具Matrix3D,Anthropic即将发布Claude Neptune新模型,清华与面壁智能联合推出端侧GUI智能体AgentCPM-GUI。谷歌搜索正测试"AI Mode"新功能,或将取代传统"手气不错"按钮。
中国AI公司昆仑万维凭借独特商业模式实现快速增长,其战略融合了Meta的开源技术、Adobe的垂直产品矩阵和腾讯的生态思维。公司90%收入来自海外市场,通过视频、音乐、社交等产品矩阵在东南亚、中东等新兴市场快速扩张。核心产品包括短剧平台DramaWave(年收入1.2亿美元ARR)和AI音乐平台Mureka(年收入1200万美元ARR),均实现盈利。技术层面,公司采用"垂直开源+商业验证"模式,推出SkyReels视频生成等开源模型,形成开发者生态闭环。其独特之处在于:既非单纯对标国际巨头的通用模型,也避免国内同质化竞争,而是通过开源底座+垂类产品+生态卡位的组合构建差异化优势。2024年财报显示,公司AI业务年收入达10亿元,研发投入同比增长23.4%。市场看好其"平台型AI矩阵"价值,近一月股价上涨20.7%。这家中型科技企业的突围路径,为行业提供了技术出海与生态共建的新范式。
2025年5月7日,文远知行宣布获得Uber追加1亿美元股权投资,这是Uber在自动驾驶领域的最大单笔投资。双方自2024年9月达成战略合作以来,已在阿布扎比部署中东最大Robotaxi车队,并拓展至迪拜市场。此次合作升级计划未来五年在欧洲、中东等15个城市部署数十万辆自动驾驶汽车,覆盖千万用户。Uber CEO表示这将加速全球自动驾驶服务普及。此次合作标志着自动驾驶产业迈向规模化、全球化新阶段,有望重塑人类出行方式,并为行业商业化进程树立新标杆。
在人们担忧特朗普关税政策会导致消费减少、以及包括特斯拉在内的竞争对手纷纷进军自动驾驶出租车领域等不利情况下,Uber 也没落下扩大其全球影响力的步伐……
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、阿里通义实验室LHM技术实现从单图像的快速3D人体重建与动画生成阿里通义实验室的LHM技术在3D人体重建领域取得了重要突破,利用多模态变换器架构和头部特征金字塔编码方案,显著提高了重建精度和效率。该系统由Ableton远程脚本和MCP服务器组成,用户可以通过Claude与Ableton进行互动,执行各种音乐制作指令。
在过去的一两年中,Transformer架构不断面临来自新兴架构的挑战。在众多非Transformer架构中,Mamba无疑是声量较大且后续发展较好的一个。通过合理的设计,Transformer强大的性能可以与Mamba在长上下文和效率上的优势整合到一起,为大型语言模型和大型多模态模型带来新的可能性。