11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
腾讯云
12-20
本期AI日报涵盖多项重要动态:MiniMax发布上市后首份财报,展示其AI平台战略进展;阿里通义千问开源Qwen3.5小型模型系列,支持多模态处理,适用于边缘设备;Google NotebookLM上线信息图自定义样式功能,简化知识可视化流程;Claude Code推出语音模式,提升编程协作效率;疑似GPT-5.4细节泄露,或具备超长上下文和状态化能力;Zopia实现多智能体协作自动化视频制作;QM发布2025年AI应用榜,豆包、DeepSeek、元宝等位列前五;DeepSeek V4 Lite凭借2000亿参数展现顶尖性能,成为国产模型新标杆。整体显示AI技术正快速向多模态、轻量化、场景化方向演进。
DBRX是一个由Databricks的Mosaic研究团队构建的通用大型语言模型,在标准基准测试中表现优于所有现有开源模型。它采用Mixture-of-Experts架构,使用362亿个参数,拥有出色的语言理解、编程、数学和逻辑推理能力。为了体验「DBRX」的强大功能,请访问AIbase网站查看更多介绍。
基于transformer架构的大型语言模型已经崭露头角。Chat-GPT和LLaMA-2等模型展示了LLMs参数的迅速增加,从几十亿到数万亿。当资源受限或需要实时应用时,BiTA的可调提示设计使其成为一种可插即用的方法,可用于加速任何公开可用的LLMs。
LAM 是一个研究项目,旨在开发可以理解和模拟人类在计算机应用中的行为的系统。这个系统被称为大型行动模型(LAM),采用神经符号编程技术,允许直接模拟各种应用程序和用户在其上执行的操作。LAM在精确度、可解释性和速度方面与最先进的方法相媲美。它的目标是为各种AI助手和操作系统的部署提供支持,帮助塑造下一代自然语言驱动的消费者体验。点击前往LAM官网体�
苹果公司的人工智能研究人员表示,在将大型语言模型部署到iPhone和其他内存有限的苹果设备上取得了关键性突破。他们发明了一种创新的闪存利用技术,可有效应对内存限制问题。苹果计划提供云端AI和设备上AI处理的结合。
GoogleCloud和巴黎的生成型AI初创公司MistralAI当地时间周三联合宣布合作,允许这家初创公司在科技巨头的基础设施上分发其语言模型。根据双方的联合声明,「根据协议,MistralAI将使用GoogleCloud的AI优化基础设施,包括TPU加速器,以进一步测试、构建和扩大其大型语言模型,同时受益于GoogleCloud的安全和隐私标准。该公司周一表示,在七个月内第二轮融资中筹集了3.85亿欧元,由Andreessen-Horowitz和LightSpeedVentures等投资者领投。
JetBrains于当地时间周三发布了一款新的AI编码助手,这款助手能够从开发者的集成开发环境获取信息,并将其反馈给AI软件,以提供编码建议、代码重构和文档支持。这家开发工具公司声称,其AI助手是第一个供应商中立的此类产品,因为它使用了多个大型语言模型不是依赖单一的AI平台。为了适应这些开发者,JetBrains已经引入了禁用AI的功能。
OpenAI董事会突然解雇了该公司的首席执行官,这引发了人们的猜测:董事会成员对人工智能突飞猛进的发展速度以及过快寻求技术商业化可能带来的风险感到震惊。RobustIntelligence是一家成立于2020年的初创公司,与耶鲁大学的研究者合作,开发了一种探测大型语言模型的系统性方法,包括OpenAI的GPT-4。他说:「我们需要确保设计使用LLMs的系统时,越狱不能让恶意用户访问他们不应该访问的内容。
供本地使用的LLM通常作为一组权重分布在数GB文件中。这些软件不能直接单独使用,这通常使得它们比其他软件更难分发和运行。这些权重文件本身不能直接使用,需要通过特定的软件框架或环境来加载和运行,这使得与其他类型的软件相比,它们的分发和运行更加复杂。
TogetherAI最近发布了RedPajamav2,这是一个庞大的在线数据集,包含了30万亿token,成为目前公开可用的最大数据集之一,专门用于学习型机器学习系统的培训。对于像Llama、Mistral、Falcon、MPT和RedPajama等最先进的开放式LLM,高质量的数据至关重要,但由于HTML到纯文本的转换引发的异常、通常质量较低的数据来源以及网络内容传播中固有的偏见,这些数据未经精细处理,不适合直接用于LLM的培训。这一工作将为LLM领域的研究和应用提供更多的有力数据支持。