11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
腾讯云
12-20
本期AI日报涵盖多项重要动态:MiniMax发布上市后首份财报,展示其AI平台战略进展;阿里通义千问开源Qwen3.5小型模型系列,支持多模态处理,适用于边缘设备;Google NotebookLM上线信息图自定义样式功能,简化知识可视化流程;Claude Code推出语音模式,提升编程协作效率;疑似GPT-5.4细节泄露,或具备超长上下文和状态化能力;Zopia实现多智能体协作自动化视频制作;QM发布2025年AI应用榜,豆包、DeepSeek、元宝等位列前五;DeepSeek V4 Lite凭借2000亿参数展现顶尖性能,成为国产模型新标杆。整体显示AI技术正快速向多模态、轻量化、场景化方向演进。
本地部署大型语言模型的开源框架Ollama备受关注,那么ollama到底是什么呢?一个专为本地机器设计的开源框架,旨在简化大型语言模型的部署和运行。它提供了一套工具和命令,使用户能够轻松地下载、管理和运行各种语言模型,包括LLaMA、LLaVA等流行模型。它减少了对云服务或复杂基础设施设置的依赖,使得大型语言模型的部署和应用变得更加容易和高效。
苹果公司正在开发自己的大型语言模型。这款模型将能够在设备上本地运行,从优先考虑速度和隐私保护。苹果更广泛的人工智能战略预计将在6月份的WWDC上与主要软件更新预览一起公布。
DBRX是一个由Databricks的Mosaic研究团队构建的通用大型语言模型,在标准基准测试中表现优于所有现有开源模型。它采用Mixture-of-Experts架构,使用362亿个参数,拥有出色的语言理解、编程、数学和逻辑推理能力。为了体验「DBRX」的强大功能,请访问AIbase网站查看更多介绍。
多模态大型语言模型在视觉情境下的表现异常出色,引起了广泛关注。它们解决视觉数学问题的能力仍需全面评估和理解。这表明需要更先进的数学专用视觉编码器,突显了MLLM发展的潜在未来方向。
LLMPricing是一个聚合并比较各种大型语言模型定价信息的网站,这些模型由官方AI提供商和云服务供应商提供。用户可以在这里找到最适合其项目的语言模型定价。点击前往LLMPricing官网体验入口需求人群:适用于需要选择合适的大型语言模型进行项目开发的企业和开发者,帮助他们根据成本效益做出决策。
Command-R是一个可扩展的生成型模型,旨在平衡高效率和强大的准确性,使企业能够超越概念验证阶段,进入生产阶段。它专为长内容任务设计,如使用外部API和工具的检索增强生成。点击前往Command-R官网体验入口需求人群:适用于需要在生产规模上实施AI的企业,特别是在需要处理长文本上下文和多语言支持的场景中。
腾讯研发团队于3月8日在预印本平台arXiv发布了一项重要成果,推出了名为ELLA的大型语言模型适配器。这一适配器的推出标志着在扩散模型中配备大语言模型的新里程碑,为模型提供了增强的语义对齐能力。这一创新的推出将为语言模型领域带来新的发展机遇,为模型的语义理解和应用提供了更为有效的解决方案。
斯坦福大学的研究人员最近发布了一种名为C3PO的新方法,旨在解决语言模型定制化面临的挑战。在人工智能领域不断发展的今天,语言模型的定制化对于确保用户满意度至关重要。这项研究的意义超出了技术成就的范畴,预示着人工智能可以无缝适应个人偏好、增强其实用性和可访问性的未来。
ChatGPT和AI图像生成器的出现初期令全球欢欣鼓舞,然政府官员开始担心它们可能被用于更黑暗的用途。五角大楼开始与科技行业领袖举行会议,加速发现和实施最有用的军 事应用。“英国国防人工智能中心”负责人瑞秋・辛格顿上校在研讨会上表示,英国感到有必要迅速为内部军 事使用开发一个LLM解决方案,因为担心员工可能会诱惑使用商业LLMs,从使敏感信息面临风险。