11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
腾讯云
12-20
今日在FORCE LINK AI创新巡展武汉站上,字节跳动旗下火山引擎披露最新大模型token调用数据。 火山引擎总裁谭待现场表示,豆包大模型使用量从2024年5月1200亿tokens增长253倍至今年9月的超30万亿tokens。 在企业市场,据IDC9月报告,2025年上半年,中国公有云大模型调用量达536.7万亿tokens。
华为云在2025年8月27日宣布其Tokens服务全面接入CloudMatrix384超节点,通过xDeepServe架构创新,实现单芯片最高2400TPS吞吐量和50ms低延迟,性能超越业界水平。该服务基于MaaS模式,提供多种规格选择,支持大模型和AI工具,助力企业快速开发AI应用。同时,华为云与超100家伙伴合作,深入行业场景,共建智能生态,加速各行业AI落地。
北京大学张牧涵团队在昇腾算力支持下,研发出一套高效大模型训练推理架构,实现百万tokens输入成本低至1元。该成果包含三项关键技术:1)通过分离注意力头中的位置与非位置信息,仅用3%位置信息即可维持模型性能;2)采用联合KV低秩压缩方法,仅保留12.5%的KV Cache;3)基于昇腾硬件并行计算能力,实现Recurrent Decoding技术提升训练数据利用率。该架构显著降低AI大模型应用成本,验证了昇腾算力平台支撑尖端科研的实力。
据报道,谷歌近日公布了Gemini2.5Pro的API定价,基础定价为每百万输入tokens1.25美元,每百万输出tokens10美元。对于超过20万tokens的长文本输入,价格调整为每百万输入tokens2.50美元,输出tokens15美元。谷歌CEO桑达尔皮查伊表示,Gemini2.5Pro是目前最受开发者欢迎的AI模型,仅本月在GoogleAIStudio和GeminiAPI上的使用量就增长了80%。
本周,超算互联网平台上线阿里巴巴开源推理模型QwQ-32BAPI接口服务,现在用户可获得免费的100万Tokens。基于国产深算智能加速卡以及全国一体化算力网,平台支持海量用户便捷调用QwQ-32B、DeepSeek-R1等国产开源大模型的接口服务。阿里已采用宽松的Apache2.0协议,将千问QwQ-32B模型向全球开源,所有人都可免费下载及商用。
阿里云官方宣布,阿里云百炼平台已经全面上线DeepSeek全系列大模型,包括DeepSeek-V3、DeepSeek-R1、DeepSeek-R1-Distill-Qwen-32B/14B/7B/1.5B等共六款。所有用户都可以享受DeepSeek-R1、DeepSeek-V3两款模型各100万的免费tokens。用户无需编写代码,即可通过阿里云平台实现从模型训练到部署再到推理的全过程,极大地简化了AI模型的开发流程。
今日,阿里云宣布本年度第三轮大模型降价,通义千问视觉理解模型全线降价超80%。Qwen-VL-Plus直降81%,输入价格仅为0.0015元/千tokens,创下全网最低价格。在今年9月的云栖大会上,阿里云再度官宣大降价,阿里云百炼平台上的三款通义千问主力模型再次降价,其中Qwen-Turbo价格直降85%,低至百万tokens0.3元。
2024年的AI图像生成技术,又提升到了一个新高度。技术的飞速迭代,让这一领域的商业化落地进入加速阶段。可以期待的是,大模型这条赛道的竞争正在开启新篇章在新的章节里,国产大模型将有机会书写更加浓墨重彩的一笔。
OpenAI宣布从今天开始到9月23日,免费为4级、5级用户提供GPT-4omini微调服务,帮助开发者打造特定业务用例的生成式AI应用。每天限制200万tokens数据,超过的部分将按照每10万tokens3美元收取。OpenAI已经用GPT-4omini取代了之前的GPT-3.5Turbo,免费为ChatGPT提供服务。
大模型之争,到了不只是拼技术的时刻。最新的行业风向是:谁能大范围应用落地?谁能笑到最后?谁能真正产生价值?对大模型行业玩家的评判标准也不再只看技术。腾讯决定打一场持久战。