11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
伦敦无障碍出行服务公司Transreport荣获2025年度英国"国王企业奖"创新类奖项。该公司由华人创业者沈星杰2015年创立,通过移动App和后台系统为残障人士提供一键预约高铁、机场等场所的照护服务。其创新技术已支持超700万次援助请求,拥有全球100万用户。目前正拓展日本、中东市场,与阪急集团合作将于2025年在日本推出服务。该奖项由英国国王亲自颁发,表彰其在推动交通系统现代化和无障碍出行领域的突出贡献。
6月20日,华为发布盘古大模型5.5,五大基础模型全面升级。该模型采用业界首创的Triplet+Transformer统一预训练架构,能跨行业处理表格数据、时间序列数据和图片数据,显著提升预测精度和泛化能力。已在水泥、钢铁、电解铝、供热等多个工业场景落地应用:海螺水泥实现熟料强度预测,宝武钢铁高炉出铁温度合格率超90%,云南铝业年省电2600万度,天津供热能耗降低10%。模型聚焦工业领域,通过工艺优化和系统寻优,助力企业降本增效,推动行业智能化转型。
欧洲AI公司Mistral发布多模态新模型Mistral Medium 3,主打编程和多模态理解能力,性能达Claude 3.7的90%但成本仅1/8(输入0.4美元/百万token)。该模型在编程和STEM任务表现突出,支持企业级定制部署,已上线多个云平台。同时推出企业聊天机器人服务Le Chat Enterprise,集成第三方工具。尽管因未开源权重引发争议,其高性价比仍获业界关注。公司透露正在开发更大规模模型。
4月10日,Plume,首个专为现实世界资产融资打造的全集成区块链及生态系统,宣布与Matrixdock达成合作并引入其黄金代币XAUm。Matrixdock是亚洲首个推出代币化短期国债的公司,由全球领先的一站式加密金融服务平台Matrixport创立。这将使Plume用户能够利用抗通胀资产类别来分散投资组合。
最新爆料显示,继今年1月在CES2025上发布三款面向掌机市场的Z2处理器后,AMD计划再推出两款新型号Z2A和AIZ2Extreme。从命名可以看出,AIZ2Extreme将是专注于AI性能的掌机处理器,预计将配备XDNA2神经处理单元,能够提供更强大的AI加速功能。它预计会配备8核Zen4架构CPU和12核RDNA3架构GPU,能够满足大多数掌机用户的基本需求。
今天,联发科发布一款旗舰芯片KompanioUltra910,专为ChromebookPlus笔记本电脑打造,是迄今为止性能最高的Chromebook芯片。KompanioUltra910基于台积电3nm工艺制程制造,采用了134”三丛全大核心设计,共计8个核心。联发科表示,无论是多任务处理、创建内容、玩光线追踪游戏和流媒体是享受身临其境的多媒体,KompanioUltra910都能承担最具挑战性的任务,确保无与伦比的结果,为ChromeOS用户提供优秀的使用体验。
在过去的一两年中,Transformer架构不断面临来自新兴架构的挑战。在众多非Transformer架构中,Mamba无疑是声量较大且后续发展较好的一个。通过合理的设计,Transformer强大的性能可以与Mamba在长上下文和效率上的优势整合到一起,为大型语言模型和大型多模态模型带来新的可能性。
据报道,字节跳动豆包大模型Foundation团队近日宣布了一项重要创新成果UltraMem稀疏模型架构。这一架构通过将计算和参数解耦,在保证模型效果的同时,有效解决了推理过程中的访存问题,为人工智能领域带来了新的突破。这一突破为构建规模达到数十亿value或expert的模型铺平了道路,预示着人工智能领域将迎来更加高效、经济的新发展模式。
“MoE”加上“前所未有大规模投入生产环境的LightningAttention”,再加上“从框架到CUDA层面的如软件和工程重构”,会得到什么?一个追平了顶级模型能力、且把上下文长度提升到400万token级别的新模型。这显然是巨大的野心,但在如今人们都在关注大模型接下来往哪儿走的时候,非常需要这样的野心,非常需要一个或者更多个“Transformer时刻”——在一个自己相信的路线上做到极致,把看似所有人都知道的配方,最终兑现出来,展示给技术社区里的人们,让它变成某个决定性的时刻,给AI的前进再添把火。
今天凌晨3点,全球社交巨头Meta分享了一个创新研究——Memorylayers。Transformer架构的预训练大模型在存储、查询数据时,随着参数的变大对算力的需求呈指数级增长。这样的设计既简化了维护流程,又提高了系统的灵活性和适应性。