首页 > 业界 > 关键词  > 开源模型最新资讯  > 正文

颠覆LLM格局,AI2新模型OLMo2,训练过程全公开,数据架构双升级

2025-01-25 13:44 · 稿源:新智元公众号

【新智元导读】非营利研究机构AI2近日推出的完全开放模型OLMo2,在同等大小模型中取得了最优性能,且该模型不止开放权重,还十分大方地公开了训练数据和方法。最近,非营利研究机构AI2上新了OLMo2系列模型,他们称之为「迄今为止最好的完全开源模型」。OLMo2系列包含7B和13B两个型

......

本文由站长之家合作伙伴自媒体作者“新智元公众号”授权发布于站长之家平台,本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间,为了保证文章信息的及时性,内容观点的准确性,平台将不提供完全的内容展现,本页面内容仅为平台搜索索引使用。需阅读完整内容的用户,请查看原文,获取内容详情。

举报

  • 相关推荐
  • 音箱智商史诗升级 AI大模型渗透率已超20%

    目前上市的新品已经全面搭载AI大模型技术,例如小度大金刚Pro和小米智能音箱等搭载大模型技术的新品在4月上市,兼顾了声学、美学和语音技术的多方面升级。

  • DeepSeek领航大模型普惠化浪潮,xAI/微美息加速开源AI布局打造新格局

    DeepSeek 作为当前最受关注的大模型之一,凭借其技术创新正在加速 AI 普惠化进程。根据机构新报告显示,DeepSeek已经成为全球增长最快的AI工具,其每月新增网站访问量已经超过OpenAI的ChatGPT。DeepSeek市场份额全球第三目前,DeepSeek市场份额6.58%,仅次于ChatGPT和Canva。DeepSeek是继ChatGPT之后的又一现象级AI产品,它的市场份额从2.34%快速增长至6.58%,展现出强劲的增长态势。全球著名�

  • 可灵AI发布2.0模型:上线多模态视频编辑功能

    快科技4月16日消息,据报道,可灵AI在北京举行灵感成真”2.0模型发布会,正式发布可灵2.0视频生成模型及可图2.0图像生成模型。据介绍,可灵2.0模型在动态质量、语义响应、画面美学等维度保持领先;可图2.0模型在指令遵循、电影质感及艺术风格表现等方面显著提升。3月27日,全球AI基准测试机构Artificial Analysis发布了最新的全球视频生成大模型榜单,快手可灵1.6pro(高品质模

  • 不要思考过程,推理模型能力能够更强

    UC伯克利和艾伦实验室的最新研究表明,推理模型无需依赖冗长的思考过程也能有效工作。研究人员提出的"无思考(NoThinking)"方法通过简单提示直接生成解决方案,跳过了传统推理模型中的显性思考步骤。实验证明,在低资源(低token数量、少模型参数)或低延迟情况下,NoThinking方法的表现优于传统思考方式,能减少token使用量并提高推理速度。该方法在数学问题解决、编程和形式定理证明等任务中表现优异,尤其在资源受限时优势更明显。研究还发现,结合并行计算扩展后,NoThinking能进一步提升性能,在保持准确性的同时显著降低延迟和计算成本。这一发现挑战了"推理模型必须依赖详细思考过程"的传统认知。

  • 能理解海豚声音!谷歌开发AI模型DolphinGemma

    快科技4月15日消息,谷歌公布了一款名为DolphinGemma”的大型语言模型,旨在帮助科学家理解海豚的声音,并生成类似海豚的声音序列。研究人员预计在未来几个月内测试DolphinGemma及其配套的Cetacean Hearing Augmentation Telemetry(CHAT)发声系统,以探索是否能够翻译并模仿海豚的声音,进而实现与海豚的某种对话”。海豚是地球上最聪明且最善于沟通的动物之一,其社交互动极其复杂�

  • 百度Create AI开发者大会:李彦宏发布两大新模型、多款热门AI应用、开发者面拥抱MCP

    4月25日,百度在武汉举办Create 2025开发者大会。李彦宏发布文心大模型4.5 Turbo和深度思考模型X1 Turbo,性能提升同时价格大幅下降。大会推出全球首个电商交易MCP平台,并发布数字人、智能体心响APP等多款AI应用。百度宣布未来5年培养1000万AI人才,并点亮国内首个三万卡集群。同时启动第三届"文心杯"创业大赛,最高奖金达7000万元。大会还包含6大分会场、40节AI公开课及5000平互动展区,全面展示百度AI生态布局。

  • AI大模型+渠道整合:容联七陌智能客服赋能制造业升级

    自《中国制造2025》战略提出以来,制造业的智能化发展进入快车道,但行业仍面临劳动力成本上升、供应链不透明、客户需求碎片化等挑战。企业亟需通过技术手段实现降本增效,而智能化客户服务成为关键突破口。与此同时,客服行业正经历颠覆性变革。传统客服依赖人工响应,存在效率低、成本高、数据割裂等痛点。随着AI大模型技术成熟,全渠道整合、智能客服机器人�

  • COLMO以“抽真空”为突破口!重塑高端空调安装服务标杆

    随着消费者对家居舒适度要求提升,空调安装服务质量成为行业关注焦点。文章指出空调行业存在"三分产品七分装"的说法,而抽真空环节是决定安装质量的关键。许多用户因抽真空不规范导致制冷衰减、耗电增加等问题。COLMO空调通过建立智能监控系统和专业安装团队,严格执行标准化作业流程:挂机抽真空不少于15分钟,柜机30分钟。同时推出"365天只换不修"承诺,从技术和服务层面提升安装质量,为行业树立新标杆,推动空调服务品质升级。

  • 聚智2025,AI重塑未来格局——2025人工智能论坛圆满落幕

    这场行业盛会云集了 200 余位国内外顶尖学者、行业领军人物,以大模型创新、人工智能前沿应用、AI哲学与伦理、数学科学交叉融合等热门议题为核心,展开多轮深度研讨与思维碰撞。论坛通过线上线下联动的形式,吸引了超千名专业人士及爱好者参与,为全球人工智能领域奉献了一场兼具学术深度与实践价值的思想盛宴,成为年度行业发展趋势的重要风向标。

  • 何小鹏“剧透”:小鹏训练的一个物理大模型 是国内车企“独一份”

    快科技4月14日消息,今日早间,小鹏汽车创始人何小鹏在社交平台发帖称:作为最早把「智能化」作为核心的车企,小鹏的本质是「AI汽车公司」,我认为AI 最大的价值在于改变物理世界,而不仅是数字世界,我们要做一家面向全球的AI汽车公司,我更想通过 AI 来改变物理世界,这是很有意义的,但难度也更大。小鹏坚持全栈自研,去年率先在自动驾驶领域引入强化学习、模型