首页 > 传媒 > 关键词  > 正文

训练3个月 ,「APUS大模型3.0伶荔」已免费开放

2024-02-07 10:35 · 稿源: 站长之家用户

近日,APUS与深圳大学大数据系统计算技术国家工程实验室(以下简称“大数据国家工程实验室”)联合训练伶荔Linly-70B中文大模型,并在GitHub上正式首发开源,这是APUS大模型3.0的头个开源大模型。

据了解,APUS大模型3.0伶荔在中文基准测评榜单C-Eval上评分80.6分,中文能力超越GPT-4,在所有参评模型中排名第三,相比原始开源模型标杆LLaMa2-70B取得了大幅提升。

值得注意的是,大数据国家工程实验室由深圳大学牵头,与国家信息中心、清华大学和腾讯科技等联合建设;更有中国科学院陈国良院士、国家重点研发项目首席科学家李坚强等一批拔尖人才组成研发组,实验室副主任沈琳琳教授领导的伶荔项目团队支撑了此次模型的联合训练和开源发布。

此次APUS与大数据国家工程实验室联合训练开源的APUS大模型3.0伶荔中文大模型,进一步推动了AI技术创新与国内场景应用深化融合。“伶荔是国内仅有的几家700亿参数规模的中文开源大模型之一,相信能让更多国人开发者参与到人工智能产业大潮中。”伶荔项目团队李煜东博士如此表示。

可以看到,APUS大模型3.0伶荔中文大模型在词表大小、训练语料等方面进行了定制化调优,基于模块化增量预训练框架开发,针对中文场景扩充词表,增加汉字和中文符号支持,实现综合性能达到同量级开源模型的领先水平。在语料训练上,APUS大模型3.0伶荔采用高质量中英文公开数据源包括悟道、万卷、MNBVC等,并结合自研数据选择策略,构成模型有效训练的混合语料库。基于APUS郑州智算中心的算力支持,APUS大模型3.0伶荔耗时3个月完成训练,当前上下文长度设定为4K(约8000-10000汉字)。

此外,伶荔项目团队还提出课程学习策略,基于动态数据采样,在训练中调整数据的分布,实现将模型的英文语言能力平稳迁移学习到中文能力领域,为训练出高性能中文大模型提供有力保障。

随着APUS大模型3.0伶荔的联合发布、开源,国产开源大模型向构建中文场景大型语言模型又迈出了重要一步。此次合作也是双方深化践行“为中国定制人工智能大模型,积极构建人工智能生态,让大模型应用和价值创造接轨”战略的重要举措。

据悉,APUS还将与大数据国家工程实验室持续推动模型的能力提升和应用拓展,积极探索深化大模型在工具使用、剧情生成和角色扮演、医疗等领域的专业能力,聚力构建大模型生态,让为中国打造的AI大模型真正驱动中国AI产业高质量发展,实现价值共创,赋能千行万业。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 用了3个月GEO监控,我发现品牌在AI推荐中的5个真相

    文章探讨AI搜索时代企业面临的新挑战:用户转向ChatGPT、豆包等平台直接提问,导致传统搜索引擎询盘量下降。核心提出GEO品牌监控概念,需关注品牌在AI推荐中的曝光率、排名位置、提及场景等5个关键指标。通过工具持续监控并优化内容,可提升AI搜索可见性。数据显示GEO投入回报率达1:3.71,建议企业尽早布局抢占新兴流量入口。

  • 3个月瘦100斤送保时捷!健身训练营回应:活动真实 收30人 报名费一万

    近日,山东滨州,一健身训练营发文称举办减重挑战赛,体重成功减掉100斤以上,奖励一辆保时捷帕拉梅拉,获网友广泛关注。 对此,有媒体联系到该俱乐部教练。 教练称比赛真实有效,报名满30人将截止,目前已有七八人报名,只要在三个月内减重100斤以上就能获得帕拉梅拉。 同时,他还表示,减重挑战赛报名费1万元左右,双人间包吃包住,全封闭式

  • 百度搜索AI API全面开放 绝大多数结果由AI生成

    11月13日,百度创始人李彦宏在2025百度世界大会上宣布,百度搜索已实现绝大多数结果由AI生成,首条结果富媒体覆盖率高达70%。他强调,百度正通过AI技术深度重构搜索结果页,从传统文字链接模式转向以图片、视频等富媒体内容为核心的AI应用。李彦宏指出,百度是全球搜索引擎中对AI化改造最激进的,正引领行业进入全新时代。他还表示,企业需善用AI方能立于不败之地,个人也需掌握AI技能以掌控未来。目前,百度已通过AI+API开放搜索能力,与三星、荣耀、vivo等主流厂商建立合作,共同探索AI搜索的无限可能。

  • 寒武纪:构建大模型开发到部署的全流程开放服务能力

    华鑫证券研报显示,寒武纪2025年上半年业绩亮眼,营收28.81亿元,同比增长4347.82%;归母净利润10.38亿元,增长295.82%。公司募资39.85亿元,重点投向大模型芯片及软件平台建设,以增强AI算力芯片综合实力。凭借云边端一体、软硬协同等技术优势,其产品已获多领域客户认可,覆盖金融、互联网等行业。未来随着技术迭代与生态完善,业绩有望持续提升。

  • 从价格内卷到价值引领:雅迪华宇电池以“13个月全换新”重塑用户服务标准

    雅迪华宇电池发布全新服务标准,以"不换维护只换新"为核心,颠覆传统铅酸电池行业"维修周转"模式。通过智能检测仪实现2小时极速检测,数据实时上传云端,确保门店、经销商与厂方三方互认,杜绝标准争议。故障确认后立即更换全新同级电池,无需等待维修,显著提升用户体验。该标准依托雄厚研发实力与严格品控体系,推动行业从价格竞争转向价值竞争,树立服务效率新标杆。

  • AI日报:广电整治AI动画乱象;360发布大模型安全白皮书;百度推出小度AI眼镜Pro

    国家广电总局宣布自2026年3月起全面整治AI生成内容,要求AIGC作品纳入分类分层审核体系。360发布《大模型安全白皮书》,提出全链路AI安全防线应对新型威胁。百度推出2299元小度AI眼镜Pro,集成智能翻译等多项功能。StepFun开源音频编辑模型Step-Audio-EditX,实现文本化语音编辑。Grok新增纯文本生成视频功能,17秒可生成带特效视频片段。研究发现谷歌Veo-3模型能生成逼真手术视频但缺乏医学逻辑。阿里Qwen3-Max-Thinking在全球数学竞赛夺冠,并在加密货币交易中取得显著回报。OpenAI推出轻量化GPT-5 Codex Mini模型,优化开发者体验。

  • AI工具网站GEO优化实战:3个月让品牌曝光率提升40%

    随着AI搜索工具普及,传统SEO面临挑战。数据显示,71%美国用户用AI研究产品,58.5%的谷歌搜索实现零点击。流量正从搜索引擎转向AI平台,企业需转向GEO(生成引擎优化)。通过监控AI平台推荐情况、分析竞品曝光策略、持续优化内容质量,案例显示3个月内品牌曝光率可从10%提升至42%。建议每周固定监测核心问题排名,针对高价值问题优化页面,建立“监控-优化-验证”闭环。

  • 百度搜索推出“百度猎户座”AI引擎,涵盖基座模型、搜索AI API、 MCP、垂类优势能力

    2025年11月13日,百度发布“百度猎户座”AI引擎,全面开放25年搜索技术与前沿AI能力。该系统整合底座模型、搜索API、MCP及垂直领域能力,基于多智能体架构统一连接信息、工具、服务与模型,融合搜索技术优势与全网MCP生态资源。即日起对外开放,支持企业快速接入打造专属AI应用。同时,文心助手上线个性化记忆功能,视频生成推出“参考生成”玩法,AI短剧创作平台免费提供超30万部IP资源及全流程工具。

  • 华为余承东:鸿蒙智行全系交付突破100万台 仅用43个月

    华为常务董事余承东10月28日宣布,鸿蒙智行全系交付量突破100万台,仅用43个月,远超行业预期。这一里程碑式成就彰显其在中国新势力品牌中的强劲竞争力。9月单月交付新车近3万台,累计交付量已超95万台,成交均价稳居新势力榜首,体现高端优质品牌形象。余承东感谢团队与合作伙伴,并期待下一个百万台更快到来,展现对未来发展的信心。

  • 突破大模型对齐瓶颈,北大团队携手昇腾打通产业应用通路

    北大杨耀东团队研发Align-Anything多模态对齐框架,以RLHF为核心解决传统反馈信息有限问题,覆盖文本、图像、音频等全模态数据。该框架集成专用评估工具Eval-Anything,已在昇腾平台实现智慧医疗、网络安全等领域规模化落地。通过构建安全治理体系,显著提升大模型安全水位,同时保持通用能力。团队联合推出课程培养人才,深化产学研协同,为多模态大模型发展提供关键技术支撑。

今日大家都在搜的词: