首页 > AI头条  > 正文

智源研究院开源全球首个万亿单体稠密模型Tele-FLM-1T

2024-07-25 16:44 · 来源: AIbase基地

北京智源人工智能研究院和中国电信人工智能研究院(TeleAI)联合研发的Tele-FLM系列大模型最近进行了升级,发布了52B指令模型FLM-2-52B-Instruct和全球首个万亿单体稠密模型Tele-FLM-1T,并将相关技术报告和模型的checkpoint开源。

FLM-2-52B-Instruct是基于Tele-FLM-52B基座模型进行指令微调获得的指令对话模型,专注于提升中文对话能力。通过监督微调,使用100万条开源指令数据进行训练,最终基于3万条数据的子集获得了最优结果。这些数据包括数学题目、代码和多轮对话数据。模型训练采用了特定的batch size、学习率和epoch设置,并在AlignBench评测平台上进行了评测。结果显示,FLM-2-52B-Instruct在中文对话能力上达到了GPT-4的90%。

Tele-FLM-1T是全球首个开源的万亿参数稠密模型,采用生长式预训练以节省成本。模型结构在GPT系列的decoder-only Transformers基础上进行了改进,包括加入Input和Output乘子、旋转位置编码、RMSNorm和SwiGLU等。生长策略包括横向生长和纵向生长,使用了基于MSG改进的保值算子。预训练过程中采用了特定的超参数设置。

FLM-2-52B-Instruct模型开源链接:

https://huggingface.co/CofeAI/FLM-2-52B-Instruct-2407

Tele-FLM-1T模型开源链接:

https://huggingface.co/CofeAI/Tele-FLM-1T

52B +1T技术报告链接:

https://arxiv.org/abs/2407.02783

52B基座模型技术报告链接:

https://arxiv.org/abs/2404.16645


  • 相关推荐
  • 全球首个女性肿瘤AI大模型 “木兰”正式进入临床应用

    快科技5月14日消息,华中科技大学宣布,全球首个女性肿瘤AI大模型木兰”,正式进入临床应用阶段。目前,公众可通过华中科技大学同济医院”公众号或掌上同济”APP,在互联网医院下的同济木兰AI咨询”栏目中获得免费服务。未来,该模型还将通过更多手机端线上平台、电脑端应用以及各级医疗机构等多种渠道,向公众开放。据介绍,木兰”由华中科技大学同济医学院附属同济医院主导研发,该模型以国内外权威的女性肿瘤医疗指南和高质量专家共识为基础,融合了同济医院近20年来的高质量病例数据。还整合了中国工程院院士、同济医院妇产科学系主任

  • 复合维生素矿物质有效预防感冒(流感) 赫力昂全球首个真实世界研究成果 加固中国民免疫防线

    赫力昂公司发布全球首个复合维生素矿物质免疫防线研究成果,证实每日服用可降低感冒/流感发生率42.8%,已感染者症状缓解最高达45%。该研究历时16个月,覆盖18个省份3415例受试者,由北京协和医院牵头。研究显示复合维生素矿物质能有效预防呼吸道疾病,适合常态化防疫需求。赫力昂中国表示,这种成本可控的防治方案有望成为提升全民免疫力的常备选择。研究参与者反馈,坚持服用后免疫力明显提升,感冒症状减轻、病程缩短。该成果标志着中国感冒/流感防治取得重要突破。

  • 超越OpenAI、拿下全球双料第一,“AI吴彦祖”背后大模型SOTA了!

    超越OpenAI! 国产大模型突袭,AI语音生成天花板被重新定义了。 MiniMax最新发布Speech-02,同时拿下Artificial Analysis Speech Arena和Hugging Face TTS Arena两项全球权威语音基准测评第一!

  • 持续霸榜!可灵2.0模型登顶全球视频生成大模型榜单

    快手旗下可灵AI 2.0模型在权威AI评测中表现优异,以1124分超越自研1.6版本,连续三个月蝉联全球图生视频领域冠军。4月15日发布的2.0大师版在视频质量、语义理解和画面美学等核心指标持续领先行业。数据显示,自2023年6月上线以来,可灵AI全球用户突破2200万,月活激增25倍,累计生成视频1.68亿个、图片3.44亿张。商业化方面,其单月流水已超千万元,并与伊利、vivo等头部品牌达成深度合作,展现出AI视频生成技术的广阔商业前景。

  • 中文大模型忠实性幻觉评测:豆包大模型幻觉率仅4%,位居全球收之首

    SuperCLUE+最新评测显示,豆包大模型1.5Pro以仅4%的幻觉率和96%的准确率位居全球榜首,超越DeepSeek、Gemini-2.5-pro和GPT-4o等主流模型。该模型在文本摘要、多文本问答等关键任务中表现优异,尤其在中文理解任务上国内领先。基于MoE架构设计,其综合性能超过多款超大规模预训练模型,推理成本显著降低。截至2025年3月,豆包大模型日均调用量达12.7万亿tokens,是一年前的106倍。IDC报告指出火山引擎以46.4%市场份额领跑中国公有云大模型市场。据悉,6月11日将发布豆包大模型最新升级进展。

  • AI日报:阿里开源长文本深度思考模型QwenLong-L1;GPT-4o语音模式上线唱歌功能;秘塔AI搜索推出新“极速”模型

    本文汇总了AI领域最新动态:1)中国信通院发布智能体开发标准,推动AI商业化进程;2)阿里推出QwenLong-L1-32B长文本推理模型,性能媲美Claude-3;3)GPT-4o语音模式升级,新增唱歌功能;4)秘塔AI搜索推出极速模型,响应速度达400tokens/秒;5)谷歌发布LMEval评估框架,统一大模型评测标准;6)Chrome浏览器集成Gemini AI助手;7)阿联酋全民免费使用ChatGPT Plus;8)苏州成立60亿元AI产业基金;9)法国Kyutai实验室推出10秒定制语音的Unmute系统;10)UAV-Flow项目实现无人机语音精准控制;11)Claude将升级支持百万字上下文和记忆功能;12)百度心响iOS版上线;13)夸克推出高考深度搜索功能;14)Chrome v137开发者工具升级;15)美团AI业务接近GPT-4o水平;16)Direct3D-S2实现3D生成速度提升10倍;17)OpenAI计划2026年推出首款AI硬件。

  • 网易严选荣登“全球品牌中国线上500强”,荣获全球宠物品牌TOP3

    5月21日,"全球品牌中国线上500强榜单"发布,网易严选凭借卓越产品力与品牌创新力成功上榜,荣登全球宠物品牌中国线上TOP3。该榜单由北大国家发展研究院等机构联合推出,基于淘宝天猫真实消费数据评选。网易严选宠物类目2024年销售额实现两位数增长,稳居行业前三。其构建了"4S安心矩阵"体系,从科学配方到透明供应链实现全链路品质管控。目前国产宠物品牌在榜单中占比超80%,显示国产品牌正从"跟随者"转变为"标准制定者"。网易严选表示将持续拓展产品线,构建一站式宠物解决方案。

  • 知乎研究院发布「中国高端手机影像趋势与用户洞察」报告,「以人为本」探手机影像技术下半场新赛道

    2024年全球智能手机市场迎来复苏,第一季度出货量同比增长3.049%。中国市场表现亮眼,全年出货量达2.86亿台,同比增长5.6%,其中高端机型(≥4000元)市场份额突破72%。手机影像功能成为用户选购关键因素,知乎"手机摄影"话题浏览量达43.3亿。调研显示,77.2%摄影爱好者以手机为主力设备,71.8%用户每天使用手机拍照。用户需求从"拍得到"转向"拍得美""

  • HTX携手HTX DAO共庆BTC披萨节,开启Web3全球化共识新篇章

    2025年5月22日,加密行业迎来重要时刻:比特币披萨节15周年之际,BTC价格突破11万美元创历史新高。

  • 九四智能亮相大阪,AI大模型驱动全球企业实现智能化转型

    2025年5月28-29日,九四智能(94AI)将携自主研发的"大模型联络中心"解决方案亮相大阪"2025呼叫中心CRM演示和会议"。该方案通过AI Agent技术实现从用户触达、需求挖掘到服务闭环的全流程自动化,助力企业重构客户服务与运营效率。作为智能语音领域领军企业,九四智能已在金融、电商、保险等行业积累创新实践,其解决方案支持多语种与文化适配,满足GDPR等全球合规要求。会议重点探讨了数字化转型背景下AI与CRM系统的深度融合,展示了AI在跨境场景中的语言、文化及合规优势。未来,九四智能将持续推动全球企业智能化转型。

今日大家都在搜的词: