首页 > 业界 > 关键词  > 国家超算天津中心最新资讯  > 正文

国家队来了!国产中文大语言模型“天河天元”发布:由天河超算训练

2023-05-21 08:51 · 稿源: 快科技

5月21日消息,5月18日,2023第七届世界智能大会于国家会展中心(天津)正式开始。而天河新一代超级计算机是中国新一代百亿亿次超级计算机,也在此次展会迎来首次亮相。

同时,为充分发挥超算在算力方面的优势,推动国产异构超级计算机平台在AI应用开发和服务领域中的应用。

国家超算天津中心在大会上发布了天河E级智能计算开放创新平台”和天河天元大模型”。

据介绍,中文大语言模型的数据集非常稀缺。国家超算天津中心搜集整理了网页数据、各种开源训练数据、中文小说数据、古文数据、百科数据、新闻数据,以及专业领域的中医、医药、问诊、法律等多种数据集。

训练数据集总token数达到350B,最终训练打造出了自己的中文语言大模型天河天元大模型。

据悉,天河E级智能计算开放创新平台”将带来突破百亿亿次的跨模态的超级计算算力,支撑传统的科学工程计算,并服务智能混合计算,打造全方位的算力赋能创新和数字经济高质量发展载体。

举报

  • 相关推荐
  • 时空壶接入大语言模型,跨语言沟通已成翻译的艺术

    在当今全球化浪潮中,跨语言沟通的需求如潮水般汹涌。从商务领域的跨国谈判,到文化交流中的思想碰撞,高效、精准的语言翻译成为关键桥梁。随着技术的不断发展与迭代,时空壶有望持续引领行业变革,推动全球交流合作迈向新的高度,真正实现跨越语言障碍,让世界沟通无阻。

  • 时空壶接入DeepSeek、豆包等大语言模型,翻译准确度再次跃升

    在全球跨语言沟通需求持续攀升的当下,时空壶再次以创新之举震撼行业。时空壶正式宣布接入DeepSeek、豆包等大语言模型,为其同传耳机产品带来了前所未有的体验升级,彻底改写了同传翻译的游戏规则,也让传统机翻模式成为历史。这一创新举措不仅满足了当下各行业对高质量跨语言沟通的迫切需求,更为未来跨语言交流的发展指明了方向,有望推动整个行业向更加智能、精准、自然的方向迈进,助力全球交流合作开启全新篇章。

  • 何小鹏“剧透”:小鹏训练的一个物理大模型 是国内车企“独一份”

    快科技4月14日消息,今日早间,小鹏汽车创始人何小鹏在社交平台发帖称:作为最早把「智能化」作为核心的车企,小鹏的本质是「AI汽车公司」,我认为AI 最大的价值在于改变物理世界,而不仅是数字世界,我们要做一家面向全球的AI汽车公司,我更想通过 AI 来改变物理世界,这是很有意义的,但难度也更大。小鹏坚持全栈自研,去年率先在自动驾驶领域引入强化学习、模型

  • 国产六大推理模型激战OpenAI?

    2025年春节前夕,DeepSeek-R1模型发布,标志着中国AI进入推理模型新时代。文章梳理了国产大模型发展历程:从2022年ChatGPT引发国内追赶OpenAI热潮,到2023年"百模大战",再到2024年"AI六小虎"格局形成。重点分析了六大国产推理模型(DeepSeek、百度、阿里、科大讯飞、字节、腾讯)的技术特点与市场表现,指出国产模型在性能上已接近GPT-4水平。特别强调科大讯飞星火X1凭借全国产化技术路线获得政企青睐,以及DeepSeek-R1以560万美元超低成本实现高性能的突破。文章还探讨了英伟达芯片断供危机下,国产全栈技术路径的重要性,认为自主可控将成为对抗国际不确定性的关键。最后指出,随着推理模型成为竞争焦点,国产大模型正从技术追随转向自主创新阶段。

  • iOS 18.4正式版发布:5G-A来了!苹果智能终于支持中文

    今天凌晨,苹果推送了iOS18.4正式版更新,带来了一大批的新功能和优化修复。首先大家感知最强的就是5G-A,也就是我们常说的5.5G,其理论峰值速率可达5G的10倍。需要注意的是,此次推送的更新介绍,很多国行用户反馈没有进行汉化,全篇都是英文,可能是个bug或者苹果的疏忽。

  • 摩尔线程与松应科技共建国产物理AI仿真生态,开启机器人训练国产化新纪元

    在全球机器人产业研发效率持续升级的背景下,端到端物理AI仿真技术已成为缩短产品开发周期、降低试错成本的关键基础设施。叠加《"十四五"机器人产业发展规划》与《新一代人工智能发展规划》的政策推动,机器人产业正面临技术自主化与规模化应用的双重挑战。我们的愿景是为美好世界加速。

  • 高考考上985的AI来了!超强数理推理横扫真题,训练秘籍剑指AGI

    全球首个工业界多模态推理模型Skywork-R1V升级至2.0版本,全面开源38B参数模型权重。该模型在高考物理、生物等学科题目上展现出强大的图文推理能力,准确率媲美985考生水平。技术突破包括:1)首创视觉奖励模型Skywork-VL Reward,在视觉和文本奖励基准测试中均获SOTA;2)引入混合偏好优化(MPO)机制,平衡推理深度与通用能力;3)采用选择性样本缓冲(SSB)技术解决训练中的优势�

  • 国家天文台、阿里云联合发布全球首个太阳AI大模型:耀斑预报准确率超91%

    中科院国家天文台联合阿里云,发布了全球首个太阳AI大模型金乌”,基于阿里通义千问系列开源模型,目前在M5级太阳耀斑预报上准确率超91%,这也是该级别太阳耀斑预报的最高水平。太阳耀斑是太阳表面发生的剧烈能量释放事件,会辐射出大量带电高能粒子,影响地球电磁环境,严重时可造成大范围停电,威胁在轨卫星、空间站的安全。值得一提的是,中科院国家天文台的星语”大模型、中科院青藏高原研究所的全球首个水能粮大模型洛书”、中科院南海所的珊瑚礁多模态大模型瑶华”,都是基于阿里通义千问系列模型打造的。

  • 提升大模型自动修Bug能力 豆包正式开源首个多语言类SWE数据集

    今日,字节跳动豆包大模型团队宣布,正式开源首个多语言类SWE数据集Multi-SWE-bench,可用于评估和提升大模型自动修Bug”能力。在SWE-bench基础上,Multi-SWE-bench首次覆盖Python之外的7种主流编程语言,是真正面向全栈工程”的评测基准。相比于以往聚焦Python的单语言任务,Multi-SWE-bench更贴近现实中的多语言开发场景,也更能反映当前模型在自动化软件工程”方向上的实际能力边界。

  • 火山引擎即将发布深度思考模型

    据悉,字节跳动旗下云服务平台火山引擎即将发布豆包深度思考模型。有消息称,豆包APP和桌面端的“深度思考模式”已进行了多个实验版本的测试,而此次发布后,该模型将正式面向企业提供服务。目前,豆包大模型家族已覆盖全模态、全场景,包括大语言模型、语音大模型,以及图像、视频等视觉大模型,企业可以通过火山引擎使用豆包大模型API服务。IDC最新发布的《中�