首页 > 传媒 > 关键词  > 智源大会最新资讯  > 正文

智源发布悟道3.0,天数智芯从底层赋能大模型发展

2023-06-10 17:06 · 稿源: 站长之家用户

     6月9-10日,由北京智源人工智能研究院举办的2023智源大会正式召开。与会期间,智源发布了完整的悟道3.0大模型系列,标志着大模型进入到了全面开源的新阶段。此次悟道3.0包含首 个支持中英双语知识、开源商用许可的“悟道·天鹰(Aquila)”语言大模型系列,提供“能力-任务-指标”三维评测框架的“天秤(FlagEval)”大模型评测体系,力求打造大模型时代“新Linux”生态的FlagOpen大模型开源技术体系,以及6项“悟道·视界”视觉大模型研究成果。

       一年一度的智源大会是国际人工智能生态发展的标志性活动,全球人工智能精英汇聚一堂,用最前沿的成果、最广阔的国际视野进行思想碰撞。大模型成为主角的背后,是此前ChatGPT掀起全球技术革命和商业浪潮的必然结果。如今,伴随着大模型的快速崛起及广泛应用,底层算力的支撑作用愈发凸显。潮流之下,国内领先的AI硬件公司天数智芯与此次智源大会有多方面的深度合作。

       在技术推动层面,基于天数智芯天垓100加速卡的算力集群,仅用19天便成功完成北京智源人工智能研究院70亿参数大模型全量训练,收敛效果与英伟达A100集群相当。天数智芯从硬件、软件两个角度推动战略升级,打造高性价比、广通用性的全栈式集群解决方案,为大模型时代提供强大算力底座。

       天数智芯的通用GPU产品天垓、智铠系列具有自主可控、高性能、通用性、灵活性等特点,广泛支持PyTorch、TensorFlow、PaddlePaddle 等各种原生框架,支撑了200余种人工智能算法模型稳定运行。在此基础上,天数智芯自主研发了IXCCL分布式通信技术,显著提升多机多卡高速互联性能,打造基于自主通用GPU的算力集群方案,持续优化自动混精训练、流水线并行、张量并行、数据并行以及模型并行等并行加速策略,让大模型训练、推理变得更加有效。

       大模型应用的海量爆发,天数智芯以持续的研发和技术升级,支撑算力成规模增长的需求。用国际领先的高性能通用GPU产品,不断升级算力解决方案,适配支持更多参数量、更大数据集、更复杂算法的大模型。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 中文大模型忠实性幻觉评测:豆包大模型幻觉率仅4%,位居全球收之首

    SuperCLUE+最新评测显示,豆包大模型1.5Pro以仅4%的幻觉率和96%的准确率位居全球榜首,超越DeepSeek、Gemini-2.5-pro和GPT-4o等主流模型。该模型在文本摘要、多文本问答等关键任务中表现优异,尤其在中文理解任务上国内领先。基于MoE架构设计,其综合性能超过多款超大规模预训练模型,推理成本显著降低。截至2025年3月,豆包大模型日均调用量达12.7万亿tokens,是一年前的106倍。IDC报告指出火山引擎以46.4%市场份额领跑中国公有云大模型市场。据悉,6月11日将发布豆包大模型最新升级进展。

  • AI大模型客服赋能电商企业,轻松应对618流量高峰

    618大促期间,电商客服系统面临三大挑战:咨询量暴增300%、多渠道服务协同难、服务质量保障压力大。智能联络中心通过五大核心能力应对:1)AI智能分流处理80%常见咨询;2)语音识别+情感分析实现多模态交互;3)人机协同提升座席效率300%;4)全渠道数据整合实现服务无缝衔接;5)弹性云架构支持每秒10万级并发。以米糠云为代表的解决方案已帮助电商企业实现客服响应速度提升5倍,人力成本降低40%,客户满意度达98%,在物流、医疗等多行业落地验证。AI大模型的应用使企业在流量高峰中保持服务稳定性与用户体验的平衡。

  • AI日报:豆包大模型1.6发布;OpenAI推o3-pro模型、o3价格暴降80%;Figma官方MCP重磅上线

    【AI日报】今日AI领域重要动态:1)火山引擎发布豆包大模型1.6和视频生成模型Seedance1.0pro,性能显著提升;2)OpenAI推出o3-pro模型,专注可靠性但响应较慢;3)Figma推出Dev Mode MCP服务,实现设计到代码一键转换;4)Krea AI发布图像生成模型Krea1,解决传统AI绘图问题;5)火山引擎豆包日调用量突破16.4万亿次;6)法国Mistral发布推理模型Magistral;7)苹果系统整合ChatGPT图像生成功能;8)OpenAI大幅下调o3价格80%并推出o3-pro;9)Hugging Face开源榜单显示中国团队Qwen与DeepSeek进入全球前15;10)阿里开源MaskSearch框架,提升AI解决复杂问题能力。

  • 一场文心大模型的「AI马拉松」

    对于百度而言,既要保持长期主义的战略定力,也要在技术路径上灵活应变,这种「变与不变」的平衡或许正是其在这轮科技革命中的制胜之道。 2025年,模型能力的重要性依然无需多言。 从预训练的角度来看,虽然连 OpenAI 前首席科学家 Ilya Sutskever 都说,预训练数据即将用尽,但海量的图像、视频等多模态数据资源依然有待挖掘。 从后训练的角度来看,强化学习新范式正�

  • 加速产业智能化发展 每日互动“可信数据空间+可控大模型”数享会成功召开

    5 月 17 日,“瓯江论数数安未来” 2025 数据安全发展大会在温州开幕,行业大咖、专家学者、企业精英相聚瓯江之畔,共商数据要素市场化配置改革的“温州实践”,共绘数据安全与价值释放的“中国方案”。作为中国(温州)数安港“九个一”基本架构之一,本次数据安全发展大会旨在深入剖析数据产业发展新趋势、新挑战、新机遇,挖掘数据在数字经济时代的潜在价值,�

  • AI日报:通义千问开源Qwen3向量模型;字节跳动图像编辑模型SeedEdit 3.0;ElevenLabs推v3语音模型

    本文汇总了近期AI领域的重要动态:1)通义千问发布Qwen3-Embedding系列模型,在多语言文本处理表现优异;2)字节跳动推出图像编辑模型SeedEdit3.0,提升细节保持能力;3)ElevenLabs发布情感语音合成系统Eleven v3 Alpha;4)Anthropic推出面向国家安全的Claude Gov模型;5)可灵AI月收入连续两月超1亿元;6)Meta公布智能眼镜Aria Gen2技术细节;7)爱诗科技上线AI视频工具"拍我AI";8)富国银行预测2030年ChatGPT广告收入将达千亿美元。

  • 大模型时代:内容产业智变新浪潮

    腾讯研究院院长司晓在第15届中国(深圳)国际文化产业博览交易会上发表演讲,指出大模型技术正推动文化内容生产从"专业主导"转向"全民共创"。大模型已从工具赋能升级为生态重构,显著提升内容生产效率和质量,如腾讯混元模型支持实时图像生成与调整。AI技术加速影视、音乐等内容创作,如上海民族乐团与腾讯音乐合作的AI音乐会《零·壹 | 中国色》。同时,大模型在理解与交互能力上取得突破,如GPT-4o能准确识别物体细节。腾讯通过"探元计划"推动科技与文化融合,如"云游敦煌"等项目。未来,AI将实现"智力即服务",大幅提升创作效率和质量,推动文化内容产业进入"千人千面"新时代。

  • 中国石油发布3000亿参数昆仑大模型:华为、中国移动、科大讯飞联合打造

    日前,中国石油发布3000亿参数昆仑大模型,标志着中国石油在人工智能领域迈出关键一步。 据了解,昆仑大模型由中国石油、中国移动、华为、科大讯飞联合打造,2024年8月完成备案,成为中国能源化工行业首个通过备案的大模型。 去年8月28日,330亿参数昆仑大模型发布,11月28日又发布700亿参数昆仑大模型。

  • 东风汽车奕派007接入豆包大模型

    东风汽车旗下电动品牌奕派推出2025款奕派007,全面接入豆包大模型,实现三大智能化创新:1)毫秒级响应的全场景语音交互,支持10个高频指令同时处理;2)"情绪管家"模式可主动提供娱乐内容调节驾乘情绪;3)结合AIGC技术实现旅途画面一键艺术化创作分享。该车型通过智能决策能力和个性化服务重构人车关系,定位为Z世代"AI搭子"。未来将与火山引擎合作探索更多智能出行场景,构建差异化竞争力。

  • 对话智源研究院王仲远:做具身智能的“安卓系统”,而非专用的“iOS”

    大模型的发展正在遭遇瓶颈。随着互联网文本数据被大规模消耗,基于数字世界训练的AI模型性能提升速度明显放缓。与此同时,物理世界中蕴藏着数字世界数百倍甚至千倍的多模态数据,这些数据远未被有效利用,成为AI发展的下一个重要方向。 在2025北京智源大会上,智源研究院发布了“悟界”系列大模型,试图推动AI从数字世界迈向物理世界,实现所谓的物理AGI。这一系�