首页 > 业界 > 关键词  > 正文

潞晨科技旗下Colossal-AI开源650亿参数大模型预训练方案

2023-07-20 10:10 · 稿源:站长之家

站长之家(ChinaZ.com)7月20日 消息:AI创业公司潞晨科技宣布,旗下Colossal-AI 首个开源了650亿参数 LLaMA 低成本预训练方案。

据介绍,相比业界其他主流选择,该预训练方案可提升预训练速度38%,仅需32张 A100/A800即可使用,并且不限制商业使用。

微信截图_20230720101044.png

开源地址:https://github.com/hpcaitech/ColossalAI

举报

  • 相关推荐
  • 鲁大师2025年手机半年报:ColorOS蝉联流畅霸主,小米玄戒杀入性能前五

    2025年上半年手机市场迎来旗舰芯片大战:骁龙8至尊版领衔版与天玑9400+旗舰芯片成为主流,红魔10S Pro+凭借超频至4.47GHz的骁龙8至尊版和液金散热技术,以1912990分登顶性能榜。系统流畅度方面,ColorOS15以226.76分连续四季夺冠,OriginOS紧随其后。AI性能榜被搭载骁龙8至尊版的机型包揽,vivo X200 Ultra凭借蓝心大模型以276423分居首。芯片榜中骁龙8至尊版以1295851分封王,小米玄戒O1采用台积电N3E工艺,以四丛集十核架构杀入前五,成为最大黑马。随着第二代骁龙8至尊版和天玑9500即将量产,下半年旗舰之争将重塑行业格局。

  • 「6月30日AI日报」百度开源文心大模型4.5系列;通义千问发布多模态生成模型Qwen VLo

    AI日报精选:1)百度开源文心大模型4.5系列,含10款新模型,性能优异;2)通义千问发布多模态模型Qwen-VL,支持图文交互;3)阿里开源3亿参数多模态模型Ovis-U1;4)华为开源盘古7B稠密和72B混合专家模型;5)美图MOKI推出AI创意广告功能,一键生成专业视频;6)谷歌Gemini 2.5 Pro API重新免费开放;7)豆瓣上线"深入研究"AI功能;8)小米"AI百宝箱"结束内测;9)北京智研院开源多模态系统OmniGen2;10)知乎升级"直答"知识库功能。

  • @开发者们:百度文心大模型4.5系列模型开源,国内首发平台GitCode现已开放下载!

    6月30日,百度文心大模型4.5系列正式开源并在国内领先的开源平台GitCode首发上线。该系列包含10款模型,涵盖47B和3B参数的混合专家(MoE)模型及0.3B的稠密参数模型,采用创新的多模态异架构结构实现跨模态知识融合。模型基于飞桨框架开发,训练效率达47% MFU,在文本和多模态基准测试中达到SOTA水平。所有模型按Apache2.0协议开源,配套产业级开发套件支持多种芯片部署。GitCode平台已汇聚620万用户,为AI开发者提供代码托管、协同开发等全流程支持。此次开源将推动中国AI生态创新,加速大模型技术产业化应用。

  • 美团:2024年月均有单骑手336万 高频月收入在6650至9344元

    今日,美团发布2024年ESG报告(企业社会责任报告)。 全面呈现过去一年美团在促进就业、助力商家、保障骑手、绿色发展、服务社会等多方面的社会责任实践。 其中在个体发展篇中提到。 在骑手保障骑手权益方面,美团2024年平台月均有单骑手336万。 其中,美团全国范围内高频骑手的月均收入在6650元至9344元之间。 截至2024年底,共有150多个城市的超1.6万个社区加入骑手�

  • 贝索斯抛售亚马逊股票 套现超50亿元:为年内首度减持

    近日,亚马逊创始人杰夫·贝索斯(Jeff Bezos)的股票操作引发资本市场高度关注。据最新监管文件披露,贝索斯于近期抛售330万股亚马逊公司股票,套现约7.367亿美元(约合人民币52.78亿元),这是其2024年首次大规模减持公司股份。 此次交易正值亚马逊市值突破2万亿美元关口之际。数据显示,截至7月4日,亚马逊股价报197美元,总市值达2.056万亿美元。然而,贝索斯的减持计划导

  • “晓妙”产业大模型——AI驱动的产业变革

    7月4日,安徽数智建材研究院在长城工程科技会议上发布"晓秒"产业大模型。该模型由傲林科技投资支持,采用"1+1+N"架构,融合数据、机理和业务模型,实现生产运营全流程实时闭环优化。中国建材集团董事长周育先表示,该模型已在水泥板块试点应用,吨水泥成本降低1%以上,能耗电耗下降2%以上。会议指出,AI落地制造业需突破三大关键:建立数字化体系、夯实数据基础、实现工艺与数据融合。未来将拓展至新能源、钢铁等十余个行业,推动产业智能化升级。

  • AI日报:xAI 震撼发布Grok4;微软开源全新Phi-4-mini版本;上海累计82款大模型通过备案

    AI日报栏目聚焦人工智能领域最新动态:1)xAI发布旗舰模型Grok4,在数学推理和代码生成表现突出,同时推出开发者专用Grok4Code;2)微软开源Phi-4-mini模型,推理效率提升10倍,适合边缘设备;3)上海82款大模型完成备案,垂直领域应用取得突破;4)Hugging Face推出开源桌面机器人Reachy Mini,支持Python编程;5)Perplexity发布AI浏览器Comet挑战Chrome;6)OpenAI将首次发布开放权重模型,打破闭源惯例;7)谷歌医疗AI模型MedGemma系列上新,单个GPU即可运行;8)OpenAI以约65亿美元收购AI硬件公司io Products,正式进军硬件市场。

  • 全球优质AI语音大模型盘点:Whisper、Gemini Speech

    本文分析了当前主流AI语音大模型的核心优势与应用场景。全球顶尖模型包括:OpenAI Whisper(多语言识别与翻译)、Google Gemini(情感化语音生成)、Meta AudioCraft(音乐创作与风格转换)。国内讯飞星火(方言识别)、阿里通义(电商客服)、百度文心(车载场景)表现突出。技术突破点在于云端协同架构、零样本克隆和情感语音合成。选择模型需考虑语言支持、场景适配、部署

  • 国内有哪些ai大模型?一文看懂中国核心AI大模型全景

    近两年中国AI大模型发展迅猛,已形成"通用+行业"双轨并进的生态格局。百度文心一言、阿里通义千问等通用大模型在中文理解、多模态生成等方面表现突出;深度求索DeepSeek以1/10参数实现GPT-4级推理能力;月之暗面Kimi以20万汉字上下文窗口领跑长文本处理;智谱AI的GLM-4成为首个支持视频对话的国产千亿模型。医疗、金融等垂直领域涌现出百川智能等专业模型,覆盖超1000家医院。开源生态加速国产芯片适配,15家厂商完成深度优化。行业应用方面,工程文档效率提升60%,24小时拟人化客服等案例凸显价值。未来趋势呈现模型蒸馏、端侧部署和开源生态三大方向,中国AI正从实验室走向产业变革前沿。

  • 微云全息(NASDAQ: HOLO)引领加密货币预测新纪元:HNFCS技术揭秘

    微云全息(NASDAQ:HOLO)开发了混合神经模糊控制系统(HNFCS),结合神经网络学习能力和模糊逻辑灵活性,能有效预测比特币等加密货币价格波动。该系统通过处理海量市场数据,动态调整预测模型,克服了传统方法在样本外预测和超时预测准确性方面的局限。HNFCS技术优势在于其自适应性和实时性,可扩展应用于多种金融场景,为投资者提供精准决策支持,有望成为加密货币市场的重要分析工具。