首页 > 业界 > 关键词  > 正文

姜子牙大模型开源代码大模型Ziya-Coding-34B-v1.0

2023-09-28 16:13 · 稿源:站长之家

站长之家(ChinaZ.com) 9月28日 消息:IDEA 研究院封神榜团队最近开源了最新的代码大模型 Ziya-Coding-34B-v1.0,该模型在 HumanEval Pass@1的评测上取得了75.5的好成绩,超过了 GPT-4的得分。

微信截图_20230928161500.png

此次开源的Ziya-Coding-34B-v1.0,基于Code LLaMA34B的预训练模型,经过了两个阶段的有监督精调,支持多种与代码相关的任务,包括代码生成、代码解释、代码纠错以及单元测试的生成等。

项目地址:

ModelScope地址:https://modelscope.cn/models/Fengshenbang/Ziya-Coding-34B-v1.0

Huggingface地址:https://huggingface.co/IDEA-CCNL/Ziya-Coding-34B-v1.0

举报

  • 相关推荐
  • 大家在看
  • 蚂蚁集团开源代码大模型CodeFuse-CodeLlama-34B 4bits量化版本

    蚂蚁集团代码大模型CodeFuse-CodeLlama-34B4bits量化版本发布。CodeFuse-CodeLlama-34B-4bits是CodeFuse-CodeLlama-34B模型的4bits量化版本,后者是通过QLoRA对基座模型CodeLlama-34b-Python进行多代码任务微调得到的代码大模型,模型输入长度为4K。CodeFuse是蚂蚁自研的代码生成专属大模型,根据开发者的输入提供智能建议和实时支持,帮助开发者自动生成代码、自动增加注释,自动生成测试用例,修复和优化代码等,以提升研发效率。

  • 智源研究院开源中英双语大模型悟道·天鹰340亿Aquila2-34B

    智源研究院发布了最强开源中英双语大模型——悟道・天鹰340亿。这个新模型在推理、泛化等方面表现出色,在智能体、代码生成、文献检索等场景方面取得了一系列成绩。智源研究院还发布了FlagScale高效并行训练框架和FlagAttention高性能Attention算子集,进一步推动大模型研究的发展。

  • 开源大模型正在“杀死”闭源?

    “OpenAI不足为惧,开源会慢慢赶上来。”彼时HuggingFace创始人ClemDelangue的一句预言,正在迅速成为现实。这也足以说明,开源还是闭源,或许只是阶段和位置的不同,但可以肯定的是,大模型时代,已经加速进入下一赛段。

  • 阿里魔搭社区开源知识检索模型Ziya-Reader

    阿里魔搭社区宣布开源Ziya-Reader。Ziya-Reader是一个针对知识检索的开源模型。除了Ziya-Reader,团队还自建了向量检索模型,并测试了整个搜索系统流水线的效果,结果超越了OpenAI。

  • 开源标杆!最强中英双语大模型来了,340亿参数,超越 Llama2-70B等所有开源模型

    开源界最强的中英双语大模型,悟道·天鹰34B,来了!有多强?一言蔽之:不仅模型够大够能打还一口气送上整套“全家桶”级豪华周边。能有如此大手笔的,正是中国大模型开源派先锋——智源研究院。Aquila2模型全系开源地址:https://github.com/FlagAI-Open/Aquila2https://model.baai.ac.cn/https://huggingface.co/BAAIAquilaSQL开源仓库地址:https://github.com/FlagAI-Open/FlagAI/tree/master/examples/Aquila/Aquila-sqlFlagAttenti

  • AI的大模型时代 ≠ 只有大模型的AI时代

    什么样的技术能经历时间洗礼还历久弥新?答案或许可以归总为一个“三部曲”般的规律——兴起、发展和大规模应用,外加这个过程再一次演进式的迭代。引领第一次工业革命的是蒸汽机,当它演进成为内燃机并开始普及时,第二次工业革命的颠覆者——电能本身以及与它相关的各种设备正处于初创期在电力设备走向微电子的迭代革新时,各种燃油引擎还在持续改良和普及中�

  • 度小满“轩辕70B”金融大模型开源

    度小满推出全新的金融行业大模型“轩辕70B”,标志着金融大模型迈向新的高度。该模型在通用能力和专业金融领域表现出色,名列各项开源模型评测榜单前列,特别在中文任务评测和金融领域十大类权威考试方面提供专业支持。5.对话能力:XuanYuan-70B-Chat模型经过通用和金融指令微调,具备出色的对话生成能力,可以用于生成金融领域的文本摘要以及回答各种问题。

  • 百度发布医疗大模型“灵医大模型

    9月19日,百度正式发布国内首个“产业级”医疗大模型——灵医大模型。百度正式宣布面向大健康上下游产业开放灵医大模型测评、试用,推动医疗行业的数字化和智能化进程。在辅助诊疗方面,灵医大模型可实现通过多轮对话了解病人病情,实时辅助医生确诊疾病,推荐治疗方案,提升就诊全流程的效率和体验,并成为患者的24小时“健康管家”,提供智能客服服务。

  • To C大模型,亏钱也得干

    大模型的两条落地方向,虽南辕北辙但境遇相似。被寄予商业化落地厚望的是确定性较强的toB方向,只是目前看来还还击不穿成本的隔膜,定制化叙事背后的高人力、高资金成本阻碍业务向下普及,增量缓慢。刚刚彻底开放的大模型赛道迎来了智能助手这一赛点,其成熟与爆发很可能是新一轮的行业洗牌潮。

  • 周鸿祎:大模型自身不是壁垒,挑战在于垂直大模型深度定制

    “‘360智脑’在部分场景的表现已接近国际先进水平”,9月17日,由南京市人民政府、中国信息通信研究院联合主办,南京经济技术开发区管委会、中国人工智能产业发展联盟共同承办的2023南京人工智能产业发展大会将在宁召开。三六零集团创始人周鸿祎以“垂直大模型引领新工业革命”为题发表主题演讲。在解决大模型安全,将大模型关进笼子之前,这只是人类美好的愿望是要让人保持在决策回路上。

今日大家都在搜的词: