首页 > 业界 > 关键词  > 大模型最新资讯  > 正文

开源大模型正在“杀死”闭源?

2023-10-07 13:39 · 稿源: ​光锥智能公众号

“OpenAI不足为惧,开源会慢慢赶上来。”彼时Hugging Face创始人Clem Delangue的一句预言,正在迅速成为现实。ChatGPT横空出世7个多月后,7月19日,Llama2宣布开源,并且可直接商用。如今回看,这一天也成为了大模型发展的分水岭。在此之前,全世界开源的大模型不计其数,可只是停

......

本文由站长之家合作伙伴自媒体作者“​光锥智能公众号”授权发布于站长之家平台,本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间,为了保证文章信息的及时性,内容观点的准确性,平台将不提供完全的内容展现,本页面内容仅为平台搜索索引使用。需阅读完整内容的用户,请查看原文,获取内容详情。

举报

  • 相关推荐
  • 大家在看
  • 全面超越LLaMA2,月下载量超三百万,国产开源大模型如何成为新晋顶流?

    图源备注:图片由AI生成,图片授权服务商Midjourney回想两个月前,LLaMA2的开源,曾以一己之力改变了大模型领域的竞争格局。相比于今年2月推出的第一代LLaMA,LLaMA2在推理、编码、精通性和知识测试等任务中都实现了性能的大幅提升,甚至可以在某些数据集上接近GPT-3.5。如何让大模型的能力与业务场景更好结合,同样是当下每一家大模型提供商的重点课题,也需要科技公司、学术机构和开发者共同创造。

  • 百川智能发布大模型Baichuan2-53B 并开放API

    百川智能发布了闭源大模型Baichuan2-53B,该模型全面升级了Baichuan1-53B的各项能力。Baichuan2-53B在数学和逻辑推理能力上表现出显著的提升,并且通过高质量数据体系和搜索增强的方法极大降低了模型幻觉,是目前国内幻觉问题最低的大模型。企业和开发者可以通过API将Baichuan2-53B集成到他们的应用程序和服务中。

  • 九章云极DataCanvas公司入选可信开源大模型产业推进方阵首批成员

    2023OSCAR开源产业大会在北京圆满落幕。由中国信息通信研究院发起的可信开源大模型产业推进方阵正式成立,九章云极DataCanvas公司凭借DataCanvasAlaya九章元识大模型强大的开源支持能力和灵活的AI应用能力成为首批成员单位,赋能开源大模型产业向上向阳发展。九章云极DataCanvas公司将继续坚持开源开放的初心理念,以自主创新的AI技术和前沿的大模型落地化经验赋能开源大模型的标准体系建设和规模化落地,为AI大模型开源生态的繁荣发展增添动力。

  • 姜子牙大模型开源代码大模型Ziya-Coding-34B-v1.0

    IDEA研究院封神榜团队最近开源了最新的代码大模型Ziya-Coding-34B-v1.0,该模型在HumanEvalPass@1的评测上取得了75.5的好成绩,超过了GPT-4的得分。此次开源的Ziya-Coding-34B-v1.0,基于CodeLLaMA34B的预训练模型,经过了两个阶段的有监督精调,支持多种与代码相关的任务,包括代码生成、代码解释、代码纠错以及单元测试的生成等。

  • 度小满“轩辕70B”金融大模型开源

    度小满推出全新的金融行业大模型“轩辕70B”,标志着金融大模型迈向新的高度。该模型在通用能力和专业金融领域表现出色,名列各项开源模型评测榜单前列,特别在中文任务评测和金融领域十大类权威考试方面提供专业支持。5.对话能力:XuanYuan-70B-Chat模型经过通用和金融指令微调,具备出色的对话生成能力,可以用于生成金融领域的文本摘要以及回答各种问题。

  • AI的大模型时代 ≠ 只有大模型的AI时代

    什么样的技术能经历时间洗礼还历久弥新?答案或许可以归总为一个“三部曲”般的规律——兴起、发展和大规模应用,外加这个过程再一次演进式的迭代。引领第一次工业革命的是蒸汽机,当它演进成为内燃机并开始普及时,第二次工业革命的颠覆者——电能本身以及与它相关的各种设备正处于初创期在电力设备走向微电子的迭代革新时,各种燃油引擎还在持续改良和普及中�

  • 上海AI实验室开源图文混合创作大模型浦语灵笔

    上海人工智能实验室近日推出了首个图文混合创作大模型书生·浦语灵笔,该模型能够根据用户提供的主题或图片,自动创作出图文并茂的文章,为大模型落地应用提供更多可能。浦语灵笔是基于书生·浦语大语言模型的多模态扩展,书生·浦语是上海AI实验室今年7月以来陆续开源的7B及20B版本的大语言模型,为业界提供了完整的大模型研发与应用基座,以及全链条工具体系。浦

  • 团队推出「生长策略」 解决大模型训练算力成本过高问题

    智源研究院联合中科院计算所、南洋理工大学、电子科技大学、哈尔滨工业大学的研究团队共同提出了一种「生长策略」,以解决大模型算力成本极高的问题。研究团队基于「生长策略」逐步构建了一个具有1010亿参数的FLM-101B大模型。实验结果显示,FLM-101B在这些评测任务上表现出了非常好的能力。

  • 百度发布医疗大模型“灵医大模型

    9月19日,百度正式发布国内首个“产业级”医疗大模型——灵医大模型。百度正式宣布面向大健康上下游产业开放灵医大模型测评、试用,推动医疗行业的数字化和智能化进程。在辅助诊疗方面,灵医大模型可实现通过多轮对话了解病人病情,实时辅助医生确诊疾病,推荐治疗方案,提升就诊全流程的效率和体验,并成为患者的24小时“健康管家”,提供智能客服服务。

  • 开源中英文语义向量模型训练数据集MTP

    智源研究院发布面向中英文语义向量模型训练的大规模文本对数据集MTP。这是全球最大的中、英文文本对训练数据集,数据规模达3亿对,希望推动解决中文模型训练数据集缺乏问题。作为中国大模型开源生态圈的代表机构,智源持续进行包括数据在内的大模型全栈技术开源,推动人工智能协同创新。

今日大家都在搜的词: