首页 > 业界 > 关键词  > 大模型最新资讯  > 正文

开源大模型正在“杀死”闭源?

2023-10-07 13:39 · 稿源: ​光锥智能公众号

“OpenAI不足为惧,开源会慢慢赶上来。”彼时Hugging Face创始人Clem Delangue的一句预言,正在迅速成为现实。ChatGPT横空出世7个多月后,7月19日,Llama2宣布开源,并且可直接商用。如今回看,这一天也成为了大模型发展的分水岭。在此之前,全世界开源的大模型不计其数,可只是停

......

本文由站长之家合作伙伴自媒体作者“​光锥智能公众号”授权发布于站长之家平台,本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间,为了保证文章信息的及时性,内容观点的准确性,平台将不提供完全的内容展现,本页面内容仅为平台搜索索引使用。需阅读完整内容的用户,请查看原文,获取内容详情。

举报

  • 相关推荐
  • 大家在看
  • 全面超越LLaMA2,月下载量超三百万,国产开源大模型如何成为新晋顶流?

    图源备注:图片由AI生成,图片授权服务商Midjourney回想两个月前,LLaMA2的开源,曾以一己之力改变了大模型领域的竞争格局。相比于今年2月推出的第一代LLaMA,LLaMA2在推理、编码、精通性和知识测试等任务中都实现了性能的大幅提升,甚至可以在某些数据集上接近GPT-3.5。如何让大模型的能力与业务场景更好结合,同样是当下每一家大模型提供商的重点课题,也需要科技公司、学术机构和开发者共同创造。

  • 百川智能发布大模型Baichuan2-53B 并开放API

    百川智能发布了闭源大模型Baichuan2-53B,该模型全面升级了Baichuan1-53B的各项能力。Baichuan2-53B在数学和逻辑推理能力上表现出显著的提升,并且通过高质量数据体系和搜索增强的方法极大降低了模型幻觉,是目前国内幻觉问题最低的大模型。企业和开发者可以通过API将Baichuan2-53B集成到他们的应用程序和服务中。

  • 九章云极DataCanvas公司入选可信开源大模型产业推进方阵首批成员

    2023OSCAR开源产业大会在北京圆满落幕。由中国信息通信研究院发起的可信开源大模型产业推进方阵正式成立,九章云极DataCanvas公司凭借DataCanvasAlaya九章元识大模型强大的开源支持能力和灵活的AI应用能力成为首批成员单位,赋能开源大模型产业向上向阳发展。九章云极DataCanvas公司将继续坚持开源开放的初心理念,以自主创新的AI技术和前沿的大模型落地化经验赋能开源大模型的标准体系建设和规模化落地,为AI大模型开源生态的繁荣发展增添动力。

  • 姜子牙大模型开源代码大模型Ziya-Coding-34B-v1.0

    IDEA研究院封神榜团队最近开源了最新的代码大模型Ziya-Coding-34B-v1.0,该模型在HumanEvalPass@1的评测上取得了75.5的好成绩,超过了GPT-4的得分。此次开源的Ziya-Coding-34B-v1.0,基于CodeLLaMA34B的预训练模型,经过了两个阶段的有监督精调,支持多种与代码相关的任务,包括代码生成、代码解释、代码纠错以及单元测试的生成等。

  • 度小满“轩辕70B”金融大模型开源

    度小满推出全新的金融行业大模型“轩辕70B”,标志着金融大模型迈向新的高度。该模型在通用能力和专业金融领域表现出色,名列各项开源模型评测榜单前列,特别在中文任务评测和金融领域十大类权威考试方面提供专业支持。5.对话能力:XuanYuan-70B-Chat模型经过通用和金融指令微调,具备出色的对话生成能力,可以用于生成金融领域的文本摘要以及回答各种问题。

  • AI的大模型时代 ≠ 只有大模型的AI时代

    什么样的技术能经历时间洗礼还历久弥新?答案或许可以归总为一个“三部曲”般的规律——兴起、发展和大规模应用,外加这个过程再一次演进式的迭代。引领第一次工业革命的是蒸汽机,当它演进成为内燃机并开始普及时,第二次工业革命的颠覆者——电能本身以及与它相关的各种设备正处于初创期在电力设备走向微电子的迭代革新时,各种燃油引擎还在持续改良和普及中�

  • 上海AI实验室开源图文混合创作大模型浦语灵笔

    上海人工智能实验室近日推出了首个图文混合创作大模型书生·浦语灵笔,该模型能够根据用户提供的主题或图片,自动创作出图文并茂的文章,为大模型落地应用提供更多可能。浦语灵笔是基于书生·浦语大语言模型的多模态扩展,书生·浦语是上海AI实验室今年7月以来陆续开源的7B及20B版本的大语言模型,为业界提供了完整的大模型研发与应用基座,以及全链条工具体系。浦

  • 团队推出「生长策略」 解决大模型训练算力成本过高问题

    智源研究院联合中科院计算所、南洋理工大学、电子科技大学、哈尔滨工业大学的研究团队共同提出了一种「生长策略」,以解决大模型算力成本极高的问题。研究团队基于「生长策略」逐步构建了一个具有1010亿参数的FLM-101B大模型。实验结果显示,FLM-101B在这些评测任务上表现出了非常好的能力。

  • 百度发布医疗大模型“灵医大模型

    9月19日,百度正式发布国内首个“产业级”医疗大模型——灵医大模型。百度正式宣布面向大健康上下游产业开放灵医大模型测评、试用,推动医疗行业的数字化和智能化进程。在辅助诊疗方面,灵医大模型可实现通过多轮对话了解病人病情,实时辅助医生确诊疾病,推荐治疗方案,提升就诊全流程的效率和体验,并成为患者的24小时“健康管家”,提供智能客服服务。

  • 开源中英文语义向量模型训练数据集MTP

    智源研究院发布面向中英文语义向量模型训练的大规模文本对数据集MTP。这是全球最大的中、英文文本对训练数据集,数据规模达3亿对,希望推动解决中文模型训练数据集缺乏问题。作为中国大模型开源生态圈的代表机构,智源持续进行包括数据在内的大模型全栈技术开源,推动人工智能协同创新。

  • Cadenza:智能音乐创作工具,一键生成专业和弦进行。

    Cadenza是一款AI驱动的音乐制作工具,它允许用户通过简单的描述来生成专业的MIDI和弦进行。该工具能够确保和弦流畅地转换,适用于各种音乐风格,从流行到爵士。Cadenza的主要优点包括用户友好的界面、实时生成和弦进行的能力以及与各种数字音频工作站(DAW)的兼容性。价格方面,Cadenza在促销期间以30美元的价格出售,这使得它对于音乐制作人来说是一个经济实惠的选择。

  • Florence-2-base-ft:先进的视觉基础模型,支持多种视觉和视觉-语言任务

    Florence-2是由微软开发的高级视觉基础模型,采用基于提示的方法处理广泛的视觉和视觉-语言任务。该模型能够解释简单的文本提示,执行诸如图像描述、目标检测和分割等任务。它利用FLD-5B数据集,包含54亿个注释,覆盖1.26亿张图像,精通多任务学习。其序列到序列的架构使其在零样本和微调设置中均表现出色,证明是一个有竞争力的视觉基础模型。

  • Tellers:将任何文本、文章或故事快速转化为视频

    Tellers是一个AI驱动的视频编辑平台,它允许用户将书面内容快速转化为视频,无需视频编辑专业知识。该平台通过使用机器学习和信号处理算法,为用户提供了一种创新和实用的方式来扩展内容的覆盖范围,提高SEO排名,触及新的社区,并提高内容的可访问性。Tellers还提供了商业版,支持企业整合和定制化服务,满足数据隐私和内部软件集成的需求。

  • MyTrainingPlan:个性化马拉松训练计划

    MyTrainingPlan是一个提供个性化马拉松和半程马拉松训练计划的网站。它通过AI技术根据用户在Strava上的活动历史和当前健康状况来创建定制的训练计划。用户可以轻松调整计划以适应变化,并与之前的训练周期进行比较,以保持动力。此外,网站还提供里程统计、配速计算器和比赛倒计时等工具,帮助用户更好地准备比赛。

  • Licode:无需编码,快速构建AI驱动的网页应用

    Licode是一个无代码平台,为构建者、企业和创业者提供了一个原生由AI驱动的网页应用创建环境。它允许用户无需编码即可轻松构建SaaS、门户、仪表板、CRM、聊天应用和表单应用。Licode内置了AI功能,用户可以随时随地在应用中启用AI提示,赋予用户即开即用的AI能力。此外,Licode还提供了预构建的UI组件、内置的认证和用户管理系统、与Stripe集成的账单管理、安全的数据库存储以及自定义业务逻辑的动作创建功能。

  • SEOJuice:AI驱动的内部链接工具,简化SEO工作

    SEOJuice是一个AI驱动的内部链接工具,旨在简化SEO工作,通过自动化创建内部链接,帮助网站提升在搜索引擎中的排名。由Vadim个人开发,以解决手动添加内部链接的繁琐和耗时问题。SEOJuice通过AI扫描网站内容,找到合适的上下文链接和关键词,并自动添加,从而提升整个网站的SEO性能。作为一个自筹资金、独立运营的项目,SEOJuice不依赖外部投资,以用户订阅费用为运营资金。

  • Florence-2-large-ft:先进的视觉基础模型,支持多种视觉和视觉-语言任务。

    Florence-2-large-ft是由微软开发的高级视觉基础模型,使用基于提示的方法来处理广泛的视觉和视觉-语言任务。该模型能够通过简单的文本提示执行诸如图像描述、目标检测和分割等任务。它利用FLD-5B数据集,包含54亿个注释,覆盖1.26亿张图像,实现多任务学习。模型的序列到序列架构使其在零样本和微调设置中均表现出色,证明其为有竞争力的视觉基础模型。

  • 豆包 MarsCode:智能开发工具,一触即发

    豆包 MarsCode 是一款即将发布的智能开发工具,旨在通过AI技术激发开发者的创造力。它将为编程工作带来革命性的改变,提高开发效率,降低技术门槛。

  • Florence-2-base:先进的视觉基础模型,支持多种视觉和视觉-语言任务。

    Florence-2是由微软开发的高级视觉基础模型,采用基于提示的方法处理广泛的视觉和视觉-语言任务。该模型能够解释简单的文本提示,执行如描述、目标检测和分割等任务。它利用包含54亿个注释的5.4亿张图像的FLD-5B数据集,精通多任务学习。模型的序列到序列架构使其在零样本和微调设置中都表现出色,证明其为有竞争力的视觉基础模型。

  • Florence-2-large:先进的视觉基础模型,支持多种视觉和视觉-语言任务

    Florence-2-large是由微软开发的先进视觉基础模型,采用基于提示的方法处理广泛的视觉和视觉-语言任务。该模型能够解释简单的文本提示来执行如图像描述、目标检测和分割等任务。它利用包含54亿注释的5.4亿图像的FLD-5B数据集,精通多任务学习。其序列到序列的架构使其在零样本和微调设置中均表现出色,证明是一个有竞争力的视觉基础模型。

  • Multi:多人协作,提升软件开发效率

    Multi是一款专为软件开发团队设计的协作工具,它通过多人协作、共享控制、即时通讯和自动记录等功能,帮助团队成员更高效地沟通和工作。产品基于Zoom的高质量音视频基础设施,提供低延迟的共享控制体验,并通过AI技术自动生成会议摘要和行动项,进一步加速团队的软件开发流程。

  • 智能编码助手通义灵码:智能编码助手,提升开发效率

    通义灵码是一款专为开发者设计的智能编码助手,支持多种开发环境,包括JetBrains IDEs、Visual Studio Code、Visual Studio等。它通过集成先进的AI技术,帮助开发者快速完成编码任务,提高编码效率和质量,适用于各种编程语言和开发场景。

  • MOFA-Video:通过生成运动场适应实现单图像动画化

    MOFA-Video是一种能够将单张图片通过各种控制信号动画化的方法。它采用了稀疏到密集(S2D)运动生成和基于流的运动适应技术,可以有效地使用轨迹、关键点序列及其组合等不同类型的控制信号来动画化单张图片。在训练阶段,通过稀疏运动采样生成稀疏控制信号,然后训练不同的MOFA-Adapters来通过预训练的SVD生成视频。在推理阶段,不同的MOFA-Adapters可以组合起来共同控制冻结的SVD。

  • Duix:AI数字人智能交互平台

    DUIX是一个开源的AI数字人智能交互平台,由硅基智能打造。它允许开发者接入多种大模型和语音能力,实现数字人实时交互,并支持在Android和iOS多终端一键部署。DUIX适用于多种场景,包括地铁、银行、政务等,具有低成本快速部署、小网络依赖和功能多样化的特点。

  • SuperSonic:下一代BI平台,融合Chat BI和Headless BI。

    SuperSonic是一个集成了由大型语言模型(LLM)驱动的Chat BI和由语义层驱动的Headless BI的下一代商业智能(BI)平台。它确保Chat BI能够访问与传统BI相同的经过策划和治理的语义数据模型。此外,这两种范式的实现都从集成中受益:Chat BI的Text2SQL通过从语义模型中检索上下文得到增强;Headless BI的查询接口通过自然语言API得到扩展。SuperSonic提供了一个Chat BI界面,使用户能够使用自然语言查询数据,并以适当的图表可视化结果。要实现这种体验,唯一需要的就是通过Headless BI接口构建逻辑语义模型(定义指标/维度/标签及其含义和关系)。同时,SuperSonic被设计为可扩展和可组合的,允许使用Java SPI添加和配置自定义实现。

  • DB-GPT:AI原生数据应用开发框架

    DB-GPT是一个开源的AI原生数据应用开发框架,利用AWEL(Agentic Workflow Expression Language)和代理(agent)技术,简化了大型模型应用与数据的结合。它通过多模型管理、Text2SQL效果优化、RAG框架优化、多代理框架协作等技术能力,使企业和开发者能够以更少的代码构建定制化应用。DB-GPT在数据3.0时代,基于模型和数据库,为构建企业级报告分析和业务洞察提供了基础数据智能技术。

  • OpenAgents:一个开放平台,用于日常使用的语言代理。

    OpenAgents是一个开放平台,旨在使用户和开发者能够在日常生活中使用和托管语言代理。该平台已经实现了三种代理:数据分析的Data Agent、集成200+日常工具的Plugins Agent和自动网页浏览的Web Agent。OpenAgents通过优化的Web UI使普通用户能够与代理功能进行交互,同时为开发者和研究人员提供在本地设置上的无缝部署体验,为创新语言代理的构建和现实世界评估提供了基础。

  • ChattyUI:你的私人AI聊天工具,运行在浏览器中。

    Chatty是一个利用WebGPU技术在浏览器中本地且私密地运行大型语言模型(LLMs)的私人AI聊天工具。它提供了丰富的浏览器内AI体验,包括本地数据处理、离线使用、聊天历史管理、支持开源模型、响应式设计、直观UI、Markdown和代码高亮显示、文件聊天、自定义内存支持、导出聊天记录、语音输入支持、重新生成响应以及明暗模式切换等功能。

  • AsyncDiff:异步去噪并行化扩散模型

    AsyncDiff 是一种用于并行化扩散模型的异步去噪加速方案,它通过将噪声预测模型分割成多个组件并分配到不同的设备上,实现了模型的并行处理。这种方法显著减少了推理延迟,同时对生成质量的影响很小。AsyncDiff 支持多种扩散模型,包括 Stable Diffusion 2.1、Stable Diffusion 1.5、Stable Diffusion x4 Upscaler、Stable Diffusion XL 1.0、ControlNet、Stable Video Diffusion 和 AnimateDiff。

  • MacAIverse:macOS风格的开源React桌面环境

    MacAIverse是一个完全由AI生成代码,使用React构建的macOS风格的开源桌面环境。该项目由Claude AI助手初始创建,现在开放给其他Claude实例或其他开发者贡献新的应用。它遵循macOS设计原则,保持与整体桌面环境的一致性,并通过Tailwind CSS和framer-motion库实现流畅的动画和响应式布局。

今日大家都在搜的词: