首页 > 传媒 > 关键词  > 人工智能最新资讯  > 正文

对话aiXcoder总裁刘德欣:智能化软件开发2.0时代,企业如何落地领域化大模型

2024-08-16 10:39 · 稿源: 站长之家用户

科技日新月异的今天,以大模型、Agent等为代表的人工智能技术正引领各行各业的深刻变革。软件开发领域,一场由AI驱动的产业智能化升级快速演变,进入智能化软件开发2.0时代。

近日,我们采访了硅心科技(以下简称:aiXcoder)总裁刘德欣,主要围绕企业如何落地领域化大模型,如何更好地拥抱智能化软件开发2.0时代等话题进行深入探讨。以下内容根据采访实录整理。

请刘总简单介绍下智能化软件开发1.0时代及其发展现状?

智能化软件开发1.0时代可以说是通过引入大模型技术,集中实现了软件开发的一些初级自动化场景,包括代码生成、代码补全、单元测试生成和缺陷检测等。系统也支持简单的需求捕获和拆分等任务。但是,这些功能通常是以独立的方式执行,不能深入理解和应用企业特定的业务逻辑。

目前国内外的玩家主要有GitHub的Cop ilot、Amazon的CodeWhisperer、百度的comate 、阿里的通义灵码、甚至包括我们aiXcoder的上一代产品等。各家产品在功能和能力上差异并不大,缺乏明显的差异化。尽管产品在宣传中,强调了具有更强的上下文理解能力和更大的参数量,甚至与GPT-3.5等模型进行比较占据优势,但实际上并没有真正解决大模型与企业领域知识融合这一核心问题,使得它们无法满足企业基于自身的业务落地大模型的需求,简单来讲,觉得大模型学不会自己企业的领域知识,幻觉和生成结果不确定性严重;而这种孤立性和对业务逻辑的理解不足,也导致了其产品对软件开发复杂需求的处理浮于表面,实际上代码输出的准确性和实用性往往会大打折扣,限制了其在实际企业业务环境中的应用效果和用户的信任度。

您认为智能化软件开发1.0时代具体存在的问题有哪些?

智能化软件开发1.0存在的问题主要问题是不进行有效个性化训练而直接落地大模型,这会直接产生两大缺陷:应用模式缺陷和技术缺陷。

首先,从应用模式来看,主要缺陷表现在两个方面。

首先,在训练层面,缺乏对业务原始需求与设计的考量。1.0时代的产品往往只关注代码本身的语法和结构,忽略了代码必须服务于具体的业务需求和逻辑,所以并没有将需求分析和设计文档等企业背景知识融合进模型的训练中,导致生成/补全的代码往往缺乏业务逻辑,从而使产品的准确性和可用性不足。

第二,在测试层面,无法形成需求到测试的闭环。测试自动化在1.0时代通常只基于现有代码进行,忽略了测试的本质是验证需求的完整性和正确性,没能深入到需求层面,而是仅依赖于代码级的表面生成,没有实现对原始需求的全面交互和验证。

其次,从技术缺陷来看,主要表现在三个方面。

一是环境依赖信息的缺失,现在的大模型训练主要是在开源代码及企业代码上的训练,这种脱离企业背景知识,仅对代码训练的方式,依然缺乏足够的项目上下文支持,这导致生成的代码虽然在语法上正确,但经常与项目的实际业务需求不符。虽然各大模型厂商都在上下文长度上努力,但并不会从根源上解决这一技术缺陷。

二是当前的智能化开发辅助主要依赖于大模型的语言能力,通过模式匹配和简单的Prompt指令生成代码。然而,这种方法仅停留在表层语言模型的使用上,无法深入理解复杂的业务逻辑和编程规范,导致大模型在实际应用中的表现不尽如人意,影响了结果的有效性和可靠性,尤其是生成内容的可靠性仍然存在较大问题。

三是微调方法的局限性,尽管在1.0时代我们采用了全参微调(Fine Tuning)、以及LoRa、Adapter、Prompt等PEFT有效参数微调(部分参数微调)方式,甚至尝试使用RAG和MoE等方法让大模型学习特定领域知识,但这些常规微调技术和方法仍存在局限性。尽管它们在某些特定任务中表现出一定的效果,但由于没有充分训练企业领域的专有数据和背景知识,这些方法在真实业务应用中的表现往往难以达到预期,无法完全满足实际业务的需求。

从客户角度来看,我们发现很多大模型在通用的场景或者主流的测评集上表现都不错,声称也能达到30%到50%的准确率。但是一旦拿到企业中去应用,通常发现准确率下降到了10%以下。即使用各种方式做微调,效果也不尽如人意。对于企业而言,技术团队和商务团队尽力引入并上线了智能软件开发产品,也进行了相应的微调,但如果最终结果无法达到预期,可能会引发内部大量用户和软件开发人员的投诉,带来巨大的风险。综合来看,真实企业软件开发场景是非常复杂的,具有很强的业务逻辑、拥有明确的编码规范和独特的代码风格,在多阶段的复杂开发流程中更是涉及多角色、多工具、多团队的共同协作参与。尽管智能化软件开发1.0时代提供了一定的软件自动化支持,但其并没有真正解决企业领域知识问题,也没有充分考虑真实开发场景的复杂需求。所以基于这样一个背景,aiXcoder率先提出了软件开发2.0时代的概念,并已成功在多家大型企业中落地实施。通过这一模式,企业才能真正抓住并充分利用大模型所带来的技术红利。

aiXcoder如何定义智能化软件开发2.0时代的?

智能化软件开发2.0时代:首先通过严格的数据治理和链式管理,对企业的特定领域知识进行全面的结构化处理,确保从需求定义、设计、编码到最终代码提交的每个环节都得到准确记录和系统关联。在此基础上,进行低成本、高度个性化的模型训练,构建基于领域的软件工程大模型。通过多智能体协同自动化、传统软件开发方法和理想实践的有机结合,全面保障了开发流程的有效性与结果的准确性,使大模型从单一的代码生成工具转变为与企业开发过程深度协同的智能体集合,显著提升了开发效率和产品质量。

我们所定义的智能化软件开发2.0时代,其核心概念并不复杂。可以用一个公式来概括:智能化软件开发2.0= 专业软工领域大模型 + 多Agent协同 + 传统软件工程方法。

首先,本阶段的智能软件开发强调对软件研发流程的高度数据治理。整个开发全过程,从需求分析、概要设计、详细设计、编码实现、测试,直到最终产品上线,每一个环节都通过结构化的数据治理和全面的数据链管理进行链式数据追踪,确保软件开发的原始需求被比较准确记录并与系统紧密关联。这种全链条的协同工作方式,不仅使得大模型能够较大程度地理解企业特定的业务逻辑,还能够在开发的每一个阶段中准确反映这些逻辑。同时,基于经过治理的领域化数据集,对模型进行个性化训练,使大模型能够深入学习并应用企业的领域知识,从而构建一个低成本、高度个性化的企业领域化大模型,这将是最关键的一步。此外,在实现领域个性化的基础上,通过多Agent方式处理软件开发流程中的各类任务,并结合传统的软件开发方法、工具和理想实践,确保了领域大模型输出的准确性和可靠性。

这种结合了专业软工领域大模型、多Agent协同,以及传统软件工程方法、工具与理想实践的协同自动化方式,正是我们所定义的智能化软件开发2.0时代。

根据智能化软件开发2.0时代的定义和特性,刘总,您认为企业在迈入2.0时代时,应该重点关注哪些关键行动或策略?有哪些具体的准备工作是企业需要优先考虑的?

结合多年来我们团队对软件工程领域的深刻理解,以及aiXcoder在企业领域化大模型落地方面的丰富经验。我们总结了以下4个核心策略,帮助企业更好的拥抱智能软件开2.0时代。

首先是面向领域的开发数据治理,这一点非常关键。简而言之,企业需要对最原始的需求文档进行深入治理,将自然语言表达的“大白话”需求逐步转化为比较准确的开发语言描述,从需求分析、设计,到开发、测试及运维等环节的数据、知识都进行整合并进行全链条数据治理,并确保数据质量、规模与多样性,以服务于领域大模型的构建与优化。值得一提的是,这种数据管理框架和方法能够有效复用,日后大模型产生的海量数据都是基于该框架治理,从而可持续用于训练,这有助于提高企业在应对市场变化时的灵活性和响应速度。

第二是基于领域数据的个性化模型构建。通过利用治理好的领域知识数据集,并充分考虑企业算力资源、代码量等因素,对大模型进行灵活的个性化训练及参数调优,确保大模型能够准确捕捉并反映企业业务需求,使其逐步掌握企业特定的业务流程与逻辑、专业术语和编码规范。进一步地,通过应用PEFT、MoE、RAG和AI Agent等技术和方法,确保个性化训练能够根据企业具体业务需求进行灵活调整和优化。这样的策略不仅增强了模型的业务适应性,还提升了模型训练效率和输出的准确性。

第三点是将大模型的先进能力与传统软件工程的方法和工具相结合。许多企业在引入大模型后,往往倾向于完全依赖大模型,忽视了原本效果优异的软件开发工具。这种做法实际上并不合理,因为大模型虽然具有强大的能力,但其生成结果并非总是准确无误。为了确保大模型输出结果的准确性与可靠性,企业应继续结合和利用传统的软件工程工具与方法,使其与大模型协同工作,从而保障开发流程的时效性和结果的高质量。

最后一点是面向各场景的智能协同。通过引入Agent技术,将其与企业特有的软件开发流程和现有的软件开发工具相结合,以提升开发流程的透明度和效率。同时,确保所有自动化过程的合规性和可追踪性,实现需求分析、设计、编码、测试和部署等各个开发场景的深度协同。通过系统化的数据共享和流程整合,开发团队能够在各个阶段实现无缝衔接,从而更加有效地应对复杂的项目需求和快速变化的市场环境。

aiXcoder如何帮助企业落地智能软件开发2.0时代?

在与很多大型企业交流的过程中,我们发现目前企业普遍面临着搞不懂、训不转、学不会三大挑战,展开来讲,就是企业缺乏优秀人才,现有的技术人员搞不懂模型应该如何训练。有些企业技术积累较好,试图通过开源模型+各种微调的方式,尝试让大模型的能力更贴近企业的真实开发环境要求,最终还是发现大模型学不会企业的领域知识,效果不尽如人意。

为此,我们发布了一个大模型落地框架LLM Adoption Framework(LAF),旨在帮助企业了解如何将大模型与领域知识相结合,并利用我们的经验,帮助来自各个领域和行业的企业有效地部署和落地领域大模型。具体来说,该框架是一种咨询的方法论,分为以下三个阶段:首先个阶段,评估阶段。我们首先会根据企业的商业目标进行全面评估,深入了解企业已开展的工作,以及为何未能实现大模型落地的预定业绩目标,并分析导致这些差距的原因。第二阶段,模型构建及训练阶段。基于这些差距企业应该怎么选择模型,怎么准备和处理数据,如何训练模型,可以通过哪些数据治理的方法来达到预期的状态。此阶段旨在比较准确构建并优化大模型,确保模型深度融合并体现企业特有的领域知识。在这一阶段,不仅进行模型架构的设计与搭建,还包括针对企业独特业务逻辑和领域特定数据的深入治理及训练过程。第三阶段,上线及产品化阶段。这一阶段主要涉及产品化的过程。我们将帮助企业将领域大模型与其内部多个平台通过API进行集成,并确保模型能力能够有效输出到业务端,所有这些都需要根据企业的实际需求进行定制化实现。

总而言之,aiXcoder的LAF并非特定于任何一个开源/闭源大模型提供商,而是大量利用aiXcoder提供的大模型训练、领域经验和软件工程理想实践为企业提供更具体的深度咨询和指导。同时,aiXcoder的LAF不限制于aiXcoder模型使用,企业可以选择任何闭源和开源模型,它是完全可以通用的,并非aiXcoder“独门秘籍”,可以根据企业“领域知识”量身定制大模型落地实施及行动计划。

最后,总结一下我们的观点:

● 无论是开源还是闭源,选择专业的软件工程大模型,而不是通用大模型。

● 不关注大模型厂商宣传支持了多少功能和HumanEval、MBPP、MultiPL-E等常规的“打榜”评测集评测结果,要关注大模型实际生成内容是否真的理解企业的业务。

● 务必要结合领域知识治理并训练,再做进一步微调。直接使用常规的全参微调、有效微调、RAG等方式帮助不大。

● 大模型落地要高度自治、解耦,企业业务的复杂程度和连续性,更不允许绑定某个大模型厂商。

● 一定要做个性化训练,不能直接落地代码大模型,同时培养自己的技术人员,有效规避直接部署模型的高风险。

关于aiXcoder简介:aiXcoder孵化自北京大学软件工程研究所,创始团队均来自北京大学,是全球最早将深度学习技术应用于代码生成与代码理解领域的团队,也是最早将深度学习应用在编程产品的团队。公司专注于AIGC for Code领域,致力于将前沿人工智能技术应用于软件工程,为企业提供完备的智能化软件开发解决方案,包括私有化部署、领域化大模型落地及定制化开发等服务,现已在金融、军工、航空航天、通信、高科技等行业头部企业部署实施。目前已服务智能编程社区版产品用户80万+,获得广泛行业及众多C端开发者们的认可。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 大家在看
  • Ausha Intelligence:AI助力播客内容优化与搜索可见性提升

    Ausha Intelligence是Ausha推出的一款AI工具,旨在帮助播客制作者快速生成优化的内容,显著提高在播客应用中的可见性。它通过一键操作,可以生成全面的标题、吸引人的描述、结构化的章节、相关的标签、社交媒体帖子和新闻稿,从而增强播客的可发现性,并确保一致且有效的营销策略。Ausha Intelligence通过集成到平台中,提供了清晰、用户友好、流畅的体验。它不仅实用,还经过了播客营销策略的训练,能够推广节目、简化营销工作流程,并提高节目的可见性。Ausha Intelligence保证了无与伦比的内容质量。

  • ChatPPT:一键开启AI,免费解析PPT,与PPT畅所欲言。

    ChatPPT是一个利用人工智能技术,帮助用户一键分析PPT并生成对话总结的工具。它通过AI技术简化了PPT内容的理解和交流,使得用户能够更高效地处理演示文稿。该产品的主要优点是能够快速提取PPT中的关键信息,并通过对话形式呈现,使得内容更加通俗易懂。ChatPPT适合需要频繁处理PPT文件的商务人士和教育工作者,它能够显著提高工作效率和学习效率。

  • AI句子生成器:利用AI技术生成高质量句子的在线工具

    AI句子生成器是一个基于人工智能技术的在线工具,它能够根据用户提供的主题和类型生成连贯且上下文相关的句子。这项技术对于作家、学生和任何希望提高写作技能的人都非常有价值。它通过复杂的自然语言处理技术和机器学习模型,确保每个生成的句子都是定制化的,以满足用户的需求。AI句子生成器的主要优点包括简化写作过程、节省时间、激发创造力,并帮助用户生成多样化的句子结构和语调,提高整体写作风格。

  • AI Name Generators:AI驱动的名字生成工具,快速生成各种创意名称。

    AI Name Generators是一款利用人工智能技术自动生成各种类型名称的工具。用户只需输入一些基本信息或选择特定类别,如船名、日本名、游戏名等,系统将根据输入的标准生成一系列独特且富有创意的名字。该工具特别适合需要命名的场合,比如游戏开发者、作家和企业主,因为它节省时间并提供灵感,帮助他们找到最合适的名字。

  • HeadshotAI:AI驱动的头像生成器,在家即可制作专业级头像。

    HeadshotAI是一个利用人工智能技术生成逼真头像的平台,它使用先进的算法分析上传的照片,生成具有专业摄影效果的头像。这项技术的重要性在于,它让个人能够以更低的成本和更便捷的方式,获得高质量的头像,从而提升个人品牌和职业形象。HeadshotAI的主要优点包括无与伦比的真实感、轻松定制、快速生成、价格亲民以及无缝集成。

  • IconGen.io:AI驱动的图标生成器,快速创建精美图标。

    IconGen.io是一个由AI驱动的图标生成器,用户可以通过它快速创建适用于商业、演示文稿等场合的精美图标。该工具利用人工智能技术,简化了图标设计流程,使得即使是没有设计背景的用户也能轻松创建出专业的图标。IconGen.io的主要优点包括快速生成、易于使用、设计多样化,适合需要提升品牌形象的用户。

  • gptme:终端中的个人AI助手,具备本地工具。

    gptme是一个运行在终端的个人AI助手,它装备了本地工具,可以编写代码、使用终端、浏览网页、视觉识别等。它是一个不受软件、互联网访问、超时或隐私问题限制的ChatGPT“代码解释器”的本地替代方案。

  • Reverb:开源的语音识别和说话人分割模型推理代码

    Reverb 是一个开源的语音识别和说话人分割模型推理代码,使用 WeNet 框架进行语音识别 (ASR) 和 Pyannote 框架进行说话人分割。它提供了详细的模型描述,并允许用户从 Hugging Face 下载模型。Reverb 旨在为开发者和研究人员提供高质量的语音识别和说话人分割工具,以支持各种语音处理任务。

  • Voice-Pro:AI语音转录、翻译和TTS的Gradio Web-UI

    Voice-Pro是一个集成的字幕、翻译和文本到语音(TTS)解决方案。它支持将视频添加多语言字幕和多语言音频,助力视频内容扩展到全球市场。该产品使用OpenAI Whisper和开源翻译器及TTS技术,提供一键安装和便携式使用。它还配备了Vocal Remover,使用UVR5和Meta的Demucs引擎,以提高语音识别的准确性。

  • firecrawl-openai-realtime:集成Firecrawl的OpenAI实时API控制台

    firecrawl-openai-realtime是一个集成了Firecrawl的OpenAI实时API控制台,旨在为开发者提供一个交互式的API参考和检查器。它包括两个实用库,openai/openai-realtime-api-beta作为参考客户端(适用于浏览器和Node.js),以及/src/lib/wavtools,后者允许在浏览器中简单管理音频。该产品是使用create-react-app创建的React项目,并通过Webpack打包。

  • DepthFlow:2.5D视差效果视频制作工具

    DepthFlow是一个高度可定制的视差着色器,用于动画化您的图像。它是一个免费且开源的ImmersityAI替代品,能够将图像转换成具有2.5D视差效果的视频。该工具拥有快速的渲染能力,支持多种后处理效果,如晕影、景深、镜头畸变等。它支持多种参数调整,能够创建灵活的运动效果,并且内置了多种预设动画。此外,它还支持视频编码导出,包括H264、HEVC、AV1等格式,并且提供了无需水印的用户体验。

  • Arc Search for Android:现代、支持人工智能的移动浏览器

    Arc Search 是一款现代、支持人工智能的移动浏览器,专注于让用户更快地找到答案,而不会受到互联网的干扰。它通过智能搜索技术,帮助用户过滤掉不必要的信息,直接定位到他们需要的答案,从而提高搜索效率。

  • Depth Pro:高精度单目深度估计模型

    Depth Pro是一个用于单目深度估计的研究项目,它能够快速生成高精度的深度图。该模型利用多尺度视觉变换器进行密集预测,并结合真实与合成数据集进行训练,以实现高准确度和细节捕捉。它在标准GPU上生成2.25百万像素深度图仅需0.3秒,具有速度快、精度高的特点,对于机器视觉和增强现实等领域具有重要意义。

  • o1:使用Groq或OpenAI或Ollama创建类推理链

    o1是一个实验性的项目,旨在通过使用大型语言模型(LLM)来创建推理链,帮助模型解决通常难以处理的逻辑问题。它支持Groq、OpenAI和Ollama后端,通过动态推理链让模型能够“思考”并解决问题。o1展示了仅通过提示就能显著提高现有模型的逻辑推理能力,而无需额外训练。

  • Minionverse:一个受启发的创意工作流

    Minionverse是一个基于AI的创意工作流,它通过使用不同的节点和模型来生成图像。这个工作流的灵感来自于一个在线的glif应用,并且提供了一个视频教程来指导用户如何使用。它包含了多种自定义节点,能够进行文本替换、条件加载、图像保存等操作,非常适合需要进行图像生成和编辑的用户。

  • Rev AI:世界最精确的AI语音转录服务

    Rev AI提供高精度的语音转录服务,支持58种以上语言,能够将视频和语音应用中的语音转换为文本。它通过使用世界上最多样化的声音集合进行训练,为视频和语音应用设定了准确性标准。Rev AI还提供实时流媒体转录、人类转录、语言识别、情感分析、主题提取、总结和翻译等服务。Rev AI的技术优势在于低词错误率、对性别和种族口音的最小偏见、支持更多语言以及提供最易读的转录文本。此外,它还符合世界顶级的安全标准,包括SOC II、HIPAA、GDPR和PCI合规性。

  • RobotFingerPrint:统一的多机械手抓取坐标空间

    RobotFingerPrint是一种用于多种机械手抓取合成的统一坐标空间的创新表示方法。它使用经度和纬度作为坐标,在三维空间中形成一个球体的二维表面,所有机械手共享此坐标空间。该技术通过将机械手的掌心表面映射到统一的坐标空间,并设计条件变分自编码器来预测给定输入对象的统一坐标,从而建立机械手与对象之间的对应关系,用于优化问题以解决抓取姿态和手指关节。该技术能显著提高多种机械手抓取合成的成功率和多样性。

  • Flex3D:从单张图片或文本提示生成高质量3D资产

    Flex3D是一个两阶段流程,能够从单张图片或文本提示生成高质量的3D资产。该技术代表了3D重建领域的最新进展,可以显著提高3D内容的生成效率和质量。Flex3D的开发得到了Meta的支持,并且团队成员在3D重建和计算机视觉领域有着深厚的背景。

  • Helpful DoggyBot:四足机器人室内移动操作系统

    Helpful DoggyBot是一个四足机器人室内移动操作系统,它通过前端夹持装置进行物体操作,使用在模拟环境中训练的低级控制器实现敏捷技能,如攀爬和全身倾斜。此外,它还结合了预训练的视觉-语言模型(VLMs)进行语义理解和命令生成。该系统在没有实际数据收集或训练的情况下,能在未见过的环境中零样本泛化完成任务,如按照用户的指令在攀爬过后的床边取回随机放置的玩具,成功率达到60%。

  • Paper Central:一站式搜索开源成果的平台

    Paper Central 是 Hugging Face 推出的一个全面、便捷的学术平台,它将arXiv、Hugging Face 论文页、模型、数据集、Space、GitHub 和会议论文集等多个来源的开源学术资源整合在一起,帮助研究人员和开发者快速获取并使用开源资源。

今日大家都在搜的词: