对话aiXcoder总裁刘德欣：智能化软件开发2.0时代，企业如何落地领域化大模型

2024-08-16 10:39 · 稿源：站长之家用户

科技日新月异的今天，以大模型、Agent等为代表的人工智能技术正引领各行各业的深刻变革。软件开发领域，一场由AI驱动的产业智能化升级快速演变，进入智能化软件开发2.0时代。

近日，我们采访了硅心科技（以下简称:aiXcoder）总裁刘德欣，主要围绕企业如何落地领域化大模型，如何更好地拥抱智能化软件开发2.0时代等话题进行深入探讨。以下内容根据采访实录整理。

请刘总简单介绍下智能化软件开发1.0时代及其发展现状?

智能化软件开发1.0时代可以说是通过引入大模型技术，集中实现了软件开发的一些初级自动化场景，包括代码生成、代码补全、单元测试生成和缺陷检测等。系统也支持简单的需求捕获和拆分等任务。但是，这些功能通常是以独立的方式执行，不能深入理解和应用企业特定的业务逻辑。

目前国内外的玩家主要有GitHub的Cop ilot、Amazon的CodeWhisperer、百度的comate 、阿里的通义灵码、甚至包括我们aiXcoder的上一代产品等。各家产品在功能和能力上差异并不大，缺乏明显的差异化。尽管产品在宣传中，强调了具有更强的上下文理解能力和更大的参数量，甚至与GPT-3.5等模型进行比较占据优势，但实际上并没有真正解决大模型与企业领域知识融合这一核心问题，使得它们无法满足企业基于自身的业务落地大模型的需求，简单来讲，觉得大模型学不会自己企业的领域知识，幻觉和生成结果不确定性严重;而这种孤立性和对业务逻辑的理解不足，也导致了其产品对软件开发复杂需求的处理浮于表面，实际上代码输出的准确性和实用性往往会大打折扣，限制了其在实际企业业务环境中的应用效果和用户的信任度。

您认为智能化软件开发1.0时代具体存在的问题有哪些?

智能化软件开发1.0存在的问题主要问题是不进行有效个性化训练而直接落地大模型，这会直接产生两大缺陷:应用模式缺陷和技术缺陷。

首先，从应用模式来看，主要缺陷表现在两个方面。

首先，在训练层面，缺乏对业务原始需求与设计的考量。1.0时代的产品往往只关注代码本身的语法和结构，忽略了代码必须服务于具体的业务需求和逻辑，所以并没有将需求分析和设计文档等企业背景知识融合进模型的训练中，导致生成/补全的代码往往缺乏业务逻辑，从而使产品的准确性和可用性不足。

第二，在测试层面，无法形成需求到测试的闭环。测试自动化在1.0时代通常只基于现有代码进行，忽略了测试的本质是验证需求的完整性和正确性，没能深入到需求层面，而是仅依赖于代码级的表面生成，没有实现对原始需求的全面交互和验证。

其次，从技术缺陷来看，主要表现在三个方面。

一是环境依赖信息的缺失，现在的大模型训练主要是在开源代码及企业代码上的训练，这种脱离企业背景知识，仅对代码训练的方式，依然缺乏足够的项目上下文支持，这导致生成的代码虽然在语法上正确，但经常与项目的实际业务需求不符。虽然各大模型厂商都在上下文长度上努力，但并不会从根源上解决这一技术缺陷。

二是当前的智能化开发辅助主要依赖于大模型的语言能力，通过模式匹配和简单的Prompt指令生成代码。然而，这种方法仅停留在表层语言模型的使用上，无法深入理解复杂的业务逻辑和编程规范，导致大模型在实际应用中的表现不尽如人意，影响了结果的有效性和可靠性，尤其是生成内容的可靠性仍然存在较大问题。

三是微调方法的局限性，尽管在1.0时代我们采用了全参微调（Fine Tuning）、以及LoRa、Adapter、Prompt等PEFT有效参数微调(部分参数微调)方式，甚至尝试使用RAG和MoE等方法让大模型学习特定领域知识，但这些常规微调技术和方法仍存在局限性。尽管它们在某些特定任务中表现出一定的效果，但由于没有充分训练企业领域的专有数据和背景知识，这些方法在真实业务应用中的表现往往难以达到预期，无法完全满足实际业务的需求。

从客户角度来看，我们发现很多大模型在通用的场景或者主流的测评集上表现都不错，声称也能达到30%到50%的准确率。但是一旦拿到企业中去应用，通常发现准确率下降到了10%以下。即使用各种方式做微调，效果也不尽如人意。对于企业而言，技术团队和商务团队尽力引入并上线了智能软件开发产品，也进行了相应的微调，但如果最终结果无法达到预期，可能会引发内部大量用户和软件开发人员的投诉，带来巨大的风险。综合来看，真实企业软件开发场景是非常复杂的，具有很强的业务逻辑、拥有明确的编码规范和独特的代码风格，在多阶段的复杂开发流程中更是涉及多角色、多工具、多团队的共同协作参与。尽管智能化软件开发1.0时代提供了一定的软件自动化支持，但其并没有真正解决企业领域知识问题，也没有充分考虑真实开发场景的复杂需求。所以基于这样一个背景，aiXcoder率先提出了软件开发2.0时代的概念，并已成功在多家大型企业中落地实施。通过这一模式，企业才能真正抓住并充分利用大模型所带来的技术红利。

aiXcoder如何定义智能化软件开发2.0时代的?

智能化软件开发2.0时代:首先通过严格的数据治理和链式管理，对企业的特定领域知识进行全面的结构化处理，确保从需求定义、设计、编码到最终代码提交的每个环节都得到准确记录和系统关联。在此基础上，进行低成本、高度个性化的模型训练，构建基于领域的软件工程大模型。通过多智能体协同自动化、传统软件开发方法和理想实践的有机结合，全面保障了开发流程的有效性与结果的准确性，使大模型从单一的代码生成工具转变为与企业开发过程深度协同的智能体集合，显著提升了开发效率和产品质量。

我们所定义的智能化软件开发2.0时代，其核心概念并不复杂。可以用一个公式来概括:智能化软件开发2.0= 专业软工领域大模型 + 多Agent协同 + 传统软件工程方法。

首先，本阶段的智能软件开发强调对软件研发流程的高度数据治理。整个开发全过程，从需求分析、概要设计、详细设计、编码实现、测试，直到最终产品上线，每一个环节都通过结构化的数据治理和全面的数据链管理进行链式数据追踪，确保软件开发的原始需求被比较准确记录并与系统紧密关联。这种全链条的协同工作方式，不仅使得大模型能够较大程度地理解企业特定的业务逻辑，还能够在开发的每一个阶段中准确反映这些逻辑。同时，基于经过治理的领域化数据集，对模型进行个性化训练，使大模型能够深入学习并应用企业的领域知识，从而构建一个低成本、高度个性化的企业领域化大模型，这将是最关键的一步。此外，在实现领域个性化的基础上，通过多Agent方式处理软件开发流程中的各类任务，并结合传统的软件开发方法、工具和理想实践，确保了领域大模型输出的准确性和可靠性。

这种结合了专业软工领域大模型、多Agent协同，以及传统软件工程方法、工具与理想实践的协同自动化方式，正是我们所定义的智能化软件开发2.0时代。

根据智能化软件开发2.0时代的定义和特性，刘总，您认为企业在迈入2.0时代时，应该重点关注哪些关键行动或策略?有哪些具体的准备工作是企业需要优先考虑的?

结合多年来我们团队对软件工程领域的深刻理解，以及aiXcoder在企业领域化大模型落地方面的丰富经验。我们总结了以下4个核心策略，帮助企业更好的拥抱智能软件开2.0时代。

首先是面向领域的开发数据治理，这一点非常关键。简而言之，企业需要对最原始的需求文档进行深入治理，将自然语言表达的“大白话”需求逐步转化为比较准确的开发语言描述，从需求分析、设计，到开发、测试及运维等环节的数据、知识都进行整合并进行全链条数据治理，并确保数据质量、规模与多样性，以服务于领域大模型的构建与优化。值得一提的是，这种数据管理框架和方法能够有效复用，日后大模型产生的海量数据都是基于该框架治理，从而可持续用于训练，这有助于提高企业在应对市场变化时的灵活性和响应速度。

第二是基于领域数据的个性化模型构建。通过利用治理好的领域知识数据集，并充分考虑企业算力资源、代码量等因素，对大模型进行灵活的个性化训练及参数调优，确保大模型能够准确捕捉并反映企业业务需求，使其逐步掌握企业特定的业务流程与逻辑、专业术语和编码规范。进一步地，通过应用PEFT、MoE、RAG和AI Agent等技术和方法，确保个性化训练能够根据企业具体业务需求进行灵活调整和优化。这样的策略不仅增强了模型的业务适应性，还提升了模型训练效率和输出的准确性。

第三点是将大模型的先进能力与传统软件工程的方法和工具相结合。许多企业在引入大模型后，往往倾向于完全依赖大模型，忽视了原本效果优异的软件开发工具。这种做法实际上并不合理，因为大模型虽然具有强大的能力，但其生成结果并非总是准确无误。为了确保大模型输出结果的准确性与可靠性，企业应继续结合和利用传统的软件工程工具与方法，使其与大模型协同工作，从而保障开发流程的时效性和结果的高质量。

最后一点是面向各场景的智能协同。通过引入Agent技术，将其与企业特有的软件开发流程和现有的软件开发工具相结合，以提升开发流程的透明度和效率。同时，确保所有自动化过程的合规性和可追踪性，实现需求分析、设计、编码、测试和部署等各个开发场景的深度协同。通过系统化的数据共享和流程整合，开发团队能够在各个阶段实现无缝衔接，从而更加有效地应对复杂的项目需求和快速变化的市场环境。

aiXcoder如何帮助企业落地智能软件开发2.0时代?

在与很多大型企业交流的过程中，我们发现目前企业普遍面临着搞不懂、训不转、学不会三大挑战，展开来讲，就是企业缺乏优秀人才，现有的技术人员搞不懂模型应该如何训练。有些企业技术积累较好，试图通过开源模型+各种微调的方式，尝试让大模型的能力更贴近企业的真实开发环境要求，最终还是发现大模型学不会企业的领域知识，效果不尽如人意。

为此，我们发布了一个大模型落地框架LLM Adoption Framework（LAF），旨在帮助企业了解如何将大模型与领域知识相结合，并利用我们的经验，帮助来自各个领域和行业的企业有效地部署和落地领域大模型。具体来说，该框架是一种咨询的方法论，分为以下三个阶段:首先个阶段，评估阶段。我们首先会根据企业的商业目标进行全面评估，深入了解企业已开展的工作，以及为何未能实现大模型落地的预定业绩目标，并分析导致这些差距的原因。第二阶段，模型构建及训练阶段。基于这些差距企业应该怎么选择模型，怎么准备和处理数据，如何训练模型，可以通过哪些数据治理的方法来达到预期的状态。此阶段旨在比较准确构建并优化大模型，确保模型深度融合并体现企业特有的领域知识。在这一阶段，不仅进行模型架构的设计与搭建，还包括针对企业独特业务逻辑和领域特定数据的深入治理及训练过程。第三阶段，上线及产品化阶段。这一阶段主要涉及产品化的过程。我们将帮助企业将领域大模型与其内部多个平台通过API进行集成，并确保模型能力能够有效输出到业务端，所有这些都需要根据企业的实际需求进行定制化实现。

总而言之，aiXcoder的LAF并非特定于任何一个开源/闭源大模型提供商，而是大量利用aiXcoder提供的大模型训练、领域经验和软件工程理想实践为企业提供更具体的深度咨询和指导。同时，aiXcoder的LAF不限制于aiXcoder模型使用，企业可以选择任何闭源和开源模型，它是完全可以通用的，并非aiXcoder“独门秘籍”，可以根据企业“领域知识”量身定制大模型落地实施及行动计划。

最后，总结一下我们的观点:

● 无论是开源还是闭源，选择专业的软件工程大模型，而不是通用大模型。

● 不关注大模型厂商宣传支持了多少功能和HumanEval、MBPP、MultiPL-E等常规的“打榜”评测集评测结果，要关注大模型实际生成内容是否真的理解企业的业务。

● 务必要结合领域知识治理并训练，再做进一步微调。直接使用常规的全参微调、有效微调、RAG等方式帮助不大。

● 大模型落地要高度自治、解耦，企业业务的复杂程度和连续性，更不允许绑定某个大模型厂商。

● 一定要做个性化训练，不能直接落地代码大模型，同时培养自己的技术人员，有效规避直接部署模型的高风险。

关于aiXcoder简介:aiXcoder孵化自北京大学软件工程研究所，创始团队均来自北京大学，是全球最早将深度学习技术应用于代码生成与代码理解领域的团队，也是最早将深度学习应用在编程产品的团队。公司专注于AIGC for Code领域，致力于将前沿人工智能技术应用于软件工程，为企业提供完备的智能化软件开发解决方案，包括私有化部署、领域化大模型落地及定制化开发等服务，现已在金融、军工、航空航天、通信、高科技等行业头部企业部署实施。目前已服务智能编程社区版产品用户80万+，获得广泛行业及众多C端开发者们的认可。

（推广）

特别声明：以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布，本平台仅提供信息存储服务，对本页面内容所引致的错误、不确或遗漏，概不负任何法律责任，相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性，但不保证有关资料的准确性及可靠性，读者在使用前请进一步核实，并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时，可及时向站长之家提出书面权利通知或不实情况说明，并提供身份证明、权属证明及详细侵权或不实情况证明（点击查看反馈联系地址）。本网站在收到上述法律文件后，将会依法依规核实信息，沟通删除相关内容或断开相关链接。

相关推荐

关键词：

寒武纪：紧抓智能算力机遇赋能多行业智能化升级

寒武纪董事长陈天石在2025年半年度业绩说明会上指出，中国作为全球最大集成电路消费国，市场需求持续增长。人工智能算力需求爆发推动智能芯片发展，寒武纪专注AI芯片研发，产品覆盖云服务器、边缘计算及终端设备。公司已实现对DeepSeek-V3.2-Exp等主流开源大模型的适配优化，通过软硬件协同创新显著提升计算效率，降低部署成本，为多行业智能化升级提供核心支持。

寒武纪人工智能芯片集成电路
以训战促创新卡奥斯工业软件开发训战平台揭牌

10月24日，卡奥斯COSMOPlat在青岛成功举办第四届1024程序员节暨工业智能体大赛颁奖典礼。赛事历时近两月，汇聚企业及校园开发者，通过专家评审与大众投票评选出9组优胜者，涵盖科学工艺、智慧农牧等创新智能体。现场同步揭牌“卡奥斯工业软件开发训战平台”，深化产教融合。依托天智工业大模型等技术底座，平台已落地能源化工、先进制造等领域，助力企业效率提升20%以上。未来，卡奥斯将持续构建开源生态，携手全球开发者共掘工业智能新价值。

工业智能体程序员节工业软件开发
卖家精灵加入中国人工智能产业发展联盟（AIIA），加速AI赋能跨境电商

卖家精灵凭借在跨境电商智能化运营与AI大数据应用领域的领先实力，近日正式加入中国人工智能产业发展联盟（AIIA），成为该国家级AI产业生态重要成员。此次加入标志着其AI技术实力获权威认可，未来将携手联盟推动AI技术研发与产业化，助力中国品牌全球化。依托八年积累的海量电商数据与算法体系，卖家精灵已构建覆盖选品决策、市场分析等全链路AI解决方案，服务超百万跨境卖家，显著提升运营效率与决策精准度。

人工智能跨境电商 AI大数据
厚植AI创新沃土！麒麟信安打造人工智能孵化器，赋能创业梦想

10月28日，麒麟信安人工智能孵化器在长沙启动，旨在汇聚AI领域人才、技术与资本，构建开放协同的创新生态。该项目获湖南省多部门支持，已吸引60余个项目入围，组建了首批30余位专家导师团，并与多家顶尖机构共建联合体，通过政策扶持、资本对接等多维度赋能，培育优质AI项目在湘落地发展，助力区域打造人工智能产业创新高地。

人工智能孵化器麒麟信安创新创业
人工智能产业决胜与 Data&AI 数据基础设施建设——科杰科技于洋中国国际数字经济博览会主题演讲

科杰科技董事善于洋在2025中国国际数字经济博览会发表演讲，强调高质量数据集是人工智能产业决胜关键。他指出，算力、算法和数据构成AI三大要素，而数据决定模型认知边界与输出可靠性。当前需构建Data&AI一体化平台作为核心基础设施，通过集中管理、分散赋能模式，打通数据采集、治理到AI训练全链路，推动产业智能化升级。该平台已在制造、金融等领域落地，助力企业释放数据要素价值，实现弯道超车。

人工智能数据基础设施数字经济
人工智能巨头OpenAI拟上市估值或高达1万亿美元

OpenAI正积极推进上市计划，据知情人士透露，该公司可能最早于2026年下半年向证券监管机构提交上市申请，目标在2027年正式上市。此次IPO的估值有望达到约1万亿美元，或将跻身全球规模最大的IPO之列。在初步讨论中，OpenAI曾考虑通过上市筹集至少600亿美元资金，实际融资规模可能进一步扩大。

OpenAI IPO 上市计划
共建·共智·共享--新一代AtomGit平台暨人工智能开源社区发布

10月28日，AtomGit平台在北京国家会议中心举行升级发布会，正式推出"开源+AI"一体化平台及人工智能开源社区。工信部副部长熊继军出席并致辞，强调建设AI开源社区对汇聚创新资源、把握科技革命机遇的重要意义。平台将整合开源模型、数据集及算力资源，打造开放中立的基础设施，计划于11月21日正式上线。华为、百度等企业代表分享了开源实践，多所高校签署了共建AI生态倡议。此举标志着我国开源生态迈向智能化时代的重要一步。

开源社区人工智能 AtomGit
行业首个！海尔冰箱获ISO/IEC 42001人工智能管理体系认证

2025年10月，海尔冰箱成为全球首个通过ISO/IEC42001人工智能管理体系认证的家电企业，标志着其AI技术研发与管理达国际领先水平。该认证覆盖语音交互、视觉识别、健康保鲜等核心功能全流程，确保用户数据安全与隐私保护。目前AI系统已应用于博观、麦浪等高端产品，推动智能冰箱行业规范化发展。未来海尔将持续优化AI技术，为用户提供更安全、智能的健康饮食体验。

冰箱品牌人工智能技术海尔冰箱
智启申城，共赴新程｜华为坤灵中国行2025上海站，助力中小企业智能化跃升

10月30日，华为坤灵中国行2025首站活动在上海启动，聚焦"助力中小企业智能化跃升"。活动发布"百&万计划"分销伙伴激励政策及"4+10+N"场景化方案，通过一站式场景展示、精英伙伴授牌及本地化案例分享，推动中小企业降本增效。华为联合政企机构构建分销体系，旨在为中小企业提供灵活部署方案，加速数字化转型进程。

华为坤灵中小企业智能化转型
参展商变投资商，进博会见证三星产业升级

进博会是三星从参展商到投资商转型的重要平台。八年来，三星通过进博会洞察中国市场，加速产业升级：在天津建设全球领先的MLCC工厂和OLED屏幕生产线，推动高端制造；投资近550亿美元，尖端产业占比近90%；旗下新罗酒店加速在华布局。三星深度融入中国产业链，从"进入中国"迈向"融入中国"，彰显与中国协同高质量发展的决心。

进博会经贸交流产业升级

今日大家都在搜的词：

热文

3 天
7天

对话aiXcoder总裁刘德欣：智能化软件开发2.0时代，企业如何落地领域化大模型

寒武纪：紧抓智能算力机遇赋能多行业智能化升级

以训战促创新卡奥斯工业软件开发训战平台揭牌

卖家精灵加入中国人工智能产业发展联盟（AIIA），加速AI赋能跨境电商

厚植AI创新沃土！麒麟信安打造人工智能孵化器，赋能创业梦想

人工智能产业决胜与 Data&AI 数据基础设施建设——科杰科技于洋中国国际数字经济博览会主题演讲

人工智能巨头OpenAI拟上市估值或高达1万亿美元

共建·共智·共享--新一代AtomGit平台暨人工智能开源社区发布

行业首个！海尔冰箱获ISO/IEC 42001人工智能管理体系认证

智启申城，共赴新程｜华为坤灵中国行2025上海站，助力中小企业智能化跃升

参展商变投资商，进博会见证三星产业升级

今日大家都在搜的词：

热文

iPhone 18 Pro或缩小灵动岛苹果正测试特殊挖孔方案

OPPO Reno15系列官宣11月10日发布

AI日报：上海首例涉AI提示词著作权案宣判；Kimi K2 Thinking发

特斯拉股东批准马斯克万亿美元薪酬包

曝折叠屏iPhone配2400万屏下摄像头预计2026年秋亮相

华为鸿蒙智行新款享界S9开启预订：预售价31.8万起

OPPO Find X9 Pro卫星通信版开启预售：6999元

何小鹏再回应机器人里藏真人质疑：现场展示内部结构

小鹏机器人会走猫步太像人了！小鹏发布新一代人形机器人IRON

女性人形机器人里藏真人？何小鹏回应：并亲自证清白

iPhone 18 Pro或缩小灵动岛苹果正测试特殊挖孔方案

阿里回应饿了么更名：正处于灰度测试阶段

马斯克称若发现外星人证据就公开

AI日报：昆仑万维SkyReels V3模型上线；月之暗面推Kimi Linear

AI日报：Sora正式登陆Android；网易云音乐推AI调音大师；谷歌将

小米YU7全网首拆上热搜雷军回应：欢迎同行和专家指点

华为Mate70 Air官宣今日开启预售

vivo Y500 Pro官宣11月10日发布：同档首发2亿HP5主摄

站长商机