首页 > 传媒 > 关键词  > Aloudata最新资讯  > 正文

Aloudata Agent公测开启:NoETL+大模型=好数据驱动真智能,让“万数皆可问”

2025-04-25 13:51 · 稿源: 站长之家用户

4 月 22 日,Aloudata大应科技自研推出的Aloudata Agent正式发布。这是一款基于NoETL明细语义层、以“万数皆可问”为目标的分析决策智能体,致力于让企业通过自然语言即可完成查数取数、归因诊断、数据解读、报告生成,驱动经营管理决策。

从企业发展历程来看,数据分析经历了三个阶段:传统 BI 阶段、敏捷 BI 阶段以及当前的智能 BI 阶段。在传统 BI 和敏捷 BI 阶段,数据分析主要聚焦于让有一定技术能力和分析技能的专业人员通过编写 SQL 或拖拉拽等方式查看和分析数据。进入智能 BI 阶段后,依托大模型的能力,企业数据分析迈向了面向更广泛的人群进行主动洞察和智能洞察的新阶段。

随着 DeepSeek的出现, 加速了大模型的平权,企业实现“人人都是分析师”的愿景正逐步成为可能,数据民主化进程显著加速。

企业数据分析 Agent 建设挑战

在Aloudata看来,企业级数据分析是一个低容错度的场景,尽管大模型目前的智能化水平有了快速的提升,但实现企业级分析场景的落地还面临着很大的挑战。

首先是意图理解挑战。业务人员通常以口语化、业务化的方式表达需求,而数仓资产中的数据语言与之存在巨大差异,导致大模型难以直接跨越这一鸿沟实现准确理解。

其次,数据口径一致性挑战。同一问题在不同时间或由不同业务人员提出时,可能得到差异化的结果,这种“幻觉”现象影响了分析结论的可靠性。

第三,场景覆盖度挑战。当前有些企业已经进行了初步探索,但限制于比较小的场景和有限范围的尝试。当分析需求扩展至更多业务场景或更大用户群体时,企业需投入高昂成本才能维持 80% 以上的准确度,场景覆盖能力有待提升。

第四,性能优化和成本平衡的挑战。大模型本身并不擅长数据查询性能优化,直接生成查询 SQL 较难确保稳定的性能输出与成本之间的平衡。

第五,数据权限管控的挑战。智能分析场景一定解决数据权限管控问题,避免问数时出现数据越权泄露。

企业数据分析 Agent 落地路径

目前,业界探索数据分析 Agent 主要采用 NL2SQL、NL2DSL2SQL 及 NL2MQL2SQL 三种路径。

第 一, NL2SQL 路径。通过自然语言生成查询 SQL 来实现问数,完全依赖大模型能力。此方案下,业务语义与数据语义难以对齐,问数准确率较低;同时,大模型生成的查询 SQL 难以实现性能优化;此外,由于缺乏权限管控机制,存在数据安全风险。

第二, NL2DSL2SQL 路径。借助 BI 系统沉淀的数据集和报表作为大模型的知识库,大模型生成 BI 查询 DSL 再转换成数据查询 SQL。这种方案可以一定程度地提高问数的准确性。然而,该路径依赖于BI 中的数据集和报表,前期准备成本较高;同时受限于数据集和报表的覆盖范围,分析场景的灵活性和扩展性不足;此外,该方案仍无法解决报表指标口径不一致的问题。

第三, NL2MQL2SQL 路径。这是包括Aloudata在内的一些厂商探索的一个新方向,这种方式先由大模型将自然语言转化为对指标语义层的查询请求(MQL,Metrics Query Language),再由指标平台将指标和维度的查询与计算逻辑转化为准确的 SQL 查询语句。其最 大优点在于引入指标语义层,实现自然语言意图与指标口径的准确对齐,从而显著提升了问数的准确性和可靠性。同时,指标语义层具备查询性能优化能力,并支持基于指标的权限管理,既可解决数据口径不一致问题,又能确保数据安全管控。

三种路径的差异表明,企业数据分析 Agent 的核心竞争力不在于模型或算力,而在于企业知识库的构建。那怎样的企业知识库才能实现更好的智能问数效果。

第 一种,基于报表语义层的知识库虽能实现基础语义映射,但受限于预定义指标的固定性,难以支持业务人员动态组合指标与维度的深度分析需求,且无法解决报表间数据口径不一致的固有缺陷,因此难以满足智能洞察场景的灵活性与准确性要求。

第二种,基于宽表模型构建的语义层仍存在显著局限:其一,分析灵活性受限于宽表已固化加工的指标与维度组合,业务人员无法突破预定义的模型框架自由组合;其二,宽表模型存在指标冗余定义,同一指标(如销售额)在不同宽表中可能按会员、商品等不同维度重复构建,大模型在多指标场景下会召回存在口径冲突的结果。

因此,理想的企业语义知识库应该是基于数仓明细数据沉淀的指标语义层。

其一,支持从明细数据逐层聚合的弹性分析,业务人员可自由组合指标、维度与统计周期,实现从宏观汇总数据到明细下钻的全场景覆盖;

其二,知识库维护成本显著降低,仅需定义原子指标和维度即可,问数的同时 Agent 可基于原子指标动态添加统计周期、筛选条件、同环比、排名等分析要素,无需预先固化所有分析路径;

其三,指标要素化设计,标准化定义,既保障了数据口径的一致性,又赋予业务人员近乎无限的分析组合能力,从而在语义对齐与灵活性之间达成最 优平衡。

具体来看,明细级语义层的能力体现在以下方面:

第 一,标准化指标定义。一方面降低指标定义门槛,零代码界面化操作,通过业务语义完成指标口径逻辑表达;另一方面在定义指标的时候可以对指标名称和口径进行判重,确保沉淀的语义资产具有唯 一性,避免歧义。

第二,明细级语义沉淀。通过明细事实表与维度表的关联机制,可实现公共层数据资源的全场景覆盖:任意事实与维度组合的跨表的动态分析需求均能得到满足。

第三,智能化加速路由。针对明细级指标定义可能引发的查询性能担忧,NoETL 指标平台通过物化加速和智能路由技术,将用户提交的明细数据查询请求自动改写为预计算表查询路径,预计算表的生成与维护过程完全由系统自主完成,无需人工干预。既满足业务场景的灵活分析需求,又规避了明细数据查询的性能瓶颈。

第四,灵活查询时衍生。无需预定义全部指标,仅需维护原子指标和维度即可支撑复杂业务场景的灵活问答,无需投入巨大精力构建企业知识库。

Aloudata Agent 关键创新

关键创新一:NL2MQL,实现准确、灵活、快速、安全的数据问答

在技术实现层面,采用 NL2MQL2SQL 的技术路线。首先,指标语义层沉淀了最全、最丰富的指标和维度的元数据,作为大模型的知识图谱底座,帮助大模型提升意图识别准确度。

用户查询经大模型语义解析后,将其转换为指标、维度及筛选条件的组合表达,并生成面向指标平台的 MQL,Aloudata CAN 指标平台的语义引擎将 MQL 转换为准确和可执行的查询 SQL,语义引擎内置函数体系与 SQL 解析器,确保语义转换的 100 % 准确性。生成的 SQL 经智能物化加速、查询改写等优化后,由数据库引擎执行查询,最终返回结果严格遵循指标粒度的行级/列级数据权限控制,如客户经理仅能获取其负责客户的销售数据。

关键创新二:基于 COT 和 ReACT 的多 Agent 架构,有效解决复杂分析问题

Aloudata Agent 充分利用大模型的思维链能力规划查询过程。针对复杂业务问题,通过 COT 将问题拆解为子任务,基于 ReAct 调用各子 Agent ,结合短期记忆(会话上下文)与长期记忆(含用户历史问题、部门偏好术语、企业通用表达)并行执行。该架构能够将复杂的问题简单化,通过有效规避了模型幻觉问题,支持从数据查询到洞察生成的完整分析链路,各子 Agent 在协同过程中持续积累业务经验,提升复杂问题处理能力。

关键创新三:基于指标语义层和 RAG,提升意图识别的准确性

通过结合指标语义层和 RAG(检索增强生成),显著提升了大模型意图识别的准确率和指标与维度召回的准确度。具体流程如下:

当用户提出问题时,Agent 首先判断用户意图,例如区分是查询指标口径、获取数据还是生成综合分析报告。

随后,通过向量检索、ES 文本检索以及 KV 关联指标检索等多路召回技术有效检索指标语义层沉淀的指标元数据信息、维度元数据信息、指标血缘关系和逻辑模型关联关系,确保指标与维度的准确召回。

在检索到相关指标和维度后,Agent 会进行二次选择,确保准确定位用户需求。根据问题的复杂度,可能生成一个或多个 MQL(Metrics Query Language)查询。随后,Aloudata CAN 指标平台语义引擎将 MQL 自动转换为底层 MPP 引擎可执行的 SQL,返回查询结果,再由 Agent 将查询结果生成符合用户意图的回答(如指标口径、指标值、图表或分析报告)返回给用户。

关键创新四:以指标为中心高阶分析能力集成,促进更深度的分析洞见

第 一,智能指标关键维度挖掘。基于既有维度和历史指标查询行为,自动识别关键分析维度。由于数据表中字段众多,但并非每个字段都具有相同的分析权重,所以 NoETL 指标平台会捕捉记忆常用查询维度,如产品、区域、客户群等。通过挖掘关键维度,在用户询问如销售额时,能够结合热门维度呈现和归纳。

第二,智能指标关联因子挖掘。在 NoETL 指标平台中已经沉淀了指标的血缘关系。可清晰识别指标间的层级关联与依赖关系。例如,将多组指标进行组合分析时,可发现指标间存在的关联关系和因子关系。基于指标血缘与查询行为的分析,可为深度洞察业务现象及分析问题根因提供数据支撑。

Aloudata Agent 产品能力

从产品架构层面,Aloudata 智能数据分析方案包含两层能力。

第 一层为指标语义层(Aloudata CAN 指标平台),作为企业级知识库承担 DWD 层模型接入与语义建模的职能:直接对接明细数据,基于星型模型、雪花模型等构建语义模型,生成虚拟大宽表;建立标准化指标管理体系,形成可复用的知识资产库。

往上, Aloudata Agent 这一层,开放对接各种大模型(千问、DeepSeek 、GPT 等)。通过标准化接口与协议适配,实现多模型能力统一调用,利用大模型在自然语言理解、任务规划及工具链编排方面的优势,完成用户意图理解、复杂任务拆解及工具调用。该层已沉淀四大核心能力模块:自然语言的智能问数、智能归因、智能的数据解读和智能的报告生成。

基于上述能力体系,未来Aloudata也会进一步围绕着企业的应用场景打磨子 Agent。例如:针对经营分析场景的 Agent,针对门店管理的 Agent 以及针对风控需求的风险预警 Agent。

Aloudata Agent 产品特性

一是分析过程透明化,向用户完整呈现数据处理逻辑;二是指标口径可追溯,所有指标均附带定义口径说明,确保不同业务角色对同一指标的认知统一;三是交互式引导与追问,在分析过程中嵌入交互式的引导与追问功能,提升操作便捷性;四是用户可理解可干预,用户可直接对大模型返回的初始结果进行修正,支持时间维度扩展(如将“本月至今”调整为“全年”)、指标切换等界面操作,无需重新输入查询条件。

总结与展望

总结一下,Aloudata Agent 依托企业明细级指标语义层知识库及大模型能力,形成五大核心优势:

第 一是准确,基于 NL2MQL2SQL 的路径,解决业务语言与数据语言间的语义鸿沟,提升意图识别精度,实现 SQL 翻译零误差。

第二是全面,基于明细指标语义层,支持用户通过多维度、多指标组合筛选生成派生或衍生指标,以维护有限知识库覆盖多样化业务场景。

第三是聪明,采用 COT 与 ReAct 架构,将复杂分析问题拆解为可执行子任务,增强复杂问题处理能力。

第四是友好,提供交互式引导功能,支持引用、跳转、下钻等操作,优化用户体验。

第五是安全,通过指标语义层行级/列级权限控制,确保数据访问严格遵循企业安全策略,杜绝数据越权风险。

展望未来,Aloudata Agent 的核心发展方向是打破数据分析场景限制,将其能力深度嵌入企业业务流程中。为此,Aloudata计划于今年下半年推出 Aloudata Agent 的 MCP(模型上下文协议),通过开放 MCP 助力企业快速基于自身业务场景构建 AI 应用生态,例如策略优化 AI、商品管理 AI、风险控制 AI 等场景应用。同时,将持续优化 Aloudata Agent 的基础能力:强化异常诊断功能;增强分析报告可视化效果等。

作为产品首秀,即日起开放产品体验通道,访问Aloudata大应科技官网即可预约咨询与试用。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 数据分析迎来“智能体”时代,火山引擎披露多智能体架构性能优化关键

    在2025智能大会暨第18届中国R会议上,火山引擎专家分享了Data Agent在业务数据分析中的性能调优实践。报告指出,数据分析正从传统商业智能向数据智能体跃迁,其核心能力扩展到复杂任务的自主执行与决策。Data Agent通过工具生态、运行时管理与安全环境设计,实现全场景覆盖,具备多步骤任务规划与动态调整能力,显著降低企业数据分析门槛并提升洞察效率。未来该技术将融合多模态理解与实时计算能力,在金融、制造、医疗等领域形成规模化落地,成为企业数据价值释放的核心引擎。

  • TabTab 登顶模力工场 AI 应用榜榜首, 把 AI 数据分析师装进口袋,关键结论更快抵达!

    TabTab是一款全链路AI数据分析助手,核心功能包括多源数据连接(支持文档、数据库、电商平台等)、自动化采集清洗、内置分析模型及可视化呈现。其优势在于通过多智能体系统实现自然语言交互,降低分析门槛,让非技术人员也能快速完成客户洞察、销售业绩等分析,显著提升效率。产品定位中立,致力于构建多元化AI效率提升生态。

  • 智能问数:让数据 “开口”,让 BI 价值 “焕新”

    在数字经济时代,传统BI模式因技术壁垒使数据价值难以释放。智能问数通过自然语言交互,让非技术人员直接对话数据,快速获取洞察,实现从“为报表而生”到“为决策赋能”的转变。其核心架构融合智能问数、数据洞见与动态分析,支持多轮对话优化可视化呈现,并引入数据洞见能力,助力企业看清过去、把握现在、预判未来,重塑数据驱动增长的新范式。

  • 数据智能体 TabTabAI 正式上线,零门槛上手,让 “数据分析” 人人可用

    AI数据智能体TabTabAI正式上线,以“零门槛交互+全流程自主处理”为核心优势,打破数据分析技术壁垒。该工具通过自然语言对话,支持多源数据采集、智能处理、深度洞察与可视化,让普通职场人无需编程背景即可完成复杂分析任务。其多智能体协同架构与自动化能力,覆盖从数据收集到决策建议的全链路,助力用户将原始数据高效转化为精准决策依据,真正实现“人人都是数据分析师”。

  • 剪辑快人一步!索尼ICE-Cloud助力婚礼视频团队高效高质交付

    北京二十四格文化有限公司(24Frames)成立于2004年,专注极致纪实影像美学,深耕婚礼电影、商业宣传、纪录片、综艺及艺人合作等领域。团队以真实事件与情感为核心,融合高级审美与技艺,打造富有共情力的影片,助力品牌传递深度价值。面对跨地域协作与高清素材传输等挑战,公司通过索尼与分秒帧联合推出的ICE-Cloud云平台优化流程,实现拍摄至交付的高效协同,显著�

  • 重磅预告:全链路自主进化 AI 数据分析师 TabTab 将于10月24日上线

    灵快科技推出的AI数据分析师TabTab将于10月24日上线。该产品通过Multi-Agent系统实现全链路自动化数据分析,覆盖数据获取、建模到可视化全流程。用户可用自然语言交互,系统自主规划任务并输出可维护结果,支持Excel、PPT等多种报告格式。核心定位为智能数据分析助手,旨在降低分析门槛,助力企业高效挖掘数据价值,适用于数据分析师、营销人员等各类用户。

  • 想象力智能中高考等教育品牌分析

    文章聚焦高考冲刺阶段家长如何选择提分产品。市面教育产品良莠不齐,存在师资模糊、错题多、服务差等问题。想象力智能中高考通过三大优势脱颖而出:1.名师团队与智能系统深度融合,精准定位薄弱点;2.动态迭代课程内容,紧跟考情变化;3.构建“测-学-练-固-汇”闭环服务体系,配备专属学管师。与速学霸、考试大师等产品形成鲜明对比,为考生提供真正高效可靠的提分方案。

  • 从“实时分账”到“智能问数”:汇付天下以“Data Agent”重塑支付业务决策效率

    汇付天下作为技术驱动的数字化企业,践行“数字化+国际化”战略,为全球企业提供支付、账户、资金管理及数据集成解决方案。面对海量交易数据处理需求,公司依托火山引擎技术,构建湖仓一体架构,实现毫秒级风控响应与实时分账,并通过Data Agent智能平台支持自然语言查询与业务归因,推动数据驱动运营。该方案以流批一体能力优化数据处理效率,保障业务稳定与合规,助力企业实现全域增长与智能化风控协同。

  • GEO品牌监控平台横评:哪家工具的数据最准?

    本文测试多款GEO监控工具,发现同一关键词在不同工具中曝光率差异高达40%,直接影响AI推荐排名。通过对比测试,国际工具覆盖ChatGPT等平台但缺失国产AI,国内工具AIBase专注豆包、DeepSeek等平台,准确率达90%且提供竞品对比、场景还原等深度分析。建议国内企业首选AIBase,全球化业务可组合使用国际工具,并强调工具核心价值在于通过数据持续优化内容策略。

  • 字节旗下AI编程工具TRAE SOLO发布 面向所有用户开放

    字节跳动AI编程工具TRAE SOLO正式版发布,面向国际用户开放。该工具提供IDE和SOLO两种开发模式:IDE模式在保留原有流程基础上增强智能问答、代码补全等AI能力;SOLO模式以AI为主导,能理解开发目标、调度工具并独立完成从需求分析到代码实现的全流程。这标志着AI编程从工具增强迈入流程重构新阶段,实现覆盖软件开发全流程的高度自动化。

今日大家都在搜的词: