首页 > 业界 > 关键词  > 字节跳动最新资讯  > 正文

提升大模型自动修Bug能力 豆包正式开源首个多语言类SWE数据集

2025-04-10 15:11 · 稿源: 快科技

快科技4月10日消息,今日,字节跳动豆包大模型团队宣布,正式开源首个多语言类SWE数据集Multi-SWE-bench,可用于评估和提升大模型自动修 Bug”能力。

在SWE-bench基础上,Multi-SWE-bench首次覆盖Python之外的7种主流编程语言(Java、Go、Rust、C、C、TypeScript、JavaScript),是真正面向全栈工程”的评测基准。

Multi-SWE-bench包含1632个实例,均来自GitHub issue,并经过统一的测试标准和专业开发者的审核筛选,确保每个样本具备清晰的问题描述、正确的修复补丁以及可复现的运行测试环境。

豆包大模型团队希望,Multi-SWE-bench能作为大模型在多种主流编程语言与真实代码环境中的系统性评测基准,推动自动编程能力向更实用、更工程化的方向发展。

团队表示,相比于以往聚焦Python的单语言任务,Multi-SWE-bench更贴近现实中的多语言开发场景,也更能反映当前模型在自动化软件工程”方向上的实际能力边界。

举报

  • 相关推荐
  • 大模型时代的新燃料|标贝科技推出大规模拟真多风格语音合成数据集

    本文探讨了人工智能语音交互领域的发展现状与挑战。文章指出,大模型技术驱动下语音交互应用场景持续拓展,但面临数据质量、隐私合规等挑战。当前语音大模型训练需要TB至PB级数据,而传统数据供给模式难以满足需求。合成数据作为真实数据的重要补充,能通过参数化生成机制规避隐私风险,突破传统数据在多样性和场景覆盖上的局限性。国内外科技企业已开始广泛应用合成数据训练AI模型,如Meta的LLaMA3和微软的Phi-4模型。标贝科技推出超大规模拟真多风格语音合成数据集,包含上万小时数据,覆盖中英混合场景,支持情感合成、风格迁移等前沿任务,为虚拟偶像、数字人等元宇宙场景提供实时语音生成方案。该数据集基于32kHz高保真采样率技术,在自然度、流畅度等方面达到行业领先水平。

  • 奔驰新款CLA接入豆包大模型

    4月22日,奔驰与火山引擎合作的首款国产纯电车型CLA全球首发亮相。该车搭载奔驰自研MB.OS架构,接入火山引擎大模型,支持个性化智能交互体验。智能系统可识别4种情绪并给予反馈,交互效率提升50%,唤醒仅需0.2秒。虚拟助手能解答百科问题并协助车辆功能设置。这是双方继2024年8月达成AI战略合作后落地的首款量产车型,结合生成式AI和大数据技术,为中国用户打造更智能的用车体验。

  • Qwen3深夜正式开源,小尺寸也能大力出奇迹。

    阿里发布通义千问Qwen3大模型系列,包含8个不同规模的模型,从0.6B到235B参数全覆盖。亮点包括:1)全球顶尖模型能力;2)首个开源的混合推理模型;3)支持119种语言;4)部署成本仅为DeepSeek+R1的三分之一;5)支持MCP协议。其中235B旗舰模型性能对标顶级闭源模型,30B-MoE模型激活参数仅3B。所有模型均采用Apache2.0协议开源,支持商用。实测显示Qwen3在代码和写作方面优于DeepSeek

  • 长安马自达EZ-60全球首秀,接入豆包大模型

    4月23日,长安马自达EZ-60在2025上海国际车展全球首发。作为品牌新能源战略转型产品,该车在美学设计、AI智能座舱、电感驾控及主被动安全性能等方面实现突破。最大亮点是全面接入豆包大模型,用户可通过语音指令实现复杂操作、互联网信息问答及短视频搜索等功能,打造"人-车-环境"跨模态交互体验。专属AI助手支持超700项功能语音调用,实现"所说即所得"的智能交互。长安马自达与火山引擎达成深度合作,将持续推进大模型在智能座舱领域的创新应用。

  • “奥迪助手”来了!全新AUDI车型接入豆包大模型

    2025年4月24日上海车展期间,上汽奥迪发布全新A5L Sportback和首款量产车型E5 Sportback。同时推出与火山引擎合作开发的"奥迪助手"智能交互系统,基于豆包大模型实现自然对话体验。该系统将搭载于两款新车,并同步部署在车载端和手机APP端,支持跨设备对话记录同步。火山引擎为系统提供大模型技术支持,实现语音指令控制、车辆功能讲解等智能服务,并整合抖音、汽水音乐等内容生态。上汽奥迪表示,该合作将助力品牌打造更智能、个性化的产品矩阵。

  • 2025上海车展:BBA等八成主流车企已接入豆包大模型

    2025年4月23日,第二十一届上海国际车展开幕。本届车展以"新能源"和"智能化"为核心主题,吸引近千家中外汽车企业参展,展出车辆超千辆,其中新能源车占比超七成。奔驰、奥迪、长安马自达等品牌展示了基于豆包大模型的智能座舱系统,交互效率提升50%,唤醒速度仅0.2秒。火山引擎与多家车企达成战略合作,共同推进AI大模型在智能驾驶、数字座舱等领域的�

  • 全球首个女性肿瘤AI大模型 “木兰”正式进入临床应用

    快科技5月14日消息,华中科技大学宣布,全球首个女性肿瘤AI大模型木兰”,正式进入临床应用阶段。目前,公众可通过华中科技大学同济医院”公众号或掌上同济”APP,在互联网医院下的同济木兰AI咨询”栏目中获得免费服务。未来,该模型还将通过更多手机端线上平台、电脑端应用以及各级医疗机构等多种渠道,向公众开放。据介绍,木兰”由华中科技大学同济医学院附属同济医院主导研发,该模型以国内外权威的女性肿瘤医疗指南和高质量专家共识为基础,融合了同济医院近20年来的高质量病例数据。还整合了中国工程院院士、同济医院妇产科学系主任

  • 伟世通×火山引擎:发布基于豆包大模型的智能座舱解决方案

    2025年上海车展期间,火山引擎与伟世通联合发布基于AI大模型的下一代智能座舱解决方案。该方案融合豆包大模型AI能力和伟世通高性能域控平台,通过端云协同架构和多模态交互技术,实现离线功能闭环运行和快速响应。方案接入火山丰富的内容生态,支持个性化推荐和"千人千面"自适应设计,同时具备多模态交互能力,实现更自然的人机交互。双方还将共同探索AI大模型在智能座舱场景的优化适配,助力车企打造差异化智能座舱体验。

  • 理想自研星环OS正式开源!操作系统代码已开放下载

    理想汽车4月28日宣布自研"星环OS"操作系统正式开源,成为全球首个实现整车级操作系统全面开源的车企。该系统代码已通过Gitee平台开放下载,采用Apache License V2.0开源协议,覆盖智能车控、智能驾驶、通信中间件、信息安全四大核心模块。该系统不同于车载屏幕系统,而是整车全链路操作系统,包括车辆控制等核心功能。研发始于2021年,投入200名研发人员和10亿元人民币。系统采用资源集中与共享架构,支持英飞凌、地平线等主流车规芯片,芯片适配验证时间比传统闭源系统缩短80%。在性能方面,AI算力虚拟化损耗降低80%,传感器访问时延降低90%,存储资源占用减少30%,响应速度比AUTOSAR提升1倍。安全性能方面,120km/h高速状态下AEB刹停距离缩短7米。

  • 李想:理想VLA司机大模型 就是从动物进化到人

    预训练相当于人类学习物理世界和交通领域的常识,通过大量高清2D和3D Vision(视觉)数据、交通相关的Language(语言)语料,以及与物理世界相关的VL(Vision-Language,视觉和语言)联合数据,训练出云端的VL基座模型,并通过蒸馏转化为在车端高效运行的端侧模型。