首页 > 业界 > 关键词  > Devin最新资讯  > 正文

超越Devin!姚班带队,他们创大模型编程新世界纪录

2024-06-03 13:52 · 稿源: 量子位公众号

超越Devin!SWEBench排行榜上迎来了新玩家——StarShip CodeGen Agent,姚班带队初创公司OpenCSG出品,以23.67%的成绩获得全球第二名的成绩。同时创造了非GPT-4o基模的最高纪录(SOTA)。我们都知道,SWEBench评测高度贴近真实编程场景,难度极高,不仅要求模型能理解需求、协调多个

......

本文由站长之家合作伙伴自媒体作者“量子位公众号”授权发布于站长之家平台,本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间,为了保证文章信息的及时性,内容观点的准确性,平台将不提供完全的内容展现,本页面内容仅为平台搜索索引使用。需阅读完整内容的用户,请查看原文,获取内容详情。

举报

  • 相关推荐
  • AI影像的新世界正在加载

    《宇宙肥肠》是一部黏土风格科幻微电影,故事发生在未来星球Y87,一支航空探险小队带回「肥肠计划」后闹出连番笑话。美术风格呈现出异化玩具般的复古质感,虽然是科幻设定,但又充满黑色幽默的现实讽刺氛围。在IMAX银幕观影过程中,我甚至忘记了「AI生成」这个前提,联想起了《僵尸新娘》式的黏土动画杰作。 由快手可灵AI与星芒短剧联合出品、异类Outliers团队制作�

  • 连打40万页创世界纪录,奔图“扛打”护航2025天津夏季达沃斯

    奔图打印机在2025年天津夏季达沃斯会议上发布新款"扛打"系列产品,以连续打印40万页、卡纸率低于0.02‰的卓越性能打破世界纪录,成为会议指定服务用机。该系列通过WRCA认证,获得"世界卓越的扛打耐用打印机"证书,展现了中国打印产业的技术突破。奔图建立了覆盖全国的快速响应服务体系,推出"三年20万页"超长质保服务,并针对物流、医疗等行业痛点提供解决方案。作为中国唯一掌握激光打印核心技术的品牌,奔图产品已热销全球110多个国家和地区,累计下线超2000万台,连续8年保持全球增速第一,推动中国打印产业从技术突围向创新引领转变。

  • 8999元起!荣耀Magic V5一图看懂:拿下8大世界纪录

    荣耀Magic V5今晚正式发布,是全球最轻薄折叠屏手机,同时也是一款折叠机皇。 拿下8大世界纪录,包括:0.18mm超薄高硅电芯芯片、0.014mm超细编织航天纤维、0.003mm超高组装适配精度,8.8mm最薄折叠手机、217g最轻折叠手机、25%最高硅含量电池、6100mAh最大折叠电池,以及2300MPa最强铰链钢材。 配置如下: 芯片:搭载骁龙8至尊芯片满血版。 通信:支持全球多版本卫星通信,覆盖1

  • 国内有哪些ai大模型?一文看懂中国核心AI大模型全景

    近两年中国AI大模型发展迅猛,已形成"通用+行业"双轨并进的生态格局。百度文心一言、阿里通义千问等通用大模型在中文理解、多模态生成等方面表现突出;深度求索DeepSeek以1/10参数实现GPT-4级推理能力;月之暗面Kimi以20万汉字上下文窗口领跑长文本处理;智谱AI的GLM-4成为首个支持视频对话的国产千亿模型。医疗、金融等垂直领域涌现出百川智能等专业模型,覆盖超1000家医院。开源生态加速国产芯片适配,15家厂商完成深度优化。行业应用方面,工程文档效率提升60%,24小时拟人化客服等案例凸显价值。未来趋势呈现模型蒸馏、端侧部署和开源生态三大方向,中国AI正从实验室走向产业变革前沿。

  • 当 CODING 宣布其 DevOps 产品停服计划时,国内软件研发工具行业的平静被彻底打破

    腾讯旗下CODING DevOps平台将于2024年9月起逐步停服,极狐GitLab迅速推出专属迁移福利争夺用户。其优惠政策包括:首年订阅超低折扣(SaaS团队版300元/人)、免费代码仓库迁移服务、社区版用户专属折扣及3个月企业版试用权益。此举直击用户迁移痛点,降低经济门槛和操作风险。极狐凭借"中外合作3.0"模式在中国市场快速崛起,已与沃尔玛、理想汽车等企业建立成功合作案例。这场用户争夺战将加速国内研发工具行业洗牌,推动平台提升智能化服务和生态建设,最终使开发者获得更高效的工具选择。

  • 主流AI多模态大模型有哪些?超全的多模态大模型指南分享

    2024年多模态大模型成为AI领域最具前景的技术方向之一。文章全面分析了主流多模态大模型的特点、应用场景和发展趋势。多模态大模型能同时处理文本、图像、音频、视频等多种数据,实现更智能的人机交互。重点介绍了GPT-4V、Claude3.5、Gemini、通义千问等代表性模型,对比了它们在视觉理解、编程能力、中文处理等方面的优势。应用场景涵盖智能客服、内容创作、教育医疗等领域。未来发展趋势包括模型规模扩大、支持更多模态、实时交互能力提升等。选择模型需考虑应用需求、语言支持、性能成本等因素。

  • “晓妙”产业大模型——AI驱动的产业变革

    7月4日,安徽数智建材研究院在长城工程科技会议上发布"晓秒"产业大模型。该模型由傲林科技投资支持,采用"1+1+N"架构,融合数据、机理和业务模型,实现生产运营全流程实时闭环优化。中国建材集团董事长周育先表示,该模型已在水泥板块试点应用,吨水泥成本降低1%以上,能耗电耗下降2%以上。会议指出,AI落地制造业需突破三大关键:建立数字化体系、夯实数据基础、实现工艺与数据融合。未来将拓展至新能源、钢铁等十余个行业,推动产业智能化升级。

  • 马斯克旗xAI推出Grok 4 宣称世界上最强大的AI模型

    据媒体报道,马斯克旗下人工智能公司xAI正式推出新一代旗舰模型Grok 4,并宣称其为世界上最强大的AI模型”。 该模型基于xAI的Colossus超级计算机训练,核心优势在于其深度推理能力,承诺带来显著增强的逻辑推理和文本生成水平。 此外,Grok 4还具备自然的人类对话风格、实时网络访问能力,以及对互联网文化(包括梗、俚语和幽默)的高精度理解。

  • @开发者们:百度文心大模型4.5系列模型开源,国内首发平台GitCode现已开放下载!

    6月30日,百度文心大模型4.5系列正式开源并在国内领先的开源平台GitCode首发上线。该系列包含10款模型,涵盖47B和3B参数的混合专家(MoE)模型及0.3B的稠密参数模型,采用创新的多模态异架构结构实现跨模态知识融合。模型基于飞桨框架开发,训练效率达47% MFU,在文本和多模态基准测试中达到SOTA水平。所有模型按Apache2.0协议开源,配套产业级开发套件支持多种芯片部署。GitCode平台已汇聚620万用户,为AI开发者提供代码托管、协同开发等全流程支持。此次开源将推动中国AI生态创新,加速大模型技术产业化应用。

  • 文生图大模型有哪些?探索AI绘画的核心引擎与选择利器

    本文探讨了当前主流的AI文生图技术及其应用场景。国际阵营中,OpenAI的DALL·E3擅长复杂语义理解,MidJourney以艺术风格见长,Stable Diffusion则以开源生态支持深度定制。中国力量方面,百度文心一格在中文语义和国风创作表现突出,阿里通义万相侧重商业化应用,昆仑万维天工支持长文本生成连贯图像。垂直领域工具如Adobe Firefly深度集成设计流程,Runway ML革新视频创作。文章建议通过聚合平台高效对比模型特性,并指出下一代技术将突破分辨率限制,实现跨模态生成。从精准语义到无限可能,AI文生图正在重塑视觉创作边界。