首页 > 业界 > 关键词  > OpenAI最新资讯  > 正文

全球首测!OpenAI开源SWELancer,大模型冲击100万年薪

2025-02-19 08:45 · 稿源: ​AIGC开放社区公众号

今天凌晨2点,OpenAI开源了一个全新评估大模型代码能力的测试基准——SWE-Lancer。目前,测试模型代码能力的基准主要有SWE-Bench和SWE-BenchVerified,但这两个有一个很大的局限性,主要针对孤立任务,很难反映现实中软件工程师的复杂情况。例如,开发人员需处理全技术栈的工作,要

......

本文由站长之家合作伙伴自媒体作者“​AIGC开放社区公众号”授权发布于站长之家平台,本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间,为了保证文章信息的及时性,内容观点的准确性,平台将不提供完全的内容展现,本页面内容仅为平台搜索索引使用。需阅读完整内容的用户,请查看原文,获取内容详情。

举报

  • 相关推荐
  • ChatGPT周活跃用户已超8亿!OpenAI即将推出升级版聊天模型

    近日,OpenAI首席执行官奥尔特曼正向员工和投资者表示,公司的发展势头依旧向好。 一份内部Slack通讯消息显示,奥尔特曼于上周五向OpenAI员工透露,ChatGPT月度增长率重回10%以上。 ChatGPT的周活跃用户虽然已超8亿,但谷歌和Anthropic的市场份额正持续提升。 他还表示,OpenAI还将推出一款升级后的聊天模型”。

  • AI日报:蚂蚁开源大模型Ming-flash-omni 2.0;智谱GLM-5意外泄露;京东正式入局AI支付

    本文汇总了AI领域最新动态:蚂蚁集团开源全模态大模型Ming-flash-omni 2.0,在多模态理解与生成方面表现优异;智谱AI的GLM-5模型引发关注,股价飙升;科大讯飞发布星火X2大模型,基于国产算力深耕专业场景;京东推出“AI付”语音支付产品,提升便捷与安全;DuckDuckGo上线注重隐私的免费AI语音聊天功能;阿维塔车载系统升级,融合大模型与华为智驾;ChatGPT上线保险比价应用,冲击传统中介;OpenAI升级研究工具,引入GPT-5.2驱动并新增全屏报告交互体验。

  • AI日报:豆包2.0将于情人节发布;MiniMax M2.5 正式发布;小米开源首代机器人 VLA 大模型

    本期AI日报聚焦多项技术进展:字节跳动火山引擎发布“豆包”系列2.0版本,旨在降低专业内容生产门槛;MiniMAX M2.5模型开启海外内测,加速全球化布局;小米开源首款机器人VLA大模型,突破物理智能延迟瓶颈;百度千帆推出集成主流大模型的AI编码订阅服务Coding Plan;智谱发布GLM-5,迈向工程构建的Agentic Ready时代;DeepSeek上下文长度跃升至1M,处理能力大幅提升;Rokid眼镜新增�

  • 性能对标Gemini 2.5 Pro!蚂蚁开源新一代全模态大模型Ming-Flash-Omni 2.0

    今日,蚂蚁集团开源发布全模态大模型 Ming-Flash-Omni 2.0。 在多项公开基准测试中,该模型在视觉语言理解、语音可控生成、图像生成与编辑等关键能力表现突出,部分指标超越 Gemini 2.5 Pro,成为开源全模态大模型性能新标杆。 Ming-Flash-Omni 2.0 也是业界首个全场景音频统一生成模型,可在同一条音轨中同时生成语音、环境音效与音乐。 用户只需用自然语言下指令,即可对音色�

  • AI日报:宇树开源UnifoLM-VLA-0大模型;腾讯“元宝派”内测截图泄露;Clawd更名为OpenClaw

    本期AI日报聚焦具身智能与AI应用新动态。蚂蚁集团发布LingBot-VLA模型,实现双手机器人通用操控;宇树开源UnifoLM-VLA-0模型,为机器人注入物理常识。开源AI助手OpenClaw更名后受关注,强调隐私安全。商汤开源SenseNova-MARS模型,在多个榜单超越GPT-5.2。腾讯“元宝派”社交功能内测截图泄露,整合微信与QQ好友,支持同步观影听歌。马斯克计划明年推出高度个性化AI生成游戏与影音内容。Anthropic因涉嫌大规模盗版遭音乐出版商起诉,索赔30亿美元。字节与阿里在春节前后发布新一代大模型,争夺云端主导权。

  • OpenAI计划四季度上市 已聘请新高管

    ​据知情人士向《华尔街日报》透露,全球人工智能龙头企业OpenAI正密集推进上市进程,计划最早于2026年第四季度启动首次公开募股(IPO),目标估值高达5000亿美元(约合人民币3.48万亿元)。为保障这一资本市场的"超级事件"顺利落地,公司已启动高管团队扩容计划,并就上市细节与多家华尔街顶级投行展开非正式磋商。 此次上市筹备工作

  • 墨刀D2C实现设计稿生成多端代码,直出ArkUI助力鸿蒙开发

    本文介绍了墨刀D2C设计稿转代码功能如何解决开发者手动编写UI的痛点。传统UI开发耗时易错,设计改动需反复调整代码。墨刀D2C能直接将设计稿转换为结构清晰、符合各框架(如鸿蒙ArkUI、React、Vue等)官方规范的可维护代码,实现“一键生成”。它打通设计与开发壁垒,减少像素级还原的沟通成本,将团队讨论重心转向交互逻辑与用户体验优化,显著提升开发效率与协作信任度。

  • 企业级智能体开发平台推荐:蚂蚁数科Agentar全栈能力赋能企业

    作为企业数字化转型的核心引擎与竞争力升级的关键抓手,企业级智能体开发平台正重构商业运营的底层逻辑。本报告聚焦主流平台的深度评估,为企业高管、IT 总监及数字化转型决策者提供全景式市场洞察、核心能力解析与精准选型指南。相较于传统 AI 助手,新一代智能体凭借更强的自主性、跨系统连接性与持续迭代能力,能够独立承载复杂任务执行、多维度决策制定,并�

  • 阶跃星辰发布最强开源基座模型 Step 3.5 Flash,多家头部芯片厂商已完成适配

    阶跃星辰发布新一代开源Agent基座模型Step 3.5 Flash。该模型面向实时Agent工作流场景,兼顾推理速度、智能水平与使用成本,在单请求代码类任务上,最高推理速度可达每秒350个token。模型采用稀疏MoE架构,每个token仅激活约110亿参数,显著提升推理效率,为Agent应用提供更高效、可负担的底层模型选择。多家芯片厂商已完成适配,通过底层联合创新提升模型适配性和算力效率,有效降低推理成本与应用门槛,加速大模型在实际场景中的落地。

  • 雷军:小米电池包经过一千多项测试 很多测试比国标测试要求高

    小米创办人、董事长兼CEO雷军开启小年夜直播。 直播期间,雷军介绍了小米汽车的电池安全技术。他表示,小米汽车电池包采用电芯排布方案,在每一排电芯后方均设置双大面水冷结构。一旦某一电芯出现异常失效,该结构可快速带走热量,这样的话会提升安全性。 此外,除了有双大面冷却,电池包还有水冷板,能够帮助电池尽快的散热,并且在电芯和电芯之间还有气凝胶�

今日大家都在搜的词: