代码能力超越GPT-4，这个模型登顶Big Code排行榜，YC创始人点赞

2023-11-03 14:36 · 稿源：量子位公众号

一款号称代码能力超越GPT-4的模型，引发了不少网友的关注。准确率比GPT-4高出超过10%，速度却接近GPT-3.5，而且窗口长度也更长。据开发者描述，他们的模型取得了74.7%的Pass@1通过率，超过了原始GPT-4的67%，登上了Big Code榜首。这个模型名叫Phind，和以其为基础的面向开发者的AI

......

本文由站长之家合作伙伴自媒体作者“量子位公众号”授权发布于站长之家平台，本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间，为了保证文章信息的及时性，内容观点的准确性，平台将不提供完全的内容展现，本页面内容仅为平台搜索索引使用。需阅读完整内容的用户，请查看原文，获取内容详情。

即将跳转到外部网站

安全性未知，是否继续

继续前往

（举报）

相关推荐

关键词：

GPT-4
模型

OpenAI发布GPT-5.1：情商大涨本周开始推送

OpenAI正式推出GPT-5.1模型，以“智商与情商深度融合”为核心亮点。新模型优化推理能力，强化情绪价值与个性化交互，包含Instant与Thinking两大核心版本：Instant首次引入自适应推理功能，针对复杂任务延长思考时间，简单问题保持极速响应；Thinking版本智能分配思考时长，提升回答透彻度与通俗性。新增Auto功能自动匹配最佳模型，支持六种官方预设风格及精准微调。安全评估首次纳入心理健康与情感依赖维度，防范拟人化风险。付费用户可保留旧版三个月过渡期。

GPT-5.1模型智商与情商自适应推理
荐AI日报：月之暗面开源AI新框架Kosong；百度发布新模型ERNIE-4.5-VL；GPT-5.1“隐身”登场

本期AI日报聚焦多项技术突破：月之暗面开源AI代理框架Kosong，支持异步编排与插件化设计；Replit推出AI集成功能，可一键调用300+模型；商汤发布空间智能模型SenseNova-SI，性能超越GPT-5；百度推出多模态模型ERNIE-4.5-VL，新增图像思考能力；谷歌地图全面AI化，集成Gemini实现智能交互；ChatTutor上线可视化教学系统，覆盖多学科实时推演；新版Google Finance引入AI深度搜索与财报追踪；OpenAI低调上线Polaris Alpha模型，支持256K上下文并更新知识库至2024年10月。

AI代理开源框架异步编排
荐AI日报：李飞飞Marble 3D世界模型公测；OpenAI首次推出ChatGPT群聊功能；百度发布多模态 AI助手超能小度

本期AI日报聚焦多项技术突破：World Labs推出Marble 3D模型，实现多模态生成可交互虚拟世界；OpenAI在韩新试点ChatGPT群聊功能，支持多人协作互动；苹果更新隐私政策，要求第三方AI调用需明示授权；百度发布多模态助手“超能小度”，支持空间感知与设备免费升级；LinkedIn推出AI人脉搜索，通过自然语言精准匹配专业人士；Cursor完成23亿美元融资，估值达293亿；Character AI与耶鲁合作实现音画同步技术Ovi；Google NotebookLM上线深度研究工具，支持多格式文件分析与知识库构建。

AI 3D虚拟世界多模态输入
第49家零售店来了！苹果北京大兴Apple Store官宣12月6日开业

今日，苹果宣布，北京荟聚Apple Store将于12月6日上午10:00开业。新店位于北京市大兴区欣宁街15号北京荟聚一层，是苹果在北京的第6家、中国大陆第49家零售店。

苹果零售店北京荟聚 Apple
颠覆Diffusion局限！Utopai双模型耦合架构，攻克AI影视长叙事核心难题

Utopai Studios推出专为影视制作设计的AI模型与工作流，区别于主流视频生成模型，其核心能力在于理解剧本、规划镜头及生成场景，通过自回归模型负责叙事规划与一致性约束，扩散模型专注高质量画面渲染。该系统能解决跨镜头元素漂移难题，提升制作效率与作品品质。目前工作流仅用于公司自有项目，强调AI作为创作者协作者的角色，并遵循行业道德与版权规范。

AI影视制作 Utopai Studios
荐AI日报：阿里千问APP公测；Veo 3.1上线多图参考；超级小爱AI大模型“随心修图”上线

本期AI日报聚焦多项技术突破：阿里千问APP公测，基于Qwen3模型对标ChatGPT；谷歌Veo 3.1支持三图融合生成8秒视频；小米推出"随心修图"功能与7B多模态模型Miloco；谷歌Flow集成Nano Banana模型实现智能抠图；多模态AI工具DeepEyesV2可执行代码与网络搜索；NotebookLM升级支持图像导入检索；JetBrains推出DPAI Arena测试编码AI性能。全球AI竞争持续升温，产品迭代加速。

AI 阿里巴巴千问APP
双11洗衣机：海尔云溪4.0居行业销额TOP1

双十一期间，海尔云溪4.0洗衣机凭借AI直驱洁净科技和AI双擎热泵技术，精准解决顽固污渍难洗净、娇贵面料易损伤、烘干缠绕打结等用户痛点，实现15分钟洗净81种污渍、1.28超高洗净比及透干不伤衣效果，以技术升级推动行业从“洗净”向“洗好护好”转型，稳居行业销额榜首。

双十一家电竞争海尔洗衣机
Billus AI高交会全球首发多模态大模型以AI Agent重构创意产业文明进化路径

2025年11月15日，Billus AI在高交会首发多模态大模型Billus0.57EDIT及“超级员工智能体”初阶版，依托自研生存式大模型与AI Agent技术，打破创意领域垂直局限，构建覆盖文创、时尚、艺术等全场景智能创作生态。该模型通过自然语言指令直达创意成果，实现从平面图到施工图的全流程高效生成。同时，Billus AI同步打造“创意设计超级员工+产业链智能体”体系，探索生成式创意与供应链智能推荐的新商业路径，助力行业从“经验驱动”向“数据智能”跃迁。

高交会 Billus毕鲁斯多模态大模型
Creators’ App迎来重大更新

索尼与分秒帧联合推出云端影像创作平台ICE-Cloud，集成索尼先进影像技术与高效云端协作能力，为创作者提供从拍摄到后期全流程赋能。平台支持移动端、PC端及网页应用，实现素材自动上传、云端管理、在线审片和项目协同，打破时空限制，提升创作效率。通过Creators’ App连接相机与云端，实现即拍即传、异地实时协作，致力于打造新一代创意工作流。

索尼云端影像创作平台 Creators’
智检加速：AI云测试如何为香港企业 IT 项目减负40%人力成本

香港企业在App研发中面临高昂人力成本与复杂技术栈挑战，导致测试效率低、交付缓慢。Testin云测通过AI驱动的自动化测试方案，整合云端资源与专业服务，实现降本增效：硬件投入优化50%，人力成本降低40%；AI脚本生成技术提升测试效率60%，支持跨平台复用；精准OCR识别助力迭代周期缩短50%。聚焦金融、政企、交通等重点行业，提供符合国际标准的安全测试保障，助力企业从人力密集型向技术密集型转型，以更高质量、更快速度赢得市场竞争。

商业痛点香港企业质量保证

今日大家都在搜的词：

热文

3 天
7天

代码能力超越GPT-4，这个模型登顶Big Code排行榜，YC创始人点赞

OpenAI发布GPT-5.1：情商大涨本周开始推送

荐AI日报：月之暗面开源AI新框架Kosong；百度发布新模型ERNIE-4.5-VL；GPT-5.1“隐身”登场

荐AI日报：李飞飞Marble 3D世界模型公测；OpenAI首次推出ChatGPT群聊功能；百度发布多模态 AI助手超能小度

第49家零售店来了！苹果北京大兴Apple Store官宣12月6日开业

颠覆Diffusion局限！Utopai双模型耦合架构，攻克AI影视长叙事核心难题

荐AI日报：阿里千问APP公测；Veo 3.1上线多图参考；超级小爱AI大模型“随心修图”上线

双11洗衣机：海尔云溪4.0居行业销额TOP1

Billus AI高交会全球首发多模态大模型以AI Agent重构创意产业文明进化路径

Creators’ App迎来重大更新

智检加速：AI云测试如何为香港企业 IT 项目减负40%人力成本

今日大家都在搜的词：

热文

华为Mate 80系列已在华为商城开启预约

华为Mate 80 Pro Max外观公布：采用双圆环设计

华为Mate 80/Pro/Pro Max/RS开启预约：全系直屏设计

AI日报：阿里千问APP公测；Veo 3.1上线多图参考；超级小爱AI大

荣耀500系列官宣将于11月24日发布

小米超级小爱AI大模型推出随心修图功能

一加Ace 6T官宣将于本月发布：首发骁龙8 Gen5

阿里巴巴回应千问崩了：状态良好欢迎来问

影视飓风CEO在相亲角被大妈吐槽网友：大妈不识货

腾讯发布2025第三季度财报：营收1928.69亿元同比增长 15%

小米澎湃OS 3第三批正式版推送：支持小米14、K70系列等

华为Mate 80系列已在华为商城开启预约

AI日报：百度发布文心5.0；可灵2.5Turbo模型上线“首尾帧”功能

AI日报：李飞飞Marble 3D世界模型公测；OpenAI首次推出ChatGPT

荣耀500系列开启预约：Pro版外观首次亮相

华为Mate 80 Pro Max外观公布：采用双圆环设计

1899元苹果手机包卖完了！iPhone Pocket在吐槽声中销售火爆

iPhone Pocket正式开售：联名三宅一生售价1299元起

站长商机