首页 > 原创 > 关键词  > 人工智能最新资讯  > 正文

AI日报:腾讯混元3D 2.1大模型开源;字节跳动AI Lab负责人李航卸任;OpenAI Codex 全新升级

2025-06-16 16:06 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、腾讯宣布混元3D2.1大模型对外开源

混元3D2.1作为首个全链路开源的工业级3D生成大模型,显著提升了几何生成质量和PBR材质生成能力,降低了开发门槛,适用于多个行业领域。

image.png

【AiBase提要:】

✨ 首个全链路开源工业级3D生成大模型,几何生成与PBR材质生成效果显著提升。

🎮 支持游戏、电影、电商等领域生成高质量3D角色、道具与产品模型,告别传统‘塑料感’。

💻 全链路开源且部署友好,适配消费级显卡,适合个人与团队快速上手开发。

详情链接:https://3d-models.hunyuan.tencent.com/

2、OpenAI Codex 全新升级:让程序员轻松获取理想代码

OpenAI Codex迎来重磅更新,通过生成多样代码版本提升开发效率,优化细节如加载进度查看、取消操作等,并支持复杂任务处理,助力开发者专注创新。

image.png

【AiBase提要:】

✨ Codex新增生成多种代码版本功能,满足不同需求,提升开发效率。

🔧 优化细节包括加载进度查看、取消操作及安装问题修复,操作更灵活。

🌟 基于codex-1模型优化,提高代码生成准确性,支持GitHub代码库提取。

3、字节跳动AI Lab负责人李航卸任,Seed团队步入调整期

字节跳动AI Lab负责人李航卸任,转为劳务/顾问身份,标志着字节跳动AI领域的核心团队正在经历重大调整。随着吴永辉、朱文佳等人的加入及团队重组,字节跳动在AI领域的战略方向逐渐清晰。

【AiBase提要:】

李航卸任AI Lab负责人,转为劳务/顾问身份,标志着字节跳动AI Lab的重大人事调整。

自2020年起,AI Lab逐步转型为技术中台,并在2023-2024年将部分大模型团队并入Seed团队。

字节跳动AI Lab自2016年成立以来,历经多位负责人领导,逐步成为支撑字节跳动多项业务的技术核心。

4、微软发布700个真实 AI 案例,探索智能化工作新模式

微软展示了700个AI应用案例,覆盖多个行业,通过AI技术提高企业效率、优化工作体验并提升客户满意度。

image.png

【AiBase提要:】

🌍 全球范围内,微软展示了700个AI应用案例,涵盖金融、医疗、教育等多个行业。

🤖 AI智能体通过自动化任务,显著减少工作时间,提升企业效率。

💼 众多企业借助AI提升客户体验,推动业务增长与运营优化。

5、微软AI重磅发布Code Researcher:58%崩溃解决率震撼业界!

我非常看好Code Researcher这款工具,它通过强大的语义分析和多步骤推理能力,显著提高了系统级软件维护的效率和准确性。作为开发者,我期待它能进一步简化我们的工作流程,减少手动调试的时间。

image.png

【AiBase提要:】

🔍 Code Researcher基于大型语言模型(LLM),能深度分析代码库和提交历史,追踪崩溃根本原因并生成修复补丁。

📈 在Linux内核崩溃修复测试中,Code Researcher的崩溃解决率高达58%,远超SWE-agent的37.5%。

🌐 它适用于多种大型代码库,为企业级软件维护提供高效解决方案,推动系统级软件开发自动化进程。

详情链接:https://www.microsoft.com/en-us/research/publication/code-researcher-deep-research-agent-for-large-systems-code-and-commit-history/

6、AI监工上线!Observer AI让屏幕自动化更高效,解放你的双手

Observer AI作为一款专为屏幕自动化工具设计的AI框架,通过实时监控屏幕内容并进行智能化分析,显著提升了操作效率,解决了传统工具效率瓶颈的问题。

【AiBase提要:】

屏幕实时记录:Observer AI通过高精度捕捉技术完整记录界面变化,确保数据无遗漏。

AI智能分析:内置先进算法快速解析屏幕内容,识别任务完成情况或潜在问题。

自动化响应:支持调用MCP或自定义方案,自动执行下一步操作,实现闭环自动化。

详情链接:https://github.com/Roy3838/Observer

7、Genspark AI 发布革新性 AI Browser,开启智能网络浏览新时代

Genspark AI Browser是一款集成先进AI技术的新型浏览器,通过自动化与智能化功能提升用户生产力。它内置AI代理,提供无广告、超高速的浏览体验,并支持模块化扩展。这款浏览器在学术研究、商业决策和内容创作等领域展现出巨大潜力。

image.png

【AiBase提要:】

🌟 Genspark AI Browser内置AI代理,提供智能导航与内容分析,例如自动搜索全网最低价。

💻 支持MCP Store模块化扩展,用户可通过定制化AI工具满足多样化需求。

🚀 适用于多种场景,包括学术研究、商业决策及内容创作,提升信息处理与任务自动化效率。

8、麻省理工利用 AI 技术迅速修复15世纪名画,仅需三个半小时

麻省理工开发出一种基于人工智能的创新修复技术,通过可拆卸的掩膜和数字地图,大幅缩短艺术品修复时间,提高修复效率。

image.png

【AiBase提要:】

🎨 麻省理工开发新技术,通过 AI 修复名画,仅需三个半小时。

⏳ 该技术将修复时间从数月缩短到几个小时,大幅提高效率。

🖼️ 采用可拆卸掩膜和数字地图,修复过程安全可逆,保护原画。

9、蚂蚁集团和Inclusion AI联合推Ming-Omni:首个开源版多模态GPT-4o

Ming-Omni是一款由蚂蚁集团和Inclusion AI联合推出的多模态模型,具备图像、文本、音频及视频处理能力,支持语音与图像生成、多模态输入融合处理,并开放源代码以促进研究与发展。

image.png

【AiBase提要:】

🌟 支持多模态输入融合处理,无需额外模型或特定任务微调,高效完成多样化任务。

🗣️ 提供语音与图像生成功能,支持方言理解、语音克隆及上下文感知对话,提升人机交互体验。

🌐 首个开源多模态模型,与GPT-4o匹敌,激励社区研究与开发,推动技术进步。

详情链接:https://lucaria-academy.github.io/Ming-Omni/

10、视频版AI换衣框架MagicTryOn,基于Wan2.1视频模型

MagicTryOn 是一种基于大型视频扩散变换器的虚拟试穿框架,通过创新的模型设计和服装保留策略,在大幅度运动场景下表现出色,提升了视频虚拟试穿的时空一致性。

image.png

【AiBase提要:】

🌟 MagicTryOn 采用扩散变换器,显著提升视频虚拟试穿的时空一致性。

👗 引入粗到细的服装保留策略,增强服装细节表现力。

🎥 在大幅度运动场景下表现优异,展现服装与人体动作的自然互动。

详情链接:https://vivocameraresearch.github.io/magictryon/

11、字节跳动Seaweed APT2震撼发布!实时互动AI视频生成,解锁3D虚拟世界新纪元

字节跳动推出的Seaweed APT2是一款高效的AI视频生成模型,具有实时视频流生成、互动相机控制和虚拟人类生成的能力,被认为是通往虚拟全息甲板的重要一步。

image.png

【AiBase提要:】

✨Seaweed APT2采用自回归对抗后训练技术,大幅降低计算复杂性,实现高效实时视频生成。

🎥支持实时3D世界探索和互动虚拟人类生成,适用于虚拟主播、游戏角色等多种场景。

🌟相比传统模型,Seaweed APT2在动作连贯性和场景多样性方面有显著提升,开启AI视频生成新篇章。

12、OpenAI升级ChatGPT Search功能,提供更精准、更智能的响应

我非常看好这次ChatGPT Search的功能升级,它不仅提升了搜索质量,还增强了用户体验,尤其是新增的图片搜索和项目管理功能,让ChatGPT变得更强大、更实用。

image.png

【AiBase提要:】

🔍 新增图片搜索功能,支持多样化交互方式。

📚 Projects功能升级,助力高效管理对话和文件。

🌐 挑战谷歌霸主地位,提供更高效、人性化搜索体验。

13、字节火山引擎澄清与老凤祥 AI 智能眼镜合作传闻

本文探讨了关于字节跳动旗下火山引擎与中国珠宝品牌老凤祥合作开发AI智能眼镜的传闻,分析了双方的声明以及实际展示的功能。

【AiBase提要:】

火山引擎否认与老凤祥合作开发AI智能眼镜,但老凤祥展示的眼镜确实使用了豆包大模型。

老凤祥AI眼镜专为老年用户设计,具备多种实用功能如语音导航、实时翻译等。

豆包大模型作为公开产品,任何合规客户均可购买并应用到自己的设备中。

举报

  • 相关推荐
  • 腾讯混元3D世界模型在魔搭社区开源首发

    7月27日,腾讯混元3D世界模型1.0在魔搭社区开源首发。这是业界首个开源的沉浸式3D世界生成模型,支持文字/图片输入快速生成完整3D场景,将原本需要数周的建模时间缩短至几分钟。该模型显著提升了游戏开发、VR、数字内容等领域的创作效率,开发者可免费下载体验,还能通过魔搭社区提供的4000+MCP服务和调试工具进行优化训练。作为中国最大AI开源社区,魔搭已汇聚500+机构、7万+模型,覆盖36个国家1600万开发者。此前腾讯开源的混元MoE模型Hunyuan-A13B也在该社区首发。

  • 加速AI场景落地和产业赋能 云谷“论数”之人工智能产业应用大会圆满举办

    7月16日,云谷"论数"之"AI·场景落地+产业崛起 就在浙里"人工智能产业应用大会在杭州举行。活动由浙江省工程师学会等多家单位联合主办,聚焦AI规模化落地与科技成果转化。与会专家指出,2025年是AI发展关键年,浙江将深化场景落地实践,打造"应用实践-技术优化-价值创造"闭环。企业代表分享了AI在智能制造、智慧交通等领域的应用案例,强调技术需扎根产业需求。活动还成立了大数据与人工智能专委会,未来将促进产学研协同创新,推动AI在千行百业规模化应用,助力浙江打造全球AI创新高地。

  • 星辰聚智·才启未来:2025世界人工智能大会中国电信发布系列前沿能力及AI产品

    7月27日,TeleAI科技前沿论坛在上海模速空间举办,主题为"星辰聚智·才启未来"。论坛汇聚全球行业专家、青年学者及企业家,探讨AI创新趋势。中国电信发布多项AI成果:1)TeleAI研究院凭借大模型创新获2025SAIL之星奖;2)提出"智传网"三大定律(信容律、同源律、集成律)及生成式智能传输等创新技术;3)发布"星小辰"智能终端,整合高德地图、航旅纵横等服务;4)推出首款智能眼镜"天翼AI智镜",具备物体识别、实时翻译等功能;5)启动"青年智算计划",投入超600P算力支持AI创新。论坛展示AI在终端、机器人等领域的深度应用,体现中国电信"云改数转智惠"战略布局。

  • 零门槛数字IP上线,邦彦Nuwaai掀起世界人工智能大会(WAIC)互动体验热潮​

    邦彦技术在2025世界人工智能大会发布Nuwaai数字人平台,主打"3分钟创建AI数字IP"概念。该平台通过三大核心模块(形象塑造、才艺赋能、个性养成)实现数字人全流程创作,支持古风、职业装等多种风格定制,并能加载营销、直播等专业技能。相比传统方案,Nuwaai将开发成本降至8元起,交付周期缩短至3分钟,支持按需加载功能。平台定位"数字人生产力工具",覆盖营销、社交、娱乐等多场景应用,旨在推动数字人技术从概念探索迈向实用化。目前官网已开放注册,面向个人创作者和企业用户提供低成本数字IP解决方案。

  • 加佳科技亮相世界人工智能大会,参与浦东重点项目签约并发布创新技术成果

    2025世界人工智能大会(WAIC)7月26日在上海开幕。加佳智云的"曦源一号"项目入选浦东新区人工智能重点项目并签约合作协议。加佳科技首次发布"数字商务智能体训练场"创新技术平台,与多家企业达成战略合作。浦东新区人工智能产业规模超1600亿元,占全市40%。加佳科技通过"曦源一号"训练场基础底座平台,为行业提供"硬件+软件+产业解决方案"一体化服务,推动AI与产业深度融合。大会期间,加佳科技展示其核心成果"数字商务智能体训练场"平台,该平台依托国产替代算力,提供全生命周期开发运营服务,降低企业AI应用门槛。加佳科技还与多家企业达成合作,加速构建开放共生的AI产业生态。

  • Checkout.com项尧受邀参与 WAIC2025 共话人工智能时代跨境支付新机遇

    2025世界人工智能大会(WAIC)于7月26-28日在上海举办,全球领先支付解决方案提供商Checkout.com受邀参与"无界人工智能:深化中英合作"主题论坛。其大中华区总经理项尧与行业专家探讨AI赋能跨境商业生态的创新实践,重点分享公司在代理电商平台(Agentic Commerce)领域的支付技术创新,包括与Mastercard、Visa合作构建支持AI代理交易的技术框架。作为支付行业领军者,Checkout.com通过智能支付网络帮助电商平台优化交易管理,支持多币种支付,每年为客户解锁数亿美元收入潜力。本届WAIC展览面积首次突破7万平方米,吸引800余家企业参展,涵盖40余款大模型及60余款智能机器人。

  • 视觉中国战投企业景致三维:启动深圳首家3D数字技术订单班

    视觉中国战略投资企业景致三维联合深圳携创高级技工学校,于2025年7月22日启动深圳首家"3D梦工场订单班"。该项目针对3D数字技术人才缺口,定向培养逆向工程师、动画师、渲染师等紧缺人才。课程引入亚马逊、京东等真实商业项目案例,学生将系统学习3ds Max、Maya等主流工具,并考取职业资格证书。学习期间企业提供奖学金和带薪实习,毕业生考核合格可直接入职景�

  • 智慧养老预告| 让养老更有AI!作为科技邀您共赴WAIC 2025世界人工智能大会

    2025世界人工智能大会(WAIC2025)将于7月26-28日在上海举办,主题为"智能时代 同球共济"。本届大会展览面积首次突破7万平方米,吸引800余家企业参展,展示3000余项前沿展品,涵盖40余款大模型、50余款AI终端、60余款智能机器人及80余款"全球首发"新品。12位诺贝尔奖与图灵奖得主、80余位中外院士、30余国1200位重磅嘉宾将齐聚申城,围绕大模型革命、算力新基建等十大方向展开对话。大会首次将"AI+医疗"列为核心议题,中国主导制定的全球养老机器人国际标准将在会上发布。面对中国3亿老年人口(其中失能半失能老人超4500万)的养老需求痛点,大会将探讨AI赋能智慧养老解决方案,推动"全域数据贯通→精准需求洞察→资源动态调度"闭环,重塑养老产业生态。

  • AI日报:火山引擎发布豆包3.0;通义开源Qwen3非思考模型;谷歌偷偷升级Imagen 4

    【AI日报】栏目聚焦人工智能领域最新动态:1)火山引擎发布豆包系列AI模型升级,包括图像编辑3.0、同声传译2.0等;2)通义千问开源Qwen3-30B模型,支持多语言处理;3)OpenAI推出ChatGPT Study学习助手;4)中国发布HYPIR图像复原大模型;5)谷歌NotebookLM新增视频概览功能;6)谷歌Imagen4图像生成模型升级,性能媲美GPT-4o;7)昆仑万维开源多模态模型Skywork UniPic;8)理想汽车发布首搭VLA大模型的i8纯电SUV;9)谷歌在英国推出AI搜索模式;10)OWL团队开源多智能体协作工具;11)2025年用户增速最快APP榜单显示DeepSeek等AIGC应用表现突出。

  • 工业大模型进入能力正赛,权威评测北电数智骄阳·工业大模型拿下综合排名第一

    国产工业大模型正从概念热潮走向应用深水区。7月24日,SuperCLUE发布中文工业大模型评测基准SC-Industry最新榜单,北电数智"骄阳·工业大模型"以83.44分获综合第一,在应用能力(90.07分)、工业数据分析(90.38分)和工业智能体(89.97分)三个细分维度均居榜首。报告指出,产业级应用能力成为新分水岭,国产模型在工业任务能力方面实现突破。北电数智通过建立工业数据标准体系、研发场景化微调数据生成技术等举措,构建了精准垂类认知、高质量数据治理和合规管控机制三大优势。该模型将亮相2025世界人工智能大会,分享"AI+生产"等核心场景的创新实践。