首页 > 原创 > 关键词  > 人工智能最新资讯  > 正文

AI日报:腾讯混元3D 2.1大模型开源;字节跳动AI Lab负责人李航卸任;OpenAI Codex 全新升级

2025-06-16 16:06 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、腾讯宣布混元3D2.1大模型对外开源

混元3D2.1作为首个全链路开源的工业级3D生成大模型,显著提升了几何生成质量和PBR材质生成能力,降低了开发门槛,适用于多个行业领域。

image.png

【AiBase提要:】

✨ 首个全链路开源工业级3D生成大模型,几何生成与PBR材质生成效果显著提升。

🎮 支持游戏、电影、电商等领域生成高质量3D角色、道具与产品模型,告别传统‘塑料感’。

💻 全链路开源且部署友好,适配消费级显卡,适合个人与团队快速上手开发。

详情链接:https://3d-models.hunyuan.tencent.com/

2、OpenAI Codex 全新升级:让程序员轻松获取理想代码

OpenAI Codex迎来重磅更新,通过生成多样代码版本提升开发效率,优化细节如加载进度查看、取消操作等,并支持复杂任务处理,助力开发者专注创新。

image.png

【AiBase提要:】

✨ Codex新增生成多种代码版本功能,满足不同需求,提升开发效率。

🔧 优化细节包括加载进度查看、取消操作及安装问题修复,操作更灵活。

🌟 基于codex-1模型优化,提高代码生成准确性,支持GitHub代码库提取。

3、字节跳动AI Lab负责人李航卸任,Seed团队步入调整期

字节跳动AI Lab负责人李航卸任,转为劳务/顾问身份,标志着字节跳动AI领域的核心团队正在经历重大调整。随着吴永辉、朱文佳等人的加入及团队重组,字节跳动在AI领域的战略方向逐渐清晰。

【AiBase提要:】

李航卸任AI Lab负责人,转为劳务/顾问身份,标志着字节跳动AI Lab的重大人事调整。

自2020年起,AI Lab逐步转型为技术中台,并在2023-2024年将部分大模型团队并入Seed团队。

字节跳动AI Lab自2016年成立以来,历经多位负责人领导,逐步成为支撑字节跳动多项业务的技术核心。

4、微软发布700个真实 AI 案例,探索智能化工作新模式

微软展示了700个AI应用案例,覆盖多个行业,通过AI技术提高企业效率、优化工作体验并提升客户满意度。

image.png

【AiBase提要:】

🌍 全球范围内,微软展示了700个AI应用案例,涵盖金融、医疗、教育等多个行业。

🤖 AI智能体通过自动化任务,显著减少工作时间,提升企业效率。

💼 众多企业借助AI提升客户体验,推动业务增长与运营优化。

5、微软AI重磅发布Code Researcher:58%崩溃解决率震撼业界!

我非常看好Code Researcher这款工具,它通过强大的语义分析和多步骤推理能力,显著提高了系统级软件维护的效率和准确性。作为开发者,我期待它能进一步简化我们的工作流程,减少手动调试的时间。

image.png

【AiBase提要:】

🔍 Code Researcher基于大型语言模型(LLM),能深度分析代码库和提交历史,追踪崩溃根本原因并生成修复补丁。

📈 在Linux内核崩溃修复测试中,Code Researcher的崩溃解决率高达58%,远超SWE-agent的37.5%。

🌐 它适用于多种大型代码库,为企业级软件维护提供高效解决方案,推动系统级软件开发自动化进程。

详情链接:https://www.microsoft.com/en-us/research/publication/code-researcher-deep-research-agent-for-large-systems-code-and-commit-history/

6、AI监工上线!Observer AI让屏幕自动化更高效,解放你的双手

Observer AI作为一款专为屏幕自动化工具设计的AI框架,通过实时监控屏幕内容并进行智能化分析,显著提升了操作效率,解决了传统工具效率瓶颈的问题。

【AiBase提要:】

屏幕实时记录:Observer AI通过高精度捕捉技术完整记录界面变化,确保数据无遗漏。

AI智能分析:内置先进算法快速解析屏幕内容,识别任务完成情况或潜在问题。

自动化响应:支持调用MCP或自定义方案,自动执行下一步操作,实现闭环自动化。

详情链接:https://github.com/Roy3838/Observer

7、Genspark AI 发布革新性 AI Browser,开启智能网络浏览新时代

Genspark AI Browser是一款集成先进AI技术的新型浏览器,通过自动化与智能化功能提升用户生产力。它内置AI代理,提供无广告、超高速的浏览体验,并支持模块化扩展。这款浏览器在学术研究、商业决策和内容创作等领域展现出巨大潜力。

image.png

【AiBase提要:】

🌟 Genspark AI Browser内置AI代理,提供智能导航与内容分析,例如自动搜索全网最低价。

💻 支持MCP Store模块化扩展,用户可通过定制化AI工具满足多样化需求。

🚀 适用于多种场景,包括学术研究、商业决策及内容创作,提升信息处理与任务自动化效率。

8、麻省理工利用 AI 技术迅速修复15世纪名画,仅需三个半小时

麻省理工开发出一种基于人工智能的创新修复技术,通过可拆卸的掩膜和数字地图,大幅缩短艺术品修复时间,提高修复效率。

image.png

【AiBase提要:】

🎨 麻省理工开发新技术,通过 AI 修复名画,仅需三个半小时。

⏳ 该技术将修复时间从数月缩短到几个小时,大幅提高效率。

🖼️ 采用可拆卸掩膜和数字地图,修复过程安全可逆,保护原画。

9、蚂蚁集团和Inclusion AI联合推Ming-Omni:首个开源版多模态GPT-4o

Ming-Omni是一款由蚂蚁集团和Inclusion AI联合推出的多模态模型,具备图像、文本、音频及视频处理能力,支持语音与图像生成、多模态输入融合处理,并开放源代码以促进研究与发展。

image.png

【AiBase提要:】

🌟 支持多模态输入融合处理,无需额外模型或特定任务微调,高效完成多样化任务。

🗣️ 提供语音与图像生成功能,支持方言理解、语音克隆及上下文感知对话,提升人机交互体验。

🌐 首个开源多模态模型,与GPT-4o匹敌,激励社区研究与开发,推动技术进步。

详情链接:https://lucaria-academy.github.io/Ming-Omni/

10、视频版AI换衣框架MagicTryOn,基于Wan2.1视频模型

MagicTryOn 是一种基于大型视频扩散变换器的虚拟试穿框架,通过创新的模型设计和服装保留策略,在大幅度运动场景下表现出色,提升了视频虚拟试穿的时空一致性。

image.png

【AiBase提要:】

🌟 MagicTryOn 采用扩散变换器,显著提升视频虚拟试穿的时空一致性。

👗 引入粗到细的服装保留策略,增强服装细节表现力。

🎥 在大幅度运动场景下表现优异,展现服装与人体动作的自然互动。

详情链接:https://vivocameraresearch.github.io/magictryon/

11、字节跳动Seaweed APT2震撼发布!实时互动AI视频生成,解锁3D虚拟世界新纪元

字节跳动推出的Seaweed APT2是一款高效的AI视频生成模型,具有实时视频流生成、互动相机控制和虚拟人类生成的能力,被认为是通往虚拟全息甲板的重要一步。

image.png

【AiBase提要:】

✨Seaweed APT2采用自回归对抗后训练技术,大幅降低计算复杂性,实现高效实时视频生成。

🎥支持实时3D世界探索和互动虚拟人类生成,适用于虚拟主播、游戏角色等多种场景。

🌟相比传统模型,Seaweed APT2在动作连贯性和场景多样性方面有显著提升,开启AI视频生成新篇章。

12、OpenAI升级ChatGPT Search功能,提供更精准、更智能的响应

我非常看好这次ChatGPT Search的功能升级,它不仅提升了搜索质量,还增强了用户体验,尤其是新增的图片搜索和项目管理功能,让ChatGPT变得更强大、更实用。

image.png

【AiBase提要:】

🔍 新增图片搜索功能,支持多样化交互方式。

📚 Projects功能升级,助力高效管理对话和文件。

🌐 挑战谷歌霸主地位,提供更高效、人性化搜索体验。

13、字节火山引擎澄清与老凤祥 AI 智能眼镜合作传闻

本文探讨了关于字节跳动旗下火山引擎与中国珠宝品牌老凤祥合作开发AI智能眼镜的传闻,分析了双方的声明以及实际展示的功能。

【AiBase提要:】

火山引擎否认与老凤祥合作开发AI智能眼镜,但老凤祥展示的眼镜确实使用了豆包大模型。

老凤祥AI眼镜专为老年用户设计,具备多种实用功能如语音导航、实时翻译等。

豆包大模型作为公开产品,任何合规客户均可购买并应用到自己的设备中。

举报

  • 相关推荐
  • 人工智能落地“最后一公里”,戴尔工作站助力AI应用提速

    AI应用落地面临“最后一公里”部署难题:传统流程繁琐耗时,从模型开发到上线需数周。英特尔携手戴尔与零克云打造“工作站-AI PC-云端”协同生态,通过本地工作站进行小规模测试验证,降低试错成本与数据泄露风险,再通过“一键部署”快速扩展至云端规模化落地。这种“先本地验证、后云端放大”的路径显著提升开发效率,释放团队创造力,让有价值的AI想法快速照进现实。

  • 简知科技“简智AI大模型”通过国家生成式人工智能服务备案,助力兴趣教育迈向智能化新阶段

    广州简知科技自主研发的“简智AI大模型”通过国家生成式人工智能服务备案,标志着该模型在安全性、合规性与可靠性方面达到国家级标准。作为兴趣教育领域AI应用的重要里程碑,该模型围绕用户兴趣成长周期设计,提供个性化学习支持:可为未明确兴趣方向的用户智能推荐内容,为入门用户规划学习路径,为基础扎实用户提供进阶训练与智能反馈。其技术能力在旗下“简小知”等品牌中已实现“学—练—评—测”全流程覆盖,并通过社群互动增强学习动力。公司未来将持续优化模型能力,联合行业伙伴构建完整培养体系,推动兴趣教育向个性化、高质量方向发展。

  • 跨境支付的未来:人工智能、嵌入式金融和即时结算

    本文系统分析了人工智能、嵌入式金融与即时结算三大技术趋势如何重构跨境支付体系。人工智能通过智能填单、动态风控和预测性维护显著提升支付效率与安全性;嵌入式金融将支付功能无缝融入电商平台与供应链,实现“无跳转支付”;即时结算技术将跨境支付时间从数日缩短至秒级,并优化现金流。三大技术深度融合形成协同效应,推动跨境支付向更智能、高效、无缝�

  • AI日报:李飞飞Marble 3D世界模型公测;OpenAI首次推出ChatGPT群聊功能;百度发布多模态 AI助手超能小度

    本期AI日报聚焦多项技术突破:World Labs推出Marble 3D模型,实现多模态生成可交互虚拟世界;OpenAI在韩新试点ChatGPT群聊功能,支持多人协作互动;苹果更新隐私政策,要求第三方AI调用需明示授权;百度发布多模态助手“超能小度”,支持空间感知与设备免费升级;LinkedIn推出AI人脉搜索,通过自然语言精准匹配专业人士;Cursor完成23亿美元融资,估值达293亿;Character AI与耶鲁合作实现音画同步技术Ovi;Google NotebookLM上线深度研究工具,支持多格式文件分析与知识库构建。

  • 华为Mate 80标准版首次支持3D人脸识别:看齐Pro

    博主数码闲聊站爆料,华为Mate 80全系支持3D人脸识别,包括标准版,这在Mate系列史上还是第一次。 已知Mate 70 Pro系列支持3D人脸识别,其正面采用三挖孔形态,预计Mate 80系列正面也将是三挖孔设计,而且该机还将支持侧边指纹识别。 据悉,全新的华为Mate 80系列共有4款机型,分别是Mate 80、Mate 80 Pro、Mate 80 Pro Max、Mate 80 RS非凡大师。 其中Mate 80和Mate 80 Pro屏幕尺寸是6.75英寸,M

  • 共建·共智·共享--新一代AtomGit平台暨人工智能开源社区发布

    10月28日,AtomGit平台在北京国家会议中心举行升级发布会,正式推出"开源+AI"一体化平台及人工智能开源社区。工信部副部长熊继军出席并致辞,强调建设AI开源社区对汇聚创新资源、把握科技革命机遇的重要意义。平台将整合开源模型、数据集及算力资源,打造开放中立的基础设施,计划于11月21日正式上线。华为、百度等企业代表分享了开源实践,多所高校签署了共建AI生态倡议。此举标志着我国开源生态迈向智能化时代的重要一步。

  • 突破大模型对齐瓶颈,北大团队携手昇腾打通产业应用通路

    北大杨耀东团队研发Align-Anything多模态对齐框架,以RLHF为核心解决传统反馈信息有限问题,覆盖文本、图像、音频等全模态数据。该框架集成专用评估工具Eval-Anything,已在昇腾平台实现智慧医疗、网络安全等领域规模化落地。通过构建安全治理体系,显著提升大模型安全水位,同时保持通用能力。团队联合推出课程培养人才,深化产学研协同,为多模态大模型发展提供关键技术支撑。

  • Billus AI高交会全球首发多模态大模型 以AI Agent重构创意产业文明进化路径

    2025年11月15日,Billus AI在高交会首发多模态大模型Billus0.57EDIT及“超级员工智能体”初阶版,依托自研生存式大模型与AI Agent技术,打破创意领域垂直局限,构建覆盖文创、时尚、艺术等全场景智能创作生态。该模型通过自然语言指令直达创意成果,实现从平面图到施工图的全流程高效生成。同时,Billus AI同步打造“创意设计超级员工+产业链智能体”体系,探索生成式创意与供应链智能推荐的新商业路径,助力行业从“经验驱动”向“数据智能”跃迁。

  • 1299元起售!iPhone Pocket发布:采用3D 针织一体结构

    今日下午,苹果发文称,三宅一生携手苹果正式推出新配件iPhone Pocket。 其中短带款提供八种色彩外观:柠檬色、柑橘色、紫色、粉色、孔雀绿色、宝石蓝色、肉桂色和黑色。 长带款提供三种色彩外观:宝石蓝色、肉桂色和黑色。 短带款iPhone Pocket售价为1299元,长带款售价为1899元。

  • 告别电脑与线缆!Toucan无线一体式3D扫描仪双十一首发特惠,锁定11550元尝鲜价

    积木易搭发布新款无线一体式3D扫描仪Toucan,已在京东、天猫旗舰店首发上线。新品具备无线一体设计,无需连接电脑即可独立完成扫描建模全流程,支持大、中、小不同幅面物体扫描,精度达0.03mm,并搭载双镜头模组与双功率模式,适应多种作业场景。首发期间优惠价11550元,活动持续至11月30日,助力3D创作者高效完成数字内容制作。

今日大家都在搜的词: