AI日报：类GPT-5新模型将上线？奥特曼发草莓照片引热议；美图发布美图云修Pro版； ComfyUI已支持腾讯混元DiT与Flux模型

2024-08-08 14:56 · 稿源：站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、奥特曼发草莓图引发猜测暗示OpenAI将发布新模型 “Strawberry”

山姆・奥特曼在社交媒体发布关于夏季花园的照片，引发关于新模型 “草莓” 的猜测。网友热议草莓项目可能即将到来，期待其突破性质。

【AiBase提要:】
🍓 奥特曼发布草莓相关照片，引发猜测和热议。
🗣️ 新模型 “匿名聊天机器人”推理能力优于现有模型，可能与 “草莓” 项目相关。
🚀 “草莓” 项目旨在使AI具备自主互联网搜索和深度研究能力，被认为是可能的突破。

2、百度网盘发布AI修图摄影行业解决方案

百度网盘在2024年8月推出针对摄影行业的解决方案，集存储备份、AI修图和高效交付于一体，旨在帮助影楼提高效率、降低成本并增强业务增长。该解决方案通过一站式服务，实现了存储备份、内部协同、AI修图和一键交付，成功解决了影楼的管理、效率和成本问题。

【AiBase提要:】
⚙️ 一站式服务:存储备份、内部协同、AI修图和一键交付，提高影楼管理效率。
💡 连锁影楼优势:提升内部协同效率，客片分类存储和多人协作照片流转，批量初修、客户选片和客片交付。
🔬 百度云朵引擎技术:9大人像分析检测能力、86项人像与图像美化能力、1000+视觉技术专利，提供个性化AI修图服务。
详情链接:https://www.wjx.cn/vm/hMDEeN7.aspx

3、美图发布美图云修Pro版上线AI批量调色、AI批量精修等功能

美图公司旗下的美图云修Pro版引入了AI批量调色、AI批量精修等新功能，为商业摄影行业提供更全面的修图解决方案。AI工作流实现了从转档、修图到交付的自动化处理，显著提高工作效率。已有3万余家商业摄影机构选择使用美图云修，年修图量超过5亿张，精修效率提升12倍。

【AiBase提要:】
✨ AI批量调色、AI批量精修功能提升修图效率
💡 智能修图API服务支持即传、即修、即用
🚀 使用美图云修实现商业模式高效转型、节省成本

4、360AI企业浏览器升级支持AI搜索、办公助手和AI应用商店

360企业安全浏览器是一款为企业提供综合安全办公解决方案的浏览器，具备智能办公和安全防护功能，支持灵活部署以满足不同企业需求。它提供AI办公助手、360AI搜索和文档、音视频分析等AI应用，构建高效办公环境，全面安全防护，聚合应用，实现智能化办公。通过跨平台兼容性支持多种操作系统，提供200条管控策略，为企业提供安全、高效、智能化的办公环境。

【AiBase提要:】
⚙️ 智能办公: 集成360AI搜索、AI办公助手和AI应用商店，提高工作效率。
🔒 全面安全防护: 提供多层防护措施，包括浏览器原生安全、Web数据安全和用户行为安全。
🚀 聚合应用: 提供高质量的开发保障，实现统一访问入口和跨平台兼容性，加强安全性，简化配置流程。
详情链接:https://top.aibase.com/tool/360-qiyeanquanliulanqi

5、腾讯混元大模型:斩获“图生文”多模态理解国内大模型第一

腾讯混元大模型在8月SuperCLUE-V测评中荣获国内大模型排名第一，展现出在多模态理解领域的卓越表现。其综合优势得益于对图像识别精确度和现实世界理解力的深入考验。腾讯混元大模型技术底座支持AI原生应用腾讯元宝，已扩展至万亿级参数规模，具备国内领先水平的多模态理解能力。

【AiBase提要:】
🏆 腾讯混元大模型荣获国内大模型排名第一，展现综合优势
🔍 评测结果显示，腾讯混元大模型在多模态理解基础和应用能力上表现突出
💡 腾讯混元大模型已扩展至万亿级参数规模，采用MoE结构，多模态理解能力达国内领先水平

6、Comfy Org重大进展:ComfyUI已支持腾讯混元DiT与Flux模型

Comfy Org 最近取得了重大进展，引入了新的模型支持和技术升级，加强了核心执行引擎，展现了对技术创新和用户体验的承诺。这些更新使得 ComfyUI 在 AI 领域变得更加可靠和强大。

【AiBase提要:】
🚀 新增模型支持: Flux 模型集成为用户提供了示例工作流和模型下载链接，显著增强了 AI 图像生成能力。
🔥 Hunyuan DiT 模型支持丰富了 ComfyUI 的多语言支持能力，表现出色在理解中文提示方面。
💡 前端技术升级将带来更强大和可维护的代码库，支持新前端功能的快速开发。
详情链接:https://blog.comfy.org/august-2024-flux-support-new-frontend-for-loops-and-more/

7、Reddit用户实测:GTP-4o在国际象棋上击败Gemini1.5pro

在最近的实验中，Reddit用户@zefman搭建了一个平台，让不同的语言模型实时对战国际象棋，其中GPT-4o表现出色成为最强选手。实验展示了不同模型的思考过程，提供了有趣的互动体验。

【AiBase提要:】
🌟 GPT-4o在国际象棋对战中表现出色，成为最强的语言模型。
♟️ 实验允许不同模型实时对弈，展示了它们的思考过程。
🔄 性能较弱的模型有时会选择错误的走法，但实验提供了重新选择的机会，保持游戏进行。

8、全景图像生成新方法PanoFree:无需调优生成多视角图片

PanoFree是一种无需调优的多视角图像生成技术，通过迭代变形和修补解决了一致性和伪影问题，提升了时间效率和内存使用效率，结果多样性更高。

【AiBase提要:】
🌟 无需调优的多视角图像生成方法
🚀 通过迭代变形和修补解决一致性和伪影问题
💡 时间效率和内存使用大幅提升，结果多样性更高
详情链接:https://top.aibase.com/tool/panofree

9、ExAvatar: 通过简短视频克隆人像并转化为3D数字形象

ExAvatar是由DGIST和Meta公司的Codec Avatars Lab联合研发的一项技术，能够通过捕捉视频中的动作和表情，转化为栩栩如生的3D数字形象。这项技术解决了以往技术中的难题，提高了动画的自然度和渲染效果。

【AiBase提要:】
🌟 全身3D驱动: 支持身体、手和面部的全面动画，生成多种姿势和表情。
💡 混合表示法: 结合3D高斯和表面网格，确保几何和外观一致性，减少伪影。
🚀 高质量渲染: 采用先进算法和技术，实现高质量动态表现和渲染效果。
详情链接:https://top.aibase.com/tool/exavatar

10、Mistral AI推出新开发工具用户可自主优化和构建智能Agents

Mistral AI最新推出的开发工具为用户和开发者提供了更强大、更灵活的AI模型优化和应用能力，受到广泛关注和期待。用户可以通过La Plateforme微调模型，使用Agents平台构建智能Agents，同时新版本SDK支持Python和Typescript，提供更多选择和灵活性。

【AiBase提要:】
✨ 用户可通过La Plateforme微调模型，更好利用数据进行优化。
🔧 Agents平台帮助用户详细调整模型，构建智能Agents。
🚀 新版本SDK支持Python和Typescript，集成和使用更加便捷。

11、Napkin:利用AI轻松将文本转化为可视化图形

在信息爆炸的时代，Napkin是一款利用AI技术的视觉化平台，能够将文本转化为各种可视化图形，帮助用户更轻松地表达创意和思想。尽管具有创新潜力，但也存在一些挑战和改进空间。

【AiBase提要:】
🧠 利用AI技术的视觉化平台，帮助用户将文本转化为各种可视化图形。
🚀 提供定制化功能，用户可以调整图标、颜色、字体等元素，导出多种文件格式或URL链接。
⚙️ 需要进一步优化AI技术处理模糊内容的能力，提升视觉设计水平和个性化程度。
详情链接:https://top.aibase.com/tool/napkin-ai

12、OpenAI ChatGPT应用收入创新高7月净收入2800万美元

OpenAI旗下ChatGPT移动应用在今年7月创下单月收入新高，净收入达2800万美元，主要得益于推出的GPT-4omni 模式。该模式带来了处理文本、语音和视频的新能力，提供更快的响应速度，使人工智能交互更加自然。尽管增速有所放缓，但整体保持健康增长态势，预计未来几个月收入将继续增长。

【AiBase提要:】
💰 ChatGPT应用7月净收入达2800万美元，较5月环比增长40%。
📱 苹果App Store贡献83%的收入，较6月增长20%。
🚀 GPT-4omni 模式为ChatGPT带来处理文本、语音和视频的新能力，提供更快的响应速度，用户交互更自然。

（举报）

相关推荐

关键词：

Strawberry

字节旗下AI编程工具TRAE SOLO发布面向所有用户开放

字节跳动AI编程工具TRAE SOLO正式版发布，面向国际用户开放。该工具提供IDE和SOLO两种开发模式：IDE模式在保留原有流程基础上增强智能问答、代码补全等AI能力；SOLO模式以AI为主导，能理解开发目标、调度工具并独立完成从需求分析到代码实现的全流程。这标志着AI编程从工具增强迈入流程重构新阶段，实现覆盖软件开发全流程的高度自动化。

AI编程工具 TRAE SOLO
小米最强旗舰！卢伟冰回国网友：要准备小米17 Ultra了

小米17+ Ultra预计12月发布，已备案。配备双卫星通信技术，支持天通一号卫星通话和北斗短报文，无地面网络时仍可保持通信。影像系统是核心卖点，主摄采用新一代LOFIC技术，提升高光场景表现，减少过曝。搭载骁龙8至尊版旗舰平台，电池容量6000-7000mAh，支持无线充电和超声波屏下指纹。正面直屏，背部大圆镜头模组，后置1英寸超大底主摄及2亿像素潜望长焦。

小米17 Ultra 卢伟冰
50人团队、1亿美元ARR，AI PPT还在续写“神话”？

AI 生成 PPT 可以说是去年的热门赛道，尤记得关于这类产品是否具有真正竞争力的热烈讨论，而2025年9月份的数据显示，赛道头部的明星创企 Gamma 却已经默默接近3000万的访问量。并且，今天官宣了由 a16z 领投的6800万美元 B 轮融资，融资后估值达到21亿美元。而不仅 Gamma，根据 AI 产品榜数据，9月份，AIPPT 赛道的 Top3产品流量平均涨幅30%+，更有一款

AI生成PPT Gamma融资 AIPPT赛道
小米17 Ultra蓄势待发：直屏+大圆镜头没有背屏

据爆料，小米17+Ultra将在春节前发布，主打影像功能，配备1英寸超大底主摄和2亿像素潜望长焦，支持外挂镜头。荣耀Magic8+Ultra也可能节前亮相，而OPPO、vivo超大杯旗舰则安排在节后。小米17+Ultra正面为直屏，背部采用大圆镜头设计，无副屏，是其与Pro系列最大差异。此外，小米15+Ultra预计配备新国屏，搭载骁龙8 Gen5平台，顶配版支持双卫星通信。

小米17 Ultra 荣耀Magic8
小米17 Ultra 12月亮相：小米最强影像旗舰

据爆料，小米17 Ultra将于12月亮相，搭载1英寸超大底主摄，配备全新LOFIC技术及徕卡镀膜，结合2亿像素潜望长焦，大幅提升高光细节表现。新机采用圆形镜头模组，主摄与长焦均支持光学防抖，配备超瓷晶面板、骁龙8 Gen4处理器，电池容量达6000-7000mAh，顶配版支持双卫星通信，堪称小米最强影像旗舰。

小米17Ultra 影像旗舰 LOFIC技术
寒冬出行便捷与舒适兼得，问界新M5 Ultra凭实力助您告别烦恼

冬季出行面临晨雾、路面湿滑等挑战，问界新M5 Ultra凭借卓越软硬件配置，成为用户安心之选。其搭载华为ADS辅助驾驶系统，配备多雷达与摄像头，实现360°环境感知，浓雾中仍能精准识别路况。舒适制动功能优化减速曲线，减轻晕车感。主动安全配置如全向防碰撞系统，配合高强度车身，全面守护驾乘安全。同时，快速空调升温与加热座椅提升冬季舒适性。当前购车可享至高价值37794元权益，含多项补贴与服务优惠，助您从容应对寒冬出行。

新能源汽车冬季驾驶问界新M5Ultra
荣耀Magic8 Ultra有望明年1月发布：7000mAh大电池、外观更尊

今日，数码博主智慧皮卡丘”曝光了一款荣耀新旗舰，结合其配置与定位来看，预计为荣耀Magic8 Ultra。该博主透露，荣耀Magic8 Ultra暂定明年1月发布，采用更尊贵的外观设计，正面为等深四曲屏，电池容量超过7000mAh。

荣耀Magic8 Ultra 高通第五代骁龙8
AI赋能移动影像三星Galaxy S25 Ultra开启全场景专业拍摄体验

三星Galaxy S25 Ultra以专业影像系统满足用户创作需求：搭载2亿像素四摄系统，实现从超广角到长焦的全焦段覆盖，支持100倍空间变焦与OIS防抖。新增增强版超视觉引擎，通过双降噪技术与AI算法提升夜景和逆光画质。集成Galaxy AI智能工具，提供生成式编辑、人像风格化及音频降噪等功能，让用户可一键完成专业级后期创作。从拍摄到编辑，全方位助力用户随手记录生活，轻松产出电影感作品。

手机摄影三星Galaxy S25Ultra
特斯拉磁悬浮Cybertruck车模上架中国官网售价999元

特斯拉磁悬浮Cybertruck车模11月12日在中国官网开售，定价999元。这款1:24比例模型精准还原实车细节，采用银色涂装与可亮车灯，内置14个LED灯，展现科技感。模型重293克，底座重1291克，确保稳定悬浮。使用时只需通电并放置于非金属表面，通过磁力实现悬浮效果，可静置观赏或轻触旋转，为收藏爱好者带来独特视觉体验。

特斯拉 Cybertruck 车模
荐AI日报：百度发布文心5.0；可灵2.5Turbo模型上线“首尾帧”功能；微博推出 VibeThinker-1.5B

本期AI日报聚焦多项技术突破：OpenAI推出GPT-5.1，提升对话自然度与响应速度；百度发布原生全模态大模型文心5.0，支持跨文本图像生成；微博开源VibeThinker-1.5B模型，以低成本实现高效推理；可控视频生成模型新增首尾帧控制功能；李飞飞团队推出商用3D世界生成工具Marble；东北大学开源多语言翻译模型支持60种语言；谷歌Gemini语音功能升级实现更自然交互；阿里启动“千问”项目对标ChatGPT，全面布局C端AI应用竞争。

AI视频生成可灵2.5Turbo 首尾帧功能

今日大家都在搜的词：

热文

3 天
7天

AI日报：类GPT-5新模型将上线？奥特曼发草莓照片引热议；美图发布美图云修Pro版； ComfyUI已支持腾讯混元DiT与Flux模型

字节旗下AI编程工具TRAE SOLO发布面向所有用户开放

小米最强旗舰！卢伟冰回国网友：要准备小米17 Ultra了

50人团队、1亿美元ARR，AI PPT还在续写“神话”？

小米17 Ultra蓄势待发：直屏+大圆镜头没有背屏

小米17 Ultra 12月亮相：小米最强影像旗舰

寒冬出行便捷与舒适兼得，问界新M5 Ultra凭实力助您告别烦恼

荣耀Magic8 Ultra有望明年1月发布：7000mAh大电池、外观更尊

AI赋能移动影像三星Galaxy S25 Ultra开启全场景专业拍摄体验

特斯拉磁悬浮Cybertruck车模上架中国官网售价999元

荐AI日报：百度发布文心5.0；可灵2.5Turbo模型上线“首尾帧”功能；微博推出 VibeThinker-1.5B

今日大家都在搜的词：

热文

华为Mate 80系列已在华为商城开启预约

华为Mate 80 Pro Max外观公布：采用双圆环设计

华为Mate 80/Pro/Pro Max/RS开启预约：全系直屏设计

AI日报：阿里千问APP公测；Veo 3.1上线多图参考；超级小爱AI大

小米超级小爱AI大模型推出随心修图功能

荣耀500系列官宣将于11月24日发布

一加Ace 6T官宣将于本月发布：首发骁龙8 Gen5

阿里巴巴回应千问崩了：状态良好欢迎来问

影视飓风CEO在相亲角被大妈吐槽网友：大妈不识货

腾讯发布2025第三季度财报：营收1928.69亿元同比增长 15%

小米澎湃OS 3第三批正式版推送：支持小米14、K70系列等

华为Mate 80系列已在华为商城开启预约

AI日报：百度发布文心5.0；可灵2.5Turbo模型上线“首尾帧”功能

荣耀500系列开启预约：Pro版外观首次亮相

AI日报：李飞飞Marble 3D世界模型公测；OpenAI首次推出ChatGPT

华为Mate 80 Pro Max外观公布：采用双圆环设计

1899元苹果手机包卖完了！iPhone Pocket在吐槽声中销售火爆

iPhone Pocket正式开售：联名三宅一生售价1299元起

站长商机