首页 > 业界 > 关键词  > Strawberry最新资讯  > 正文

AI日报:类GPT-5新模型将上线?奥特曼发草莓照片引热议;美图发布美图云修Pro版; ComfyUI已支持腾讯混元DiT与Flux模型

2024-08-08 14:56 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、奥特曼发草莓图引发猜测暗示OpenAI将发布新模型 “Strawberry

山姆・奥特曼在社交媒体发布关于夏季花园的照片,引发关于新模型 “草莓” 的猜测。网友热议草莓项目可能即将到来,期待其突破性质。

image.png

【AiBase提要:】

🍓 奥特曼发布草莓相关照片,引发猜测和热议。

🗣️ 新模型 “匿名聊天机器人”推理能力优于现有模型,可能与 “草莓” 项目相关。

🚀 “草莓” 项目旨在使AI具备自主互联网搜索和深度研究能力,被认为是可能的突破。

2、百度网盘发布AI修图摄影行业解决方案

百度网盘在2024年8月推出针对摄影行业的解决方案,集存储备份、AI修图和高效交付于一体,旨在帮助影楼提高效率、降低成本并增强业务增长。该解决方案通过一站式服务,实现了存储备份、内部协同、AI修图和一键交付,成功解决了影楼的管理、效率和成本问题。

image.png

【AiBase提要:】

⚙️ 一站式服务:存储备份、内部协同、AI修图和一键交付,提高影楼管理效率。

💡 连锁影楼优势:提升内部协同效率,客片分类存储和多人协作照片流转,批量初修、客户选片和客片交付。

🔬 百度云朵引擎技术:9大人像分析检测能力、86项人像与图像美化能力、1000+视觉技术专利,提供个性化AI修图服务。

详情链接:https://www.wjx.cn/vm/hMDEeN7.aspx

3、美图发布美图云修Pro版 上线AI批量调色、AI批量精修等功能

美图公司旗下的美图云修Pro版引入了AI批量调色、AI批量精修等新功能,为商业摄影行业提供更全面的修图解决方案。AI工作流实现了从转档、修图到交付的自动化处理,显著提高工作效率。已有3万余家商业摄影机构选择使用美图云修,年修图量超过5亿张,精修效率提升12倍。

image.png

【AiBase提要:】

✨ AI批量调色、AI批量精修功能提升修图效率

💡 智能修图API服务支持即传、即修、即用

🚀 使用美图云修实现商业模式高效转型、节省成本

4、360AI企业浏览器升级 支持AI搜索、办公助手和AI应用商店

360企业安全浏览器是一款为企业提供综合安全办公解决方案的浏览器,具备智能办公和安全防护功能,支持灵活部署以满足不同企业需求。它提供AI办公助手、360AI搜索和文档、音视频分析等AI应用,构建高效办公环境,全面安全防护,聚合应用,实现智能化办公。通过跨平台兼容性支持多种操作系统,提供200条管控策略,为企业提供安全、高效、智能化的办公环境。

image.png

【AiBase提要:】

⚙️ 智能办公: 集成360AI搜索、AI办公助手和AI应用商店,提高工作效率。

🔒 全面安全防护: 提供多层防护措施,包括浏览器原生安全、Web数据安全和用户行为安全。

🚀 聚合应用: 提供高质量的开发保障,实现统一访问入口和跨平台兼容性,加强安全性,简化配置流程。

详情链接:https://top.aibase.com/tool/360-qiyeanquanliulanqi

5、腾讯混元大模型:斩获“图生文”多模态理解国内大模型第一

腾讯混元大模型在8月SuperCLUE-V测评中荣获国内大模型排名第一,展现出在多模态理解领域的卓越表现。其综合优势得益于对图像识别精确度和现实世界理解力的深入考验。腾讯混元大模型技术底座支持AI原生应用腾讯元宝,已扩展至万亿级参数规模,具备国内领先水平的多模态理解能力。

【AiBase提要:】

🏆 腾讯混元大模型荣获国内大模型排名第一,展现综合优势

🔍 评测结果显示,腾讯混元大模型在多模态理解基础和应用能力上表现突出

💡 腾讯混元大模型已扩展至万亿级参数规模,采用MoE结构,多模态理解能力达国内领先水平

6、Comfy Org重大进展:ComfyUI已支持腾讯混元DiT与Flux模型

Comfy Org 最近取得了重大进展,引入了新的模型支持和技术升级,加强了核心执行引擎,展现了对技术创新和用户体验的承诺。这些更新使得 ComfyUI 在 AI 领域变得更加可靠和强大。

image.png

【AiBase提要:】

🚀 新增模型支持: Flux 模型集成为用户提供了示例工作流和模型下载链接,显著增强了 AI 图像生成能力。

🔥 Hunyuan DiT 模型支持丰富了 ComfyUI 的多语言支持能力,表现出色在理解中文提示方面。

💡 前端技术升级将带来更强大和可维护的代码库,支持新前端功能的快速开发。

详情链接:https://blog.comfy.org/august-2024-flux-support-new-frontend-for-loops-and-more/

7、Reddit用户实测:GTP-4o在国际象棋上击败Gemini1.5pro

在最近的实验中,Reddit用户@zefman搭建了一个平台,让不同的语言模型实时对战国际象棋,其中GPT-4o表现出色成为最强选手。实验展示了不同模型的思考过程,提供了有趣的互动体验。

image.png

【AiBase提要:】

🌟 GPT-4o在国际象棋对战中表现出色,成为最强的语言模型。

♟️ 实验允许不同模型实时对弈,展示了它们的思考过程。

🔄 性能较弱的模型有时会选择错误的走法,但实验提供了重新选择的机会,保持游戏进行。

8、全景图像生成新方法PanoFree:无需调优生成多视角图片

PanoFree是一种无需调优的多视角图像生成技术,通过迭代变形和修补解决了一致性和伪影问题,提升了时间效率和内存使用效率,结果多样性更高。

image.png

【AiBase提要:】

🌟 无需调优的多视角图像生成方法

🚀 通过迭代变形和修补解决一致性和伪影问题

💡 时间效率和内存使用大幅提升,结果多样性更高

详情链接:https://top.aibase.com/tool/panofree

9、ExAvatar: 通过简短视频克隆人像并转化为3D数字形象

ExAvatar是由DGIST和Meta公司的Codec Avatars Lab联合研发的一项技术,能够通过捕捉视频中的动作和表情,转化为栩栩如生的3D数字形象。这项技术解决了以往技术中的难题,提高了动画的自然度和渲染效果。

【AiBase提要:】

🌟 全身3D驱动: 支持身体、手和面部的全面动画,生成多种姿势和表情。

💡 混合表示法: 结合3D高斯和表面网格,确保几何和外观一致性,减少伪影。

🚀 高质量渲染: 采用先进算法和技术,实现高质量动态表现和渲染效果。

详情链接:https://top.aibase.com/tool/exavatar

10、Mistral AI推出新开发工具 用户可自主优化和构建智能Agents

Mistral AI最新推出的开发工具为用户和开发者提供了更强大、更灵活的AI模型优化和应用能力,受到广泛关注和期待。用户可以通过La Plateforme微调模型,使用Agents平台构建智能Agents,同时新版本SDK支持Python和Typescript,提供更多选择和灵活性。

【AiBase提要:】

✨ 用户可通过La Plateforme微调模型,更好利用数据进行优化。

🔧 Agents平台帮助用户详细调整模型,构建智能Agents。

🚀 新版本SDK支持Python和Typescript,集成和使用更加便捷。

11、Napkin:利用AI轻松将文本转化为可视化图形

在信息爆炸的时代,Napkin是一款利用AI技术的视觉化平台,能够将文本转化为各种可视化图形,帮助用户更轻松地表达创意和思想。尽管具有创新潜力,但也存在一些挑战和改进空间。

image.png

【AiBase提要:】

🧠 利用AI技术的视觉化平台,帮助用户将文本转化为各种可视化图形。

🚀 提供定制化功能,用户可以调整图标、颜色、字体等元素,导出多种文件格式或URL链接。

⚙️ 需要进一步优化AI技术处理模糊内容的能力,提升视觉设计水平和个性化程度。

详情链接:https://top.aibase.com/tool/napkin-ai

12、OpenAI ChatGPT应用收入创新高7月净收入2800万美元

OpenAI旗下ChatGPT移动应用在今年7月创下单月收入新高,净收入达2800万美元,主要得益于推出的GPT-4omni 模式。该模式带来了处理文本、语音和视频的新能力,提供更快的响应速度,使人工智能交互更加自然。尽管增速有所放缓,但整体保持健康增长态势,预计未来几个月收入将继续增长。

【AiBase提要:】

💰 ChatGPT应用7月净收入达2800万美元,较5月环比增长40%。

📱 苹果App Store贡献83%的收入,较6月增长20%。

🚀 GPT-4omni 模式为ChatGPT带来处理文本、语音和视频的新能力,提供更快的响应速度,用户交互更自然。

举报

  • 相关推荐
  • OpenAI CEO奥特曼发文:永别了 GPT—4!

    快科技5月1日消息,当地时间5月1日上午10:23,OpenAI创始人奥特曼发文向GPT-4告别:再见了,GPT-4。你掀起了一场革命。我们将自豪地将你的重量保存在一个特殊的硬盘中,以便将来送给一些历史学家。”据报道,OpenAI此前宣布,自2025年4月30日起,GPT-4将从CHATGPT中退役,由GPT-4o完全替代 ,不过GPT-4仍将在API中提供。OpenAI表示,在面对面的评估中,GPT-4o在写作、编码、STEM等方面持续超越GPT-4。最近的升级进一步改进了GPT-4o的指令跟踪、问题解决和对话流程,使其成为GPT-4的自然继承者。据悉,GPT-4于2023年3月发布,较上一代GPT-3

  • AI日报腾讯混元3D生成模型2.5版本发布;海螺推出像人物参考功能;百度上线移动端超级智能体心响App

    本文介绍了多款AI领域的新产品和技术进展:1)Kortix-AI推出开源通用AI智能体平台Suna;2)腾讯混元3D生成模型升级至2.5版本;3)海螺AI推出基于单张图像生成多角度角色图像功能;4)百度发布"心响"App整合多智能体协作;5)Nari Labs开源媲美真人的对话语音模型Dia;6)Grok新增视觉处理和多语言支持;7)Genspark推出AI幻灯片工具;8)Character.AI发布让静态图片"说话"的AvatarFX模型;9)pad.ws结合白板和代码编辑器;10)OpenBMB开源社区推出长文本生成模型"卷姬";11)腾讯推出AI阅读助手"企鹅读伴";12)OpenAI有意收购Chrome浏览器;13)字节跳动调整AI产品线布局。这些创新展现了AI技术在自动化、3D生成、语音交互、内容创作等领域的快速发展。

  • AI日报:Kimi全新音频基础模型Kimi-Audio;阶跃星辰开源像编辑模型Step1X-Edit;​夸克AI超级框上线 “拍照问夸克”

    本期AI日报聚焦多项AI技术突破与应用:1)Moonshot AI推出开源音频模型Kimi-Audio,基于13亿小时训练数据,支持语音识别等任务;2)阶跃星辰开源图像编辑模型Step1X-Edit,展现强大生成能力;3)夸克AI上线"拍照问夸克"功能,实现视觉问答;4)苹果iOS18.5将在中国推送,带来智能功能;5)谷歌发布601个生成式AI应用案例,覆盖多行业;6)微软推出深度整合Windows的UFO²自动化系统;7)OpenAI升级ChatGPT至GPT-4o版本,提升STEM领域能力;8)Ema公司推出高性价比语言模型EmaFusion;9)Liquid AI发布面向边缘设备的Hyena Edge模型;10)LemonAI推出实时音视频数字人产品Slice Live。此外,国内方面,智谱与生数科技达成战略合作推动大模型发展,宝马中国宣布新车将接入DeepSeek技术。

  • AI日报:阿里腾讯全面支持MCP协议;阶跃星辰多模态推理模型Step-R1-V-Mini;美图WHEE图像生成模型Miracle F1

    欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、阿里巴巴已宣布全面支持MCP协议腾讯紧随其后近日,中国人工智能领域迎来技术标准的变革,ModelContextProtocol成为国内AI生态的事实标准。12.英伟达发布Llama3.1NemotronUltra253B,性能�

  • GPT-4.5功臣遭驱逐,奥特曼盛赞工作出色,美国深陷AI人才危机

    OpenAI核心开发者Kai Chen因绿卡申请被拒面临离境困境。作为GPT-4.5核心开发者之一,她的遭遇引发业内震动。同时,1700多名国际学生和研究人员签证受阻,《自然》调查显示75%的美国科学家正考虑离开。移民政策收紧正导致美国AI领域人才流失,可能动摇其技术领先地位。OpenAI员工透露公司高度依赖海外人才,去年提交了80多份H-1B签证申请。乔治城大学研究显示,美国66%顶尖AI公

  • 奥特曼ChatGPT不是AGI!OpenAI最强开源模型直击DeepSeek

    【新智元导读】代码截图泄露,满血版o3、o4-mini锁定下周!更劲爆的是,一款据称是OpenAI的神秘模型一夜爆红,每日处理高达260亿token,是Claude用量4倍。奥特曼在TED放话:将推超强开源模型,直面DeepSeek挑战。持续的创新、丰富的资源和智能AI将会无缝融入日常生活,未来一代人将会觉得当前人们又辛苦又落后。

  • AI日报:智谱开源32B/9B系列GLM模型并启用Z.ai域名;OpenAI发布GPT-4.1系列模型;阿里魔搭上线MCP广场

    欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、智谱AI启用全新域名Z.ai 并开源32B/9B 系列 GLM 模型智谱技术团队近期宣布开源32B和9B系列的GLM模型,并推出全新交互体验平台Z.ai。这些模型遵循MIT许可协议,支持商业用途,提升了

  • 我用AI监控了奥特曼,当他一推特AI就会自动给我打电话。

    文章讲述了一周内的经历,包括尝试控制特拉斯的X、发送紧急电话消息以及与飞书平台的交互过程。文中提到通过飞书的客户端和拨打紧急电话功能实现简单操作,并探讨了权限管理和自动化电话服务的需求。最后,作者表示通过这些接口可以更好地观察和测试相关功能,同时强调了保持信息保存的重要性。

  • 10倍精度升级!腾讯混元3D模型v2.5版本发布

    腾讯混元3D模型升级至v2.5版本,建模精度和贴图真实度显著提升。新版本参数体量从1B增至10B,有效面片数增加超10倍,支持1024几何分辨率。纹理系统支持4K高清贴图和凹凸细节,率先支持多视图生成PBR模型。针对动画场景优化骨骼蒙皮系统,支持非标准姿态自动绑定。新增文生/图生3D减面模型、多视图建模模板等专业工作流。混元3D v2.5已全面更新至腾讯AI创作引擎,免费生成额度提升至每日20次,并正式上线腾讯云API面向企业开放。GitHub开源版本累计Star超1.2万。

  • AI日报:阿里通义千问Qwen3问鼎全球开源模型;Kimi长思考模型API发布;OpenAI发布新一代GPT-4.1模型

    【AI日报】汇总了近期AI领域重要动态:1)阿里通义千问3开源模型上线7天即登顶全球开源模型榜首,在指令遵循和推理能力上超越闭源模型;2)月之暗面推出Kimi长思考模型API,可解决复杂代码和数学问题;3)OpenAI发布GPT-4.1模型,性能提升显著;4)Google推出Gemini2.5Pro模型,提升开发者编码能力;5)联想发布"天禧超级智能体",具备多模态感知能力;6)腾讯元宝上线"对话分