AI日报：ChatGPT推全能型版本ChatGPT Edu；快手上线文生图产品可图；阿里宝藏项目被Novita AI开源了；Midjourney将发布V6.5版本

2024-05-31 16:03 · 稿源：站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解：https://top.aibase.com/

1、ChatGPT Edu版本来啦：支持GPT-4o、自定义GPT、数据分析

ChatGPT Edu版本推出，为大学校园提供多功能ChatGPT，助力学生、老师提升学习质量和教学效率。多所顶尖大学已在教育中应用ChatGPT，18-24岁年轻人是主要用户群。功能包括GPT-4o支持、数据分析、自定义GPT等，提供更高消息限制和语音支持。安全机制完善，实际应用案例丰富。

【AiBase提要:】
🚀 ChatGPT Edu版本推出，支持GPT-4o、自定义GPT、数据分析，助力学生、老师提升学习效率。
🔍 多所顶尖大学已在教育中使用ChatGPT，18-24岁年轻人是主要用户群，具有强大的学习需求和接受能力。
💡 实际应用案例丰富，包括期末反思作业、社区服务、语言训练等，教育领域深度应用ChatGPT。

2、快手上线自研文生图大模型产品“可图”

快手自研的文生图大模型“可图”正式对外开放，为用户带来全新的AI图像创作体验。这款大模型支持文生图和图生图两类功能，可用于AI创作图像以及AI形象定制。用户可以通过“可图”微信小程序或网页版轻松体验前沿技术。

【AiBase提要:】
🔍 “可图”大模型参数规模达十亿级，数据来源包括开源社区、快手内部构建和自研AI技术的融合。
🎨 “可图”覆盖常见千万级中文实体概念，提供更广泛、更深入的图像创作支持。
🧠 “可图”引入强化学习和奖励模型技术，解决文生图大模型处理长文本和复杂语义文本输入效果不佳的问题。
产品入口：https://top.aibase.com/tool/kuaishouketudamoxingkolors

3、百度网盘推出漫画头像AI生成功能

百度网盘推出了一项令人惊叹的AI新功能，在儿童节前夕，用户只需一张照片就能变身为童年动漫中的主角。这项功能极具个性化，让用户仿佛置身于精彩的动画世界，快速高效的处理速度也让体验更加流畅。

【AiBase提要:】
🎨 个性化转化：用户上传照片即可变身为动漫人物，体验独特风格。
🚀 快速处理：百度网盘AI功能处理速度极快，短短几秒钟即可生成精美动漫照片。
🌟 多样化效果：不仅可转化为动漫形象，还能模拟经典动画效果，满足不同用户需求。

4、Claude 3 开放第三方 API，实现业务流程自动化

Anthropic 的新功能使得用户可以更便捷地与 Claude 互动，并通过结构化 API 调用实现各种任务的自动化执行。同时，Claude 也能够处理图像并融合到实时应用中，为企业提供更智能、高效的解决方案。

【AiBase提要:】
🔍 用户通过文本提问让 Claude 自动执行多种任务
🔍 用户可以通过结构化 API 调用实现常规操作和问题回答
🔍 Anthropic 的新功能使 Claude 能处理图像和实时应用

5、Novita AI开源Animate Anyone项目上传一张照片即可合成动画

Novita AI开源了Animate Anyone项目，用户只需上传一张照片即可合成动画。这一技术为动画制作带来了新的可能性和机遇，让用户能够快速创建令人惊艳的作品。

【AiBase提要：】
👉 ViViD可以自然地将服装移到视频人物身上
👉 无论是裙子还是裤子都可以随意替换，适应多种服装试穿需求
👉 目前官方只发布了演示和论文，暂未公布代码
项目页：https://top.aibase.com/tool/vivid
论文地址：https://arxiv.org/pdf/2405.11794

6、阿里中科大合推虚拟试衣技术ViViD 轻松实现视频换衣

阿里巴巴与中国科学技术大学联手推出的ViViD框架革新了虚拟试衣体验，实现了视频中人物衣物的实时替换，解决了时间一致性和图像质量难题，提升了试衣效果。

【AiBase提要:】
👗 先进技术：ViViD基于扩散模型技术，实现视频中衣物实时替换，生成自然逼真效果。
🔧 三大核心组件：服装编码器、姿势编码器、时间模块协同工作，提取衣物细节、编码姿势、保持时间连贯性。
🌟 创新特征融合：引入注意力特征融合机制优化衣物语义信息整合，提升试衣效果贴合用户需求。
详情链接:https://top.aibase.com/tool/vivid

7、Perplexity 推出了Page 创建功能快速生成专业文档

Perplexity AI推出了最新功能Perplexity Pages，旨在帮助用户快速生成专业级别的文档，提升内容创作者生产力，挑战传统知识库平台。工具快速生成内容，支持高度定制，媒体内容插入，信息验证与来源管理，共享与搜索优化。

【AiBase提要:】
🚀 快速生成专业文档，节省时间精力。
🔧 高度定制化，满足不同需求。
📸 媒体内容插入提升文档吸引力。
详情链接:https://top.aibase.com/tool/perplexity

8、Midjourney将发布V6.5版本很快网页版将面向所有人开放

Midjourney即将发布V6.5版本，将带来图像质量的大幅提升，网页版也将迎来重大更新。尽管在视频模型开发上遇到挑战，但团队坚信持续努力将取得更大突破。

【AiBase提要:】
🚀 图像质量大幅提升，可能与V7版本一致，连贯性、皮肤、手和身体表现将改善。
💻 网页版将摆脱Discord依赖，提供更好的用户体验。
💡 推出风格空间探索器和更新探索页面，考虑提供订阅折扣吸引更多用户。

9、Suno3.5版本模型已向所有人开放可制作4分钟歌曲

Suno最新的3.5版本模型开放给所有用户使用，带来了制作4分钟歌曲、2分钟歌曲扩展和改进的歌曲结构等功能。Suno还推出了新功能，可以将任何声音转化为音乐，为音乐创作带来新可能性。公司融资1.25亿美元，巩固了在AI音乐领域的领先地位。Suno展示了强大的创新能力和领先地位。

【AiBase提要:】
🎵 制作4分钟歌曲和2分钟歌曲扩展
🎶 将任何声音转化为音乐，创作新可能性
💰 公司融资1.25亿美元，巩固领先地位
详情链接:https://top.aibase.com/tool/suno-ai

10、You.com推自定义助手功能

You.com推出自定义助手功能，让用户利用顶级语言模型如GPT-4o、Llama3和Claude3创建个性化AI助手，旨在提高用户在复杂工作任务中的生产力。该功能使强大的语言模型更易于访问并适应个人需求，为用户提供定制化的AI助手体验。

【AiBase提要:】
⭐️ 定制AI助手旨在提高用户在复杂工作任务中的生产力
⭐️ You.com致力于提供准确性和实时信息，通过在线访问提供更相关可靠的响应
⭐️ 技术的影响深远，定制AI助手有潜力改变医疗、金融和教育等领域的知识工作

11、Cartesia发布低延迟语音生成模型Sonic 要复刻ChatGPT实时语音聊天？

Cartesia发布的Sonic低延迟语音生成模型引起广泛关注，其快速推理速度和超低延迟让人印象深刻。Sonic能够实时生成具有逼真情感和表达能力的语音，用户只需提供10秒录音即可模仿说话者的声音特征。Cartesia的目标是打造实时智能系统，他们引入了创新的SSM架构，取得了初步进展。

【AiBase提要:】
🚀 Sonic模型延迟仅为135毫秒，适合聊天应用。
😊 Sonic展现人类情感和表达能力，使对话更加自然。
🔧 用户可调节音调、速度、情感等参数，定制化语音输出。
详情链接:https://top.aibase.com/tool/carteisa-sonic

12、Gartner 预测2024年人工智能芯片收入将达到712亿美元

根据Gartner的预测，到2024年全球人工智能半导体的收入将增长33%，达到712亿美元。这一趋势将推动电脑普遍具备人工智能功能，企业电脑购买也将完全转向人工智能电脑。AI处理将主要在数据中心进行，加速器的价值预计将达到210亿美元。

【AiBase提要:】
📈 预计2024年全球人工智能半导体的收入将增长33%，达到712亿美元
💻 预计2024年有22%的电脑将具备人工智能功能，到2026年底，企业电脑购买将完全转向人工智能电脑
🏭 AI处理将主要在数据中心进行，2024年服务器中使用的AI加速器的价值将达到210亿美元

13、谷歌被秒杀！高保真3D头像逼真到恐怖小姐姐挤眼，挑眉毫无破绽

最近德国慕尼黑工业大学和伦敦大学学院等研究团队提出的NPGA算法引起广泛关注，能生成高保真3D头像，逼真表情令人难以分辨真假。技术创新点在于采用高斯点云生成3D人像形状，引入神经参数化头部模型捕捉细微表情变化，提高真实感。

【AiBase提要:】
⭐ 高保真3D头像: NPGA生成逼真的3D头像，表情丰富，接近真实人类。
⚙️ 创新技术: 使用高斯点云构建3D人像形状，提高渲染效率和逼真度。
😲 神经网络模型: 利用神经参数化头模型捕捉人脸细微表情变化，模拟真实人类表情。
详情链接:https://tobias-kirschstein.github.io/nersemble/

（举报）

相关推荐

关键词：

ChatGPT

ChatGPT语音模式增添新功能：可调语速支持0.5到2.0倍速

OpenAI为其ChatGPT网页应用的语音模式推出新功能，加入语音速度”调节与自定义指令前缀”，同时配合此前升级的模型选择器，进一步提升用户体验。新增的语音速度”选项让用户可通过滑块自由调整ChatGPT的语速，范围从0.5倍速到2.0倍速，不过该功能目前仍处于隐藏状态，尚未正式开放。自定义指令前缀”功能则允许语音模式记住用户的特定要求，避免重复输入。系统明确�

ChatGPT 语音模式自定义指令
哪里找最新AI工具官网？如何快速对比ChatGPT替代品？AI工具导航指南 - AIbase

文章探讨了在AI工具爆炸式增长的时代，用户面临的信息过载和筛选困难问题。主要内容包括：1）AI领域迭代速度远超传统软件，个人追踪信息效率低下且容易错过关键更新；2）AIbase.cn平台致力于解决这一问题，通过聚合主流AI工具、严格审核信息来源、持续更新行业动态；3）平台提供多维对比功能，结构化呈现工具参数，帮助用户快速定位适合需求的解决方案；4）建议用户定期浏览平台资讯栏目，善用搜索筛选功能，通过对比视图做出明智选择。核心价值在于降低信息筛选成本，让用户更高效地获取有价值的AI工具和前沿资讯。

AI工具导航信息筛选参数对比
ChatGPT 5更新：三种模式可选 4o重新回归

OpenAI首席执行官Sam Altman在社交媒体上宣布，ChatGPT 5正式推出三种可选模式：自动（Auto）、快速（Fast）和思考（Thinking）。

ChatGPT 5 OpenAI
ChatGPT安全漏洞被曝光：无需点击即可盗用户数据！

据媒体报道，近日，OpenAI旗下连接器（Connectors）被曝存在安全漏洞。据悉，用户无需点击，攻击者就能从ChatGPT连接的第三方应用窃取敏感数据，甚至窃取API密钥。

OpenAI安全漏洞 ChatGPT数据泄露零点击攻击
迄今最先进的AI模型！ChatGPT-5具备博士级别的认知能力

ChatGPT-5在多个领域表现出色，包括编程、数学、写作、健康和视觉感知等。它具备增强的推理能力，能够根据对话类型选择最佳模型，并通过深度推理模型解决更具挑战性的问题。 OpenAI 表示，ChatGPT-5在知识工作方面表现卓越，其知识水平在40多种职业中均达到或超过专家水平，涵盖法律、物流、销售和工程等领域。在基准测试中，ChatGPT-5 展现了出色的认知能力。例如，�

ChatGPT-5 AI模型博士级智能
苹果iOS 26开发者预览版Beta 7发布：美版Apple Watch血氧回归

今天凌晨，苹果发布了iOS 26开发者预览版Beta 7，虽然已经处于测试后期，但依然加入了新功能。首先是美版Apple Watch的血氧检测功能回归，这与上周的iOS 18.6.1正式版同步，为美国Apple Watch Series 9、Series 10和Apple Watch Ultra 2用户提供了新的血氧体验。从2024年1月18日开始，因美国国际贸易委员会（ITC）认定苹果部分Apple Watch血氧传感器专利侵权，所有在美国销售的Apple Watch Series 9�

iOS 26 Apple
腾讯发布2025二季度财报微信及WeChat月活达14.11亿

今日，腾讯控股正式公布了截至2025年6月30日的第二季度财报。财报显示，腾讯在该季度实现营收1845亿元，与去年同期相比增长15%;权益持有人应占利润达556亿元，同比增长17%;即便是在非国际财务报告准则下，权益持有人应占利润也达到了631亿元，同比增长10%，整体业绩呈现出稳健上升的良好态势。

腾讯财报营收增长游戏收入
MCP服务库完整指南：如何选择最适合的Model Context Protocol服务

本文介绍了MCP（Model Context Protocol）作为连接大型语言模型与外部数据源的重要桥梁。随着AI技术发展，选择合适的MCP服务库对开发者至关重要。文章分析了MCP服务库的核心价值：提升开发效率、增强系统互操作性、降低技术门槛。评估MCP服务库质量需考虑协议兼容性、安全性、生态系统丰富度及社区活跃度等维度。建议开发者根据业务需求选择服务，初创公司可侧重简便性，大型企业应关注安全性和扩展性。文章还指出MCP服务未来将向云原生化、智能化运维和标准化方向发展，并推荐使用专业对比平台（如mcp.aibase.cn）辅助决策。

MCP服务库 AI技术数据源连接
OpenAI CEO：GPT-6将具备个性化记忆记住用户偏好习惯

OpenAI的首席执行官萨姆奥尔特曼（Sam Altman）在近日的一次专访中，透露了下一代大模GPT-6的最新进展。他表示，GPT-6 的开发正在积极推进中，其发布节奏将比从GPT-4到GPT-5的周期更快。奥尔特曼特别强调，GPT-6将不再局限于单纯回答问题，而是朝着与用户深度适配”的方向演进。他举例描述

GPT-6 OpenAI 萨姆奥尔特曼
苹果iOS 18.6.1正式版发布：美版Apple Watch血氧功能上线

今日，苹果公司如期向iPhone用户推送了iOS18.6.1正式版更新，距离上一次正式版发布仅过去16天。尽管此次更新并未给国行用户带来功能上的显著变化，但它却为美版Apple Watch用户带来了一个期待已久的好消息——血氧检测功能的回归。据更新日志详细说明，此次iOS18.6.1更新特别针对美国市场的Apple Watch Series9、Series10以及Apple Watch Ultra2用户，重新启用了血氧检测功能。用户现在�

iOS18.6.1 Apple Watch

今日大家都在搜的词：

热文

3 天
7天

AI日报：ChatGPT推全能型版本ChatGPT Edu；快手上线文生图产品可图；阿里宝藏项目被Novita AI开源了；Midjourney将发布V6.5版本

ChatGPT语音模式增添新功能：可调语速支持0.5到2.0倍速

哪里找最新AI工具官网？如何快速对比ChatGPT替代品？AI工具导航指南 - AIbase

ChatGPT 5更新：三种模式可选 4o重新回归

ChatGPT安全漏洞被曝光：无需点击即可盗用户数据！

迄今最先进的AI模型！ChatGPT-5具备博士级别的认知能力

苹果iOS 26开发者预览版Beta 7发布：美版Apple Watch血氧回归

腾讯发布2025二季度财报微信及WeChat月活达14.11亿

MCP服务库完整指南：如何选择最适合的Model Context Protocol服务

OpenAI CEO：GPT-6将具备个性化记忆记住用户偏好习惯

苹果iOS 18.6.1正式版发布：美版Apple Watch血氧功能上线

今日大家都在搜的词：

热文

60岁李国庆谈再婚：妻子是“白月光” 年轻时2次爱而不得

华为首款鸿蒙MateTV发布支持灵犀触控交互等功能

罗永浩官宣明日将公布TBT项目号称九年磨一面

《黑神话:钟馗》先导预告公布游戏科学宣布《黑神话:钟馗》官网

REDMI Note 15 Pro+首搭自研澎湃T1S芯片

AI日报：阿里开源Qwen-Image-Edit；淘宝“AI万能搜”功能灰度测

AI日报：DeepSeek V3.1正式发布；企业微信5.0推出全新AI能力；

黑神话官号更名系列游戏将开启宏大篇章

京东外卖全职骑手破15万人五险一金每人每月平均缴纳约2000元

特斯拉Model 3已标配转向灯拨杆老车主加装拨杆需2499元

60岁李国庆谈再婚：妻子是“白月光” 年轻时2次爱而不得

华为首款鸿蒙MateTV发布支持灵犀触控交互等功能

罗永浩官宣明日将公布TBT项目号称九年磨一面

《黑神话:钟馗》先导预告公布游戏科学宣布《黑神话:钟馗》官网

REDMI Note 15系列定档将于8月21日发布

AI日报：腾讯推音效生成工具AudioGenie；阿里推智能体WebWatch

REDMI Note 15 Pro+首搭自研澎湃T1S芯片

苹果正式入驻小红书 iPhone 17系列下月发布

AI日报：阿里开源Qwen-Image-Edit；淘宝“AI万能搜”功能灰度测

转战播客赛道！罗永浩微博改名“罗永浩的十字路口”

站长商机