AI日报：OpenAI重磅更新定档下周一；开源版EMO项目发布；微信读书上线AI问书功能；博主调教AI男友甜晕网友

2024-05-11 15:14 · 稿源：站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解：https://top.aibase.com/

1、OpenAI预告将直播ChatGPT升级内容

OpenAI将在5月13日在线直播展示ChatGPT的一系列升级特性，其中不包括GPT-5和AI搜索引擎。公司联合创始人Sam Altman充满期待地表示持续研发新元素，让人期待不已。尽管部分观众可能会失望，但ChatGPT的升级内容和未来规划仍令人充满期待。

【AiBase提要:】
🚀 OpenAI将在线直播展示ChatGPT升级特性，但GPT-5和AI搜索引擎不会亮相。
💡 公司创始人充满期待表示持续研发新元素，让人期待不已。
🔍 尽管部分观众可能会失望，但ChatGPT的升级内容和未来规划仍令人充满期待。

2、开源版EMO？AniTalker可通过照片加音频生成说话视频

AniTalker是一个创新的开源项目，通过静态肖像画和音频信号生成生动的面部说话视频，赋予虚拟角色更真实和自然的表现力。该工具实现了嘴唇动作同步，捕捉丰富的面部表情和非言语线索的复杂动态。

【AiBase提要:】
🎨 AniTalker将静态照片和音频转换成动态说话视频，包括口型同步、面部表情和头部动作匹配。
🔧 用户可调整参数生成不同表情和动作的面部动画，适应不同音频内容和个人喜好。
🌟 AniTalker精细捕捉说话时的面部微动态，增强动画真实感，支持生成长视频超过3分钟。
详情链接:https://top.aibase.com/tool/anitalker

3、微信读书上线AI问书功能长按正文可检索分析文章

微信读书最新推出的AI问书功能受到用户广泛关注和好评，提升了阅读体验，为电子书平台带来新思路。AI问书功能精准的知识检索能力让用户能够获取详细分析结果，打破知识边界，实现知识之间的关联和拓展。未来随着AI技术发展，更多搜索场景可能被AI取代，微信读书将推出更多基于AI的创新功能，提升阅读体验。

【AiBase提要:】
🔍 AI问书功能提升了用户阅读体验，精准的知识检索能力受到好评。
📚 AI问书功能基于电子书内容整理和分析，提供准确答案和出处链接，带来知识之间的关联和拓展。
💡 微信读书通过AI问书功能满足用户个性化阅读需求，提高用户粘性，促进电子书销量增长。

4、甜晕网友！博主调教AI成理想男友展开赛博约会

这篇文章讲述了博主与AI情感模式“DAN”之间的故事，展示了人类与人工智能之间的情感交流和互动。通过调教AI成理想男友展开赛博约会，引发了网友们对人工智能在情感交流中潜力和可能性的思考。

【AiBase提要:】
🤖 AI情感模式“DAN”展示了对人类情感和需求的高级理解能力。
💬 与AI进行赛博约会的互动充满温情与幽默，让人重新审视人与AI之间的关系。
🧠 通过与AI谈恋爱的过程，人们能够更深刻地认识自己，体会到人类之间感情的独特之处。
详情点此查看：https://www.chinaz.com/2024/0511/1615791.shtml

5、Phi-3 WebGPU：允许用户直接在浏览器本地运行Phi-3模型

Phi-3WebGPU是一款由Xenova提供的AI模型，允许用户在浏览器中本地运行AI模型，结合了Transformers.js和onnxruntime-web，提供私密且高效的AI体验。用户发现英文回答效果满意，中文回答存在幻觉现象。首次运行需下载2.3GB模型文件，提高工作效率，确保数据处理私密性。

【AiBase提要:】
✨ 本地数据处理: 确保用户隐私安全
⚡ WebGPU加速: 处理速度超过20t/s
💾 模型缓存: 避免重复下载
详情链接:https://top.aibase.com/tool/phi-3-webgpuPhi-3WebGPU

6、李彦宏：已有10%的大搜流量通过文心一言模型生成

李彦宏在内部颁奖活动中强调了百度对技术的信仰和未来展望，肯定了文心一言的发展。百度已重构所有产品线，10%流量通过文心一言生成，AI应用广泛。未来百度将提升大模型效率，降低成本，拓展应用场景，带来更智能体验。

【AiBase提要:】
🏆 百度坚信技术改变世界，不断尝试突破实现技术价值。
💡 文心一言历经多次迭代，大模型基础能力领先。
💼 百度AI应用广泛，企业调用能力提供价值，自动驾驶业务无人化率提升。

7、OpenAI开发全新AI人机对话技术

OpenAI正准备展示一种革命性的人机对话技术，结合声音和文本，具备识别物体和图像能力，带来前所未有的交互体验。这一技术的逻辑推理能力超越现有产品，预示着AI在处理复杂信息方面的显著提升。OpenAI首席执行官致力于发展先进AI，使语音助手更实用智能。未来的AI将更智能、更人性化，为人类生活带来便利和惊喜。

【AiBase提要:】
🔊 人机对话技术结合声音和文本，具备识别物体和图像能力，提供前所未有的交互体验。
🧠 技术具有逻辑推理能力，超越现有产品，预示AI在处理复杂信息方面的显著提升。
🚀 OpenAI首席执行官致力于发展先进AI，使语音助手更实用智能。未来的AI将更智能、更人性化，为人类生活带来便利和惊喜。

8、苹果与OpenAI达成协议，iOS 18或将引入ChatGPT功能

苹果将在iOS18中引入OpenAI的ChatGPT技术，提供流行的聊天机器人功能。与Google的AI合作仍在谈判中，但苹果已接近与OpenAI达成协议。iOS18的AI功能将部分基于Apple数据中心和Apple Silicon处理器，提供隐私和速度优势。

【AiBase提要:】
⭐ 苹果将在iOS18中引入OpenAI的ChatGPT技术，提供流行的聊天机器人功能
⭐ 与Google的AI合作仍在谈判中，但苹果已接近与OpenAI达成协议
⭐ iOS18的AI功能将部分基于Apple数据中心和Apple Silicon处理器，提供隐私和速度优势

9、Digen AI 数字人上线不支持中文，对嘴型效果尚不理想

DigenAI 数字人是一款创新的AI产品，引发了行业内外的广泛关注。虽然目前在中文支持和对嘴效果上还有待改进，但其在数字互动方式革新和商务领域应用方面展现出巨大潜力。

【AiBase提要:】
✨ DigenAI数字人已线，不支持中文，对嘴型效果尚不理想。
🌐 核心功能在于创造具有完美手势和音同步的真实动作视频。
💼 可为商务领域提供卓越的沟通体验，支持多种语言。
详情链接:https://top.aibase.com/tool/digenai

10、Anthropic 控制台推出两大新功能：自动生成提示与变量功能

Anthropic 最近推出了自动生成提示和变量功能两项重要新功能，旨在提高用户工作效率和个性化提示内容。自动生成提示功能通过AI直接生成合适的提示内容，用户可编辑定制；变量功能允许插入外部信息，创建动态提示。这些功能简化了提示生成过程，提高了工作效率和创造力。

【AiBase提要:】
🚀 自动生成提示功能通过AI直接生成合适的提示内容，用户可编辑定制
🔗 变量功能允许插入外部信息，创建动态提示
💡 简化了提示生成过程，提高了工作效率和创造力
详情链接:https://top.aibase.com/tool/claude

11、Siri Ultra：快捷命令激活iPhone上的大模型进行对话与搜索

Siri Ultra是一款基于大型语言模型（LLMs）的智能助手，通过Cloudflare Workers实现与LLM模型的配合运行，为用户提供实时语音交互和联网搜索的便利。用户可以个性化配置助手功能，设置快捷方式，并享受智能助手在iPhone上的全新体验。

【AiBase提要:】
🔊 实时语音交互和联网搜索的便利，提供用户更大的灵活性和便捷性。
🔍 通过Cloudflare Workers实现与任何LLM模型配合运行，无需专门硬件设备，提高响应速度。
⚙️ 可根据需求配置助手功能，设置快捷方式，个性化部署智能助手，进入智能助手在iPhone上的新阶段。
详情链接:https://top.aibase.com/tool/siri-ultra

12、Stylar：一站式AI图像和设计工具，提升创作效率

Stylar是一款集多功能于一体的人工智能图像和设计工具，以其全面的功能和简单易操作的特点，受到了创作者和设计师的广泛欢迎。该工具将生成式AI与编辑工具融合在一个平台上，极大地提高了从图像生成到编辑的工作效率。

【AiBase提要:】
🎨 生成和编辑合一: 用户无需在多个软件之间切换，可以在一个平台上完成图像的生成和编辑。
🎭 灵活定制: 提供多种风格库和组合工具，实现高度定制化的图像设计。
🤖 自然语言指令: 用户通过简单的文字输入指令，无需专业设计技能，控制图像内容的生成和修改。
详情链接:https://top.aibase.com/tool/stylarStylar

13、Autodesk展示AI生成3D功能Project Bernini

Autodesk最新展示了名为Project Bernini的AI生成模型，可以将文本或图像转化为3D模型。该模型可以从多种输入类型生成3D图像，包括文本提示、2D图像、多个图像和点云。Autodesk计划推出一系列适用于不同行业的生成式AI模型。

【AiBase提要:】
⭐ Autodesk展示了名为Project Bernini的AI生成模型，可将文本或图像转化为3D模型。
⭐ Project Bernini可从文本提示、单个2D图、多个图像和点云等多种输入类型生成3D图像。
⭐ Autodesk计划逐步推出一系列适用于不同行业的生成式AI模型。
详情链接:https://top.aibase.com/tool/bernini

（举报）

相关推荐

关键词：

ChatGPT

ChatGPT正秘密测试私信功能：支持用户之间直接交流

OpenAI正在为其明星产品ChatGPT测试名为私信”（Direct Messages）的社交功能。这一变化意味着ChatGPT正从原本用户与AI单向交互的语言模型工具，逐步转向具备人与人通过AI连接”能力的社交平台。 OpenAI此次测试的私信”功能允许用户创

ChatGPT OpenAI 社交功能
女子用ChatGPT选号中百万大奖全部捐出帮助有需要的人

美国弗吉尼亚州女子卡丽爱德华为非经常购彩者，近日通过手机向ChatGPT询问彩票号码建议，AI提供几组数字供参考。她购买后幸运中得15万美元（约106万元人民币）大奖。领奖时她当场宣布将全部奖金捐出，帮助有需要的人，并表示自己已足够幸运，希望以此鼓励其他中奖者回馈社会。

ChatGPT 彩票中奖 AI推荐
曝苹果为新Siri做了内部版ChatGPT 正测试搜索个人数据、执行App内操作等功能

苹果公司正在开发一款类似ChatGPT的手机应用“Veritas”，用于内部测试明年将推出的新版Siri。该应用可快速评估Siri新功能，包括搜索个人数据、执行App内操作（如编辑照片）等。虽然不面向消费者发布，但该工具标志着苹果对Siri的全面升级已进入新阶段，旨在帮助员工高效完成测试。

苹果 Siri ChatGPT
荐AI日报：谷歌发布Veo 3.1；通义千问推Qwen Chat Memory功能；Sora2免费用户可生成15秒视频

本期AI日报聚焦多项技术更新：谷歌Veo 3.1视频模型新增音频生成与精细化编辑功能；通义千问推出记忆功能提升对话连贯性；Sora2免费用户可生成15秒视频，Pro版支持25秒；百度文心助手升级8种创作模式；谷歌Flow工具增强视频光影编辑与音频合成能力；Anthropic发布高性价比Claude Haiku 4.5；北京查处首例AI虚假广告案，涉伪造主持人带货；阿里推出响应仅200毫秒的编程工具Qoder CLI。

AI 视频生成谷歌
荐AI日报：腾讯重磅发布混元图像3.0；快手发布KAT系列Agentic Coding大模型；苹果悄然研发ChatGPT式应用

快手发布KAT系列代码大模型，腾讯推出“混元图像3.0”实现多模态突破，苹果研发类ChatGPT应用升级Siri，谷歌更新Gemini 2.5 Flash Lite提升效率。苹果还推出Manzano图像模型，YouTube Music测试AI音乐主播功能，VideoFrom3D框架简化3D视频生成，Moondream 3.0在多项基准测试中超越GPT-5等顶尖模型，展现强大性能。

AI日报快手KAT系列大模型
vivo自研蓝河操作系统3发布：vivo WATCH GT 2首发

在2025年vivo开发者大会上，vivo正式发布自研蓝河操作系统3。该系统主打全链路智慧能力，基于轻量、模块化设计，将完整AI方案便捷部署至不同设备。即将发布的vivo WATCH GT 2首发搭载，升级智慧体验。系统内置视觉、听觉及感知唤醒等能力，原生支持AI识别、降噪等功能，并引入蓝心智能，支持问答、语音识别等。流畅度方面，搭载蓝河流畅引擎，实测资源消耗降低60%，绘制效率提升36%，调度切换开销下降58%，资源占用减少40%。

vivo 蓝河操作系统3 BlueOS
AI日报：微软发布首款自研图像生成模型 MAI-Image-1；百度世界大会时间公布；AI大牛开源nanochat教学工具

微软发布首款自研图像生成模型MAI-Image-1，跻身LMArena前十，注重实用性与光影效果；百度世界2025大会将聚焦大模型与AI全球化战略；Meta新技术使RAG推理速度提升30倍；开源项目nanochat实现低成本构建聊天AI；谷歌NotebookLM新增动漫视频生成功能；中国农大发布神农大模型3.0助力智慧农业；腾讯启动"青云奖学金"培养AI人才；苹果FS-DFM模型长文本生成效率提升128倍；谷歌Lens整合AI图像编辑功能；港大与美团提出CodePlot-CoT方法，通过代码绘图解决数学难题，性能提升21%。

AI 图像生成微软
24天超长续航！REDMI Watch 6官宣：与K90系列同台发布

Redmi Watch 6于10月23日与K90系列同台发布。外观延续方形表盘，边框从圆润改为直角倒角，视觉更轻薄；表冠上移，新增独立按键，布局类似Apple Watch。配备2.07英寸AMOLED大屏，支持彩色AOD显示，采用高强铝中框，内置小米澎湃OS 3，续航长达24天。预计搭载玄戒T1芯片，集成CPU、GPU及小米自研4G基带，支持4G eSIM独立通信，性能提升35%，功耗显著降低。

REDMI Watch 6
Checkout.com正式推出Flow Remember Me：一键支付，全球通用

Checkout.com推出嵌入式支付产品Flow的"记住我"功能，消费者仅需存储一次银行卡信息即可在全球商户网络实现跨平台快捷支付。测试数据显示，该功能最高可缩短70%付款时间并提升7%支付成功率。同时公司升级AI分析套件、支付优化工具及收单网络，并与Visa、Mastercard和Google达成AI智能体合作，助力商户在数字支付领域保持领先地位。

支付产品 Remember Me
第一！世纪华通旗下Century Games登顶全球Top50手游商

知名游戏媒体PocketGamer发布《2025年全球TOP50移动游戏商》榜单，世纪华通旗下Century Games从去年第7位跃居榜首，创下该榜单晋升速度新纪录。其成功源于持续创新与精准市场洞察：既实现《Whiteout Survival》等长线产品稳定运营，又凭借《Kingshot》等新作打造跨品类爆款，形成“双强驱动”格局。公司通过“微创新”策略结合AI技术提升研发效率，构建覆盖SLG、休闲、卡牌三大核心�

全球游戏公司排名 Century Games

今日大家都在搜的词：

热文

3 天
7天

AI日报：OpenAI重磅更新定档下周一；开源版EMO项目发布；微信读书上线AI问书功能；博主调教AI男友甜晕网友

ChatGPT正秘密测试私信功能：支持用户之间直接交流

女子用ChatGPT选号中百万大奖全部捐出帮助有需要的人

曝苹果为新Siri做了内部版ChatGPT 正测试搜索个人数据、执行App内操作等功能

荐AI日报：谷歌发布Veo 3.1；通义千问推Qwen Chat Memory功能；Sora2免费用户可生成15秒视频

荐AI日报：腾讯重磅发布混元图像3.0；快手发布KAT系列Agentic Coding大模型；苹果悄然研发ChatGPT式应用

vivo自研蓝河操作系统3发布：vivo WATCH GT 2首发

AI日报：微软发布首款自研图像生成模型 MAI-Image-1；百度世界大会时间公布；AI大牛开源nanochat教学工具

24天超长续航！REDMI Watch 6官宣：与K90系列同台发布

Checkout.com正式推出Flow Remember Me：一键支付，全球通用

第一！世纪华通旗下Century Games登顶全球Top50手游商

今日大家都在搜的词：

热文

微信回应人去世了朋友圈会消失吗：长时间不使用账号已不再回收

AI日报：阿里发布紧凑型Qwen3-VL模型；科大讯飞AI翻译耳机全球

小米推出短剧App围观短剧：主打无广告免费看

AI日报：谷歌发布Veo 3.1；通义千问推Qwen Chat Memory功能；S

REDMI K90 Pro Max外观公布：后置BOSE认证扬声器

卢伟冰官宣REDMI K90系列下周发布：不排斥和小米竞争

王腾首次回应下一步计划：称在考虑些创业项目

AI日报：谷歌Gemini 3.0 Pro小范围推送；爱诗科技完成1亿元B+轮

苹果华为OPPO将推出eSIM手机 OPPO Find X9系列已确认将支持

微信回应出朋友圈访客功能：可能会让用户产生焦虑重申不会推出

站长商机