AI日报：阿里推多角色一致性框架UniPortrait；腾讯混元上线三款ControlNet插件；苹果研发桌面机器人；Claude推提示词缓存功能

2024-08-15 15:08 · 稿源：站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、阿里团队推新框架UniPortrait:支持多角色一致性和风格参考

阿里巴巴集团研究团队发布了UniPortrait框架，专注于人像图像的个性化处理，实现单角色一致性、多角色一致性和风格参考。该框架具备高度逼真的面部特征保留，支持广泛的面部编辑功能，用户可通过自由文本描述生成图像。UniPortrait为人像个性化定制带来新可能性，提升图像生成质量，为未来应用场景铺平道路。

【AiBase提要:】
🌟UniPortrait框架专注于单一和多重身份的图像个性化处理，保持高质量的面部特征。
✍️框架由ID嵌入模块和ID路由模块组成，通过两阶段训练方案实现高效定制。
🚀UniPortrait支持自由文本描述和多样化布局生成，为人像个性化定制提供丰富可能性。
详情链接:https://top.aibase.com/tool/uniportrait

2、可精准控图!腾讯混元文生图开源模型上线三款ControlNet插件

腾讯混元文生图大模型（HunyuanDiT）近日发布了三款新的可控制插件ControlNet，进一步扩展了其应用场景，为开发者和创作者提供更精准的图片生成和更大自由度的创作能力。

【AiBase提要:】
🔍 Tile插件实现超清放大，适合对细节有极致追求的场景。
🎨 Inpainting插件填充涂抹部分，实现背景更换、人物主体改变等效果。
🖌️ Lineart插件创作真人、动漫和建筑图片，适用于建筑效果图生成和手稿上色。
详情链接:https://dit.hunyuan.tencent.com/

3、苹果正在研发一款神奇的桌面机器人，预计2026年面世!

苹果公司正秘密研发一款结合 iPad 显示屏和机械臂的桌面机器人，将彻底改变家庭生活。这款设备功能多样，可控制智能家居、进行视频通话和监控家庭安全，内置 Siri 语音助手，操作便捷。预计在2026年或2027年发布，售价约1000美元。

【AiBase提要:】
📱 苹果正在研发一款结合 iPad 显示屏和机械臂的桌面机器人，功能多样。
🛋️ 这款设备可以控制智能家居、进行视频通话和监控家庭安全，预计在2026年或2027年发布。
🗣️ 内置 Siri 语音助手，支持语音命令，让用户操作更便捷。

4、Claude推出提示缓存功能允许开发人员在API缓存常用上下文

Anthropic公司推出的提示缓存功能在提高AI使用效率和降低成本方面具有潜在的重要意义，然而其实际效果还需市场检验。该功能允许用户存储和重复使用特定上下文信息，为商业AI应用带来效率提升。

【AiBase提要:】
🔑 提示缓存功能可降低企业AI成本并提升性能，但实际效果需市场验证。
🚀 功能适用于长时间对话、文档处理等场景，有望带来高达90%的成本降低和响应速度提升。
💡 其他AI公司也在探索提高模型效率和降低成本的方法，市场对功能表现持谨慎态度。

5、Grok2图像生成无所不能!原来用的是FLUX.1模型

在这个AI日新月异的时代，马斯克推出了AI助手Grok的新功能，让图片生成变得自由而充满争议。Black Forest Labs开发的FLUX.1模型引领着AI界的创新，但也引发了版权和虚假信息等问题。马斯克的选择反映了对信息自由的态度，但也可能带来信息灾难。在AI快速发展的时代，我们需要提高辨识能力，谨慎应对这种无拘无束的创造力。

【AiBase提要:】
🌟 Grok2 推出新图像生成功能，生成图片无过滤机制，质量上甚至超过了Midjourney和OpenAI的产品
💰 Grok2 用的是Black Forest Labs 开发的FLUX.1 模型
⚠️ 不受约束的图像生成可能导致假新闻和版权问题。

6、HeadGAP:三张视角图片即可生成逼真3D虚拟人

研究团队开发的"HeadGAP"方法引起了广泛关注，通过少量照片快速创建高仿真3D虚拟人头部形象，实现个性化定制与优化。该方法结合高斯点网络和动态建模技术，展示出色的渲染质量和动画表现，适用于多种应用场景。

【AiBase提要:】
🎨 通过"HeadGAP"方法，仅需少量照片即可创建逼真的3D虚拟人头部形象。
🚀 采用高斯点网络和动态建模技术，实现头像个性化定制与优化。
🖼️ 实验结果显示，生成的头像在渲染质量和动画表现上都非常出色，适用于多种应用场景。
详情链接:https://top.aibase.com/tool/headgap

7、联想发布2025财年Q1财报杨元庆:混合式AI是巨大机遇

联想集团在2024/25财年第一财季业绩表现亮眼，营收增长20%，净利润同比增长65%。杨元庆强调混合式人工智能的愿景，认为是未来发展的重要方向。公司全球市场份额接近23%，AI PC出货量环比增长228%。

【AiBase提要:】
📈 营收增长20%，净利润同比增长65%。
🖥 全球市场份额接近23%，高端产品线占比31.6%。
🤖 混合式人工智能是未来发展重要方向，为个人和企业打造智能体。

8、OpenAI投的代码神器Cursor叛变，程序员却拍手叫好，疯狂买单

在科技圈，OpenAI投资的代码生成工具Cursor突然叛变，引起轰动。程序员们纷纷支持并购买Cursor，导致OpenAI失去统治地位。这一事件揭示了投资协议松散的问题。

【AiBase提要:】
🤯 程序员们疯狂支持Cursor，愿意支付双倍价格，使其成为新宠。
👀 Cursor支持Claude-3.5-Sonnet和多行编辑功能，提高代码编写效率。
💥 Claude-3.5-Sonnet在Livebench基准测试中稳坐榜首，超越GPT-4和ChatGPT。
详情链接:https://www.cursor.com/blog/openai-fund

9、Nature惊人内幕:无数论文被偷偷高价出售喂AI

学术出版商将研究论文出售给AI开发公司，引发科研界争议。研究数据用于训练AI模型，作者无知情。大型语言模型需大量数据训练，学术论文成宝贵资源。购买高质量数据集趋势上升，合作与保密并存。版权诉讼引发关注，研究者意见不一。

【AiBase提要:】
🔍 学术出版商将研究论文出售给AI开发公司，引发科研界争议。
💡 大型语言模型需大量数据训练，学术论文成宝贵资源。
⚖️ 版权诉讼引发关注，研究者意见不一。
详情链接:
https://www.nature.com/articles/d41586-024-02599-9
https://arxiv.org/pdf/2112.03570

（举报）

相关推荐

关键词：

UniPortrait

隐藏的AI指令揭示了 Anthropic 是如何控制 Claude 4 的

威利森指出，这些系统提示就像是“模型曾经做过、但现在被禁止做的事件清单”……

Anthropic Claude4系列模型 claude4
Anthropic 开始给 Claude 搞“语音模式”了

默认情况下，该功能由 Anthropic 的 Claude Sonnet 4 模型提供支持，大多数免费用户每天大约可使用 20 到 30 次。此外，只有付费用户才能使用一项 Google Workspace 连接功能……

Anthropic Claude语音模式 Claude
荐AI日报： ChatGPT免费开放记忆功能；华为WATCH 5智能手表接入双大模型；Claude Pro升级重磅功能

本期AI日报主要报道了多项AI领域重要进展：1）OpenAI向所有ChatGPT用户免费开放记忆功能；2）蚂蚁集团推出"AI健康管家"，服务4000万用户；3）Anthropic与DeepLearning.AI合作推出免费MCP课程；4）谷歌DeepMind开发无需3D模型即可生成逼真运动视频的新技术；5）Exa与OpenRouter合作为400+大模型提供实时网络搜索功能；6）中国知网推出CNKI AI学术研究助手；7）Anthropic推出Claude Explains博客项目；8）Claude Pro新增研究模式和远程MCP整合功能；9）Fish Audio发布基于200万小时数据训练的OpenAudio S1语音模型；10）OpenAI升级Codex编程工具；11）华为WATCH5接入盘古和DeepSeek双大模型。

人工智能 ChatGPT 记忆功能
荐AI日报：腾讯语音数字人模型HunyuanVideo-Avatar；Trae国际版开启付费订阅模式；Claude网页搜索功能全面开放

本文汇总了AI领域最新动态：1)腾讯开源数字人模型HunyuanVideo-Avatar，支持图像转视频创作；2)Trae国际版开启付费订阅，首月3美元；3)Claude网页搜索功能向免费用户开放；4)印度AI初创Builder.ai破产，亏损超5亿美元；5)腾讯元宝接入微信读书平台；6)快手计划加大AI投入但预计影响利润率；7)Mistral推出智能代理API；8)Claude移动端上线语音对话测试版；9)OpenAI拟推ChatGPT第三方登录功能；10)掘金发布AI项目一键部署工具；11)多模态模型视觉推理能力评估显示准确率仅25.8%；12)中石油发布3000亿参数昆仑大模型，推动油气产业智能化。

人工智能数字人短视频
荐AI日报：美团No Code平台免费开放；豆包App升级“一句话P图”功能；苹果Xcode 26内置ChatGPT等AI功能

本文介绍了AI领域多项重要进展：1)美团推出No Code平台和1680个AI应用；2)豆包App升级"一句话P图"功能；3)苹果发布内置ChatGPT的Xcode26开发工具；4)iOS26新增视觉智能功能；5)讯飞星火X1升级版即将发布；6)比亚迪接入阿里通义大模型；7)DeepSeek支持本地工具调用；8)开源框架Rowboat支持快速构建智能助手；9)X平台整合Grok AI优化内容推荐；10)港科大开发进化搜索技术提升小模型图像生成能力；11)硅基流动完成数亿元融资；12)港大与英伟达合作开发新型视觉注意力机制。这些创新展示了AI技术在各领域的快速发展和应用突破。

人工智能 AI产品应用大语言模型
荐AI日报：腾讯混元3D 2.1大模型开源；字节跳动AI Lab负责人李航卸任；OpenAI Codex 全新升级

本文介绍了AI领域最新动态：1)腾讯开源混元3D2.1大模型，提升3D生成质量；2)OpenAI Codex升级，优化代码生成功能；3)字节跳动AI Lab负责人李航卸任；4)微软发布700个AI应用案例；5)微软推出Code Researcher工具，解决58%系统崩溃问题；6)Observer AI实现屏幕操作自动化；7)Genspark发布AI浏览器；8)麻省理工用AI技术3.5小时修复15世纪名画；9)蚂蚁集团推出开源多模态GPT-4o模型Ming-Omni；10)MagicTryOn视频换衣框架；11)字节跳动发布实时互动AI视频生成模型Seaweed APT2；12)ChatGPT搜索功能升级；13)字节跳动与老凤祥合作开发AI智能眼镜。

人工智能 3D生成开源大模型
荐AI日报：ChatGPT支持MCP和会议记录功能；Cursor 1.0 版本重磅发布；Midjourney视频功能将在本月上线

本期AI日报聚焦多项AI领域突破：1）OpenAI为ChatGPT新增企业数据连接和会议记录功能；2）Cursor 1.0发布集成BugBot等开发工具；3）Midjourney即将推出视频生成功能；4）秘塔AI搜索新增PPT导出功能；5）Manus推出文本生成视频工具挑战Sora；6）法国Mistral发布企业级编程助手；7）英伟达推出文档处理专用AI模型；8）腾讯公益引入大模型提升互动体验；9）Firecrawl推出网页抓取API工具；10）Bland AI实现超真实语音克隆；11）报告显示AI训练成本逼近百亿美元；12）开源设计工具Jaaz支持批量图像生成；13）《逆水寒》手游接入AI实现图片动效玩法。

OpenAI ChatGPT 人工智能
Copy2AI三款AI软件上线，功能强大，免费无限制

Copy2AI推出三款AI工具：智能剪贴板、智能创作助手和智能聊天助手。智能剪贴板能自动分类记录剪贴内容，支持语义搜索；智能创作助手提供灵感激发、风格转换等功能，助力内容创作；智能聊天助手可定制对话风格和角色。三款工具均完全免费、无功能限制，支持本地部署保障隐私安全，适用于职场人士、内容创作者、学生等多场景，旨在让AI技术真正触手可及，提升工作和

人工智能智能助手 AI技术
普渡机器人发布AI全能清洁机器人PUDU CC1 Pro，商用清洁迈入AI时代

5月27日，深圳普渡科技发布AI全能清洁机器人PUDU CC1 Pro。该产品通过AI技术实现全流程智能化清洁，具备垃圾识别、力度调节、效果监测等功能，每小时清洁面积达1500-3000㎡。创新性地采用后视AI相机检测二次污染，搭载VSLAM+激光融合定位技术，简化部署流程。产品获得CE-MD认证，适用于商业综合体、医院等大场景。普渡科技作为服务机器人领导品牌，产品已覆盖全球60多个国家�

AI清洁机器人普渡科技智能清洁解决方案
AI日报：月之暗面首款自主智能体Kimi-Researcher；MiniMax推音色设计功能；Jaaz发布Lovart AI本地化替代品

【AI日报】今日AI领域重要动态：1)月之暗面发布Kimi-Researcher智能体，多轮搜索推理能力超越谷歌和OpenAI同类产品；2)MiniMax推出Voice Design功能，支持多语言/音色组合；3)火山引擎上线AI智能域名推荐功能；4)Anthropic强化VSCode集成；5)Google推出Gemini2.5Flash-Lite模型，可实时生成交互界面；6)苹果拟300亿美元收购AI公司Perplexity；7)月之暗面开源Kimi-2506多模态模型；8)Firecrawl将推出开源问答引擎Fireplexity；9)银河通用机器人获宁德时代10亿元融资；10)字节跳动发布DreamActor-H1视频生成系统；11)Google推出开源实时音乐生成模型Magenta RealTime；12)开源AI设计工具Jaaz发布。

人工智能技术趋势创新产品

热文

3 天
7天

AI日报：阿里推多角色一致性框架UniPortrait；腾讯混元上线三款ControlNet插件；苹果研发桌面机器人；Claude推提示词缓存功能

隐藏的AI指令揭示了 Anthropic 是如何控制 Claude 4 的

Anthropic 开始给 Claude 搞“语音模式”了

荐AI日报： ChatGPT免费开放记忆功能；华为WATCH 5智能手表接入双大模型；Claude Pro升级重磅功能

荐AI日报：腾讯语音数字人模型HunyuanVideo-Avatar；Trae国际版开启付费订阅模式；Claude网页搜索功能全面开放

荐AI日报：美团No Code平台免费开放；豆包App升级“一句话P图”功能；苹果Xcode 26内置ChatGPT等AI功能

荐AI日报：腾讯混元3D 2.1大模型开源；字节跳动AI Lab负责人李航卸任；OpenAI Codex 全新升级

荐AI日报：ChatGPT支持MCP和会议记录功能；Cursor 1.0 版本重磅发布；Midjourney视频功能将在本月上线

Copy2AI三款AI软件上线，功能强大，免费无限制

普渡机器人发布AI全能清洁机器人PUDU CC1 Pro，商用清洁迈入AI时代

AI日报：月之暗面首款自主智能体Kimi-Researcher；MiniMax推音色设计功能；Jaaz发布Lovart AI本地化替代品

热文

小米预告AI眼镜雷军：自带小爱同学啥都能直接问

雷军称YU7定价合理：希望大家猜测YU7价格要讲科学

罗永浩回应为何总能融到钱并回击谩骂

雷军分享小米端到端辅助驾驶进展：YU7全系搭载 SU7下月升级

2025新财富500创富榜发布：张一鸣问鼎首富梁文锋进前十

小米MIX Flip 2外观公布：配备骁龙8至尊版、5165mAh电池

中消协发倡议抵制极端吃播：平台应严格识别、及时下架

苹果官网首次支持国补目前仅限北京收货地址及上海线下购买

小米预告AI眼镜雷军：自带小爱同学啥都能直接问

雷军称YU7定价合理：希望大家猜测YU7价格要讲科学

罗永浩回应为何总能融到钱并回击谩骂

雷军分享小米端到端辅助驾驶进展：YU7全系搭载 SU7下月升级

站长商机