AI日报：Runway Gen 3可生成3D巨幅字幕效果；Google Vids 上线测试；百度网盘推宝宝AI长相预测；Luma AI推首尾帧视频生成

2024-07-01 14:46 · 稿源：站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解：https://top.aibase.com/

1、炸裂！Runway Gen 3可以生成电影片头3D巨幅字幕效果了

Runway最新推出的Gen-3Alpha视频生成模型在保真度、一致性和动作表现方面有重大改进，不仅生成稳定光影，还展现强大想象力。内测博主展示了3D巨幅字幕效果，Gen3即将对所有人开放使用。模型精细控制运动，审美强大，想象力丰富，符合物理规律，生成速度快。

【AiBase提要:】
⚙️ Runway Gen3 可模仿漫威电影片头效果制作3D巨幅字幕效果
💡 极度稳定的光影效果，保持高质量输出，即使在高速移动场景中
🎥 控制模式包括 Motion Brush、高级摄像头控制、导演模式，生成速度快，审美强大
详情链接:https://top.aibase.com/tool/gen-3-alpha

2、百度网盘一刻相册App推出宝宝AI长相预测功能

百度网盘一刻相册App推出了AI长相预测功能，用户上传照片即可预测宝宝未来样子，训练数据贴合中国宝宝特征，操作简单快速。未来将开发更多实用AI功能，征集用户意见。

【AiBase提要:】
👶 预测宝宝未来样子，训练数据贴合中国宝宝特征，操作简单快速。
📸 上传照片即可得到高清预测图像，提供多种时尚滤镜效果供选择。
🔮 未来将开发更多实用AI功能，如预测孩子不同成长阶段的样子，征集用户意见。

3、谷歌推出AI视频编辑应用Google Vids 上线测试

谷歌最新推出的AI视频编辑应用Google Vids在测试中展现出强大的功能和用户友好的特点，为用户提供了高效、便捷的视频编辑工具。该应用集成Gemini大模型，帮助用户轻松创建视频内容，降低了视频制作门槛，未来有望成为视频创作者的得力助手。

【AiBase提要:】
✨ Google Vids集成Gemini大模型，可帮助用户创建幻灯片、编写视频脚本，并制作分镜头脚本。
🎥 用户通过添加或删除元素来编辑视频，最终导出为MP4文件，入口位于Google Docs文档处理工具中。
🚀 Google Vids的上线测试丰富了Google Workspace套件，展示强大的AI技术能力，为用户提供便捷的视频编辑工具。

4、Luma AI新功能：首尾帧生成视频与向后延长5秒

Luma AI推出了新功能，让视频创作充满无限可能，虽然偶尔会有硬切换画面，但这正是剪辑的魅力所在，让每一秒充满惊喜和创意。未来的视频生成将基于这种延长操作完成，实现智能个性化的视频创作。

【AiBase提要:】
✨ 视频延长魔法：首尾帧生成视频能力，向后延长5秒，让每一帧充满无限可能
💡 创新视频功能“Extend”：智能分析视频内容，保持原有风格和对象一致性的基础上延长视频长度
🌟 Dream Machine模型发布：支持文本和图片输入，生成高质量视频，模拟现实物理特性，免费开放体验
详情链接:https://top.aibase.com/tool/dream-machine

5、全新Solos AirGo Vision智能眼镜发布

Solos公司在香港智能眼镜峰会上发布了全新的Solos AirGo Vision智能眼镜，集成了ChatGPT-4o的可穿戴AI大脑，让用户的双眼瞬间升级为超能力。这款智能眼镜不仅支持实时问答和视觉提示，还具备多语言翻译功能，模块化设计，售价为249美元。

【AiBase提要:】
⭐ 集成 ChatGPT-4o 的多模态 AI 功能，支持实时问答和视觉提示
⭐ 支持超过10种语言的实时翻译，轻松打破语言障碍
⭐ 模块化设计，可替换不同样式的传统框架，售价为249美元

6、商汤如影AI视频生成平台推出央视记者王冰冰AI数字人

商汤科技的AI数字人“AI冰冰”在《2024中国・AI 盛典》中首次亮相，展现了出色的多语言能力和逼真的视觉效果。数字人技术在传媒行业具有巨大潜力，能够拉近人物IP与受众之间的距离。

【AiBase提要:】
✨ 商汤科技创造的AI数字人“AI冰冰”在舞台上展现出专业且自然的表现，得益于SenseNova大模型技术。
🌐 如影平台的AI视频生成技术实现了高清复制和自然的表情、嘴型、动作效果，展示出卓越的语言能力。
🔥 商汤如影提供强大的核心技术支持，使AI冰冰能够展现逼真的视觉效果和流畅的多语种表达能力。

7、知乎宣布推出独立AI搜索平台「知乎直答」

知乎最近推出了全新AI产品「知乎直答」，旨在提升问答效率和质量，缩短用户与优质回答之间的距离，增强社区创作者内容的流通。这一举措预示着问答社区将进入更智能和个性化的新时代。

QQ截图20240701090057.png

【AiBase提要:】
🚀 知乎直答是基于知乎丰富问答数据开发的AI产品，提供简略和深入两种答案生成方式，支持用户快速找到所需内容或专家。
💡 产品定位为生产力工具和发现世界的连接器，帮助用户通过提问来探索世界的能力。
🔮 未来计划推出App版本，引入多模态能力，与知乎社区深度融合，探索对外合作，为整个问答领域带来新的发展方向。
详情链接:https://zhida.zhihu.com/

8、WhatsApp最新Android测试版2.24.14.7推出选择Meta AI Llama模型功能

WhatsApp最新测试版引入了选择Meta AI Llama模型的功能，用户可以根据需求自定义AI交互体验，体验更快速简单的回应或处理更复杂的查询。该功能展示了WhatsApp在AI领域持续创新的决心。

【AiBase提要:】
🔍 WhatsApp最新Android测试版2.24.14.7通过Google Play Beta计划推出选择Meta AI Llama模型功能。
🧠 用户可以选择默认的Llama3-70B模型获得更快速简单的回应，或选择高级的Llama3-405B模型处理更复杂的查询。
📈 WhatsApp计划提供更先进的Llama3-405B模型预览版，每周有使用次数限制，达到限制后用户将回到默认模型继续对话。

9、苹果可能在今年秋季宣布与谷歌 Gemini 的交易

苹果计划在今年秋季推出与谷歌 Gemini 的整合交易以及测试版的 Apple Intelligence，将人工智能作为直接盈利途径。第三方AI服务可能成为苹果的过渡选择，同时苹果将逐步推出自己的生成式AI系统。

【AiBase提要:】
🍎 苹果计划整合谷歌 Gemini 到设备中，推出测试版的 Apple Intelligence。
💡 苹果将人工智能作为直接盈利途径，不仅仅是推动硬件销售的功能。
🤖 第三方AI服务可能成为苹果的过渡选择，同时苹果将逐步推出自己的生成式AI系统。

10、GPTPdf：使用类似GPT-4o的多模态LLM分析PDF文件

近日，一款名为gptpdf的开源项目在github赞火，使用了类似 GPT-4o 的 VLLM 模型解析 PDF 文件并转换为 Markdown 格式。该项目代码简洁高效，只有293行，却能完美解析排版、数学公式、表格、图片、图表等各种内容。费用每页平均成本为0.013美元。

【AiBase提要:】
🔍 使用类似 GPT-4o 多模态模型解析 PDF 文件，转换为 Markdown 格式。
💻 代码简洁高效，仅293行。
🌟 解析结果几乎完美包括排版、数学公式、表格、图片、图表等内容。
详情链接:https://top.aibase.com/tool/gptpdf

11、AI音频魔法师Resona V2A 可自动为视频配音效

在AI技术大行其道的时代，Resona V2A技术横空出世，像一位神奇的魔术师，让视频自动开口，唱出属于自己的旋律。这不仅是技术突破，更是创意者的福音。Resona V2A一键生成音频，快速高效，创意者得力助手。高性价比，成本降低99%，提供高质量音频解决方案。

【AiBase提要:】
🔮 视频自动开口，唱出属于自己的旋律，技术突破与创意者福音。
⚙️ 一键生成音频，快速高效，加快音频生成速度，创意者投入更多时间和精力到视频创意设计。
💰 成本降低99%，高性价比的音频解决方案，满足不同用户需求。
详情链接:https://top.aibase.com/tool/resona-v2a

12、AI换装黑科技 MMTryon虚拟试穿框架可按需搭配一键叠穿

中山大学和字节智创数字人团队联合推出的MMTryon虚拟试穿框架颠覆了传统换装方式，实现一键生成模特试穿效果，质量高且操作简便。其服装编码器和多模态多参考注意机制让换装更精确灵活，打破了传统算法束缚，获得新SOTA。MMTryon不仅可试穿单件服装，还支持组合换装，无需分割，通过文本指令即可实现高质量虚拟换装。

【AiBase提要:】
👗 一键生成模特试穿效果，质量高且操作简便
🔥 打破传统算法束缚，获得新SOTA，支持组合换装
💡 利用服装编码器和多模态多参考注意机制，换装更精确灵活
详情链接:https://arxiv.org/abs/2405.00448

（举报）

相关推荐

关键词：

Runway

技嘉 AORUS 全明星计划持续发力：跨界联动多领域名人，定制全家桶主机彰显硬核实力

技嘉AORUS自2024年启动“全明星计划”，以跨界融合与实力彰显为核心，联合电竞、娱乐、赛车等领域名人，通过定制高性能主机展现硬件性能优化与个性化设计优势。截至2025年9月，计划持续扩大，邀请如无畏契约战队、创作者MISTERK、赛车自媒体溜溜哥等加入，其定制主机配置涵盖AMD锐龙处理器、旗舰主板及显卡，针对不同场景优化，确保稳定高性能体验。该计划强化品牌与多元用户连接，未来将继续拓展跨界影响力，推动硬件创新与个性化生态发展。

AORUS全明星计划跨界融合硬件性能优化
HUAWEI WATCH GT 6系列全新发布: 驭风而行实力进阶

9月24日，华为发布HUAWEI WATCH GT 6智能手表，主打“驭风而行”理念，兼顾运动健康与时尚设计。新品搭载全新高硅叠片异形电池，续航大幅提升，Pro版最长可达21天。升级版向日葵定位系统提升定位精度20%，新增骑行模拟功率功能，适配越野跑、滑雪等户外场景。健康管理全面升级，支持12种情绪识别及房颤负荷统计功能。设计上，Pro版采用立式计时表圈，46mm款灵感源自骑行，41mm款更小巧轻盈。售价1488元起，9月29日正式开售。

华为智能手表 WATCH GT6系列
数字人惊艳2025云栖大会！NuwaAI开创“真人+数字人”搭档协作新模式

在2025云栖大会上，邦彦技术旗下NuwaAI展示的“真人+数字人”搭档模式引发关注。该模式通过数字人与主播同台互动，突破传统直播边界，实现虚拟与现实的深度融合。NuwaAI平台将语音克隆、知识库等功能模块化，大幅降低使用门槛，使中小企业和个人创作者也能轻松创建数字人。平台以“8元起步、3分钟生成形象”的普惠模式推动数字人普及，已在电商直播、企业宣讲等场景实现高效协作，为人机共生开辟了新路径。

NuwaAI数字人真人+数字人阿里云合作
玩家齐赴技嘉AORUS DAY山城之约，RTX 50“嘉”速营奏响电竞狂想曲

技嘉AORUS DAY玩家体验会在重庆千极演艺中心举办，聚焦RTX50系列显卡性能展示。英伟达与技嘉代表分享了Blackwell架构、第四代RT Core与第五代Tensor Core的技术突破，支持DLSS4多帧生成与全光线追踪，显著提升游戏画质与流畅度。现场通过《黑神话：悟空》《三角洲行动》等热门游戏演示，展现高帧率与AI渲染优势。动捕体验区结合RTX5090显卡实时生成角色动画，凸显AI算力与图形融合能力。活动还涵盖NVIDIA App功能升级与玩家互动环节，通过集章抽奖、Cosplay表演营造电竞狂欢氛围，彰显硬件性能与玩家社区的热情结合。

RTX50显卡光线追踪技术 AI渲染
华为WATCH GT 6/Pro系列手表发布售价1488元起

华为于9月24日正式发布WATCH GT6系列智能手表，起售价1488元。该系列提供41mm和46mm两种尺寸，搭载OLED屏幕，续航最长可达21天，支持5ATM防水和IP69防尘。GT6 Pro新增跌倒检测、ECG心电图分析及专业运动模式，并配备蓝宝石玻璃表镜。全系采用高硅叠片电池技术，能量密度提升37%，支持无线快充。此外，首次应用骑行模拟功率功能，并搭载TruSense技术，精准监测心率、血氧等健康指标。GT6 Pro起售价2488元，进一步满足专业用户需求。

华为WATCH GT6 智能手表
荐AI日报：接入MJ！夸克发布造点AI；Wan2.5-Preview发布；可灵推最新视频生成模型可灵2.5Turbo

近日AI领域迎来多项重要更新：阿里夸克发布AI创作平台“造点”，整合通义万相Wan2.5与Midjourney V7，支持音画同步视频生成；Wan2.5-Preview实现多模态输入与电影级视频同步生成，提升视觉创作能力；可灵AI推出视频生成模型2.5Turbo并降价30%，降低使用门槛；阿里通义推出Qwen3-ASR-Toolkit，实现小时级音视频转录；谷歌相册AI编辑功能扩展至安卓用户，支持语音修图；谷歌Mixboard工具助力创意设计，生成情绪板；Qwen发布Qwen3-Max模型，在代码生成与智能体能力表现突出；Figma推出MCP服务器，实现设计到代码的一键转换，提升开发效率。

AI创作平台通义万相音画同步
OPPO Watch S官宣：轻薄表皇

OPPO宣布将于10月16日推出OPPO Watch S智能手表，主打“轻薄表皇”设计，厚度不足9mm，号称目前市面上最薄的智能圆表。搭载全新智能手表系统，操作体验媲美手机，健康配置亦有惊喜。同时具备“健身教练”功能，可自动识别运动并提供超100种运动模式，专业记录数据。此外，发布会还将推出OPPO Find X9和X9 Pro旗舰手机，首批搭载联发科天玑9500平台，出厂预装全新ColorOS 16系统。

OPPO Watch S
青云租携手国资基金5亿入局，RWA通证化加速落地

2025年8月27日，深圳爱高科创与深圳国英潜丰签署战略合作协议，国资金融基金5亿元投资青云租平台。资金将专项用于3C数码免押租赁业务拓展及RWA（实物资产通证化）项目。合作核心在于将青云租的免押租赁模式与区块链技术结合，实现租赁订单、应收账款等资产通证化，提升流动性和透明度。此举将推动资产证券化、跨境融资与港股市场拓展，加速中国数字租赁产业升级，展示行业硬核力量。

战略合作 3C数码租赁 RWA通证化
runway可以让人物面部生成指定表情

runway官方账号宣布运动笔刷功能升级，通过运动笔刷与提示词结合，可以实现对人物面部表情的精准控制。通过这项技术，运动笔刷可以根据提示词快速准确地在人物面部产生指定的表情，比如开心、恐惧等。这一创新不仅省去了复杂的视频编辑软件的使用，也摆脱了冗长的制作流程，让影片创作变得更加高效。

runway AI头条
对话Rent the Runway创始人：一条高级礼裙的距离

Jenn告诉我，她不仅想打造一个全新的衣服租借平台，更想把这个市场做大。

服装租赁 Renttherunway 礼服

今日大家都在搜的词：

热文

3 天
7天

AI日报：Runway Gen 3可生成3D巨幅字幕效果；Google Vids 上线测试；百度网盘推宝宝AI长相预测；Luma AI推首尾帧视频生成

技嘉 AORUS 全明星计划持续发力：跨界联动多领域名人，定制全家桶主机彰显硬核实力

HUAWEI WATCH GT 6系列全新发布: 驭风而行实力进阶

数字人惊艳2025云栖大会！NuwaAI开创“真人+数字人”搭档协作新模式

玩家齐赴技嘉AORUS DAY山城之约，RTX 50“嘉”速营奏响电竞狂想曲

华为WATCH GT 6/Pro系列手表发布售价1488元起

荐AI日报：接入MJ！夸克发布造点AI；Wan2.5-Preview发布；可灵推最新视频生成模型可灵2.5Turbo

OPPO Watch S官宣：轻薄表皇

青云租携手国资基金5亿入局，RWA通证化加速落地

runway可以让人物面部生成指定表情

对话Rent the Runway创始人：一条高级礼裙的距离

今日大家都在搜的词：

热文

雷军：小米17系列开售仅5天销量破100万台

微信又更新了撤回消息有大变化：可撤回本次发送的全部消息

雷军：小米17系列首销权益延续至10月31日

理想汽车推出焕新版L系限时优惠 10 月 8 日前享1.5万置换补贴

比特币价格突破12.5万美元刷新历史最高纪录

小米回应“小米汽车突然自己开走”：排除车辆质量问题

小米17 1TB版明日开售售价5299元

雷军：小米17系列开售仅5天销量破100万台

乔布斯逝世14周年库克发文缅怀：我们深切怀念你

腾讯混元图像3.0登顶LMArena榜一

小米 17 标准版1TB版本 5299 元开售全系列销量同比增超20%

微信又更新了撤回消息有大变化：可撤回本次发送的全部消息

雷军：小米17系列首销权益延续至10月31日

站长商机