AI日报：Runway推视频生视频功能；腾讯推AI游戏生成模型 GameGen-O；HeyGen推出Avatar 3.0；OpenAI新模型o1虚有其名？

2024-09-14 14:58 · 来源： AIbase基地

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、Runway推出“Video to Video”功能精神小伙秒变科幻片主角

Runway最新推出的Video to Video功能彻底改变了视频创作的游戏规则，让任何人都能成为数字魔法师，轻松改变视频风格、背景和氛围。这项创新技术让视频编辑变得简单易行，为用户提供前所未有的精确控制，开启了视频创作的全新可能性。

【AiBase提要:】
✨ 视频创作革命:Video to Video功能让普通用户也能制作惊艳视频效果，降低了高质量视频制作门槛。
🚀 精准控制创意表达:生成的视频准确呈现创作者的想象，无论是动作、表现力还是整体意图。
🎥 创意无限可能:用户可以自由改变背景、场景和物体材料属性，让创意插上翱翔的翅膀。
详情链接:https://top.aibase.com/tool/runwayml

2、腾讯联合多所高校出品!AI游戏生成模型 GameGen-O 轻松生成高质量游戏元素

GameGen-O 是一款由香港和中国的几所大学与腾讯联合研发的 AI 模型，专门用于创建开放世界视频游戏的模拟。这款模型不仅能生成高质量的游戏内容，还模拟了多种游戏引擎的特性，为开发者提供了快速制作原型和测试不同游戏元素的便利工具。

【AiBase提要:】
🌟 GameGen-O 能生成开放世界视频游戏的各种元素，帮助开发者快速制作原型。
🎮 模型旨在测试游戏概念，增强互动控制能力，而非创建完全可玩的游戏。
🔍 研究团队通过数据集建立和两阶段训练，为游戏开发带来新的可能性。
详情链接:https://gamegen-o.github.io/

3、HeyGen推出Avatar3.0:支持半身动作，AI数字人从此不再“假笑”

HeyGen最新推出的Avatar3.0系统重新定义了AI虚拟形象的可能性，为视频创作带来革命性变革。这次升级将虚拟角色的表现力提升到全新境界，不再局限于简单的口型同步。

视频来自官方，翻译：小互

【AiBase提要:】
🤖 动态脚本理解: 虚拟形象能准确捕捉话语中的微妙差别，传达说话者意图。
😊 精准的面部表情: AI根据对话内容生成恰到好处的表情，与信息内容完美匹配。
🎤 自然的语音变化: 系统精确控制每个单词的语气，使对话听起更自然流畅。

4、字节跳动AI助手豆包旗下“豆包爱学”升级

豆包爱学是字节跳动旗下AI智能助手品牌豆包的教育应用，最近完成全新升级。这款应用旨在成为学习者的智能伙伴和家庭教育的得力助手，为新学期的学习提供支持。

【AiBase提要:】
📚 多项辅助学习功能，包括答疑解惑、作业批改、知识问答、作文辅导和口算练习，满足家庭教育的多样化需求。
💬 特色功能如“名人聊天室”和“沉浸故事馆”，允许用户与AI智能体进行对话，体验诗词名篇的情景互动。
🎨 “互动故事”板块让用户自行设定角色，通过故事化方式探索世界;“图片创作”板块让用户通过语音和文字创作图像，体验艺术创作。

5、大失所望!用户实测OpenAI新模型o1:居然犯各种低级错误，连个字母都算错了

近日，OpenAI推出备受期待的AI模型“o1-preview”，声称能与博士生相媲美。然而，初步测试结果显示该模型在基本任务上表现不佳，频繁出现非法棋步和错误回答简单谜题。尽管OpenAI承认模型仍在发展中，长时间思考未必提高推理能力，许多基础问题仍未解决。

【AiBase提要:】
🌟 OpenAI新模型“o1-preview”声称在复杂任务上能与博士生相媲美，但实测结果显示基本任务表现不佳。
🤖 用户发现该AI模型频繁出现非法棋步和错误回答简单谜题，表现令人失望。
💬 OpenAI承认模型仍在发展中，长时间思考未必提高推理能力，许多基础问题仍未解决。

6、苹果AI促使iPhone16全系8GB内存

Johny Srouji透露，iPhone16全系标配8GB内存，主要是因为AI功能的加入，这一配置是经过深思熟虑的决定。8GB内存将显著提升性能，包括高端游戏和3A游戏的本地运行。iPhone17系列预计将从12GB内存起步。苹果在软硬件和产品集成方面的优势带来诸多好处，8GB内存配置经过多次测试被确定为最优。

【AiBase提要:】
📱 iPhone16全系标配8GB内存，AI功能是关键因素
💡8GB内存提升性能，包括高端游戏和3A游戏的本地运行
🚀 iPhone17系列预计将从12GB内存起步

7、"AI教母"李飞飞创办World Labs，获2.3亿美元融资

李飞飞创办的World Labs成功融资2.3亿美元，估值超过10亿美元，旨在打造前沿AI技术，开发能理解与3D世界互动的AI模型。2025年计划推出首款产品，潜在客户包括游戏公司和电影制片厂，展现强大商业前景。李飞飞的背景使她在计算机视觉和机器学习领域备受尊敬，期待她和团队带来的创新成果对3D AI技术发展产生深远影响。

【AiBase提要:】
💰 World Labs成功融资2.3亿美元，估值超10亿美元。
🌐 World Labs致力于开发能理解3D世界的AI模型，计划2025年推出首款产品。
🎮 潜在客户包括游戏公司和电影制片厂，展现强大商业前景。

8、如何在纪录片中使用AI?新发布的伦理指南明确创作底线!

最近，随着好莱坞的双重罢工，电影行业对人工智能的应用引起了广泛关注。纪录片制作人在这场变革中面临了许多伦理问题，特别是如何使用生成式 AI，或者说在创作中如何把握 “虚构材料” 的界限。一群纪录片制人联手发布了一套全新的伦理指南，以帮助制作人、电影工作者和各大平台应对这项技术带来的挑战。

【AiBase提要:】
🌟 生成式 AI 的应用引发纪录片制作者的伦理讨论，新的指南应运而生。
📜 该指南强调了重视原始资料、透明性和法律考量等四大原则。
🤖 生成式 AI 有助于保护受访者身份，并为纪录片创作带来新的可能性。

9、图森未来的戏剧性转型:从自动驾驶领军企业到AI动画新贵

图森未来公司经历了一场引人注目的转型，从自动驾驶领域转向AI动画和视频游戏领域。这一转变引发了股东的困惑和争议，涉及资金转移、法律纠纷等问题。公司面临着平衡股东利益、监管要求和业务转型的挑战。

【AiBase提要:】
🔍 公司转型惊人:曾是自动驾驶明星，现进军AI动画和游戏领域。
💰 争议围绕资金转移:公司试图将4.5亿美元转移到中国支持新业务，股东担心资金挪用。
🔄 业务方向转变引发质疑:公司裁员自动驾驶团队，招聘视频游戏和动画人才，股东对新业务方向不满。

10、OpenAI新款AI模型o1被评为 “中等风险” ，竟因这两大特性!

OpenAI最新推出的o1模型被评为“中等风险”，主要因其人类相似的推理能力和劝说力。该模型展示了出人意料的能力，在网络安全测试中表现突出。评估结果显示o1模型在协助专家复制生物威胁方面具有一定优势，但对非专家的影响相对较低。

【AiBase提要:】
🤖 o1模型具有人类相似的推理能力和劝说力，被评为“中等风险”。
🧬 o1模型能够协助专家复制生物威胁，但对非专家的影响有限，风险相对较低。
🔍 o1-preview模型在网络安全测试中展现出意外的能力，能够绕过挑战直接获取目标信息。

11、国家互联网信息办公室发布《人工智能生成合成内容标识办法（征求意见稿）》

国家互联网信息办公室发布了《人工智能生成合成内容标识办法（征求意见稿）》，旨在规范人工智能生成合成内容标识，保护公民、法人和其他组织的合法权益，维护社会公共利益。该办法根据多项法律法规制定，意见反馈截止时间为2024年10月14日。

微信截图_20240914110802.png

【AiBase提要:】
🔍 《办法》明确人工智能生成合成内容的定义，包括文本、图片、音频、视频等信息，并区分显式标识和隐式标识。
📝 《办法》规定服务提供者应在适当位置添加显式标识，并在文件元数据中添加隐式标识，要求网络信息内容传播平台规范生成合成内容传播。
⚖️ 服务提供者需遵守相关规定，对生成合成内容进行标识，违规将面临处罚。
详情：https://www.chinaz.com/ainews/11779.shtml

相关推荐

荐A日报：Stability AI发布实时重建模型SPAR3D；火山引擎“奇美拉”数字人平台启动封测；京东重磅开源JoyAgent-JDGenie

AI日报栏目精选了人工智能领域最新动态：1)Stability AI推出0.7秒单图3D重建模型SPAR3D；2)GitHub热门开源AI协作框架CrewAI获3.4万星；3)马斯克发布儿童AI聊天机器人Baby Grok引发安全争议；4)ComfyUI-C opilot工具简化AI工作流创建；5)CNNIC报告显示我国346款生成式AI完成备案；6)提示词管理工具AI Gist上线；7)开源语言学习工具WordPecker支持多语言学习；8)斯坦福推出多工具协作AI Agent OctoTools；9)Ope
荐AI日报：美图发布影像AI Agent RoboNeo；1.8bit量化Kimi K2模型上线；亚马逊推AI代码编辑器 Kiro

【AI日报】今日AI领域重要动态：1)美图推出RoboNeo，通过自然语言指令实现图片精修、品牌设计等全能影像处理；2)Unsloth AI将Kimi K2模型量化至1.8bit，体积缩减78%保持性能；3)谷歌Gemini嵌入模型登顶MTEB榜单，超越OpenAI；4)亚马逊发布免费AI代码编辑器Kiro，集成Claude模型；5)Claude新增应用工具目录功能提升工作效率；6)MiniMax完成近3亿美元融资，估值超40亿美元；7)UTCP新协议让AI代理直
荐A日报：Kimi开放平台上线Kimi Playground；OpenAI重磅发布ChatGPT Agent；Suno推人声替换功能

【AI日报】汇总了近期AI领域重要进展：1)月之暗面推出Kimi Playground平台，实现从对话助手到智能助理的转变；2)OpenAI发布ChatGPT Agent，支持自主执行浏览、购物等任务；3)Suno发布v4.5+版本，新增人声替换等音乐创作功能；4)谷歌Veo3视频生成模型上线，支持文本转视频；5)全球首个直播流扩散模型MirageLSD发布，实现实时视频转换；6)VSCode编程助手Traycer提升大型代码库处理效率；7)ART框架支持Python一键训练AI Agent；8)NVIDIA语音识别模型Canary-Qwen-2.5B词错率创新低；9)Mistral AI推出Le Chat挑战ChatGPT；10)百度小度上线首个支持物理交互的MCP Server；11)Lightricks的LTXV模型实现60秒高质量视频生成；12)开源模型LTX-Video13B支持30倍速高清视频生成。
ZEGO AI Agent：支持一张图生成数字人

即构科技推出AI Agent2.4，用户只需上传一张正面照即可生成1080P高清数字人，支持实时互动对话。该技术具备400ms超低延迟、2秒内完成自然交互响应，唇形同步准确，支持文本/音频/语音流驱动。适用于教育、客服等场景，提供API灵活定制，实现低成本批量生成。核心技术融合照片驱动与实时AI交互引擎，在生成效率、拟真度方面显著提升，带来低门槛、高沉浸的数字人互动体验。
荐AI日报：腾讯混元推3D生成大模型Hunyuan3D-PolyGen；钉钉AI表格重磅来袭；阿里推多模态大语言模型HumanOmniV2

本文介绍了AI领域多项重要进展：1)腾讯推出首个美术3D生成大模型Hunyuan3D-PolyGen，显著提升建模效率；2)阿里发布多模态大模型HumanOmniV2，准确率达69.33%；3)钉钉AI表格实现1小时处理千项任务；4)百度PaddleOCR3.1版本在多语种识别和文档翻译方面升级；5)微软推出Deep Research智能体，自动化研究流程；6)香港理工与OPPO联合开源视频超清框架DLoRAL；7)谷歌开源MCP工具箱简化AI与数据库集成；8)Win11将推出AI动态壁纸功能。这些创新展示了AI在3D生成、多模态理解、办公效率、视觉处理等领域的突破性进展。
荐A日报：Trae 2.0 正式升级 SOLO 模式；通义发布Qwen3新模型；智谱AI重磅推出Zread

本期AI日报聚焦多项AI领域突破：1)Trae 2.0推出SOLO模式，实现AI全流程自主开发；2)阿里通义发布Qwen3-235B大模型，支持256K文本处理；3)智谱AI推出Zread工具，一键转换GitHub项目为使用手册；4)零一万物发布万智企业大模型平台2.0及定制Agent方案；5)字节跳动推出通用机器人模型GR-3，具备高精度操作能力；6)Pika推出AI视频特效APP，降低创作门槛；7)Dia浏览器将上线AI驱动的"分身鼠标&

人工智能 AI产品开发者
荐AI日报：智谱上线PPT生成功能AI Slides；可灵 AI 发布可图2.1模型

本文介绍了AI日报栏目及近期AI领域多项突破性进展：1)智谱推出免费AI Slides工具，基于GLM模型快速生成高质量PPT；2)可灵AI发布可图2.1模型，支持180多种风格图像生成；3)NVIDIA推出DiffusionRenderer技术，实现视频到可编辑3D场景转换；4)墨刀AI新增30秒生成高保真原型功能；5)Higgsfield推出Soul ID工具，10张照片即可生成虚拟形象；6)谷歌DeepMind开源GenAI Processors工具库；7)谷歌Veo新增图像转视频功能；8)Mistral AI发布专为代码建模的Devstral2507系列模型。这些创新展示了AI在内容生成、3D建模、产品设计等领域的快速发展。
领先OpenAI三个月，百度文库GenFlow领跑通用Agent领域，2.0版本8月上线

百度文库即将在8月发布GenFlow2.0版本，该版本具备更强大的多模态能力，支持生成多种内容形态，大幅缩短任务交付时间。相比OpenAI同日发布的ChatGPT+Agent，百度文库早在4月就已上线GenFlow1.0，实现全场景覆盖和全链路调度。GenFlow基于MoE架构，在成本、性能和效率上占优，能快速生成PPT、研报等多样化内容，且依托百度14亿专业文档资源，内容质量更可靠。此外，GenFlow还能调用用户个人数据实现个性化定制，并提供内容后期编辑功能，灵活性更高。
荐刚刚，OpenAI通用智能体ChatGPT Agent正式登场

Agent AI 时代，比我们想象中来得要早一些。北京时间周五凌晨，OpenAI 突然开启了新产品直播。本次发布的是全新的 ChatGPT Agent，它实现了通用智能体（Agent）能力的关键升级。
荐AI日报：通义开源AI编程大模型Qwen3-Coder；360将推智能眼镜和AI录音笔；谷歌发布Gemini 2.5 Flash-Lite 稳定版

本文介绍了AI领域多项重要进展：1)谷歌发布Gemini 2.5 Flash-Lite稳定版，平衡速度与成本；2)腾讯混元ASR语音大模型接入ima平台；3)阿里开源Qwen3-Coder编程大模型；4)360将推智能眼镜和AI录音笔；5)夸克健康大模型通过医师评测；6)零一万物发布企业级大模型平台；7)Hedra推出低成本AI视频代理；8)Gemini2.5革新图像理解能力；9)Meta推出创新文本处理模型AU-Nets；10)苹果AI团队或寻求第三方合

谷歌 Gemini 2.5

今日大家都在搜的词：

热文

3 天
7天

AI日报：Runway推视频生视频功能；腾讯推AI游戏生成模型 GameGen-O；HeyGen推出Avatar 3.0；OpenAI新模型o1虚有其名？

荐A日报：Stability AI发布实时重建模型SPAR3D；火山引擎“奇美拉”数字人平台启动封测；京东重磅开源JoyAgent-JDGenie

荐AI日报：美图发布影像AI Agent RoboNeo；1.8bit量化Kimi K2模型上线；亚马逊推AI代码编辑器 Kiro

荐A日报：Kimi开放平台上线Kimi Playground；OpenAI重磅发布ChatGPT Agent；Suno推人声替换功能

ZEGO AI Agent：支持一张图生成数字人

荐AI日报：腾讯混元推3D生成大模型Hunyuan3D-PolyGen；钉钉AI表格重磅来袭；阿里推多模态大语言模型HumanOmniV2

荐A日报：Trae 2.0 正式升级 SOLO 模式；通义发布Qwen3新模型；智谱AI重磅推出Zread

荐AI日报：智谱上线PPT生成功能AI Slides；可灵 AI 发布可图2.1模型

领先OpenAI三个月，百度文库GenFlow领跑通用Agent领域，2.0版本8月上线

荐刚刚，OpenAI通用智能体ChatGPT Agent正式登场

荐AI日报：通义开源AI编程大模型Qwen3-Coder；360将推智能眼镜和AI录音笔；谷歌发布Gemini 2.5 Flash-Lite 稳定版

今日大家都在搜的词：

热文

华为鸿蒙HarmonyOS 5.1官宣7月31日开启升级：覆盖30多款设备

苹果发布首个iOS 26公测版液态玻璃设计引发热议

特斯拉餐厅6小时狂赚4.7万美元马斯克正式进军餐饮业

AI日报：通义开源AI编程大模型Qwen3-Coder；360将推智能眼镜

全球第一网红野兽先生计划中国行比甲亢哥更火

华为Pura 80标准版今日预售将于7月30日正式开售

AI日报：字节发布同声传译模型Seed LiveInterpret 2.0；秘塔搜

微信实时对讲功能已下线腾讯客服回应：暂无重新上线计划

腾讯市值重回5万亿港元：大涨近4.5% 创近4年新高

华为旗舰平板MatePad Pro 12.2今日发布

华为鸿蒙HarmonyOS 5.1官宣7月31日开启升级：覆盖30多款设备

马斯克正式进军餐饮业特斯拉首家超级充电站餐厅开业

微信能自动发消息了！微信新增自动发送消息功能

苹果发布首个iOS 26公测版液态玻璃设计引发热议

特斯拉餐厅6小时狂赚4.7万美元马斯克正式进军餐饮业

华为 MatePad Pro 12.2 英寸 2025 官宣 7 月 24 日发布

A日报：Stability AI发布实时重建模型SPAR3D；火山引擎“奇美拉

A日报：Trae 2.0 正式升级 SOLO 模式；通义发布Qwen3新模型；智

小米REDMI首部短剧《时空合伙人》收官雷军“声音”亮相成惊喜

黄仁勋：总感觉公司快倒闭了任CEO没有趣味每一秒都有压力

站长商机