首页 > AI头条  > 正文

AI日报:Runway推视频生视频功能;腾讯推AI游戏生成模型 GameGen-O;HeyGen推出Avatar 3.0;OpenAI新模型o1虚有其名?

2024-09-14 14:58 · 来源: AIbase基地

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、Runway推出“Video to Video”功能 精神小伙秒变科幻片主角

Runway最新推出的Video to Video功能彻底改变了视频创作的游戏规则,让任何人都能成为数字魔法师,轻松改变视频风格、背景和氛围。这项创新技术让视频编辑变得简单易行,为用户提供前所未有的精确控制,开启了视频创作的全新可能性。

【AiBase提要:】

✨ 视频创作革命:Video to Video功能让普通用户也能制作惊艳视频效果,降低了高质量视频制作门槛。

🚀 精准控制创意表达:生成的视频准确呈现创作者的想象,无论是动作、表现力还是整体意图。

🎥 创意无限可能:用户可以自由改变背景、场景和物体材料属性,让创意插上翱翔的翅膀。

详情链接:https://top.aibase.com/tool/runwayml

2、腾讯联合多所高校出品!AI游戏生成模型 GameGen-O 轻松生成高质量游戏元素

GameGen-O 是一款由香港和中国的几所大学与腾讯联合研发的 AI 模型,专门用于创建开放世界视频游戏的模拟。这款模型不仅能生成高质量的游戏内容,还模拟了多种游戏引擎的特性,为开发者提供了快速制作原型和测试不同游戏元素的便利工具。

image.png

【AiBase提要:】

🌟 GameGen-O 能生成开放世界视频游戏的各种元素,帮助开发者快速制作原型。

🎮 模型旨在测试游戏概念,增强互动控制能力,而非创建完全可玩的游戏。

🔍 研究团队通过数据集建立和两阶段训练,为游戏开发带来新的可能性。

详情链接:https://gamegen-o.github.io/

3、HeyGen推出Avatar3.0:支持半身动作,AI数字人从此不再“假笑”

HeyGen最新推出的Avatar3.0系统重新定义了AI虚拟形象的可能性,为视频创作带来革命性变革。这次升级将虚拟角色的表现力提升到全新境界,不再局限于简单的口型同步。

视频来自官方,翻译:小互

【AiBase提要:】

🤖 动态脚本理解: 虚拟形象能准确捕捉话语中的微妙差别,传达说话者意图。

😊 精准的面部表情: AI根据对话内容生成恰到好处的表情,与信息内容完美匹配。

🎤 自然的语音变化: 系统精确控制每个单词的语气,使对话听起更自然流畅。

4、字节跳动AI助手豆包旗下“豆包爱学”升级

豆包爱学是字节跳动旗下AI智能助手品牌豆包的教育应用,最近完成全新升级。这款应用旨在成为学习者的智能伙伴和家庭教育的得力助手,为新学期的学习提供支持。

【AiBase提要:】

📚 多项辅助学习功能,包括答疑解惑、作业批改、知识问答、作文辅导和口算练习,满足家庭教育的多样化需求。

💬 特色功能如“名人聊天室”和“沉浸故事馆”,允许用户与AI智能体进行对话,体验诗词名篇的情景互动。

🎨 “互动故事”板块让用户自行设定角色,通过故事化方式探索世界;“图片创作”板块让用户通过语音和文字创作图像,体验艺术创作。

5、大失所望!用户实测OpenAI新模型o1:居然犯各种低级错误,连个字母都算错了

近日,OpenAI推出备受期待的AI模型“o1-preview”,声称能与博士生相媲美。然而,初步测试结果显示该模型在基本任务上表现不佳,频繁出现非法棋步和错误回答简单谜题。尽管OpenAI承认模型仍在发展中,长时间思考未必提高推理能力,许多基础问题仍未解决。

image.png

【AiBase提要:】

🌟 OpenAI新模型“o1-preview”声称在复杂任务上能与博士生相媲美,但实测结果显示基本任务表现不佳。

🤖 用户发现该AI模型频繁出现非法棋步和错误回答简单谜题,表现令人失望。

💬 OpenAI承认模型仍在发展中,长时间思考未必提高推理能力,许多基础问题仍未解决。

6、苹果AI促使iPhone16全系8GB内存

Johny Srouji透露,iPhone16全系标配8GB内存,主要是因为AI功能的加入,这一配置是经过深思熟虑的决定。8GB内存将显著提升性能,包括高端游戏和3A游戏的本地运行。iPhone17系列预计将从12GB内存起步。苹果在软硬件和产品集成方面的优势带来诸多好处,8GB内存配置经过多次测试被确定为最优

【AiBase提要:】

📱 iPhone16全系标配8GB内存,AI功能是关键因素

💡8GB内存提升性能,包括高端游戏和3A游戏的本地运行

🚀 iPhone17系列预计将从12GB内存起步

7、"AI教母"李飞飞创办World Labs,获2.3亿美元融资

李飞飞创办的World Labs成功融资2.3亿美元,估值超过10亿美元,旨在打造前沿AI技术,开发能理解与3D世界互动的AI模型。2025年计划推出首款产品,潜在客户包括游戏公司和电影制片厂,展现强大商业前景。李飞飞的背景使她在计算机视觉和机器学习领域备受尊敬,期待她和团队带来的创新成果对3D AI技术发展产生深远影响。

image.png

【AiBase提要:】

💰 World Labs成功融资2.3亿美元,估值超10亿美元。

🌐 World Labs致力于开发能理解3D世界的AI模型,计划2025年推出首款产品。

🎮 潜在客户包括游戏公司和电影制片厂,展现强大商业前景。

8、如何在纪录片中使用AI?新发布的伦理指南明确创作底线!

最近,随着好莱坞的双重罢工,电影行业对人工智能的应用引起了广泛关注。纪录片制作人在这场变革中面临了许多伦理问题,特别是如何使用生成式 AI,或者说在创作中如何把握 “虚构材料” 的界限。一群纪录片制人联手发布了一套全新的伦理指南,以帮助制作人、电影工作者和各大平台应对这项技术带来的挑战。

【AiBase提要:】

🌟 生成式 AI 的应用引发纪录片制作者的伦理讨论,新的指南应运而生。

📜 该指南强调了重视原始资料、透明性和法律考量等四大原则。

🤖 生成式 AI 有助于保护受访者身份,并为纪录片创作带来新的可能性。

9、图森未来的戏剧性转型:从自动驾驶领军企业到AI动画新贵

图森未来公司经历了一场引人注目的转型,从自动驾驶领域转向AI动画和视频游戏领域。这一转变引发了股东的困惑和争议,涉及资金转移、法律纠纷等问题。公司面临着平衡股东利益、监管要求和业务转型的挑战。

【AiBase提要:】

🔍 公司转型惊人:曾是自动驾驶明星,现进军AI动画和游戏领域。

💰 争议围绕资金转移:公司试图将4.5亿美元转移到中国支持新业务,股东担心资金挪用。

🔄 业务方向转变引发质疑:公司裁员自动驾驶团队,招聘视频游戏和动画人才,股东对新业务方向不满。

10、OpenAI新款AI模型o1被评为 “中等风险” ,竟因这两大特性!

OpenAI最新推出的o1模型被评为“中等风险”,主要因其人类相似的推理能力和劝说力。该模型展示了出人意料的能力,在网络安全测试中表现突出。评估结果显示o1模型在协助专家复制生物威胁方面具有一定优势,但对非专家的影响相对较低。

image.png

【AiBase提要:】

🤖 o1模型具有人类相似的推理能力和劝说力,被评为“中等风险”。

🧬 o1模型能够协助专家复制生物威胁,但对非专家的影响有限,风险相对较低。

🔍 o1-preview模型在网络安全测试中展现出意外的能力,能够绕过挑战直接获取目标信息。

11、国家互联网信息办公室发布《人工智能生成合成内容标识办法(征求意见稿)》

国家互联网信息办公室发布了《人工智能生成合成内容标识办法(征求意见稿)》,旨在规范人工智能生成合成内容标识,保护公民、法人和其他组织的合法权益,维护社会公共利益。该办法根据多项法律法规制定,意见反馈截止时间为2024年10月14日。

微信截图_20240914110802.png

【AiBase提要:】

🔍 《办法》明确人工智能生成合成内容的定义,包括文本、图片、音频、视频等信息,并区分显式标识和隐式标识。

📝 《办法》规定服务提供者应在适当位置添加显式标识,并在文件元数据中添加隐式标识,要求网络信息内容传播平台规范生成合成内容传播。

⚖️ 服务提供者需遵守相关规定,对生成合成内容进行标识,违规将面临处罚。

详情:https://www.chinaz.com/ainews/11779.shtml

  • 相关推荐
  • A日报:Stability AI发布实时重建模型SPAR3D;火山引擎“奇美拉”数字人平台启动封测;京东重磅开源JoyAgent-JDGenie

    AI日报栏目精选了人工智能领域最新动态:1)Stability AI推出0.7秒单图3D重建模型SPAR3D;2)GitHub热门开源AI协作框架CrewAI获3.4万星;3)马斯克发布儿童AI聊天机器人Baby Grok引发安全争议;4)ComfyUI-C opilot工具简化AI工作流创建;5)CNNIC报告显示我国346款生成式AI完成备案;6)提示词管理工具AI Gist上线;7)开源语言学习工具WordPecker支持多语言学习;8)斯坦福推出多工具协作AI Agent OctoTools;9)Ope

  • AI日报:美图发布影像AI Agent RoboNeo;1.8bit量化Kimi K2模型上线;亚马逊推AI代码编辑器 Kiro

    【AI日报】今日AI领域重要动态:1)美图推出RoboNeo,通过自然语言指令实现图片精修、品牌设计等全能影像处理;2)Unsloth AI将Kimi K2模型量化至1.8bit,体积缩减78%保持性能;3)谷歌Gemini嵌入模型登顶MTEB榜单,超越OpenAI;4)亚马逊发布免费AI代码编辑器Kiro,集成Claude模型;5)Claude新增应用工具目录功能提升工作效率;6)MiniMax完成近3亿美元融资,估值超40亿美元;7)UTCP新协议让AI代理直

  • A日报:Kimi开放平台上线Kimi Playground;OpenAI重磅发布ChatGPT Agent;Suno推人声替换功能

    【AI日报】汇总了近期AI领域重要进展:1)月之暗面推出Kimi Playground平台,实现从对话助手到智能助理的转变;2)OpenAI发布ChatGPT Agent,支持自主执行浏览、购物等任务;3)Suno发布v4.5+版本,新增人声替换等音乐创作功能;4)谷歌Veo3视频生成模型上线,支持文本转视频;5)全球首个直播流扩散模型MirageLSD发布,实现实时视频转换;6)VSCode编程助手Traycer提升大型代码库处理效率;7)ART框架支持Python一键训练AI Agent;8)NVIDIA语音识别模型Canary-Qwen-2.5B词错率创新低;9)Mistral AI推出Le Chat挑战ChatGPT;10)百度小度上线首个支持物理交互的MCP Server;11)Lightricks的LTXV模型实现60秒高质量视频生成;12)开源模型LTX-Video13B支持30倍速高清视频生成。

  • ZEGO AI Agent:支持一张图生成数字人

    即构科技推出AI Agent2.4,用户只需上传一张正面照即可生成1080P高清数字人,支持实时互动对话。该技术具备400ms超低延迟、2秒内完成自然交互响应,唇形同步准确,支持文本/音频/语音流驱动。适用于教育、客服等场景,提供API灵活定制,实现低成本批量生成。核心技术融合照片驱动与实时AI交互引擎,在生成效率、拟真度方面显著提升,带来低门槛、高沉浸的数字人互动体验。

  • AI日报:腾讯混元推3D生成大模型Hunyuan3D-PolyGen;钉钉AI表格重磅来袭;阿里推多模态大语言模型HumanOmniV2

    本文介绍了AI领域多项重要进展:1)腾讯推出首个美术3D生成大模型Hunyuan3D-PolyGen,显著提升建模效率;2)阿里发布多模态大模型HumanOmniV2,准确率达69.33%;3)钉钉AI表格实现1小时处理千项任务;4)百度PaddleOCR3.1版本在多语种识别和文档翻译方面升级;5)微软推出Deep Research智能体,自动化研究流程;6)香港理工与OPPO联合开源视频超清框架DLoRAL;7)谷歌开源MCP工具箱简化AI与数据库集成;8)Win11将推出AI动态壁纸功能。这些创新展示了AI在3D生成、多模态理解、办公效率、视觉处理等领域的突破性进展。

  • A日报:Trae 2.0 正式升级 SOLO 模式;通义发布Qwen3新模型;智谱AI重磅推出Zread

    本期AI日报聚焦多项AI领域突破:1)Trae 2.0推出SOLO模式,实现AI全流程自主开发;2)阿里通义发布Qwen3-235B大模型,支持256K文本处理;3)智谱AI推出Zread工具,一键转换GitHub项目为使用手册;4)零一万物发布万智企业大模型平台2.0及定制Agent方案;5)字节跳动推出通用机器人模型GR-3,具备高精度操作能力;6)Pika推出AI视频特效APP,降低创作门槛;7)Dia浏览器将上线AI驱动的"分身鼠标&

  • AI日报:智谱上线PPT生成功能AI Slides;可灵 AI 发布可图2.1模型

    本文介绍了AI日报栏目及近期AI领域多项突破性进展:1)智谱推出免费AI Slides工具,基于GLM模型快速生成高质量PPT;2)可灵AI发布可图2.1模型,支持180多种风格图像生成;3)NVIDIA推出DiffusionRenderer技术,实现视频到可编辑3D场景转换;4)墨刀AI新增30秒生成高保真原型功能;5)Higgsfield推出Soul ID工具,10张照片即可生成虚拟形象;6)谷歌DeepMind开源GenAI Processors工具库;7)谷歌Veo新增图像转视频功能;8)Mistral AI发布专为代码建模的Devstral2507系列模型。这些创新展示了AI在内容生成、3D建模、产品设计等领域的快速发展。

  • 领先OpenAI三个月,百度文库GenFlow领跑通用Agent领域,2.0版本8月上线

    百度文库即将在8月发布GenFlow2.0版本,该版本具备更强大的多模态能力,支持生成多种内容形态,大幅缩短任务交付时间。相比OpenAI同日发布的ChatGPT+Agent,百度文库早在4月就已上线GenFlow1.0,实现全场景覆盖和全链路调度。GenFlow基于MoE架构,在成本、性能和效率上占优,能快速生成PPT、研报等多样化内容,且依托百度14亿专业文档资源,内容质量更可靠。此外,GenFlow还能调用用户个人数据实现个性化定制,并提供内容后期编辑功能,灵活性更高。

  • 刚刚,OpenAI通用智能体ChatGPT Agent正式登场

    ​Agent AI 时代,比我们想象中来得要早一些。 北京时间周五凌晨,OpenAI 突然开启了新产品直播。 本次发布的是全新的 ChatGPT Agent,它实现了通用智能体(Agent)能力的关键升级。

  • AI日报:通义开源AI编程大模型Qwen3-Coder;​360将推智能眼镜和AI录音笔;谷歌发布Gemini 2.5 Flash-Lite 稳定版

    本文介绍了AI领域多项重要进展:1)谷歌发布Gemini 2.5 Flash-Lite稳定版,平衡速度与成本;2)腾讯混元ASR语音大模型接入ima平台;3)阿里开源Qwen3-Coder编程大模型;4)360将推智能眼镜和AI录音笔;5)夸克健康大模型通过医师评测;6)零一万物发布企业级大模型平台;7)Hedra推出低成本AI视频代理;8)Gemini2.5革新图像理解能力;9)Meta推出创新文本处理模型AU-Nets;10)苹果AI团队或寻求第三方合

今日大家都在搜的词: