首页 > 业界 > 关键词  > Runway最新资讯  > 正文

AI日报:Runway推出“Video to Video”功能;腾讯推AI游戏生成模型 GameGen-O;HeyGen推出Avatar 3.0;OpenAI新模型o1虚有其名?

2024-09-14 15:03 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、Runway推出“Video to Video”功能 精神小伙秒变科幻片主角

Runway最新推出的Video to Video功能彻底改变了视频创作的游戏规则,让任何人都能成为数字魔法师,轻松改变视频风格、背景和氛围。这项创新技术让视频编辑变得简单易行,为用户提供前所未有的精确控制,开启了视频创作的全新可能性。

【AiBase提要:】

✨ 视频创作革命:Video to Video功能让普通用户也能制作惊艳视频效果,降低了高质量视频制作门槛。

🚀 精准控制创意表达:生成的视频准确呈现创作者的想象,无论是动作、表现力还是整体意图。

🎥 创意无限可能:用户可以自由改变背景、场景和物体材料属性,让创意插上翱翔的翅膀。

详情链接:https://top.aibase.com/tool/runwayml

2、腾讯联合多所高校出品!AI游戏生成模型 GameGen-O 轻松生成高质量游戏元素

GameGen-O 是一款由香港和中国的几所大学与腾讯联合研发的 AI 模型,专门用于创建开放世界视频游戏的模拟。这款模型不仅能生成高质量的游戏内容,还模拟了多种游戏引擎的特性,为开发者提供了快速制作原型和测试不同游戏元素的便利工具。

image.png

【AiBase提要:】

🌟 GameGen-O 能生成开放世界视频游戏的各种元素,帮助开发者快速制作原型。

🎮 模型旨在测试游戏概念,增强互动控制能力,而非创建完全可玩的游戏。

🔍 研究团队通过数据集建立和两阶段训练,为游戏开发带来新的可能性。

详情链接:https://gamegen-o.github.io/

3、HeyGen推出Avatar3.0:支持半身动作,AI数字人从此不再“假笑”

HeyGen最新推出的Avatar3.0系统重新定义了AI虚拟形象的可能性,为视频创作带来革命性变革。这次升级将虚拟角色的表现力提升到全新境界,不再局限于简单的口型同步。

视频来自官方,翻译:小互

【AiBase提要:】

🤖 动态脚本理解: 虚拟形象能准确捕捉话语中的微妙差别,传达说话者意图。

😊 精准的面部表情: AI根据对话内容生成恰到好处的表情,与信息内容完美匹配。

🎤 自然的语音变化: 系统精确控制每个单词的语气,使对话听起更自然流畅。

4、字节跳动AI助手豆包旗下“豆包爱学”升级

豆包爱学是字节跳动旗下AI智能助手品牌豆包的教育应用,最近完成全新升级。这款应用旨在成为学习者的智能伙伴和家庭教育的得力助手,为新学期的学习提供支持。

【AiBase提要:】

📚 多项辅助学习功能,包括答疑解惑、作业批改、知识问答、作文辅导和口算练习,满足家庭教育的多样化需求。

💬 特色功能如“名人聊天室”和“沉浸故事馆”,允许用户与AI智能体进行对话,体验诗词名篇的情景互动。

🎨 “互动故事”板块让用户自行设定角色,通过故事化方式探索世界;“图片创作”板块让用户通过语音和文字创作图像,体验艺术创作。

5、大失所望!用户实测OpenAI新模型o1:居然犯各种低级错误,连个字母都算错了

近日,OpenAI推出备受期待的AI模型“o1-preview”,声称能与博士生相媲美。然而,初步测试结果显示该模型在基本任务上表现不佳,频繁出现非法棋步和错误回答简单谜题。尽管OpenAI承认模型仍在发展中,长时间思考未必提高推理能力,许多基础问题仍未解决。

image.png

【AiBase提要:】

🌟 OpenAI新模型“o1-preview”声称在复杂任务上能与博士生相媲美,但实测结果显示基本任务表现不佳。

🤖 用户发现该AI模型频繁出现非法棋步和错误回答简单谜题,表现令人失望。

💬 OpenAI承认模型仍在发展中,长时间思考未必提高推理能力,许多基础问题仍未解决。

6、苹果AI促使iPhone16全系8GB内存

Johny Srouji透露,iPhone16全系标配8GB内存,主要是因为AI功能的加入,这一配置是经过深思熟虑的决定。8GB内存将显著提升性能,包括高端游戏和3A游戏的本地运行。iPhone17系列预计将从12GB内存起步。苹果在软硬件和产品集成方面的优势带来诸多好处,8GB内存配置经过多次测试被确定为最优

【AiBase提要:】

📱 iPhone16全系标配8GB内存,AI功能是关键因素

💡8GB内存提升性能,包括高端游戏和3A游戏的本地运行

🚀 iPhone17系列预计将从12GB内存起步

7、"AI教母"李飞飞创办World Labs,获2.3亿美元融资

李飞飞创办的World Labs成功融资2.3亿美元,估值超过10亿美元,旨在打造前沿AI技术,开发能理解与3D世界互动的AI模型。2025年计划推出首款产品,潜在客户包括游戏公司和电影制片厂,展现强大商业前景。李飞飞的背景使她在计算机视觉和机器学习领域备受尊敬,期待她和团队带来的创新成果对3D AI技术发展产生深远影响。

image.png

【AiBase提要:】

💰 World Labs成功融资2.3亿美元,估值超10亿美元。

🌐 World Labs致力于开发能理解3D世界的AI模型,计划2025年推出首款产品。

🎮 潜在客户包括游戏公司和电影制片厂,展现强大商业前景。

8、如何在纪录片中使用AI?新发布的伦理指南明确创作底线!

最近,随着好莱坞的双重罢工,电影行业对人工智能的应用引起了广泛关注。纪录片制作人在这场变革中面临了许多伦理问题,特别是如何使用生成式 AI,或者说在创作中如何把握 “虚构材料” 的界限。一群纪录片制人联手发布了一套全新的伦理指南,以帮助制作人、电影工作者和各大平台应对这项技术带来的挑战。

【AiBase提要:】

🌟 生成式 AI 的应用引发纪录片制作者的伦理讨论,新的指南应运而生。

📜 该指南强调了重视原始资料、透明性和法律考量等四大原则。

🤖 生成式 AI 有助于保护受访者身份,并为纪录片创作带来新的可能性。

9、图森未来的戏剧性转型:从自动驾驶领军企业到AI动画新贵

图森未来公司经历了一场引人注目的转型,从自动驾驶领域转向AI动画和视频游戏领域。这一转变引发了股东的困惑和争议,涉及资金转移、法律纠纷等问题。公司面临着平衡股东利益、监管要求和业务转型的挑战。

【AiBase提要:】

🔍 公司转型惊人:曾是自动驾驶明星,现进军AI动画和游戏领域。

💰 争议围绕资金转移:公司试图将4.5亿美元转移到中国支持新业务,股东担心资金挪用。

🔄 业务方向转变引发质疑:公司裁员自动驾驶团队,招聘视频游戏和动画人才,股东对新业务方向不满。

10、OpenAI新款AI模型o1被评为 “中等风险” ,竟因这两大特性!

OpenAI最新推出的o1模型被评为“中等风险”,主要因其人类相似的推理能力和劝说力。该模型展示了出人意料的能力,在网络安全测试中表现突出。评估结果显示o1模型在协助专家复制生物威胁方面具有一定优势,但对非专家的影响相对较低。

image.png

【AiBase提要:】

🤖 o1模型具有人类相似的推理能力和劝说力,被评为“中等风险”。

🧬 o1模型能够协助专家复制生物威胁,但对非专家的影响有限,风险相对较低。

🔍 o1-preview模型在网络安全测试中展现出意外的能力,能够绕过挑战直接获取目标信息。

11、国家互联网信息办公室发布《人工智能生成合成内容标识办法(征求意见稿)》

国家互联网信息办公室发布了《人工智能生成合成内容标识办法(征求意见稿)》,旨在规范人工智能生成合成内容标识,保护公民、法人和其他组织的合法权益,维护社会公共利益。该办法根据多项法律法规制定,意见反馈截止时间为2024年10月14日。

微信截图_20240914110802.png

【AiBase提要:】

🔍 《办法》明确人工智能生成合成内容的定义,包括文本、图片、音频、视频等信息,并区分显式标识和隐式标识。

📝 《办法》规定服务提供者应在适当位置添加显式标识,并在文件元数据中添加隐式标识,要求网络信息内容传播平台规范生成合成内容传播。

⚖️ 服务提供者需遵守相关规定,对生成合成内容进行标识,违规将面临处罚。

详情:https://www.chinaz.com/ainews/11779.shtml

举报

  • 相关推荐
  • 大家在看
  • iPad mini:功能强大的新款 ,专为 Apple Intelligence 打造

    新款 iPad mini 是一款超便携的设备,搭载了强大的 A17 Pro 芯片和支持 Apple Pencil Pro,提供了出色的性能和多功能性。它配备了8.3英寸Liquid Retina显示屏,拥有全天的电池续航能力,并预装了全新的iPadOS 18系统。这款新设备不仅性能出色,而且设计精美,提供了蓝色、紫色、星光色和深空灰四种颜色选择。iPad mini的起售价为499美元,提供了128GB的存储空间,是上一代产品的两倍,为用户带来了极高的性价比。

  • TANGO Model:共语手势视频重现技术

    TANGO是一个基于层次化音频-运动嵌入和扩散插值的共语手势视频重现技术。它利用先进的人工智能算法,将语音信号转换成相应的手势动作,实现视频中人物手势的自然重现。这项技术在视频制作、虚拟现实、增强现实等领域具有广泛的应用前景,能够提升视频内容的互动性和真实感。TANGO由东京大学和CyberAgent AI Lab联合开发,代表了当前人工智能在手势识别和动作生成领域的前沿水平。

  • gait:AI原生版本控制工具,提升代码协作效率。

    gait是一个AI原生版本控制工具,它通过存储提示、上下文和代码的结合,帮助团队更容易理解和编辑AI生成的代码。gait自动保存AI代码生成对话,并通过版本控制与团队共享开发上下文。它支持GitHub Copilot和Cursor,并且提供了包括AI Blame、Codegen Analytics和Team Collaboration在内的多种功能。gait旨在通过AI技术提高开发人员的生产力,同时确保代码的版权和知识产权得到保护。

  • Code2.AI:将你的想法快速转化为代码

    Code2.AI是一个创新的在线平台,它通过人工智能技术帮助开发者将想法快速转化为代码。该平台通过压缩代码库,使AI能够理解并与开发者一同编程。Code2.AI的主要优点包括加速开发进程、无限制的编码能力以及与现有项目的无缝集成。它支持任何编程语言,无论是Web还是移动开发,都能提供完整的函数代码,而不仅仅是代码片段。此外,Code2.AI还提供了详细的使用指南,帮助用户更有效地利用AI进行编程。

  • Parseflow:智能文档处理解决方案

    Parseflow是一个数据自动化平台,专注于通过先进的OCR和AI技术实现文档数据的自动提取和结构化。它能够显著降低操作成本,提高工作效率,适用于从发票、合同到电子邮件和简历等多种文档类型。该平台易于集成,支持60多种语言,并提供安全的数据存储。Parseflow的主要优点包括快速的数据提取、广泛的文档类型支持、多语言识别能力以及与6000多个应用的集成能力。它的目标是帮助企业释放数据的潜力,提高运营效率。

  • Dovetail 3.0:AI驱动的客户洞察中心,助力产品决策

    Dovetail 3.0是一个AI驱动的客户洞察平台,它通过自动化分析、渠道监控、即时问答和招募研究参与者等功能,帮助企业快速获取客户反馈并将其转化为产品决策。该产品利用最新的大型语言模型,自动对用户反馈、支持工单、应用评论等进行主题分类,同时提供定制化的视图,帮助企业洞察客户需求,优化产品方向。Dovetail 3.0的界面经过重新设计,更直观易用,适合各类用户。

  • FunASR:功能强大的语音离线文件转写服务

    FunASR是一款语音离线文件转写服务软件包,集成了语音端点检测、语音识别、标点等模型,能够将长音频与视频转换成带标点的文字,并支持多路请求同时转写。它支持ITN与用户自定义热词,服务端集成有ffmpeg,支持多种音视频格式输入,并提供多种编程语言客户端,适用于需要高效、准确语音转写服务的企业和开发者。

  • Perplexity for Mac:通过AI搜索和发现知识

    Perplexity是一个基于人工智能的搜索和发现工具,旨在为用户提供可信、最新的答案。它通过AI引导的搜索、语音或文本提问、深入的线索跟进、内置的信任体系(引用来源)以及个人知识库等功能,帮助用户快速获取所需的信息。这款应用适合那些追求高效获取准确信息的用户,无论是学生、研究人员还是普通知识探索者。Perplexity目前可以免费下载,并且提供内购选项。

  • Strella:AI驱动的客户研究工具,快速获取深入洞察

    Strella是一个利用人工智能技术进行客户研究的平台,它通过AI主持的访谈和即时综合分析,帮助企业和研究人员快速做出更明智的决策。该产品的主要优点包括快速研究、高响应率、实时分析、多语言支持等,它能够显著提高研究效率,降低成本,并提供灵活的访谈安排。Strella的背景信息显示,它已经为多个行业提供了客户研究服务,并且得到了积极的市场反馈。产品的价格和定位信息未在页面上明确提供,但提供了试用和演示的选项。

  • Zupport AI:为SaaS公司提供客户支持的AI解决方案

    Zupport AI是一个专为SaaS公司设计的客户支持平台,它利用人工智能技术帮助解决客户支持中的重复问题,通过意图检测提供上下文感知的回复,同时支持在应用内收集功能请求,以及与Slack同步,以提升客户支持效率和客户满意度。该产品背景信息表明,它旨在帮助SaaS公司应对产品发展过程中客户支持的挑战,通过自动化和智能化手段提高支持团队的工作效率和响应速度。

  • Project Concept:AI驱动的创意概念化和情绪板工具

    Project Concept 是 Adobe 推出的一款基于 AI 的创意概念化和情绪板工具,旨在帮助创意专业人士在项目初期快速探索和迭代创意概念。它利用 Adobe 的 Firefly 生成式 AI 模型,允许用户混合图像、变换资产区域、混合风格和背景等。该产品支持多人协作,并与 Adobe Creative Cloud 集成,使得与 Photoshop、Illustrator 或 Adobe Express 的工作流程无缝衔接。Project Concept 还通过 Content Credentials 技术尊重艺术家的工作,确保图像来源的透明度和 AI 使用的合规性。

  • eSearch:一款多功能的屏幕搜索和截屏软件。

    eSearch 是一款基于Electron开发的跨平台屏幕搜索和截屏软件,支持Linux、Windows和Mac系统。它集成了截屏、OCR文字识别、搜索、翻译、贴图、屏幕翻译、以图搜图、滚动截屏和录屏等功能。eSearch旨在提供一种方便快捷的方式来获取屏幕上的信息,并通过OCR技术将图片中的文字转换为可编辑的文本,支持多语言识别和翻译,极大地提高了工作效率。

  • RealAnime:基于Stable Diffusion的LoRA模型,生成逼真动漫风格图像

    RealAnime - Detailed V1 是一个基于Stable Diffusion的LoRA模型,专门用于生成逼真的动漫风格图像。该模型通过深度学习技术,能够理解并生成高质量的动漫人物图像,满足动漫爱好者和专业插画师的需求。它的重要性在于能够大幅度提高动漫风格图像的生成效率和质量,为动漫产业提供强大的技术支持。目前,该模型在Tensor.Art平台上提供,用户可以通过在线方式使用,无需下载安装,方便快捷。价格方面,用户可以通过购买Buffet计划来解锁下载权益,享受更灵活的使用方式。

  • VirtualWife:一个支持B站直播的虚拟数字人项目

    VirtualWife是一个虚拟数字人项目,旨在打造一个拥有自己“灵魂”的虚拟伴侣。该项目支持B站直播,并且兼容openai、ollama等大语言模型。VirtualWife不仅能够提供情感陪伴,还能作为恋爱导师和心理咨询师,满足人类的情感需求。项目处于孵化阶段,作者投入了大量的业余时间进行开发,希望用户能够通过点star来支持项目的发展。

  • Follow:下一代信息浏览器,动态内容支持,AI赋能

    Follow是一个创新的信息浏览器,它支持动态内容,包括文章、视频、图片、音频和通知。它允许用户订阅各种Web源,并利用AI技术提供翻译、摘要、个性化推荐等功能,提高信息获取的效率和质量。此外,它还引入了$POWER所有权经济,允许用户通过$POWER即时打赏创作者,支持他们喜爱的内容。Follow不仅仅是一个应用程序,它是一个社区,代表着开放和社区驱动体验的新时代。

  • FacePoke:AI革新您的面部表情

    FacePoke是一款人工智能驱动的实时头部和面部变换工具,它允许用户通过直观的拖放界面操纵面部特征,为肖像注入生命力,实现逼真的动画和表情。FacePoke利用先进的AI技术,确保所有编辑都保持自然和逼真的外观,同时自动调整周围的面部区域,保持图像的整体完整性。这款工具以其用户友好的界面、实时编辑功能和先进的AI驱动调整而脱颖而出,适合各种技能水平的用户,无论是专业内容创作者还是初学者。

  • Math.now:在线免费的AI数学求解器,由Math GPT提供支持

    Math.now是一个基于AI技术的在线数学求解平台,旨在为学生、教师和自学者提供实时的数学问题解答服务。该平台利用先进的AI技术,如OCR和GPT-4o,可以识别和解决各种数学问题,包括代数、几何和微积分等。Math.now的主要优点包括即时分步解答、互动式学习体验、个性化学习支持以及完全免费使用。产品背景信息显示,Math.now由Math GPT驱动,致力于让数学学习变得更有趣和轻松。

  • ToMusic:在线将歌词转换成歌曲的AI音乐生成器

    ToMusic是一个创新的在线平台,利用先进的AI技术将文本内容转换成音乐。它提供了一个简单易用的界面,用户可以上传歌词或文本,系统会自动分析并生成与之相匹配的音乐作品。这种技术的出现极大地降低了音乐创作的门槛,使得非专业人士也能轻松创作出个性化的音乐。ToMusic的主要优点包括操作简便、生成速度快、音乐风格多样,并且支持多种语言,适合全球用户使用。此外,ToMusic还提供了多种定价计划,满足不同用户的需求,从免费试用到专业版,用户可以根据自己的创作需求选择合适的服务。

  • ReplyWorker:AI驱动的在线对话产品提及工具

    ReplyWorker是一个利用人工智能技术在在线对话中自然提及产品的工具。它通过监测社交媒体平台上的关键词,自动找到适合提及用户产品的对话,并生成建议的回复。这种自动化的方式可以节省用户在社交媒体上寻找潜在客户的时间,提高营销效率。产品的主要优点包括节省时间、提高效率、自然融入对话、24/7不间断工作。价格方面,ReplyWorker提供不同级别的订阅服务,包括免费、专业版和企业版,以满足不同用户的需求。

  • Vmotionize:AI动画生成平台

    Vmotionize是一个领先的AI动画和3D动画软件,它能够将视频、音乐、文本、图片等内容转换成令人惊叹的3D动画。该平台通过先进的AI动画和动作捕捉工具,使得高质量的3D内容和动态图形更加易于获取。Vmotionize通过创新的方式为独立创作者和全球品牌提供了一个全新的平台,让他们可以共同通过人工智能和人类想象力来实现创意、分享故事和构建虚拟世界。

今日大家都在搜的词:

热文

  • 3 天
  • 7天