首页 > 业界 > 关键词  > Runway最新资讯  > 正文

AI日报:Runway Gen 3可生成3D巨幅字幕效果;Google Vids 上线测试;百度网盘推宝宝AI长相预测;Luma AI推首尾帧视频生成

2024-07-01 14:46 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://top.aibase.com/

1、炸裂!Runway Gen 3可以生成电影片头3D巨幅字幕效果了

Runway最新推出的Gen-3Alpha视频生成模型在保真度、一致性和动作表现方面有重大改进,不仅生成稳定光影,还展现强大想象力。内测博主展示了3D巨幅字幕效果,Gen3即将对所有人开放使用。模型精细控制运动,审美强大,想象力丰富,符合物理规律,生成速度快。

【AiBase提要:】

⚙️ Runway Gen3 可模仿漫威电影片头效果制作3D巨幅字幕效果

💡 极度稳定的光影效果,保持高质量输出,即使在高速移动场景中

🎥 控制模式包括 Motion Brush、高级摄像头控制、导演模式,生成速度快,审美强大

详情链接:https://top.aibase.com/tool/gen-3-alpha

2、百度网盘一刻相册App推出宝宝AI长相预测功能

百度网盘一刻相册App推出了AI长相预测功能,用户上传照片即可预测宝宝未来样子,训练数据贴合中国宝宝特征,操作简单快速。未来将开发更多实用AI功能,征集用户意见。

image.png

【AiBase提要:】

👶 预测宝宝未来样子,训练数据贴合中国宝宝特征,操作简单快速。

📸 上传照片即可得到高清预测图像,提供多种时尚滤镜效果供选择。

🔮 未来将开发更多实用AI功能,如预测孩子不同成长阶段的样子,征集用户意见。

3、谷歌推出AI视频编辑应用Google Vids 上线测试

谷歌最新推出的AI视频编辑应用Google Vids在测试中展现出强大的功能和用户友好的特点,为用户提供了高效、便捷的视频编辑工具。该应用集成Gemini大模型,帮助用户轻松创建视频内容,降低了视频制作门槛,未来有望成为视频创作者的得力助手。

【AiBase提要:】

✨ Google Vids集成Gemini大模型,可帮助用户创建幻灯片、编写视频脚本,并制作分镜头脚本。

🎥 用户通过添加或删除元素来编辑视频,最终导出为MP4文件,入口位于Google Docs文档处理工具中。

🚀 Google Vids的上线测试丰富了Google Workspace套件,展示强大的AI技术能力,为用户提供便捷的视频编辑工具。

4、Luma AI新功能:首尾帧生成视频与向后延长5秒

Luma AI推出了新功能,让视频创作充满无限可能,虽然偶尔会有硬切换画面,但这正是剪辑的魅力所在,让每一秒充满惊喜和创意。未来的视频生成将基于这种延长操作完成,实现智能个性化的视频创作。

【AiBase提要:】

✨ 视频延长魔法:首尾帧生成视频能力,向后延长5秒,让每一帧充满无限可能

💡 创新视频功能“Extend”:智能分析视频内容,保持原有风格和对象一致性的基础上延长视频长度

🌟 Dream Machine模型发布:支持文本和图片输入,生成高质量视频,模拟现实物理特性,免费开放体验

详情链接:https://top.aibase.com/tool/dream-machine

5、全新Solos AirGo Vision智能眼镜发布

Solos公司在香港智能眼镜峰会上发布了全新的Solos AirGo Vision智能眼镜,集成了ChatGPT-4o的可穿戴AI大脑,让用户的双眼瞬间升级为超能力。这款智能眼镜不仅支持实时问答和视觉提示,还具备多语言翻译功能,模块化设计,售价为249美元。

【AiBase提要:】

⭐ 集成 ChatGPT-4o 的多模态 AI 功能,支持实时问答和视觉提示

⭐ 支持超过10种语言的实时翻译,轻松打破语言障碍

⭐ 模块化设计,可替换不同样式的传统框架,售价为249美元

6、商汤如影AI视频生成平台推出央视记者王冰冰AI数字人

商汤科技的AI数字人“AI冰冰”在《2024中国・AI 盛典》中首次亮相,展现了出色的多语言能力和逼真的视觉效果。数字人技术在传媒行业具有巨大潜力,能够拉近人物IP与受众之间的距离。

【AiBase提要:】

✨ 商汤科技创造的AI数字人“AI冰冰”在舞台上展现出专业且自然的表现,得益于SenseNova大模型技术。

🌐 如影平台的AI视频生成技术实现了高清复制和自然的表情、嘴型、动作效果,展示出卓越的语言能力。

🔥 商汤如影提供强大的核心技术支持,使AI冰冰能够展现逼真的视觉效果和流畅的多语种表达能力。

7、知乎宣布推出独立AI搜索平台「知乎直答」

知乎最近推出了全新AI产品「知乎直答」,旨在提升问答效率和质量,缩短用户与优质回答之间的距离,增强社区创作者内容的流通。这一举措预示着问答社区将进入更智能和个性化的新时代。

QQ截图20240701090057.png

【AiBase提要:】

🚀 知乎直答是基于知乎丰富问答数据开发的AI产品,提供简略和深入两种答案生成方式,支持用户快速找到所需内容或专家。

💡 产品定位为生产力工具和发现世界的连接器,帮助用户通过提问来探索世界的能力。

🔮 未来计划推出App版本,引入多模态能力,与知乎社区深度融合,探索对外合作,为整个问答领域带来新的发展方向。

详情链接:https://zhida.zhihu.com/

8、WhatsApp最新Android测试版2.24.14.7推出选择Meta AI Llama模型功能

WhatsApp最新测试版引入了选择Meta AI Llama模型的功能,用户可以根据需求自定义AI交互体验,体验更快速简单的回应或处理更复杂的查询。该功能展示了WhatsApp在AI领域持续创新的决心。

【AiBase提要:】

🔍 WhatsApp最新Android测试版2.24.14.7通过Google Play Beta计划推出选择Meta AI Llama模型功能。

🧠 用户可以选择默认的Llama3-70B模型获得更快速简单的回应,或选择高级的Llama3-405B模型处理更复杂的查询。

📈 WhatsApp计划提供更先进的Llama3-405B模型预览版,每周有使用次数限制,达到限制后用户将回到默认模型继续对话。

9、苹果可能在今年秋季宣布与谷歌 Gemini 的交易

苹果计划在今年秋季推出与谷歌 Gemini 的整合交易以及测试版的 Apple Intelligence,将人工智能作为直接盈利途径。第三方AI服务可能成为苹果的过渡选择,同时苹果将逐步推出自己的生成式AI系统。

【AiBase提要:】

🍎 苹果计划整合谷歌 Gemini 到设备中,推出测试版的 Apple Intelligence。

💡 苹果将人工智能作为直接盈利途径,不仅仅是推动硬件销售的功能。

🤖 第三方AI服务可能成为苹果的过渡选择,同时苹果将逐步推出自己的生成式AI系统。

10、GPTPdf:使用类似GPT-4o的多模态LLM分析PDF文件

近日,一款名为gptpdf的开源项目在github赞火,使用了类似 GPT-4o 的 VLLM 模型解析 PDF 文件并转换为 Markdown 格式。该项目代码简洁高效,只有293行,却能完美解析排版、数学公式、表格、图片、图表等各种内容。费用每页平均成本为0.013美元。

image.png

【AiBase提要:】

🔍 使用类似 GPT-4o 多模态模型解析 PDF 文件,转换为 Markdown 格式。

💻 代码简洁高效,仅293行。

🌟 解析结果几乎完美包括排版、数学公式、表格、图片、图表等内容。

详情链接:https://top.aibase.com/tool/gptpdf

11、AI音频魔法师Resona V2A 可自动为视频配音效

在AI技术大行其道的时代,Resona V2A技术横空出世,像一位神奇的魔术师,让视频自动开口,唱出属于自己的旋律。这不仅是技术突破,更是创意者的福音。Resona V2A一键生成音频,快速高效,创意者得力助手。高性价比,成本降低99%,提供高质量音频解决方案。

【AiBase提要:】

🔮 视频自动开口,唱出属于自己的旋律,技术突破与创意者福音。

⚙️ 一键生成音频,快速高效,加快音频生成速度,创意者投入更多时间和精力到视频创意设计。

💰 成本降低99%,高性价比的音频解决方案,满足不同用户需求。

详情链接:https://top.aibase.com/tool/resona-v2a

12、AI换装黑科技 MMTryon虚拟试穿框架可按需搭配一键叠穿

中山大学和字节智创数字人团队联合推出的MMTryon虚拟试穿框架颠覆了传统换装方式,实现一键生成模特试穿效果,质量高且操作简便。其服装编码器和多模态多参考注意机制让换装更精确灵活,打破了传统算法束缚,获得新SOTA。MMTryon不仅可试穿单件服装,还支持组合换装,无需分割,通过文本指令即可实现高质量虚拟换装。

image.png

【AiBase提要:】

👗 一键生成模特试穿效果,质量高且操作简便

🔥 打破传统算法束缚,获得新SOTA,支持组合换装

💡 利用服装编码器和多模态多参考注意机制,换装更精确灵活

详情链接:https://arxiv.org/abs/2405.00448

举报

  • 相关推荐
  • 从“手动挡”进入“AI智能挡”:亚数TrustAsia 开启证书管理「服务化」CaaS 新时代

    随着TLS/SSL证书有效期缩短至47天,企业面临信任中断风险加剧、内部系统协同困难及预警监测缺失三大挑战。亚数TrustAsia推出新一代智能证书管理体系TrustAsia CaaS,通过自动化流程实现证书全生命周期管理,提供六大核心能力:资产发现与管理、多CA自动化签发、自动化分发部署、实时监测告警、无缝集成定制及全流程自动化,有效应对加密敏捷性需求,助力企业构建安全可信�

  • OpenAI的开源模型现已在IBM watsonx.ai上提供

    OpenAI发布两款开源AI模型GPT-OSS-120B和GPT-OSS-20B,允许开发者自由下载、运行和定制。其中120B模型已部署在IBM Watsonx.ai平台,采用专家混合架构,支持本地或云端部署,不受商业用途限制。模型具备高透明度,输出完整推理链,在多项基准测试中表现优异。此次发布标志着OpenAI首次加入开源生态,IBM强调其开放战略,为企业提供灵活、安全的AI开发选择。

  • 从瑞幸×浪浪山到喜茶×Chiikawa,萌系联名如何破圈?

    最近,社交平台再次被一波萌系联名刷屏了。 瑞幸推出的《浪浪山小妖怪》主题杯迅速成为职场人士新宠,杯身上“诸邪退散”的字样精准击中打工人的共鸣点;喜茶与Chiikawa的联名产品首日发售,全国多家门店排起长龙,粉丝们纷纷在社交平台晒出集齐全套周边的照片…… 这些现象不禁让人好奇,为什么萌系联名总能一次次引爆市场?本期跟随「克劳锐」的视角一起看看吧~

  • 2025WAIC 聚焦:扫描全能王“无限扫描”技术破解文保数字化难题

    2025世界人工智能大会上,合众信息旗下扫描全能王展示了"无限扫描"技术,为文物数字化带来突破。该技术成功应用于南京博物院镇馆之宝《坤舆万国全图》的数字化,这幅1608年的地图是国内现存最早、最完整的中文世界地图。通过AI技术,解决了大尺寸文物拍摄不全、拼接困难、图像畸变等难题,只需简单拍摄视频即可生成高清数字图像。AI还能智能识别地图元素,实现"让文物说话"的数字化体验。该技术也适用于工程设计图纸等大尺寸文档的数字化保存,突破物理条件限制,为文化传承开启新篇章。(140字)

  • 生活小妙招:戴三星Galaxy Watch8系列即可轻松保持健康

    三星Galaxy Watch8系列智能手表通过9大健康技巧帮助用户轻松实现"网红同款"健康生活:1)规律作息时间;2)优化睡眠环境;3)每日正念练习;4)个性化健康目标设定;5)坚持规律运动;6)训练后充分恢复;7)多样化蔬果摄入;8)控制酒精与夜宵;9)保持充足水分。手表配备睡眠指导、生物电阻抗分析、抗氧化指数检测等功能,可提供个性化健康建议,实时追踪身体指标,并通过SmartThings设备优化生活环境,让健康管理触手可及。

  • 化被动为主动 戴三星Galaxy Watch轻松养成健康生活习惯

    在健康信息碎片化的当下,良好生活习惯与长期健康管理正被越来越多人所重视。为了引导更多用户主动选择健康的生活方式,新款智能手表三星Galaxy Watch8系列【1】焕新而来。其搭载多项创新传感器技术,可以提供全方位数据概览与清晰且可操作的健康洞察,帮助用户更深入了解个人身心状态,养成健康生活习惯,并能够及早识别潜在的健康威胁。▲三星Galaxy Watch8系列的抗�

  • 苹果iOS 26开发者预览版Beta 7发布:美版Apple Watch血氧回归

    今天凌晨,苹果发布了iOS 26开发者预览版Beta 7,虽然已经处于测试后期,但依然加入了新功能。 首先是美版Apple Watch的血氧检测功能回归,这与上周的iOS 18.6.1正式版同步,为美国Apple Watch Series 9、Series 10和Apple Watch Ultra 2用户提供了新的血氧体验。 从2024年1月18日开始,因美国国际贸易委员会(ITC)认定苹果部分Apple Watch血氧传感器专利侵权,所有在美国销售的Apple Watch Series 9�

  • 苹果iOS 18.6.1正式版发布:美版Apple Watch血氧功能上线

    今日,苹果公司如期向iPhone用户推送了iOS18.6.1正式版更新,距离上一次正式版发布仅过去16天。尽管此次更新并未给国行用户带来功能上的显著变化,但它却为美版Apple Watch用户带来了一个期待已久的好消息——血氧检测功能的回归。 据更新日志详细说明,此次iOS18.6.1更新特别针对美国市场的Apple Watch Series9、Series10以及Apple Watch Ultra2用户,重新启用了血氧检测功能。用户现在�

  • 首款鸿蒙AI智能手表!华为WATCH 5新款上市 2699元起

    华为WATCH 5新款上市,包括46mm星河蓝、42mm极光绿两款,售价分别为2999元和2699元。 一同上市的还有两款氟橡胶表带,静谧蓝和栖霞粉,售价均为199元。 以上四款产品均将于8月22日上午10:08正式开售。 华为WATCH 5于今年6月11日发布,搭载鸿蒙5系统,也是首款鸿蒙AI智能手表!

  • AI日报:腾讯推音效生成工具AudioGenie;阿里推智能体WebWatcher;我国首个法律垂直大模型“小包公”发布

    本文介绍了AI领域最新动态:1)腾讯推出电影级音频生成工具AudioGenie,展现中国AI技术实力;2)阿里开源多模态智能体WebWatcher,突破现有系统局限;3)港大等高校联合推出3D建模技术OmniPart,实现模型组件独立性和清晰度;4)Meta发布无需标注数据的通用图像处理模型DINOv3;5)国内首个法律大模型"小包公"发布;6)ChatGPT移动端收入突破20亿美元;7)安卓厂商借鉴灵动岛设计,新芯片推动AI功能普及;8)欧洲AI公司推出仅94MB的超小模型;9)Claude Code新增编程教学模式;10)AI技术被滥用于电商恶意退款;11)IDC报告显示2024年中国AI公有云服务市场将快速增长。

今日大家都在搜的词: