首页 > 业界 > 关键词  > Remini最新资讯  > 正文

AI日报:Remini“黏土AI”攻占小红书;HeyGen推自动剪辑工具;多图漫画工具StoryDiffusion来了;AI音乐Udio可生成15分钟音频

2024-05-06 15:00 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://top.aibase.com/

1、这个五一假期,小红书被Remini“黏土AI”攻占了

在五一假期里,小红书平台上出现了一种新的流行趋势——“黏土AI”滤镜,迅速占领了小红书的首页,成为用户们热议的焦点。Remini的AI黏土滤镜功能在全球范围内掀起了新一轮的热潮,展示了AI技术在图像处理领域的应用潜力。

image.png

【AiBase提要:】

📸 小红书被“黏土AI”攻占,独特的黏土风格照片走红

🔥 Remini的AI黏土滤镜功能受欢迎,用户只需上传图片即可得到黏土风格照片

🚀 Remini的成功证明了图像处理AI产品在满足用户生活和娱乐需求方面的巨大潜力

详情链接:https://top.aibase.com/tool/remini-app

2、HeyGen推自动剪辑工具Instant Highlights 1.0

HeyGen公司最近推出了Instant Highlights 1.0自动视频剪辑工具,为用户提供便捷的视频编辑体验。该工具具有多语言配音功能,简化了视频内容的多平台适配工作,提高了内容传播效率。另外,HeyGen还发布了Avatar in Motion 1.0技术,实现了虚拟角色的动作捕捉和声音克隆,拓宽了虚拟角色在多个领域的应用潜力。这两项新技术展示了HeyGen在AI领域的实力和创新精神。

image.png

【AiBase提要:】

✨ 多语言配音功能,简化视频多平台适配工作,提高内容传播效率。

🌟 Avatar in Motion 1.0技术实现虚拟角色动作捕捉和声音克隆,拓宽了应用潜力。

💡 HeyGen在AI领域展示深厚实力和创新精神,为用户带来丰富个性化体验。

详情链接:https://top.aibase.com/tool/heygen

3、StoryDiffusion:保持角色一致,可生成多图漫画和长视频

南开大学 HVision 团队开发的StoryDiffusion工具能够创造神奇故事,保持角色一致,生成多图漫画和长视频。通过实现Consistent self-attention和Motion predictor,生成连贯的图像和视频,可用于漫画生成、图像转视频等多种场景。

image.png

【AiBase提要:】

🔮 Consistent self-attention 实现角色连贯图像生成

🎥 Motion predictor 实现长视频生成

🎨 支持漫画生成、图像转视频、长短视频等多种内容生成功能

详情链接:https://top.aibase.com/tool/storydiffusion

4、AI音乐工具 Udio更新 可制作长达 15 分钟音乐

我对Udio最新更新的功能感到非常兴奋。这些更新提供了更长、更连贯的音乐创作体验,为音乐制作者带来更多创作自由和可能性。

image.png

【AiBase提要:】

✨ 上下文窗口扩展,考虑前后两分钟内容,提升音乐作品连贯性

🎵 支持长达15分钟音轨制作,满足音乐创作时长需求

🌳 引入创新音轨历史组织方式,让用户清晰追溯音轨版本发展历程

详情链接:https://top.aibase.com/tool/udio

5、Adobe推3D图标工具 Project Neo 可快速2D转3D

Adobe公司最新推出的Project Neo是一项革命性的3D技术,通过整合3D元素和效果,提升传统2D图形设计的视觉效果和制作效率。该工具快速高效的插图制作功能,用户可以轻松创建独特的3D形状,极大提高工作效率。Project Neo具备强大的风格化和造型功能,增强的颜色控制功能让用户能够精细调整中间色和阴影,为设计作品增加深度和几何感。

image.png

【AiBase提要:】

✨ 3D技术革命,提升2D设计效率

🎨 快速插图制作,轻松创建独特形状

🖌️ 强大风格化功能,精细调整颜色和阴影

详情链接:https://top.aibase.com/tool/project-neo

6、苹果 AI 计划曝光:更智能的 Siri 即将到来

苹果正致力于改进 Siri,采用更小更高效的模型,并计划在未来使 Siri 无需唤醒词即可智能回应。苹果 AI 在健康、图像编辑、Memojis 等领域展现出多种潜力应用,公司的 AI 战略逐渐清晰。

image.png

【AiBase提要:】

⭐ 苹果致力于改进 Siri,采用更小更高效的模型。

⭐ Siri 的未来或许无需唤醒词即可智能回应。

⭐ 苹果 AI 在健康、图像编辑、Memojis 等领域展现出多种潜力应用。

7、VILA:能理解视频的多模态模型,支持笔记本部署

VILA是英伟达发布的视觉语言模型,具备视频理解和多图像理解功能。最新版本VILA-1.5支持多种模型规模选择,通过TinyChat和TensorRT-LLM后端在各类NVIDIA GPU上高效部署。

image.png

【AiBase提要:】

💡 VILA是在大规模交织图像文本数据预训练的视觉语言模型

💡 VILA-1.5发布,具备视频理解功能,支持多种模型规模选择

💡 VILA通过TinyChat和TensorRT-LLM后端在各类NVIDIA GPU上高效部署

详情链接:https://top.aibase.com/tool/vila

8、英伟达ChatRTX引入多种新功能

英伟达的ChatRTX最新更新引入了多种新功能,包括支持更多大型语言模型、对比语言图像预训练、Whisper语音识别系统等,显著增强了聊天机器人应用的能力。更新体现了英伟达在AI和RTX加速技术领域的持续创新,为用户带来更智能和互动的体验。

image.png

【AiBase提要:】

✨ ChatRTX支持更多大型语言模型,包括Google的Gemma和中英双语的ChatGLM3,扩展了语言处理能力。

🔍 ChatRTX支持OpenAI的对比语言图像预训练(CLIP),使用户能通过文字与本地设备上的照片和图像进行交互。

🎙 ChatRTX支持Whisper语音识别系统,用户可以通过语音与ChatRTX进行交互,提升用户体验。

详情链接:https://blogs.nvidia.com/blog/ai-decoded-chatrtx-update/

9、Brilliant Labs推出Frame:一款集成AI的开源AR眼镜

Brilliant Labs最近发布了一款名为Frame的开源AR眼镜,结合了人工智能(AI)和增强现实(AR)技术,为用户带来前所未有的交互体验。Frame眼镜具备强大的视觉能力,实时采集和分析用户所见的图像数据,通过先进的AI模型提供详细问题解答,增强用户对周围环境的理解和互动。支持多模态交互,实时翻译功能,结合云端Noa AI助手实现更强大的AR功能。

image.png

【AiBase提要:】

👓 Frame眼镜结合AI和AR技术,提供前所未有的交互体验。

🔍 Frame具备强大的视觉能力,实时分析用户所见图像数据。

🗣️ 支持多模态交互,实时翻译功能,结合云端Noa AI助手实现更强大的AR功能。

详情链接:https://brilliant.xyz/

10、Rabbit R1被持续扒皮:AI风口一夜转型,NFT充值用户欲哭无泪,动作大模型也是套壳的

本文揭露了Rabbit公司在AI风口下的转型之路,以及其NFT充值用户遭遇的困境。文章指出公司曾推出的大动作模型LAM依赖OpenAI接口,却被质疑套壳安卓。同时,公司从元宇宙转型为AI终端,引发了用户的质疑和关注。

【AiBase提要:】

🔍 Rabbit公司在AI风口下一夜转型,NFT充值用户面临困境。

💥 公司依赖OpenAI接口的大动作模型LAM遭质疑套壳安卓。

🔄 公司从元宇宙转型为AI终端,引发用户质疑和关注。

详情链接:https://twitter.com/EmilyLShepherd/status/1786037498507853852

举报

  • 相关推荐
  • 新Siri或明年春季发布 苹果公司或引入谷歌Gemini大模型 AI技术

    苹果因自研大模型项目遇瓶颈,决定引入谷歌Gemini大模型升级Siri,计划每年支付约10亿美元获取定制化Gemini 2.5 Pro使用权。该模型拥有1.2万亿参数,将全面负责Siri的信息摘要、任务规划及复杂指令执行等核心功能,支持多模态交互和超长文本处理。升级版Siri预计2026年春季随iOS 26.4推送,后续将在WWDC大会展示进一步整合。苹果选择谷歌主要因成本优势、长期合作基础及Gemini领先性能。

  • MiniMax让AI语音有了新基建

    熟悉MiniMax的人都了解这家公司的调性——不鸣则已,一鸣惊人。 要么选择低调,要么发动技术连招,其发展路径呈现出鲜明的“技术深潜”与“节点式爆发“的双重特征。 十月的最后一周,再次进入MiniMax式技术迭代新周期。MiniMax模型“全家桶”全面向Agent方向进化,基础文本模型M1升级至M2,“专为Agent和代码而生”;视频模型升级至Hailuo2.3,Hailuo Video Agent迭代为“全模态全�

  • 今年双11,为什么买百吋电视更推荐RGB-Mini LED?

    今年双11,百吋电视因用户消费升级与居住改善需求增长显著。京东数据显示其销量同比增长200%,反映用户不再满足“够用”尺寸,而是追求影院级沉浸体验。百吋电视受追捧源于超高清内容普及与技术门槛降低,但需注意大屏对显示技术要求更高。RGB-Mini LED技术通过红绿蓝三原色独立背光实现精准控光,解决传统电视色彩与亮度矛盾,如海信UX等产品以高色域、分区控光提升画质。选购时需关注画质芯片与屏幕抗反射能力,确保色彩真实与观看舒适。尺寸是基础,画质才是灵魂。

  • iPad mini 8外观巨变:去掉扬声器开孔

    iPad mini 8将采用全新设计,去掉扬声器开孔并提升防水性能,同时苹果也在为iPad mini 8研发一套新的扬声器系统。 据悉,iPad mini 8可能采用屏幕激励器方案,通过驱动屏幕振动来发出声音,其原理是将振动机械能直接传输到屏幕,然后让屏幕代替传统扬声器振膜发声。 具体来说,它是通过在机身内部的微驱动单元(激励器)来激励中框 ,从而带动屏幕振动发声。

  • 中国顶级画质+法国顶奢音效!海信RGB-Mini LED电视UX在巴黎歌剧院秀出影音王炸组合

    近日,海信与法国高端音响品牌帝瓦雷在巴黎歌剧院联合举办跨界盛典,推出全球首款RGB-Mini LED电视116UX,搭载双方定制的“双剧场级音响”系统,内置6.2.2声道HiFi音响与20个发声单元,实现360°环绕声场。通过精准声学调校,还原交响乐与人声细节,营造“余音绕梁”的沉浸体验。双方还成立联合实验室,推动帝瓦雷专利算法首次应用于电视。多款旗舰产品同步搭载合作音频系统,为家庭用户带来殿堂级影音享受。

  • Mini LED时代即将终结!MacBook Pro将升级为OLED屏

    苹果爆料人Mark Gurman透露,MacBook Pro会率先升级OLED,时间是明年下半年,然后MacBook Air再跟进OLED,时间是2028年,届时MacBook Pro和MacBook Air都将全面迈入OLED时代。 Mark Gurman指出,苹果旗下的iPad系列、MacBook机型全部都将启用OLED屏幕,包括iPad mini、MacBook Pro、iPad Air和MacBook Air,且大概率会按此顺序推进。PS:入门款iPad暂无搭载OLED的计划。 值得注意的是,MacBo

  • AI日报:豆包视频1.0pro fast发布;谷歌Gemini新功能上线;百度推上体体育大模型 2.0

    本期AI日报聚焦多项技术突破:火山引擎发布豆包视频生成模型1.0pro+fast,速度提升3倍且价格下降72%;百度与上海体育大学推出“上体体育大模型2.0”,拓展AI在运动员训练等场景应用;谷歌Gemini新增一键生成PPT功能;美团发布LongCat-Video模型,支持5分钟连贯视频生成;xAI推出虚拟女友Mika引发热议;MiniMax开源高性能M2编码模型;OpenAI上线企业知识管理功能;另报道20岁辍学生开发的AI笔记工具Turbo AI半年用户破500万,展现年轻创业者的技术影响力。

  • 苹果iPad mini将支持防水:看齐iPhone

    苹果正研发新一代防水iPad mini,采用无扬声器开孔设计降低进水风险,防水性能接近iPhone。与iPhone采用粘合剂密封不同,iPad mini通过全新扬声器系统实现防水。现售款无官方防水认证,而新款预计2026年上市,可能搭载OLED屏幕并涨价约100美元(现起售价499美元)。

  • MiniMax M2:所有坑都踩过,才能做出所有人都能用上的Agent

    最近一个月,基础模型似乎又有点多起来。但若仔细去看这些模型厂商的动作,大体还是走出了两条路。 一种是在诸多难点里选择一个死磕,成为这个单点上的SOTA。这种路线可以快速在开发者群体留下一个明确的印象,但也可能限制住了一家模型公司的“基座”属性。另一种则是在各个模态上全面前进,在一个最全面的基础模型蓝图里不停交出一个个关键拼图。 已经有了全

  • AI日报:昆仑万维SkyReels V3模型上线;月之暗面推Kimi Linear模型;MiniMax Music 2.0 发布

    本期AI日报聚焦多领域创新:昆仑万维推出SkyReels V3模型,整合顶尖视频生成能力;月之暗面Kimi Linear模型处理长文本速度提升2.9倍;MiniMax Music 2.0实现专业级音乐创作;字节跳动启动豆包股权激励计划吸引AI人才;苹果iOS 27将迎AI重大升级,Siri更个性化;Dia浏览器融合Arc设计理念与AI技术;文心魔法漫画工具实现一键生成连载作品;谷歌Gemini Canvas新增PPT自动生成功能,由Gemini 2.5 Pro驱动,提升职场效率。

今日大家都在搜的词: