首页 > 业界 > 关键词  > suno最新资讯  > 正文

今日AI:suno v3模型要抢歌手饭碗?字节发布AnimateDiff-Lightning模型;谷歌发布Vlogger视频模型;博主用AI做长篇漫画上架腾讯

2024-03-20 16:14 · 稿源:站长之家

欢迎来到【今日AI】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

QQ截图20240320163255.png

🤖📱💼AI应用

歌手也要失业了?suno v3模型即将推出 人人皆可创作音乐

image.png

【AiBase提要:】

⭐️ Suno AI宣布即将推出v3模型,具备惊人的创作能力。

⭐️ 能根据用户输入的文本提示生成专业水准的音乐,包括歌词和逼真人声

⭐️ Suno AI 创始人设想大众化音乐创作,让十亿人每月支付10美元来创作歌曲

官网地址:https://top.aibase.com/tool/suno-ai

字节发布AnimateDiff-Lightning模型4步推理就能生成高质量视频

image.png

【AiBase提要:】

⭐️ 只需要4-8步的推理就能生成高质量视频

⭐️ 搭配Contorlnet和Comfyui工作流,效率更高

⭐️ 包含1步、2步、4步和8步提炼模型,提供更多选择

模型下载地址:https://top.aibase.com/tool/animatediff-lightning

论文地址:https://arxiv.org/html/2403.12706v1

谷歌发布 “Vlogger” 视频模型框架:单张图片生成10秒视频

image.png

【AiBase提要:】

🎥 基于扩散模型的Vlogger可通过图片和录音生成本人演讲视频

🌐 Vlogger具备多样性和自然性,适用于视频编辑和翻译等领域

🚀 尽管存在画质和口型问题,Vlogger发布引起广泛关注和讨论

产品入口:https://top.aibase.com/tool/vlogger

Stability AI推Stable Video3D(SV3D)传图可生成3D视频

image.png

【AiBase提要:】

💡 Stable Video3D是用于生成3D视频的gen AI工具。

💡 SV3D能从单个输入图像创建和转换多视角3D网格。

💡 SV3D提供两种变体,用于特定使用案例,满足不同需求。

体验入口:https://top.aibase.com/tool/stable-video-3d

Leonardo Ai推新功能Transparency 一键生成高质量透明PNG图像

image.png

【AiBase提要:】

⭐ 可用于生成真正本地透明PNG图像

⭐ 功能不仅限于背景移除,它还支持干净边缘的图像扩散。

⭐ 抠图后轻松放入任意背景,可用于制作贴纸、T恤设计和视频游戏素材

产品入口:https://top.aibase.com/tool/leonardo-ai-transparency

Adobe将Firefly生成式AI功能整合到Substance3D工作流程中

【AiBase提要:】

⭐ Substance3D新增生成逼真或风格化纹理功能。

⭐ 更新的Sampler和Stager版本将于3月18日发布。

⭐ 更新提供更快构思、创意自由和更少时间成本生成纹理和环境能力。

APISR:超强动漫图片高清放大器 动漫爱好者的福音!

image.png

【AiBase提要:】

⭐ 超分辨率增强:恢复和增强低质量动漫图像和视频。

⭐ 处理真实世界退化图像:解决各种图像问题,提高表现。

⭐ 多种放大因子支持:提供不同放大选项,优化视觉效果。

试玩地址:https://huggingface.co/spaces/HikariDawn/APISR

项目地址:https://github.com/Kiteretsu77/APISR

📰🤖📢AI新鲜事

博主用AI做长篇漫画连载 还上架腾讯漫画和快看漫画

image.png

【AiBase提要:】

⭐️ 博主通过使用SD模型AWPainting将想法转换成长篇漫画连载。

⭐️ 目前,其长篇漫画《无常》已上架腾讯漫画和快看漫画。

⭐️ AWPainting模型提高画面光效和人物五官鲜明度。

感兴趣的可以前往查看:https://ac.qq.com/ComicView/index/id/655134/cid/25410

模型下载地址:https://top.aibase.com/tool/awpainting

360发布AI实战应用安全大模型3.0

【AiBase提要:】

🚀 首个国内安全行业AI实战大模型。

💡 以技术、能力、应用三层构建完善体系。

⚡️ 全面赋能360全线产品矩阵,提升安全工作效率。

Sam Altman表示不知道GPT-5发布时间 避谈Q*问题

【AiBase提要:】

🤖 OpenAI将推出一款令人惊叹的大模型,准备发布一系列产品为GPT-5做准备。

🤖 神秘项目Q*存在,但内容仍是谜,只是时间问题。

🤖 Sora在理解物理世界方面有突破,但需持续优化。

AI第一波红利,美图吃到了

【AiBase提要:】

⭐ 美图2023年业绩大幅增长,净利润同比增长233.2%。

⭐ 美图利用错位竞争战略,美图设计室傻瓜式操作“俘获”AI 新手

⭐ 美图在 AI 产品开发上投入大手笔,研发费用率持续降低。

与DeepMind联合打造!AI足球教练上岗利物浦 射门机会提高13%

image.png

【AiBase提要:】

🤖 利物浦与DeepMind合作,利用AI提高射门机会13%

📊 TacticAI通过图神经网络与几何深度学习优化角球战术

⚽ AI技术将改变足球比赛战术,提高比赛效率

论文地址:https://www.nature.com/articles/s41467-024-45965-x

AI动漫IP翻唱音乐火爆全网 比奇堡乐团一首AI歌曲赞藏数超40万

image.png

【AiBase提要:】

⭐ 动漫人物Chiikawa和海绵宝宝翻唱音乐在抖音、小红书等平台爆火

⭐ 小红书博主“比奇堡乐团”一首AI歌曲赞藏数超40万

⭐ 小红书博主“Marina”让乙女游戏中的角色“祁煜”翻唱了一首rapper,获赞数超1万

B站UP主9天用Runway搞出《海贼王》真人版电影 视频播放近百万

image.png

【AiBase提要:】

⭐️ B站UP主9天使用Runway制作出《海贼王》真人版电影预告片,播放量接近百万。

⭐️ 视频展示了高度还原的AI角色和场景,获得观众高度认可和好评。

⭐️ 随着AI工具的发展,越来越多网友开始创作出自己的电影级大片。

脱单模拟挑战器网络爆火 网友怒了:我连AI都攻略不了

image.png

【AiBase提要:】

⭐ 生成式AI带动脱单挑战器网络热度,挑战追高冷暗恋对象。

⭐ 玩家通过对话追心动对象,好感度上升解锁结局。

⭐ AI模拟器结合游戏系统,生活化对话场景,引发热议。

详情:https://www.chinaz.com/2024/0319/1604495.shtml

AI明星剧情号在YouTube爆火 猛男巨石强森也会耍赖哭泣

image.png

【AiBase提要:】

🌟 利用AI明星制作原创剧情视频,吸引网友关注。

🌟 视频展现AI版巨石强森和施瓦辛格的娇气一面。

🌟 视频制作利用ChatGPT生成脚本,Dall·E3生成画面。

今日Midjourney提示词:龙与女孩儿童写真

2_1710920735009_ai2023_In_front_of_a_white_glass_dragon_stands_a_Beautiful_8-ye_c42b1a84-2b03-4ede-99f9-f28fbf6d5d9c.png

图源备注:图片由AI生成,图片授权服务商Midjourney

In front of a white glass dragon, stands a Beautiful8-year-old Chinese Girl, Detailed facial details, Wearing traditional Chinese white clothing and Hanfu, facing the camera, wearing a gorgeous white silk dress, magical scenes, glass, translucent, crystal, photography, product rendering film, surrealism, glass materials, master works, God's rays, high details, ultra high definition --ar3:2--v6.0--s750

举报

  • 相关推荐
  • 大家在看
  • helpmee.ai:AI辅助的电脑帮助,让老年人轻松掌握技术。

    helpmee.ai是一个利用AI技术为老年人提供电脑使用指导的网站。通过耐心的语音对话和屏幕共享,AI伴侣逐步引导老年人完成任何计算机任务,确保他们能够自信且独立地在数字世界中导航,支持50多种语言,全天候服务。该服务使用OpenAI的最新GPT-4o模型,提供无与伦比的准确性和理解力。

  • video-subtitle-master:批量生成视频字幕并支持多语言翻译的客户端工具

    video-subtitle-master 是一个基于之前开源项目 VideoSubtitleGenerator 开发的客户端工具,它允许用户批量为视频生成字幕,并支持将字幕翻译成不同的语言。这个工具特别适合需要对视频内容进行本地化处理的个人或团队,无论是为了教育、娱乐还是商业目的。它集成了多种翻译服务,如百度翻译、火山引擎翻译等,并优化了对 Apple Silicon 的支持,提供了快速的生成速度。

  • EngineerDraft:实时字幕生成工具

    BeMyEars 是一款实时字幕生成工具,利用本地设备完成语音识别,为听障人士和需要字幕的用户提供极致体验。其主要优点包括多语言支持、多源输入、隐私保护等。

  • 大设:AI 智能绘画平台,让文本和图片成为艺术作品。

    大设是基于 Stable Diffusion 的免费 AI 绘画网站,提供一键生成高清精绘大图、SDXL 模型教程、AI 提示词工具。背景包括清华大学研发,定位为 AI 智能绘画平台。

  • Supaclip:将视频快速转化为知识库。

    Supaclip是一个旨在帮助用户将视频内容转化为知识库的在线工具。它通过提供视频摘要、AI助手、字幕和时间戳等功能,帮助用户快速理解和导航视频内容。产品适用于内容创作者、学生、播客主持人和研究人员等,通过这些功能,用户可以增加视频的有机覆盖率、从讲座中获取最大价值、提供节目笔记、通过聊天机器人进行互动以及从访谈视频和纪录片中提取关键见解和引用。

  • Context Data:一站式企业级数据平台,专为生成式AI应用设计

    Context Data是一个为生成式AI应用设计的数据处理和转换平台,旨在帮助AI团队构建数据基础设施,以便他们专注于构建AI逻辑。它提供了无需设置基础设施、跨多个源转换数据、连接多个模型、加载数据到主要向量数据库、查询私有向量数据、定时管道以及构建数据和ETL管道等功能。Context Data强调数据隐私控制,避免了将数据上传到OpenAI等外部模型,简化了构建AI就绪数据平台的压力和复杂性。

  • World of Gami:AI驱动的Trello替代品,让团队任务保持最新。

    World of Gami是一个利用AI技术简化任务管理的网站,它将日常任务转化为令人兴奋的挑战,使项目管理不仅是必需的,而且是团队工作流程中令人愉悦和有益的一部分。通过将传统任务列表或看板转变为生动和竞争性的游戏,每个用户可以创建自己的'船',使用Scrum方法进行冲刺,并竞争'冲刺皇冠',这不仅使项目管理更加有趣,而且培养了团队精神和成就感。

  • Dola AI:您的个人 AI 日历助手,简化日程安排,释放时间。

    Dola 是一款通过消息应用进行日程安排的 AI 助手,它与 Google 日历、Apple 日历和 Caldav 兼容,能够通过自然语言快速安排日程,提高效率,同时支持语音、图片和文本输入。Dola 旨在帮助用户节省时间,专注于他们喜欢的事情。

  • Remind AI:使用先进的AI技术,轻松捕捉您的数字活动并作为记忆使用。

    reMind是一款利用AI技术帮助用户捕捉和利用数字活动作为记忆的产品。它通过先进的人工智能技术,让用户能够轻松地记录和回顾自己的工作和活动,从而提高生产力。

  • BrowseBuddy:AI购物助手,提升电商购物体验

    BrowseBuddy是一款AI驱动的聊天机器人,旨在通过提供个性化的帮助来增强在线购物体验。它利用自然语言处理技术来理解客户查询,提供量身定制的产品推荐和支持。BrowseBuddy通过智能产品匹配、实时解决方案、多语言支持等技术,为电商企业提供了一种提升客户满意度和销售效率的解决方案。

  • Depthforge:AI驱动的3D图像生成应用

    Depthforge是一款利用Apple Vision Pro技术,通过文本提示生成沉浸式3D图像的应用。它易于使用,能够让用户通过简单的文本输入来创造独特的高质量3D图像,体验全新的3D图像生成世界。

  • AudiowaveAI:将任何文本转换为有声读物质量的声音。

    AudiowaveAI是一款利用人工智能技术将文本转换成高质量音频的应用程序。它与传统的文本到语音技术不同,提供了更加自然、富有情感的语音输出,让听众在学习和享受内容时获得更好的听觉体验。产品背景信息包括它是由全球创新公司和自由职业者信赖的产品,其主要优点在于其引人入胜的声音、自然的声音效果以及令人愉悦的听觉享受。产品定位为教育工具,旨在帮助用户在移动中学习,享受夏日阳光。

  • Usermaven:简单而强大的网站和产品分析工具

    Usermaven是一个简单易用且功能强大的网站和产品分析工具,专为市场营销人员和产品专业人士设计。它通过自动捕获所有事件来提供精确的追踪,无需依赖开发人员,从而简化了数据分析过程。Usermaven还提供了隐私友好的解决方案,支持GDPR和CCPA合规性,并且可以无cookie运行,保护用户隐私。

  • StarSearch:git历史查询助手,贡献者分析工具

    StarSearch是一个专注于git历史和贡献者分析的在线工具,它能够帮助用户快速获取有关贡献者活动的信息,识别关键贡献者,以及基于工作内容找到特定领域的专家。该工具对于开源项目维护者、开发者和团队领导者来说极为重要,因为它可以提高项目管理效率,优化团队协作,并促进技术社区的交流与合作。StarSearch是我们基于人工智能的功能,可以深入了解贡献者的历史和活动,带来透明度和对开源项目的全新深度认知。

  • AIGCRank.cn:AI 排行榜

    AIGCRank.cn 是一个提供 AI 产品排行榜的网站,主要收集和整理国内外各类 AI 产品的相关信息,并通过排行榜形式展示给用户。该网站旨在帮助用户了解和选择最优秀的 AI 产品,以满足其需求。

  • ReVideo:视频重制,精确控制内容与运动

    ReVideo是一个创新的视频编辑技术,它允许用户在特定区域进行精确的视频编辑,通过指定内容和运动来实现。这项技术通过修改第一帧来实现内容编辑,而基于轨迹的运动控制提供了直观的用户交互体验。ReVideo解决了内容和运动控制之间耦合和训练不平衡的新任务。通过开发三阶段训练策略,逐步从粗到细解耦这两方面,并提出一种时空自适应融合模块,以在不同的采样步骤和空间位置整合内容和运动控制。

  • TryOnDiffusion:一款基于扩散模型的服装试穿技术

    TryOnDiffusion是一种创新的图像合成技术,它通过两个UNets(Parallel-UNet)的结合,实现了在单一网络中同时保持服装细节和适应显著的身体姿势及形状变化。这项技术在保持服装细节的同时,能够适应不同的身体姿势和形状,解决了以往方法在细节保持和姿势适应上的不足,达到了业界领先的性能。

  • AIGCRank大语言模型API价格对比:汇总和比较全球主要AI模型提供商的价格信息

    AIGCRank大语言模型API价格对比是一个专门汇总和比较全球主要AI模型提供商的价格信息的工具。它为用户提供最新的大语言模型(LLM)的价格数据,包括一些免费的AI大模型API。通过这个平台,用户可以轻松查找和比较OpenAI、Claude、Mixtral、Kimi、星火大模型、通义千问、文心一语、Llama 3、GPT-4、AWS和Google等国内外主要API提供商的最新价格,确保找到最适合自己项目的模型定价。

  • Pandora:通用世界模型,支持自然语言动作和视频状态

    Pandora是一个向通用世界模型迈进的模型,它能够通过生成视频来模拟世界状态,并允许使用自然语言在任何时间控制视频内容。Pandora与以往的文本到视频模型不同,它允许在视频生成过程中随时接受自由文本动作输入,从而实现视频的即时控制。这种即时控制能力实现了世界模型支持交互式内容生成和增强的健壮推理和规划的承诺。Pandora能够跨多个领域生成视频,如室内/室外、自然/城市、人类/机器人、2D/3D等场景。此外,Pandora还允许通过高质量的数据进行指令调整,使得模型能够在一个领域学习动作并在另一个未见过的领域中使用。Pandora模型还通过自回归模型生成更长的视频,其生成的视频长度可以超过训练视频的长度。尽管Pandora作为通用世界模型的初步步骤仍有限制,例如在生成一致性视频、模拟复杂场景、理解常识和物理法则以及遵循指令/动作方面可能会失败,但它在视频生成和自然语言控制方面展示了巨大的潜力。

  • Dev Home:Windows开发者的一站式控制中心

    Dev Home是微软为Windows开发者推出的一款桌面客户端,旨在提供一个集中的控制中心,帮助开发者监控项目、设置开发环境、连接开发者账户和工具,并创建专用的存储空间。它通过自定义的仪表板小部件,使开发者能够监控工作流程、跟踪开发项目、编码任务、Azure DevOps查询、GitHub问题、拉取请求、可用SSH连接以及系统的CPU、GPU、内存和网络性能。Dev Home 0.14 预览版更新集成了 PowerToys 模块,以及基于 AI 的 Quickstart Playground 功能。

今日大家都在搜的词: