首页 > 业界 > 关键词  > suno最新资讯  > 正文

今日AI:suno v3模型要抢歌手饭碗?字节发布AnimateDiff-Lightning模型;谷歌发布Vlogger视频模型;博主用AI做长篇漫画上架腾讯

2024-03-20 16:14 · 稿源:站长之家

欢迎来到【今日AI】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

QQ截图20240320163255.png

🤖📱💼AI应用

歌手也要失业了?suno v3模型即将推出 人人皆可创作音乐

image.png

【AiBase提要:】

⭐️ Suno AI宣布即将推出v3模型,具备惊人的创作能力。

⭐️ 能根据用户输入的文本提示生成专业水准的音乐,包括歌词和逼真人声

⭐️ Suno AI 创始人设想大众化音乐创作,让十亿人每月支付10美元来创作歌曲

官网地址:https://top.aibase.com/tool/suno-ai

字节发布AnimateDiff-Lightning模型4步推理就能生成高质量视频

image.png

【AiBase提要:】

⭐️ 只需要4-8步的推理就能生成高质量视频

⭐️ 搭配Contorlnet和Comfyui工作流,效率更高

⭐️ 包含1步、2步、4步和8步提炼模型,提供更多选择

模型下载地址:https://top.aibase.com/tool/animatediff-lightning

论文地址:https://arxiv.org/html/2403.12706v1

谷歌发布 “Vlogger” 视频模型框架:单张图片生成10秒视频

image.png

【AiBase提要:】

🎥 基于扩散模型的Vlogger可通过图片和录音生成本人演讲视频

🌐 Vlogger具备多样性和自然性,适用于视频编辑和翻译等领域

🚀 尽管存在画质和口型问题,Vlogger发布引起广泛关注和讨论

产品入口:https://top.aibase.com/tool/vlogger

Stability AI推Stable Video3D(SV3D)传图可生成3D视频

image.png

【AiBase提要:】

💡 Stable Video3D是用于生成3D视频的gen AI工具。

💡 SV3D能从单个输入图像创建和转换多视角3D网格。

💡 SV3D提供两种变体,用于特定使用案例,满足不同需求。

体验入口:https://top.aibase.com/tool/stable-video-3d

Leonardo Ai推新功能Transparency 一键生成高质量透明PNG图像

image.png

【AiBase提要:】

⭐ 可用于生成真正本地透明PNG图像

⭐ 功能不仅限于背景移除,它还支持干净边缘的图像扩散。

⭐ 抠图后轻松放入任意背景,可用于制作贴纸、T恤设计和视频游戏素材

产品入口:https://top.aibase.com/tool/leonardo-ai-transparency

Adobe将Firefly生成式AI功能整合到Substance3D工作流程中

【AiBase提要:】

⭐ Substance3D新增生成逼真或风格化纹理功能。

⭐ 更新的Sampler和Stager版本将于3月18日发布。

⭐ 更新提供更快构思、创意自由和更少时间成本生成纹理和环境能力。

APISR:超强动漫图片高清放大器 动漫爱好者的福音!

image.png

【AiBase提要:】

⭐ 超分辨率增强:恢复和增强低质量动漫图像和视频。

⭐ 处理真实世界退化图像:解决各种图像问题,提高表现。

⭐ 多种放大因子支持:提供不同放大选项,优化视觉效果。

试玩地址:https://huggingface.co/spaces/HikariDawn/APISR

项目地址:https://github.com/Kiteretsu77/APISR

📰🤖📢AI新鲜事

博主用AI做长篇漫画连载 还上架腾讯漫画和快看漫画

image.png

【AiBase提要:】

⭐️ 博主通过使用SD模型AWPainting将想法转换成长篇漫画连载。

⭐️ 目前,其长篇漫画《无常》已上架腾讯漫画和快看漫画。

⭐️ AWPainting模型提高画面光效和人物五官鲜明度。

感兴趣的可以前往查看:https://ac.qq.com/ComicView/index/id/655134/cid/25410

模型下载地址:https://top.aibase.com/tool/awpainting

360发布AI实战应用安全大模型3.0

【AiBase提要:】

🚀 首个国内安全行业AI实战大模型。

💡 以技术、能力、应用三层构建完善体系。

⚡️ 全面赋能360全线产品矩阵,提升安全工作效率。

Sam Altman表示不知道GPT-5发布时间 避谈Q*问题

【AiBase提要:】

🤖 OpenAI将推出一款令人惊叹的大模型,准备发布一系列产品为GPT-5做准备。

🤖 神秘项目Q*存在,但内容仍是谜,只是时间问题。

🤖 Sora在理解物理世界方面有突破,但需持续优化。

AI第一波红利,美图吃到了

【AiBase提要:】

⭐ 美图2023年业绩大幅增长,净利润同比增长233.2%。

⭐ 美图利用错位竞争战略,美图设计室傻瓜式操作“俘获”AI 新手

⭐ 美图在 AI 产品开发上投入大手笔,研发费用率持续降低。

与DeepMind联合打造!AI足球教练上岗利物浦 射门机会提高13%

image.png

【AiBase提要:】

🤖 利物浦与DeepMind合作,利用AI提高射门机会13%

📊 TacticAI通过图神经网络与几何深度学习优化角球战术

⚽ AI技术将改变足球比赛战术,提高比赛效率

论文地址:https://www.nature.com/articles/s41467-024-45965-x

AI动漫IP翻唱音乐火爆全网 比奇堡乐团一首AI歌曲赞藏数超40万

image.png

【AiBase提要:】

⭐ 动漫人物Chiikawa和海绵宝宝翻唱音乐在抖音、小红书等平台爆火

⭐ 小红书博主“比奇堡乐团”一首AI歌曲赞藏数超40万

⭐ 小红书博主“Marina”让乙女游戏中的角色“祁煜”翻唱了一首rapper,获赞数超1万

B站UP主9天用Runway搞出《海贼王》真人版电影 视频播放近百万

image.png

【AiBase提要:】

⭐️ B站UP主9天使用Runway制作出《海贼王》真人版电影预告片,播放量接近百万。

⭐️ 视频展示了高度还原的AI角色和场景,获得观众高度认可和好评。

⭐️ 随着AI工具的发展,越来越多网友开始创作出自己的电影级大片。

脱单模拟挑战器网络爆火 网友怒了:我连AI都攻略不了

image.png

【AiBase提要:】

⭐ 生成式AI带动脱单挑战器网络热度,挑战追高冷暗恋对象。

⭐ 玩家通过对话追心动对象,好感度上升解锁结局。

⭐ AI模拟器结合游戏系统,生活化对话场景,引发热议。

详情:https://www.chinaz.com/2024/0319/1604495.shtml

AI明星剧情号在YouTube爆火 猛男巨石强森也会耍赖哭泣

image.png

【AiBase提要:】

🌟 利用AI明星制作原创剧情视频,吸引网友关注。

🌟 视频展现AI版巨石强森和施瓦辛格的娇气一面。

🌟 视频制作利用ChatGPT生成脚本,Dall·E3生成画面。

今日Midjourney提示词:龙与女孩儿童写真

2_1710920735009_ai2023_In_front_of_a_white_glass_dragon_stands_a_Beautiful_8-ye_c42b1a84-2b03-4ede-99f9-f28fbf6d5d9c.png

图源备注:图片由AI生成,图片授权服务商Midjourney

In front of a white glass dragon, stands a Beautiful8-year-old Chinese Girl, Detailed facial details, Wearing traditional Chinese white clothing and Hanfu, facing the camera, wearing a gorgeous white silk dress, magical scenes, glass, translucent, crystal, photography, product rendering film, surrealism, glass materials, master works, God's rays, high details, ultra high definition --ar3:2--v6.0--s750

举报

  • 相关推荐
  • AI日报:智谱上线PPT生成功能AI Slides;可灵 AI 发布可图2.1模型

    本文介绍了AI日报栏目及近期AI领域多项突破性进展:1)智谱推出免费AI Slides工具,基于GLM模型快速生成高质量PPT;2)可灵AI发布可图2.1模型,支持180多种风格图像生成;3)NVIDIA推出DiffusionRenderer技术,实现视频到可编辑3D场景转换;4)墨刀AI新增30秒生成高保真原型功能;5)Higgsfield推出Soul ID工具,10张照片即可生成虚拟形象;6)谷歌DeepMind开源GenAI Processors工具库;7)谷歌Veo新增图像转视频功能;8)Mistral AI发布专为代码建模的Devstral2507系列模型。这些创新展示了AI在内容生成、3D建模、产品设计等领域的快速发展。

  • 用AI解锁技术公益,第五届Light创造营圆满收官

    第五届Light创造营圆满收官,19支团队从847个申报项目中脱颖而出。经过激烈角逐,11个优秀项目入围并获得资助,覆盖无障碍服务、非遗传承、儿童教育、乡村振兴、环保等多元领域。本届创造营特别关注AI技术应用,多个项目聚焦解决残障群体生活难题,如AR字幕手语眼镜帮助听障人士实现双向沟通,面部控制系统让手部障碍者操作数字设备。此外,AI还被应用于青少年心理健康干预、景区无障碍评分等场景。腾讯基金会持续支持AI技术在公益领域的创新应用,五年来已孵化上百个具有社会价值的项目,影响范围不断扩大。

  • A日报:B站升级动漫视频生成模型AniSora V3;字节开源4D视频生成框架EX-4D;DeepSWE开源AI Agent系统强势登顶

    AI日报栏目汇总了近期AI领域的重要进展:1)字节跳动开源EX-4D框架,可将单目视频转换为多视角4D视频;2)B站开源动漫视频生成模型AniSora V3,支持多种风格;3)DeepSWE+开源基于Qwen3-32B的AI Agent系统;4)字节开源3亿参数图像编辑模型VINCIE-3B;5)Stability AI推出移动端音频生成模型Stable Audio Open Small;6)谷歌发布免费教育AI工具套件Gemini for Education;7)Topview推出革命性AI数字人带货技术Avatar

  • AI日报:阿里通义开源音频生成模型ThinkSound;谷歌Veo3支态图片生成视频;昆仑万维发布 Skywork-R1V 3.0

    【AI日报】今日AI领域重要动态:1)阿里开源支持链式推理的音频生成模型ThinkSound,实现高保真空间音频生成;2)谷歌Veo3升级,支持静态图片生成生动视频;3)Hugging Face发布30亿参数小模型SmolLM3,性能优于Llama-3.2-3B;4)阿里开源网络智能体WebSailor,展现强大推理和检索能力;5)Moonvalley发布原生1080P视频生成模型Marey Realism v1.5;6)Vidu Q1支持最多七张参考图像生成一致性视频;7)苹果�

  • AI日报:腾讯混元推3D生成大模型Hunyuan3D-PolyGen;钉钉AI表格重磅来袭;阿里推多模态大语言模型HumanOmniV2

    本文介绍了AI领域多项重要进展:1)腾讯推出首个美术3D生成大模型Hunyuan3D-PolyGen,显著提升建模效率;2)阿里发布多模态大模型HumanOmniV2,准确率达69.33%;3)钉钉AI表格实现1小时处理千项任务;4)百度PaddleOCR3.1版本在多语种识别和文档翻译方面升级;5)微软推出Deep Research智能体,自动化研究流程;6)香港理工与OPPO联合开源视频超清框架DLoRAL;7)谷歌开源MCP工具箱简化AI与数据库集成;8)Win11将推出AI动态壁纸功能。这些创新展示了AI在3D生成、多模态理解、办公效率、视觉处理等领域的突破性进展。

  • LiblibAI 重磅发布「星流 Agent」:中文语义 + 图片视频3D全能生成,中国最强设计 Agent

    LiblibAI推出Lovart中文版"星流Agent",这是一款专为中国市场深度优化的AI设计工具。该产品在保留Lovart全球版"生成-编辑-排版-交付"全链路能力基础上,针对中文语义、国风审美和本土使用场景进行了全面重构。星流Agent支持从创意构思到设计交付的全流程自动化,可处理平面设计、视频生成和3D建模等跨模态创作,内置符合中国文化的视觉风格库。该产品的推出标�

  • AI日报:阿里通义推Qwen-TTS模型;Cursor已支持网页和手机端;字节发布图像合成技术XVerse

    【AI日报】今日AI领域7大突破:1)阿里通义Qwen-TTS实现方言语音合成重大突破;2)Cursor发布Web版AI编程工具;3)字节XVerse技术实现多对象精准图像生成;4)NoteGen跨平台AI笔记工具革新知识管理;5)ManimML动画库可视化Transformer架构;6)TEN+Agent开源语音交互技术降低延迟;7)Chai-2抗体设计模型将药物研发周期缩短至两周。淘宝同时上线RecGPT推荐模型提升购物体验。

  • 「6月30日AI日报」百度开源文心大模型4.5系列;通义千问发布多模态生成模型Qwen VLo

    AI日报精选:1)百度开源文心大模型4.5系列,含10款新模型,性能优异;2)通义千问发布多模态模型Qwen-VL,支持图文交互;3)阿里开源3亿参数多模态模型Ovis-U1;4)华为开源盘古7B稠密和72B混合专家模型;5)美图MOKI推出AI创意广告功能,一键生成专业视频;6)谷歌Gemini 2.5 Pro API重新免费开放;7)豆瓣上线"深入研究"AI功能;8)小米"AI百宝箱"结束内测;9)北京智研院开源多模态系统OmniGen2;10)知乎升级"直答"知识库功能。

  • “晓妙”产业大模型——AI驱动的产业变革

    7月4日,安徽数智建材研究院在长城工程科技会议上发布"晓秒"产业大模型。该模型由傲林科技投资支持,采用"1+1+N"架构,融合数据、机理和业务模型,实现生产运营全流程实时闭环优化。中国建材集团董事长周育先表示,该模型已在水泥板块试点应用,吨水泥成本降低1%以上,能耗电耗下降2%以上。会议指出,AI落地制造业需突破三大关键:建立数字化体系、夯实数据基础、实现工艺与数据融合。未来将拓展至新能源、钢铁等十余个行业,推动产业智能化升级。

  • 全球优质AI语音大模型盘点:Whisper、Gemini Speech

    本文分析了当前主流AI语音大模型的核心优势与应用场景。全球顶尖模型包括:OpenAI Whisper(多语言识别与翻译)、Google Gemini(情感化语音生成)、Meta AudioCraft(音乐创作与风格转换)。国内讯飞星火(方言识别)、阿里通义(电商客服)、百度文心(车载场景)表现突出。技术突破点在于云端协同架构、零样本克隆和情感语音合成。选择模型需考虑语言支持、场景适配、部署