今日AI：suno v3模型要抢歌手饭碗？字节发布AnimateDiff-Lightning模型；谷歌发布Vlogger视频模型；博主用AI做长篇漫画上架腾讯

2024-03-20 16:14 · 稿源：站长之家

欢迎来到【今日AI】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

QQ截图20240320163255.png

🤖📱💼AI应用

歌手也要失业了?suno v3模型即将推出人人皆可创作音乐

【AiBase提要:】
⭐️ Suno AI宣布即将推出v3模型，具备惊人的创作能力。
⭐️ 能根据用户输入的文本提示生成专业水准的音乐，包括歌词和逼真人声
⭐️ Suno AI 创始人设想大众化音乐创作，让十亿人每月支付10美元来创作歌曲
官网地址:https://top.aibase.com/tool/suno-ai

字节发布AnimateDiff-Lightning模型4步推理就能生成高质量视频

【AiBase提要:】
⭐️ 只需要4-8步的推理就能生成高质量视频
⭐️ 搭配Contorlnet和Comfyui工作流，效率更高
⭐️ 包含1步、2步、4步和8步提炼模型，提供更多选择
模型下载地址:https://top.aibase.com/tool/animatediff-lightning
论文地址:https://arxiv.org/html/2403.12706v1

谷歌发布 “Vlogger” 视频模型框架:单张图片生成10秒视频

【AiBase提要:】
🎥 基于扩散模型的Vlogger可通过图片和录音生成本人演讲视频
🌐 Vlogger具备多样性和自然性，适用于视频编辑和翻译等领域
🚀 尽管存在画质和口型问题，Vlogger发布引起广泛关注和讨论
产品入口:https://top.aibase.com/tool/vlogger

Stability AI推Stable Video3D（SV3D）传图可生成3D视频

【AiBase提要:】
💡 Stable Video3D是用于生成3D视频的gen AI工具。
💡 SV3D能从单个输入图像创建和转换多视角3D网格。
💡 SV3D提供两种变体，用于特定使用案例，满足不同需求。
体验入口:https://top.aibase.com/tool/stable-video-3d

Leonardo Ai推新功能Transparency 一键生成高质量透明PNG图像

【AiBase提要:】
⭐ 可用于生成真正本地透明PNG图像
⭐ 功能不仅限于背景移除，它还支持干净边缘的图像扩散。
⭐ 抠图后轻松放入任意背景，可用于制作贴纸、T恤设计和视频游戏素材
产品入口:https://top.aibase.com/tool/leonardo-ai-transparency

Adobe将Firefly生成式AI功能整合到Substance3D工作流程中

【AiBase提要:】
⭐ Substance3D新增生成逼真或风格化纹理功能。
⭐ 更新的Sampler和Stager版本将于3月18日发布。
⭐ 更新提供更快构思、创意自由和更少时间成本生成纹理和环境能力。

APISR:超强动漫图片高清放大器动漫爱好者的福音!

【AiBase提要:】
⭐ 超分辨率增强:恢复和增强低质量动漫图像和视频。
⭐ 处理真实世界退化图像:解决各种图像问题，提高表现。
⭐ 多种放大因子支持:提供不同放大选项，优化视觉效果。
试玩地址:https://huggingface.co/spaces/HikariDawn/APISR
项目地址:https://github.com/Kiteretsu77/APISR

📰🤖📢AI新鲜事

博主用AI做长篇漫画连载还上架腾讯漫画和快看漫画

【AiBase提要:】
⭐️ 博主通过使用SD模型AWPainting将想法转换成长篇漫画连载。
⭐️ 目前，其长篇漫画《无常》已上架腾讯漫画和快看漫画。
⭐️ AWPainting模型提高画面光效和人物五官鲜明度。
感兴趣的可以前往查看:https://ac.qq.com/ComicView/index/id/655134/cid/25410
模型下载地址：https://top.aibase.com/tool/awpainting

360发布AI实战应用安全大模型3.0

【AiBase提要:】
🚀 首个国内安全行业AI实战大模型。
💡 以技术、能力、应用三层构建完善体系。
⚡️ 全面赋能360全线产品矩阵，提升安全工作效率。

Sam Altman表示不知道GPT-5发布时间避谈Q*问题

【AiBase提要:】
🤖 OpenAI将推出一款令人惊叹的大模型，准备发布一系列产品为GPT-5做准备。
🤖 神秘项目Q*存在，但内容仍是谜，只是时间问题。
🤖 Sora在理解物理世界方面有突破，但需持续优化。

AI第一波红利，美图吃到了

【AiBase提要:】
⭐ 美图2023年业绩大幅增长，净利润同比增长233.2%。
⭐ 美图利用错位竞争战略，美图设计室傻瓜式操作“俘获”AI 新手
⭐ 美图在 AI 产品开发上投入大手笔，研发费用率持续降低。

与DeepMind联合打造!AI足球教练上岗利物浦射门机会提高13%

【AiBase提要:】
🤖 利物浦与DeepMind合作，利用AI提高射门机会13%
📊 TacticAI通过图神经网络与几何深度学习优化角球战术
⚽ AI技术将改变足球比赛战术，提高比赛效率
论文地址:https://www.nature.com/articles/s41467-024-45965-x

AI动漫IP翻唱音乐火爆全网比奇堡乐团一首AI歌曲赞藏数超40万

【AiBase提要:】
⭐ 动漫人物Chiikawa和海绵宝宝翻唱音乐在抖音、小红书等平台爆火
⭐ 小红书博主“比奇堡乐团”一首AI歌曲赞藏数超40万
⭐ 小红书博主“Marina”让乙女游戏中的角色“祁煜”翻唱了一首rapper，获赞数超1万

B站UP主9天用Runway搞出《海贼王》真人版电影视频播放近百万

【AiBase提要:】
⭐️ B站UP主9天使用Runway制作出《海贼王》真人版电影预告片，播放量接近百万。
⭐️ 视频展示了高度还原的AI角色和场景，获得观众高度认可和好评。
⭐️ 随着AI工具的发展，越来越多网友开始创作出自己的电影级大片。

脱单模拟挑战器网络爆火网友怒了:我连AI都攻略不了

【AiBase提要:】
⭐ 生成式AI带动脱单挑战器网络热度，挑战追高冷暗恋对象。
⭐ 玩家通过对话追心动对象，好感度上升解锁结局。
⭐ AI模拟器结合游戏系统，生活化对话场景，引发热议。
详情:https://www.chinaz.com/2024/0319/1604495.shtml

AI明星剧情号在YouTube爆火猛男巨石强森也会耍赖哭泣

【AiBase提要:】
🌟 利用AI明星制作原创剧情视频，吸引网友关注。
🌟 视频展现AI版巨石强森和施瓦辛格的娇气一面。
🌟 视频制作利用ChatGPT生成脚本，Dall·E3生成画面。

今日Midjourney提示词:龙与女孩儿童写真

2_1710920735009_ai2023_In_front_of_a_white_glass_dragon_stands_a_Beautiful_8-ye_c42b1a84-2b03-4ede-99f9-f28fbf6d5d9c.png

图源备注：图片由AI生成，图片授权服务商Midjourney

In front of a white glass dragon， stands a Beautiful8-year-old Chinese Girl， Detailed facial details， Wearing traditional Chinese white clothing and Hanfu， facing the camera， wearing a gorgeous white silk dress， magical scenes， glass， translucent， crystal， photography， product rendering film， surrealism， glass materials， master works， God's rays， high details， ultra high definition --ar3:2--v6.0--s750

（举报）

相关推荐

关键词：

suno

荐AI日报：智谱上线PPT生成功能AI Slides；可灵 AI 发布可图2.1模型

本文介绍了AI日报栏目及近期AI领域多项突破性进展：1)智谱推出免费AI Slides工具，基于GLM模型快速生成高质量PPT；2)可灵AI发布可图2.1模型，支持180多种风格图像生成；3)NVIDIA推出DiffusionRenderer技术，实现视频到可编辑3D场景转换；4)墨刀AI新增30秒生成高保真原型功能；5)Higgsfield推出Soul ID工具，10张照片即可生成虚拟形象；6)谷歌DeepMind开源GenAI Processors工具库；7)谷歌Veo新增图像转视频功能；8)Mistral AI发布专为代码建模的Devstral2507系列模型。这些创新展示了AI在内容生成、3D建模、产品设计等领域的快速发展。
用AI解锁技术公益，第五届Light创造营圆满收官

第五届Light创造营圆满收官，19支团队从847个申报项目中脱颖而出。经过激烈角逐，11个优秀项目入围并获得资助，覆盖无障碍服务、非遗传承、儿童教育、乡村振兴、环保等多元领域。本届创造营特别关注AI技术应用，多个项目聚焦解决残障群体生活难题，如AR字幕手语眼镜帮助听障人士实现双向沟通，面部控制系统让手部障碍者操作数字设备。此外，AI还被应用于青少年心理健康干预、景区无障碍评分等场景。腾讯基金会持续支持AI技术在公益领域的创新应用，五年来已孵化上百个具有社会价值的项目，影响范围不断扩大。

Light创造营技术公益社会创新
荐A日报：B站升级动漫视频生成模型AniSora V3；字节开源4D视频生成框架EX-4D；DeepSWE开源AI Agent系统强势登顶

AI日报栏目汇总了近期AI领域的重要进展：1)字节跳动开源EX-4D框架，可将单目视频转换为多视角4D视频；2)B站开源动漫视频生成模型AniSora V3，支持多种风格；3)DeepSWE+开源基于Qwen3-32B的AI Agent系统；4)字节开源3亿参数图像编辑模型VINCIE-3B；5)Stability AI推出移动端音频生成模型Stable Audio Open Small；6)谷歌发布免费教育AI工具套件Gemini for Education；7)Topview推出革命性AI数字人带货技术Avatar

人工智能 AI技术趋势 4D视频生成
荐AI日报：阿里通义开源音频生成模型ThinkSound；谷歌Veo3支态图片生成视频；昆仑万维发布 Skywork-R1V 3.0

【AI日报】今日AI领域重要动态：1)阿里开源支持链式推理的音频生成模型ThinkSound，实现高保真空间音频生成；2)谷歌Veo3升级，支持静态图片生成生动视频；3)Hugging Face发布30亿参数小模型SmolLM3，性能优于Llama-3.2-3B；4)阿里开源网络智能体WebSailor，展现强大推理和检索能力；5)Moonvalley发布原生1080P视频生成模型Marey Realism v1.5；6)Vidu Q1支持最多七张参考图像生成一致性视频；7)苹果�

人工智能音频生成链式推理
荐AI日报：腾讯混元推3D生成大模型Hunyuan3D-PolyGen；钉钉AI表格重磅来袭；阿里推多模态大语言模型HumanOmniV2

本文介绍了AI领域多项重要进展：1)腾讯推出首个美术3D生成大模型Hunyuan3D-PolyGen，显著提升建模效率；2)阿里发布多模态大模型HumanOmniV2，准确率达69.33%；3)钉钉AI表格实现1小时处理千项任务；4)百度PaddleOCR3.1版本在多语种识别和文档翻译方面升级；5)微软推出Deep Research智能体，自动化研究流程；6)香港理工与OPPO联合开源视频超清框架DLoRAL；7)谷歌开源MCP工具箱简化AI与数据库集成；8)Win11将推出AI动态壁纸功能。这些创新展示了AI在3D生成、多模态理解、办公效率、视觉处理等领域的突破性进展。
LiblibAI 重磅发布「星流 Agent」：中文语义 + 图片视频3D全能生成，中国最强设计 Agent

LiblibAI推出Lovart中文版"星流Agent"，这是一款专为中国市场深度优化的AI设计工具。该产品在保留Lovart全球版"生成-编辑-排版-交付"全链路能力基础上，针对中文语义、国风审美和本土使用场景进行了全面重构。星流Agent支持从创意构思到设计交付的全流程自动化，可处理平面设计、视频生成和3D建模等跨模态创作，内置符合中国文化的视觉风格库。该产品的推出标�

Lovart AI设计中文优化
荐AI日报：阿里通义推Qwen-TTS模型；Cursor已支持网页和手机端；字节发布图像合成技术XVerse

【AI日报】今日AI领域7大突破：1）阿里通义Qwen-TTS实现方言语音合成重大突破；2）Cursor发布Web版AI编程工具；3）字节XVerse技术实现多对象精准图像生成；4）NoteGen跨平台AI笔记工具革新知识管理；5）ManimML动画库可视化Transformer架构；6）TEN+Agent开源语音交互技术降低延迟；7）Chai-2抗体设计模型将药物研发周期缩短至两周。淘宝同时上线RecGPT推荐模型提升购物体验。

人工智能语音合成 Qwen-TTS
荐「6月30日AI日报」百度开源文心大模型4.5系列；通义千问发布多模态生成模型Qwen VLo

AI日报精选：1)百度开源文心大模型4.5系列，含10款新模型，性能优异；2)通义千问发布多模态模型Qwen-VL，支持图文交互；3)阿里开源3亿参数多模态模型Ovis-U1；4)华为开源盘古7B稠密和72B混合专家模型；5)美图MOKI推出AI创意广告功能，一键生成专业视频；6)谷歌Gemini 2.5 Pro API重新免费开放；7)豆瓣上线"深入研究"AI功能；8)小米"AI百宝箱"结束内测；9)北京智研院开源多模态系统OmniGen2；10)知乎升级"直答"知识库功能。

AI日报文心大模型开源模型
“晓妙”产业大模型——AI驱动的产业变革

7月4日，安徽数智建材研究院在长城工程科技会议上发布"晓秒"产业大模型。该模型由傲林科技投资支持，采用"1+1+N"架构，融合数据、机理和业务模型，实现生产运营全流程实时闭环优化。中国建材集团董事长周育先表示，该模型已在水泥板块试点应用，吨水泥成本降低1%以上，能耗电耗下降2%以上。会议指出，AI落地制造业需突破三大关键：建立数字化体系、夯实数据基础、实现工艺与数据融合。未来将拓展至新能源、钢铁等十余个行业，推动产业智能化升级。
全球优质AI语音大模型盘点：Whisper、Gemini Speech

本文分析了当前主流AI语音大模型的核心优势与应用场景。全球顶尖模型包括：OpenAI Whisper（多语言识别与翻译）、Google Gemini（情感化语音生成）、Meta AudioCraft（音乐创作与风格转换）。国内讯飞星火（方言识别）、阿里通义（电商客服）、百度文心（车载场景）表现突出。技术突破点在于云端协同架构、零样本克隆和情感语音合成。选择模型需考虑语言支持、场景适配、部署

AI语音大模型语音交互技术多语言识别

热文

3 天
7天

今日AI：suno v3模型要抢歌手饭碗？字节发布AnimateDiff-Lightning模型；谷歌发布Vlogger视频模型；博主用AI做长篇漫画上架腾讯

荐AI日报：智谱上线PPT生成功能AI Slides；可灵 AI 发布可图2.1模型

用AI解锁技术公益，第五届Light创造营圆满收官

荐A日报：B站升级动漫视频生成模型AniSora V3；字节开源4D视频生成框架EX-4D；DeepSWE开源AI Agent系统强势登顶

荐AI日报：阿里通义开源音频生成模型ThinkSound；谷歌Veo3支态图片生成视频；昆仑万维发布 Skywork-R1V 3.0

荐AI日报：腾讯混元推3D生成大模型Hunyuan3D-PolyGen；钉钉AI表格重磅来袭；阿里推多模态大语言模型HumanOmniV2

LiblibAI 重磅发布「星流 Agent」：中文语义 + 图片视频3D全能生成，中国最强设计 Agent

荐AI日报：阿里通义推Qwen-TTS模型；Cursor已支持网页和手机端；字节发布图像合成技术XVerse

荐「6月30日AI日报」百度开源文心大模型4.5系列；通义千问发布多模态生成模型Qwen VLo

“晓妙”产业大模型——AI驱动的产业变革

全球优质AI语音大模型盘点：Whisper、Gemini Speech

热文

AI日报：xAI 震撼发布Grok4；微软开源全新Phi-4-mini版本；上海

AI日报：智谱上线PPT生成功能AI Slides；可灵 AI 发布可图2.1模

比特币首触112000美元：盘中涨幅最高达3%

微信：持续打击非法使用外挂行为进一步强化外挂营销信息治理

小米回应AI眼镜没有屏显功能：专注拍摄、AI语音交互

荣耀X70支持IP66/IP68/IP69/IP69K 号称行业最高规格防水

OPPO K13 Turbo系列官宣将于7月21日发布内置散热风扇

REDMI Turbo 4 Pro粉金新配色发布售价1899元起

小米汽车交付超30万辆：用时仅15个月

小米回应小折叠未搭载玄戒O1：立项之初总量比较有限