首页 > 业界 > 关键词  > Sora最新资讯  > 正文

AI日报:音乐圈巨震!Sora发布首支MV;百度推出AI视频模型;抖音提醒清明节慎用“AI复活”技术;PS2风格AI滤镜风靡网络

2024-04-03 15:22 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://top.aibase.com/

QQ截图20240403153039.png

📰🤖📢AI新鲜事

音乐圈巨震!Sora发布首支MV《Worldweight》

image.png

【AiBase提要:】

⭐由艺术家AugustKamp作曲,借助Sora制作的MV画面

⭐AugustKamp在雨中创作了这首歌曲,通过Sora其音乐创作有了一个具象展现

⭐AI技术引发争议,全球200位艺术家联名抗议AI侵犯权益

百度推出AI视频创作模型D&S-AI Video 由百度智能云一念提供支持

微信截图_20240403091049.png

【AiBase提要:】

🔹 D&S-AIVideo正式上线,并集成至迪思AI智链。

🔹 D&S-AI Video凭借计算与数据分析能力,智能拆分海量视频素材。

🔹 通过D&S-AI Video,简化传统视频制作流程,提高视频制作效率。

抖音提醒:未经逝者生前同意或逝者家属授权 慎用“AI复活”技术

【AiBase提要:】

👻 未经逝者同意或家属授权,慎用AI技术“复活”逝者。

💰 避免焚烧人民币内容,表达缅怀可选择其他文明方式。

🌟 尊重英烈,避免在纪念场所发布扰乱秩序的内容。

据称Stability AI资金告急,无法支付云GPU账单

【AiBase提要:】

⭐️ 公司资金告罄,无法支付云GPU租金,销售额和计算成本巨大落差

⭐️ CEO未制定商业计划,未赢得客户交易和筹集足够资金

⭐️ 未能支付云资源账单,计划转售计算资源以弥补资金缺口。

Harvey公司与OpenAI合作 为法律专业人士打造定制训练的案例法模型

QQ截图20240403113507.png

【AiBase提要:】

⭐️ AI系统具备复杂推理能力,可处理广泛法律知识

⭐️ Harvey与OpenAI合作建立定制训练模型,注入新知识

⭐️ 案例法模型提供更准确、更完整的法律信息和解决方案

官网地址:https://www.harvey.ai/

在TikTok和ChatGPT在线调情遭百万网友围观!角色扮演玩这么花的?

image.png

【AiBase提要:】

🤖 TikTok视频中使用ChatGPT在线语音调情、角色扮演走红,吸引百万网友围观。

🔥 ChatGPT回应不道德问题,网友开发FlowGPT突破限制

💡 ChatGPT视频播放量超百万,在TikTok上走红

详细内容:https://www.chinaz.com/2024/0403/1607798.shtml

普林斯顿首个「开源」AI程序员进场 基于GPT-4,可自动修复bug

【AiBase提要:】

⭐ 普林斯顿大学推出SWE-agent,首个开源AI程序员,能自动修复bug。

⭐ SWE-agent基于GPT-4技术,在GitHub仓库中表现出色。

⭐ SWE-agent工作原理类似人类UI,能成功解决软件工程问题。

项目地址:https://top.aibase.com/tool/swe-agent

B站UP主用AI翻拍《火影忍者》真人版电影10天画5000张图获赞86万

image.png

【AiBase提要:】

🎨 制作过程包括绘制5000张图和投入10天时间

🎬 预告片发布后获得86万次播放和2.8万点赞

🔥 使用工具:Midjourney、Supir、Dreamina、PixVerse、Topaz Video

详细内容:https://www.chinaz.com/2024/0403/1607805.shtml

抖音AI绘画特效out了!PS2风格AI滤镜风靡网络 真人一秒变游戏NPC

image.png

【AiBase提要:】

⭐ PS2风格AI滤镜风靡网络,让真人一秒变游戏NPC。

⭐ AI滤镜通过深度学习和图像识别技术实现PS2经典游戏风格转换。

⭐ AI滤镜提供新颖、简单的创作方式,增强社交媒体互动乐趣。

详细内容:https://www.chinaz.com/2024/0403/1607802.shtml

🤖📱💼AI应用

AI影视创作工具Dream Factory :想法秒变微电影,可长达数十分钟

image.png

【AiBase提要:】

⭐️ 创新应用多模型智能体协作技术,让一句话变成完整剧本和视频

⭐️ Dream Factory 产品实现多情节、多场景的 “微电影” 视频生成

⭐️ 通过 AI 重新定义视频制作,让每个人都能一键式制作微电影

产品入口:https://top.aibase.com/tool/dreamfactory

AI人声合成引擎ACE Studio 可修改Suno生成的音乐甚至替换歌手的声音

6384767036105528006088987.png

【AiBase提要:】

⭐️ ACE Studio是先进的AI人声合成引擎,创造自然感情丰富的真人歌声

⭐️ 利用最前沿AI技术,支持多语言AI歌手,提供免费商业使用权

⭐️ 可修改Suno生成的音乐,分离原歌曲的人声与伴奏,合成新的人声

产品入口:https://top.aibase.com/tool/ace-studio

使用教程:https://qqi2gjmnk4.feishu.cn/wiki/Eua1waVUqixSH4kuY0CceCz9nEb?fromScene=spaceOverview

南洋理工推动画自动填色技术BasicPBC 动画制作效率大大提高

image.png

【AiBase提要:】

⭐️ 线条图动画自动填色技术BasicPBC大幅简化制作流程

⭐️ 只需手动彩色化一帧,算法自动传播颜色到所有帧

⭐️ 提高动画质量、观感,节省制作时间和人力

项目地址:https://github.com/ykdai/BasicPBC

项目演示页面:https://top.aibase.com/tool/learning-inclusion-matching-for-animation-paint-bucket-colorization

Make-It-Vivid:通过文字描述生成3D卡通动画角色

image.png

【AiBase提要:】

⭐️ 该项目致力于从文本指令自动生成卡通角色的纹理设计。

⭐️ 通过 UV 空间中的文本生成高质量的纹理贴图。

⭐️ 实验表明该方法优于当前方法,可实现高效角色着色和信实的生成。

项目入口:https://top.aibase.com/tool/make-it-vivid

EMAGE:上传音频就能生成全身动作 包括头部、嘴型、身体运动

【AiBase提要:】

⭐️ 引入了新的全面共话数据集 BEATX,结合 MoShed SMPLX 身体与 FLAME 头部参数,提高了建模质量。

⭐️ 利用掩码手势先验信息进行训练,采用 Masked Audio Gesture Transformer 实现音频到手势生成。

⭐️ 可实现上传音频生成全身动作,包括头部、嘴型、身体、手部和整体运动。

项目入口:https://top.aibase.com/tool/emage

在线体验:https://huggingface.co/spaces/H-Liu1997/EMAGE

————

每日midjourney prompt:街拍美女

4_1712123657062_ai2023_street_style_photo_of_A_beautiful_Chinese_Girl_wearing_a_66973c5a-1b71-4261-8b12-9ac25f3e8dc9.png

图源备注:图片由AI生成,图片授权服务商Midjourney

street style photo of A beautiful Chinese Girl wearing a white shirt with a Black short leather skirt,full bodyshot, natural lighting, soho, shot on Agfa Vista200,4k --ar 3:4

一个美丽的中国女孩穿着白色衬衫配黑色皮短裙的街头风格照片,全身照,自然光照,soho,在Agfa Vista200上拍摄,4k

举报

  • 相关推荐
  • 大家在看
  • SignLLM:首个多语种手语生成模型,优化手语翻译与教学。

    SignLLM是首个多语种手语生成模型,它基于公共手语数据构建,包括美国手语(ASL)和其他七种手语。该模型能够从文本或提示生成手语手势,并通过强化学习加速训练过程,提高数据采样质量。SignLLM在八种手语的生产任务上都达到了最先进的性能。

  • InstructAvatar:文本引导的情感和动作控制,生成生动的2D头像

    InstructAvatar是一个创新的文本引导方法,用于生成具有丰富情感表达的2D头像。该模型通过自然语言接口控制头像的情感和面部动作,提供了细粒度控制、改进的交互性和对生成视频的泛化能力。它设计了一个自动化注释流程来构建指令-视频配对的训练数据集,并配备了一个新颖的双分支扩散基础生成器,可以同时根据音频和文本指令预测头像。实验结果表明,InstructAvatar在细粒度情感控制、唇同步质量和自然度方面均优于现有方法。

  • AnyNode:ComfyUI的节点,能够根据用户指令生成任何类型的输出。

    AnyNode是一个为ComfyUI设计的插件,它利用LLMs(大型语言模型)的能力,根据用户的输入生成所需的输出。它支持使用OpenAI API或本地LLMs API,允许用户通过简单的配置和指令,实现复杂的编程任务,无需编写代码。该插件的主要优点包括易用性、灵活性和强大的功能,能够显著提高开发效率,尤其适合需要快速原型开发和自动化任务的开发者。

  • FlashRAG:高效的检索增强生成研究工具包

    FlashRAG是一个Python工具包,用于检索增强生成(RAG)研究的复现和开发。它包括32个预处理的基准RAG数据集和12种最先进的RAG算法。FlashRAG提供了一个广泛且可定制的框架,包括检索器、重排器、生成器和压缩器等RAG场景所需的基本组件,允许灵活组装复杂流程。此外,FlashRAG还提供了高效的预处理阶段和优化的执行,支持vLLM、FastChat等工具加速LLM推理和向量索引管理。

  • MusicGPT:在本地使用 LLMs 根据自然语言提示生成音乐。

    MusicGPT 是一款允许在任何平台上以高性能方式在本地运行最新音乐生成 AI 模型的应用程序。它支持文本条件音乐生成、旋律条件音乐生成以及不确定长度 / 无限音乐流。产品优势在于无需安装重型依赖如 Python 或机器学习框架,能够本地运行 AI 模型,提供自然语言提示生成音乐的功能。

  • AI Menti Builder:AI驱动的快速演示文稿制作工具

    AI Menti Builder是一个在线工具,它利用人工智能技术帮助用户快速创建演示文稿。这个工具能够根据用户输入的主题,即时生成一个可交互的演示文稿草稿,用户可以根据自己的需求进行调整和完善。它适用于团队会议、研讨会、讲座、调查、趣味测验等多种场合,大大减少准备时间,提高效率。

  • Copilot for Telegram:Telegram上的AI伴侣,智能聊天新体验。

    Copilot for Telegram是由微软推出的一款AI聊天助手,它通过GPT技术为用户提供智能聊天体验。用户可以与Copilot进行无缝对话,获取信息,享受更智能的聊天体验,所有这些功能都集成在Telegram应用中。Copilot for Telegram的主要优点包括提供个性化建议、娱乐内容、生活小贴士等,旨在提高用户的社交互动质量。

  • 一设MJ咒语解析:反向解析AI提示词的效率工具

    MJ咒语解析是一个专注于设计领域的工具,它能够帮助用户根据图片和绘画反向解析AI提示词,从而提高设计工作的效率和质量。该工具的背景信息表明,它是由一群对AI技术在设计领域应用充满热情的开发者所创建,旨在解决设计师在创作过程中遇到的提示词难题。

  • Marlee:AI协作与绩效助手,提升团队协作与个人发展。

    Marlee是一款致力于提升团队协作和个人绩效的AI工具。它通过个性化洞察,帮助团队成员在工作流程中相互促进,提供连接、激励、协作和发展的解决方案。Marlee利用科学支持的问题和分析,以高达98%的可靠性度量48种工作动机,帮助团队成员感到被看见和接受,从而在工作中展现最佳状态。此外,Marlee还提供人才招聘、人才发展、解决冲突、团队绩效和沟通等方面的帮助,以及在并购中预测文化协同的可能性。

  • Rehance:提升SaaS产品生产力的AI助手

    Rehance是一个AI助手插件,旨在为SaaS产品提供自动化任务执行和问题解答功能,帮助用户提高工作效率,简化复杂操作,并提供使用数据以优化产品。

  • HyperCrawl:专为LLM和RAG应用设计的高效网络爬虫

    HyperCrawl是第一个为LLM(大型语言模型)和RAG(检索增强生成模型)应用设计的网络爬虫,旨在开发强大的检索引擎。它通过引入多种先进方法,显著减少了域名的爬取时间,提高了检索过程的效率。HyperCrawl是HyperLLM的一部分,致力于构建未来LLM的基础设施,这些模型需要更少的计算资源,并且性能超越现有的任何模型。

  • 2D to 3D Image Converter:快速将2D图像转换为3D,开启全新的视觉体验和无限可能性。

    Stylar AI的2D to 3D Image Converter是一个强大的图像转换工具,它利用先进的Image-to-Image技术,将平面2D图像转换为3D图像。这款工具提供高质量的图像转换和多种风格选项,能够满足用户对图像进行3D化的需求。产品的主要功能包括上传图片、选择3D效果、下载3D创作等。它还提供了多种3D风格,如3D卡通效果、3D艺术作品等,以及将草图转换为3D设计的功能。

  • ComfyUI ProPainter Nodes:ComfyUI 实现的 ProPainter 框架用于视频修补。

    ComfyUI ProPainter Nodes 是基于 ProPainter 框架的视频修补插件,利用流传播和时空转换器实现高级视频帧编辑,适用于无缝修补任务。该插件具有用户友好的界面和强大的功能,旨在简化视频修补过程。

  • Play It, Say It:个人语言教练,助你像母语者一样发音。

    Play It, Say It 是一款结合了尖端AI技术和用户友好设计的个人语言教练APP,为初学者和多语言者提供全面的学习体验。通过真实生活例句、母语者发音、录音对比和无限学习等功能,帮助用户提高语言技能,实现流畅沟通。

  • What The Product:Chrome扩展,一键获取产品洞察

    What The Product是一款Chrome浏览器扩展,利用OpenAI ChatGPT技术,为用户提供对任何网站或产品的即时洞察。用户只需一键点击,即可生成详尽的报告,帮助用户评估新产品和网站。该插件免费使用,无需注册或登录,安装后即可立即使用。

  • All in AI:探索最佳的AI产品和工具

    All in AI是一个集合了多种AI产品和服务的平台,旨在帮助用户发现包括人工智能、大型模型学习、生成工具等在内的最佳AI产品和工具。平台提供了从图像生成、聊天机器人、文本写作到视频创作、代码辅助、设计辅助、教育学习、音乐生成等多种AI应用的导航和工具目录。

  • BestBlogs.dev:为开发者提供高质量编程、AI等领域阅读体验

    BestBlogs.dev 是一个专注于编程、人工智能、产品设计、商业科技及个人成长领域的阅读平台。它通过先进的语言模型,为开发者提供智能摘要、精准评分与多语言辅助,帮助用户高效过滤信息噪音,节约时间,实现技术与认知的双重飞跃。

  • Forloop:无需编码即可快速收集和自动化数据流程。

    Forloop是一个易于使用的AI工具,专为快速增长的数据团队设计,用于数据准备和管道管理。它支持从各种数据源创建管道,如数据仓库、存储和驱动器。无代码环境允许数据科学家独立于DevOps团队工作,主要针对AI初创公司和拥有机器学习产品的公司。

  • Make-An-Audio 2:基于扩散模型的文本到音频生成技术

    Make-An-Audio 2是一种基于扩散模型的文本到音频生成技术,由浙江大学、字节跳动和香港中文大学的研究人员共同开发。该技术通过使用预训练的大型语言模型(LLMs)解析文本,优化了语义对齐和时间一致性,提高了生成音频的质量。它还设计了基于前馈Transformer的扩散去噪器,以改善变长音频生成的性能,并增强时间信息的提取。此外,通过使用LLMs将大量音频标签数据转换为音频文本数据集,解决了时间数据稀缺的问题。

  • llama-fs:自组织文件系统,智能管理文件

    LlamaFS是一个自组织文件管理器,它基于文件内容和已知约定(例如时间)自动重命名和组织文件。支持多种文件类型,包括通过Moondream处理的图片和通过Whisper处理的音频文件。它有两种运行模式:批量处理(批处理模式)和交互式守护进程(监视模式)。在监视模式下,LlamaFS启动守护进程监视目录,拦截所有文件系统操作,使用最近的编辑上下文主动学习和预测您如何重命名文件。此外,它还具有“隐身模式”的切换功能,允许通过Ollama而不是Groq路由每个请求,以确保隐私。

今日大家都在搜的词: