首页 > 业界 > 关键词  > 人工智能最新资讯  > 正文

英伟达展示AI模型Fugatto:可修改并生成新声音

2024-11-26 10:16 · 稿源: 快科技

英伟达推出 Fugatto,一款突破性的 AI 音乐生成器

Fugatto 是一款由英伟达开发的创新 AI 模型,它可以改变音频并产生新的音频。Fugatto 与传统 AI 模型不同,它不仅可以分析现有的声音,还可以灵活地修改它们。

例如,Fugatto 可以将钢琴伴奏的旋律无缝地转换成动人的歌声,也可以调整口语录音中的口音和情感。这种音频转换能力以前是无法实现的。

虽然英伟达目前没有将 Fugatto 公之于众的计划,但它的合成音频潜力正在引发业界的热烈讨论。然而,AI 音频生成也带来了挑战,例如防止误导性信息和版权侵权。

其他科技巨头,如 OpenAI 和 Meta,也正在开发类似的模型。他们何时会发布这些模型尚不清楚,但它们可能会对音频创作产生重大影响。

举报

  • 相关推荐
  • GhibliTattoo发布!AI纹身生成,吉卜力风格专属定制!

    这款工具专为吉卜力粉丝、纹身爱好者与创意设计师打造。通过文本提示或图片上传,即可生成高分辨率、透明背景的吉卜力风格纹身设计……

  • 英伟达重夺全球市值第一头衔 再度超越微软

    去年6月19日,英伟达股价曾以135.58美元创下历史新高,当时总市值达3.335万亿美元,一举超越微软和苹果,首次登上全球市值最高上市公司的宝座。此后,在全球市值排名中,英伟达与苹果、微软展开激烈角逐,三者轮番登顶。上一次英伟达成为市值最高的公司是在今年1月24日。 从英伟达自身的财务表现来看,其业绩也相当亮眼。根据英伟达2026财年第一季度财报,该季度公司

  • AI机器人赛道竞速,英伟达/微美全息GPU+AI全栈布局双轮驱动产业化浪潮!

    英伟达CEO黄仁勋在Computex2025电脑展发表主题演讲,宣布公司转型为AI基础设施提供商。重点展示了四大方向:消费级RTX显卡、B300服务器芯片、Omniverse软件平台及自动驾驶/机器人技术。推出全新GB300 Blackwell Ultra AI平台,提升训练和推理能力。黄仁勋强调机器人技术将引领下一场工业革命,推出Isaac GR00T机器人开发平台和Jetson Thor处理器。摩根士丹利预测人形机器人市场规模将达60万亿美元,中国到2050年市场规模或达6万亿元。微美全息等企业正加速布局该领域,通过AI视觉、自然语言处理等技术提升机器人环境感知与决策能力。黄仁勋指出智能体(Agent)、模型(Model)和机器人(Robot)将成为未来十年技术话语权争夺的关键。

  • 如何辨别AI生成的图片文字声音?分享一些小技巧

    在人工智能生成内容日益普及的今天,辨别AI生成的图片、文字和声音变得尤为重要。以下是一些实用的技巧,希望能帮到你……

  • 英伟达纵深扩展量子计算版图,微软/微美全息共发力奔赴技术革命新征程!

    英伟达CEO黄仁勋在COMPUTEX2025发表主题演讲,宣布推出企业AI计算平台NVIDIA RTX PRO服务器,搭载RTX PRO6000 Blackwell GPU,专为驱动AI工厂和加速企业AI工作负载设计。同时英伟达布局量子计算,设立全球量子AI技术研发中心G-QuAT,并投资量子计算初创公司PsiQuantum。微软宣布将后量子密码学技术整合到Windows系统,谷歌高管预测量子计算应用或将在五年内实现。微美全息作为量子产业先锋,通过量子计算与AI超算融合实现技术突破。全球科技巨头正加速布局量子计算领域,英伟达引领AI产业向纵深发展,在新竞争格局下进军量子计算,押注下一代技术浪潮。

  • 英伟达最新高算力芯片上车 雷军:小米YU7全系标配激光雷达

    5月22日,小米正式发布YU7智能汽车,全系标配激光雷达和4D毫米波雷达。新车搭载第三代骁龙8移动平台,采用4nm工艺,显著提升运行速度,OTA升级最快仅需15分钟。配备英伟达Thor计算平台,算力达700TOPS,支持大模型上车。激光雷达探测距离200米,暗光环境下性能更强,能精准识别异形障碍物。同时应用ALD镀膜技术摄像头,有效减少眩光干扰,提升雨雾天气行车安全,实现更智能的辅助驾驶体验。

  • OTTO逆势破圈!店小秘ERP助力卖家玩赚下半年旺季大促

    德国电商巨头OTTO在2024财年实现逆势增长,GMV达70亿欧元同比增长9%,活跃用户超1200万。平台聚焦家居、电子、户外等品类,拥有520万种商品,入驻卖家需通过严格审核。随着德国购物季临近,预计黑五期间销售额将达59亿欧元。OTTO平台以高端消费群体为主,客单价较高,但入驻门槛严格,要求卖家提供欧盟税号、CE认证等资质。店小秘ERP近期接入OTTO平台,支持批量打单发货,帮助卖家提升旺季运营效率。平台采用透明收费模式,月租39.9欧元,佣金7%-18%。

  • Meta AI新增生成式AI视频编辑功能:秒换服装、场景

    Meta 宣布,将在Meta AI应用、Meta.AI网站和Edits应用上推出一项生成式AI视频编辑功能。 用户可通过50多种预设AI提示词,一键实现视频中服装、场景、光影等元素的智能变换。 Meta称,全新的AI视频编辑功能直观易用,用户无需任何视频编辑专业知识即可制作高质量的视频。首先,用户可将视频上传到Meta AI应用、Meta.AI网站或

  • AI日报:GPT-4.1正式上线ChatGPT;阿里通义万相Wan2.1-VACE开源;可灵大模型视频生成量约占30%份额

    本文报道了AI领域最新动态:1)阿里通义万相开源视频编辑统一模型VACE;2)OpenAI发布GPT-4.1增强编码能力;3)Stability AI推出超轻量341M文字转语音模型;4)快手可灵视频生成模型占据30%市场份额;5)微软WizardLM团队整体加入腾讯混元大模型研发体系;6)腾讯宣布混元图像2.0将于5月16日发布;7)上海成立人工智能标识生态联盟;8)Lightricks发布13B参数视频生成模型LTX-Video;9)谷歌DeepMind推出AlphaEvolve优化AI训练速度;10)腾讯元宝浏览器插件上线Chrome平台。这些进展展示了AI技术在视频处理、大模型、语音合成等领域的快速发展。

  • Anthropic首席执行官:AI 模型的“幻觉”比人类少!

    Anthropic 首席执行官达里奥·阿莫代伊(Dario Amodei)表示,他认为当前的 AI 模型出现“幻觉”(即编造虚假事实并将其当作真实信息呈现)的频率,比人类还要低……