首页 > AI头条  > 正文

Adobe推新AI音频具Sketch2Sound ,只需哼唱和模仿声音就能创建音效

2024-12-23 09:48 · 来源: AIbase基地

近日,Adobe Research 与西北大学合作开发了一款名为 Sketch2Sound 的人工智能系统,这一工具有望彻底改变声音设计师的工作方式。Sketch2Sound 能够让用户通过哼唱、模仿声音以及用简单的文本描述来创建专业的音效和氛围音。

这个系统分析了用户声带输入的三个关键要素:音量、音色(决定声音的明亮或阴暗)和音高。随后,它将这些特征与用户的文本描述相结合,从而生成所需的声音。例如,用户在输入 “森林氛围” 并发出短促的声响时,系统会自动将这些声响识别为鸟鸣,而无需具体的指令。

image.png

Sketch2Sound 的另一大亮点在于它对上下文的理解能力。在制作音乐时,用户可以输入 “低音鼓、军鼓”,并通过哼唱出节奏。系统会智能地将低音鼓放在低音音符上,而军鼓则置于高音音符上。这种智能化的处理大大简化了声音设计的过程。

为了满足专业人士的需求,研究团队还内置了特殊的过滤技术,使用户可以根据需要调整生成声音的精确度。声音设计师可以选择非常准确的控制,或是更放松、近似的方式,这种灵活性可能使 Sketch2Sound 特别受 Foley 艺术家的欢迎。这些专业人士负责为电影和电视节目创作音效,使用这一工具后,他们可以通过声音和文本描述更快速地创造效果,而不必再操控实物来发声。

虽然研究人员指出,输入录音中的空间音频特性有时会对生成的声音产生不良影响,但他们正在努力解决这个问题。目前,Adobe 尚未宣布 Sketch2Sound 是否会推出商业产品或具体的发布时间。

项目入口:https://hugofloresgarcia.art/sketch2sound/

划重点:

🎵 Sketch2Sound 是一个新开发的 AI 工具,能通过哼唱和文本描述来创建音效。  

🔊 该系统分析音量、音色和音高,将用户的声音输入与文本结合生成目标音效。  

🎬 特别适合 Foley 艺术家使用,能够快速生成影视音效,提升工作效率。  

  • 相关推荐
  • 还原世俱杯真实声音!东芝电视Z700QF“火箭炮SOUND”带你如临赛场

    东芝电视旗下高端品牌REGZA在世界杯赛场亮相,通过"看球就选REGZA电视"广告语传递对全球球迷的承诺。作为日本市场占有率第一的品牌,REGZA首次赞助世界杯赛事。其最新旗舰产品Z700QF搭载革命性火箭炮SOUND音质技术平台,采用独家BRα芯片支持8声道独立驱动发声,配合杜比认证5.1.2声道音响系统,能精准还原赛场人声、背景声等细节。同时配备专业独立画质芯片,通过�

  • 「6月27日AI日报」腾讯开源轻量级混元-A13B模型;可灵AI推“视频音效”功能

    AI日报主要内容: 1. 腾讯开源混元A13B模型,采用MoE架构,总参数量800亿,激活参数130亿,支持低端GPU部署 2. 可灵AI推出"视频音效"功能,实现所见即所听的沉浸体验 3. Black Forest开源图像编辑模型FLUX.1Kontext,支持消费级硬件运行 4. OpenAI发布Deep Research API新模型o3/o4-mini,支持自动化网页搜索和数据分析 5. 小米推出1999元起AI眼镜,集成拍摄、支付、音乐等功能 6. 迅雷推出下载MCP服务,一句话指令让AI自动完成下载任务 7. HeyGen推出AI视频Agent,几分钟内生成专业级视频内容 8. 谷歌开源端侧多模态大模型Gemma3n,手机也能运行云端AI性能

  • Adobe 终于发布了 Android 版 Photoshop,且目前免费

    继今年早些时候在 iPhone 上发布 Photoshop 移动版后,Adobe 承诺推出的 Android 版本终于来了……

  • 又是别人家!游戏巨头Nexon大手笔:免费送全体员工Switch2

    韩国游戏巨头Nexon宣布,将向全体员工发放任天堂Switch 2。 公司内部通知称:为了感谢员工的辛勤工作,并支持大家的休闲娱乐,我们决定向所有员工赠送任天堂Switch 2。” 这一决定是Nexon与员工工会Starting Point”在3月底达成的工资和集体谈判协议的一部分。 不过,由于全球对Switch2的高度关注,公司预计需要相当长的时间来确保和分发所需的全部数量。

  • 阿里巴巴发布全球首个胃癌影像筛查AI模型:CT就能识别早期胃癌

    浙江省肿瘤医院联合阿里巴巴达摩院,发布了全球首个胃癌影像筛查AI模型DAMO GRAPE。 该模型首次利用平扫CT影像识别早期胃癌病灶,并联合全国20家医院,在近10万人的大规模临床研究中大幅提升胃癌检出率。 相关论文在24日登上了国际顶级期刊《自然医学》(Nature Medicine)。 据国家癌症中心统计,我国每年新发胃癌约36万例,死亡26万例,死亡人数在所有恶性肿瘤中位列第�

  • Switch2加速器怎么选?奇游618日均4毛解锁3年极速联机

    奇游联机宝618推出Switch2加速方案:三年卡首单468元日均0.43元,两年卡388元史低价。三大亮点:1)长时效覆盖Switch2全生命周期,支持PC/手游多端加速;2)分享专属码组队可获30天时长;3)购卡抽免单,半价福利覆盖全档位。6.13-6.19活动期间,Switch玩家可囤加速套餐,日均不到0.5元享受极速联机体验,新机发售即享满血游戏体验。

  • Switch2全球开售 VITURE XR眼镜解锁135英寸大屏游戏新姿势

    6月5日任天堂Switch2全球发售,国内含税到手价4242.9元。京东预约量超40万,成为今年最受玩家追捧的游戏主机。VITURE Pro XR眼镜完美解决了Switch2大屏与便携不可兼得的痛点,仅77g重量支持135英寸巨幕显示,搭配13000mAh魔宝盒可提供20小时续航。首创双人同屏模式,支持独立巨幕视角,配合HARMAN虚拟环绕音响系统带来沉浸式体验。产品获SGS A+护眼认证,支持0-500度近视调节,并斩获多项国际设计大奖。作为Switch2终极外接方案,VITURE Pro以轻量化设计和创新功能重新定义了移动游戏体验。

  • AI日报:美团No Code平台免费开放;豆包App升级“一句话P图”功能;苹果Xcode 26内置ChatGPT等AI功能

    本文介绍了AI领域多项重要进展:1)美团推出No Code平台和1680个AI应用;2)豆包App升级"一句话P图"功能;3)苹果发布内置ChatGPT的Xcode26开发工具;4)iOS26新增视觉智能功能;5)讯飞星火X1升级版即将发布;6)比亚迪接入阿里通义大模型;7)DeepSeek支持本地工具调用;8)开源框架Rowboat支持快速构建智能助手;9)X平台整合Grok AI优化内容推荐;10)港科大开发进化搜索技术提升小模型图像生成能力;11)硅基流动完成数亿元融资;12)港大与英伟达合作开发新型视觉注意力机制。这些创新展示了AI技术在各领域的快速发展和应用突破。

  • AI日报:月之暗面首款自主智能体Kimi-Researcher;MiniMax推音色设计功能;Jaaz发布Lovart AI本地化替代品

    【AI日报】今日AI领域重要动态:1)月之暗面发布Kimi-Researcher智能体,多轮搜索推理能力超越谷歌和OpenAI同类产品;2)MiniMax推出Voice Design功能,支持多语言/音色组合;3)火山引擎上线AI智能域名推荐功能;4)Anthropic强化VSCode集成;5)Google推出Gemini2.5Flash-Lite模型,可实时生成交互界面;6)苹果拟300亿美元收购AI公司Perplexity;7)月之暗面开源Kimi-2506多模态模型;8)Firecrawl将推出开源问答引擎Fireplexity;9)银河通用机器人获宁德时代10亿元融资;10)字节跳动发布DreamActor-H1视频生成系统;11)Google推出开源实时音乐生成模型Magenta RealTime;12)开源AI设计工具Jaaz发布。

  • AI营销席卷中东,Infinix和Snapchat首个AI营销合作如何在当地实现破圈?

    开年以来,AI 图片赛道迎来一轮小高潮。今年3月,在我们统计的月访问量超200万的 Web 端 AI 图片产品中,有45款产品访问量呈现环比上涨,最高增幅超过600%。这些爆款背后的共同特征,是一股席卷社交平台的“吉卜力风”。 回顾2022年至今几轮 AI 爆款产品(如 Lensa、妙鸭相机、黏土滤镜、吉卜力),其流量爆发的逻辑始终贯穿着四大共性:操作门槛极低、个性表达鲜明、用户�

今日大家都在搜的词: