首页 > 业界 > 关键词  > 正文

EMO终于来了!通义APP推出照片唱歌功能:所有用户可免费使用

2024-04-25 19:56 · 稿源: 快科技

EMO AI现已登陆通义APP,免费开放给所有用户!

只需使用AI模型,就能轻松合成视频,让照片中的人开口唱歌或说话。无论是奥黛丽赫本演唱经典歌曲,还是陶俑仕女说唱嘻哈,甚至是爱因斯坦讲述中文笑话,一切皆有可能。

通过通义APP中的“全民舞台”频道,即可进入EMO产品页面“全民唱演”。从预设模板中选择歌曲、流行语或表情包,上传肖像照片,EMO即可瞬间生成视频。

目前,通义APP提供80多个EMO模板,涵盖热门歌曲、网络热梗等。用户可自由选择,创造个性化视频。

值得注意的是,目前通义APP仅支持使用预置音频合成视频,暂不支持用户自定义音频。

EMO是通义实验室研发的AI模型,采用了业界领先的弱控制设计,无需繁琐的3D建模,即可让肖像开口说话。不仅降低了视频生成成本,更提升了视频质量。

EMO能精准捕捉并编码人类表达情绪的能力,将音频内容与人物的表情、嘴型完美匹配。同时,还能将音频的语气和情绪色彩反映到人物微表情上。

今年2月,通义实验室公布相关论文,EMO迅速成为继SORA之后最受欢迎的AI模型之一。现在,通过通义APP,所有人都能免费体验这一前沿模型的创造力。

未来,EMO技术有望广泛应用于数字人、教育、影视、陪伴和直播等领域。

值得一提的是,通义APP不断推出爆款应用,如全民舞王”,曾引发社交平台热潮。背后的模型Animate Anyone同样出自通义实验室。

此外,通义APP还提供了超长文档解析、AI编码助手、AI会议助手等实用功能。通义大模型正逐渐成为用户不可或缺的超级AI助手。

举报

  • 相关推荐
  • 苹果推出网页版App Store 浏览器即可使用

    苹果公司近日推出网页版App Store,用户无需依赖特定苹果设备,通过任意浏览器访问apps.apple.com即可浏览全平台应用。新版网页设计与原生App Store界面高度相似,功能丰富且交互流畅,取代了原先简单的登录页面。用户可通过左上角下拉菜单快速切换至iPhone、iPad等设备的专属应用页面,实现跨平台浏览。网页版完整移植了原生商店的“今日”标签页内容,包括编辑推荐、热门�

  • Sora App的AI视频社交,给了百度们新希望

    Sora2发布两周后,百度的蒸汽机AI视频模型,和谷歌Veo3.1撞了档期。 两家公司选择同期发布并非有多默契,而是Sora2带来的压迫感促使它们不得不加快脚步。 奥尔特曼将形容Sora2为“创意领域的ChatGPT3.5时刻”,不仅在物理逻辑、画面连贯性、真实感和音画同步等方面实现了质的飞跃,还把Sora从一个“文本到视频”的工具进化成一个“创意到生态”的平台。 这无疑是扔在AI视�

  • 苹果悄然在iOS 26.1中引入新功能:第三方App可以后台备份照片了!

    苹果在iOS 26.1中引入用户期待已久的后台自动备份照片功能,允许第三方应用在后台自动上传图像。此前,Google相册、OneDrive等应用因系统限制只能在应用活动时上传,导致备份中断、体验糟糕。新功能通过PhotoKit框架支持,引入后台资源上传扩展协议,确保应用未活动或设备锁定时也能持续上传。系统会控制功耗和网络访问以保障备份一致性和电池效率。开发者需完成配置扩展目标、处理上传任务等步骤来集成此功能,部分操作需用户明确同意。

  • 双11鸿蒙应用持续升级,小艺、应用市场等App让购物更省心

    双十一期间,华为应用市场推出"11.11好物集"专题,提供购物指南与达人穿搭参考,帮助用户高效筛选商品。鸿蒙系统的小艺助手支持商品比价、智能下单及多任务语音操作,简化购物流程。出境游用户可使用天际通流量服务,无需实体卡,按天计费;配合云空间自动释放本地存储,保障旅行照片视频安全同步。通过智慧功能与便捷服务,为用户打造更流畅、安全的消费与出行体验。

  • 饿了么APP更名为淘宝闪购 版本号升级至12.0.2

    饿了么App正式升级为淘宝闪购,版本号12.0.2,打通天猫旗舰店与饿了么货盘资源,推出“电商低至30分钟送达”极速服务,覆盖餐饮、3C数码、美妆等全品类商品。升级后与饿了么携手加大补贴力度,提供免单红包、免单奶茶、大额满减外卖券等超级权益,并加入今年天猫双11活动,88VIP用户可获红包惊喜、折上折等福利,提升消费者购物体验与实惠。

  • B站回应拉黑指定用户可屏蔽开屏广告:不实信息

    近日,“B站拉黑指定用户可屏蔽开屏广告”话题登上热搜。起因是网友发现B站疑似通过零等级、无头像的隐藏账号发布视频实现开屏广告投放,网上还流传一份“拉黑名单”。部分网友称实测有效,但经媒体实测发现该方法无效。B站官方回应称此说法为不实信息,提醒用户理性看待网络谣言,切勿相信和传播。

  • Soul App开源模型SoulX-Podcast登顶Hugging Face TTS趋势榜,AI语音对话再升级

    SoulX-Podcast语音生成模型在开源社区Hugging Face发布次日登顶TTS趋势榜。该模型由Soul AI Lab联合高校团队开发,专为多轮对话场景设计,支持中英川粤等多语言/方言与副语言风格,能生成超60分钟流畅自然、角色切换准确、韵律丰富的语音。它解决了传统语音系统在多轮对话中上下文衔接不自然、缺乏副语言控制能力等痛点,在播客、语音合成等场景表现突出,获开发者广泛关注。Hugging Face CEO也转发相关内容,团队未来将持续优化语音对话、拟人化表达等核心交互能力,深化开源生态建设。

  • 《命悬一生》豆瓣7.6,“迷雾剧场”这次终于支棱起来了?

    两年低谷期后,迷雾剧场终于凭借《命悬一生》多多少少找回了过去的“高光时刻”,重新支棱了起来。 单以豆瓣评分而言,该剧7.6的分数并不算太强,在角色复杂度、节奏舒适度、细节丰富度等层面,也与《隐秘的角落》《沉默的真相》等昔日神作相去甚远。但在今年华语悬疑剧里已足够排名前三,也是近期值得一看的佳作。

  • AI日报:Lovart AI上线“元素拆分”功能;Xcode 26.1.1发布;阿里云通义模型首次大规模赋能双11

    本期AI日报涵盖八大热点:Lovart AI推出"元素拆分"功能,实现海报智能分层编辑;苹果Xcode 26.1.1优化AI编码性能;阿里云通义模型双11单日翻译调用量突破14亿次;Gemini 3在历史手稿破译中展现专家级能力;德国法院裁定OpenAI使用歌词训练构成侵权;开源语音模型Maya1实现富有表现力的实时文本转语音;Meta首席AI科学家LeCun计划离职创办世界模型公司;AI专家罗福莉加入小米,将致力于构建物理世界智能。

  • 科大讯飞1024发布:讯飞翻译APP迭代焕新,同声传译+音视频翻译重构沟通体验

    在2025科大讯飞全球1024开发者节期间,讯飞翻译APP迎来关键升级,重点强化同声传译功能。通过搭载全新语音同传大模型,实现翻译更准、响应更快;新增实时分享、记录留存、悬浮字幕等特性,支持跨场景高效应用。该产品已在东盟博览会等国际场合验证实用性,结合IDC报告八大维度第一的权威背书,彰显了AI翻译技术从研发到落地的全链条优势,为跨语言沟通提供简单如母语的体验。

今日大家都在搜的词: