首页 > 业界 > 关键词  > 阿里云最新资讯  > 正文

阿里AI模型EMO免费上线通义APP 一张照片即可开口唱歌说话

2024-04-26 15:11 · 稿源:站长之家

站长之家(ChinaZ.com)4月26日 消息:阿里云宣布,EMO模型成功在通义APP中上线,并且完全开放给所有用户免费使用。

如今,在通义千问APP内,用户只需简单三步操作:选择模版、上传照片、生成视频,即可轻松实现照片中人物演戏唱歌的神奇效果。

通义APP首批上线了多达80个EMO模板,涵盖了热门歌曲、网络热梗等多种内容。用户可以选择预置的音频来生成视频,但目前暂不支持用户自定义音频。

微信截图_20240426151315.png

EMO模型是通义实验室精心研发的AI模型,其背后的肖像说话技术正是当前AIGC领域的热门话题。与传统的Talking Head技术相比,EMO模型采用了创新的弱控制设计,无需对人脸、人头或身体部分进行繁琐的3D建模,即可轻松驱动肖像开口说话。这不仅大大降低了视频生成的成本,还显著提升了视频的质量。

EMO模型具备强大的学习能力,能够编码人类表达情绪的能力。它能够将音频内容与人物的表情、嘴型精准匹配,甚至能将音频的语气特征和情绪色彩细腻地反映到人物的微表情上,使得生成的视频更加生动逼真。

自2月底通义实验室公布相关论文以来,EMO模型便受到了广泛关注,成为继Sora之后最受瞩目的AI模型之一。未来,EMO技术有望在数字人、数字教育、影视制作、虚拟陪伴、电商直播等众多领域发挥巨大潜力。

通义APP一直致力于为用户提供前沿模型的免费体验。除了EMO模型外,通义APP还推出了众多现象级应用,如“全民舞王”、“兵马俑跳科目三”、“金毛跳舞”等,这些应用背后的模型也均出自通义实验室。此外,通义APP还不断推出实用功能,如超长文档解析、AI编码助手、AI会议助手等,为用户提供全方位的超级AI助手服务。

体验地址:https://top.aibase.com/tool/tongyiqianwen

举报

  • 相关推荐
  • 完美收官!Yoosee 亮相阿里云通义智能硬件展

    2026年初,深圳阿里云通义智能硬件展上,Yoosee展示了其端云协同AI战略。通过星瀚AI大模型,Yoosee将传统监控从“被动提醒”升级为“主动理解”,用户可通过自然语言交互获取精准事件摘要。现场亮相的智能硬件,如AI观鸟器、低功耗摄像机等,均体现了软件定义摄像头的理念。Yoosee正从硬件销售转向“硬件+软件+云服务”的VSaaS模式,致力于成为AI视觉时代的“操作系统”提供商。

  • WhatsApp升级不再“二选一”:阿里云Chat App支持账号共存,手机聊天记录全保留

    阿里云Chat App消息服务宣布全面支持WhatsApp Business账号共存模式,解决了企业长期以来的痛点。过去,企业若将WhatsApp账号升级至API接口,手机端App的客户聊天记录将全部丢失。如今,通过阿里云Chat App,企业可让同一WhatsApp账号同时登录手机App和云端API,实现“人机协同”。销售团队可继续在手机端查看历史记录、回复客户;运营人员则能利用云端自动化工具进行群发或部署聊天机器人,提升效率。该功能无需复杂开发,几分钟即可完成配置,标志着企业WhatsApp营销进入高效运营新时代。

  • 死了么APP宣布改名:启用全球化品牌名Demumu

    “死了么”APP宣布将启用全球化品牌名Demumu。该应用专为独居人群设计,通过签到机制监测用户安全,若多日未签到将自动通知紧急联系人。目前仅iOS版售价8元,已登顶苹果工具类应用榜首。其独特功能获BBC报道,助力海外市场爆发增长。创始人透露,应用初期投入不足1500元,下载量增长约300倍。团队无意添加广告,计划融资50万美元推动发展。

  • AI日报:阿里云推多模态交互开发套件;智谱AI港股首日上市;混元发布 HY-Motion1.0开源3D 角色动画生成模型

    阿里云发布多模态交互开发套件,集成通义千问、万相、百聆三大模型,赋能智能硬件。腾讯混元推出开源3D角色动画生成模型HY-Motion 1.0,助力游戏与动画制作。智谱AI在港上市,募资43亿港元,加速商业化落地。抖音在深圳南山设立第二总部,聚焦AI与泛视频研发。OpenAI推出ChatGPT Health,强化健康数据管理与隐私保护。法拉第未来宣布进军具身智能机器人领域,推动汽车与机器人业务协同。蚂蚁阿福月活超3000万,AI健康赛道进入中美竞速新阶段。MiroThinker 1.5以300亿参数实现媲美万亿模型的性能,显著降低推理成本。

  • 千问APP与通义系列大模型,才是智能汽车的“黄金组合”

    近年来,车企普遍采用大模型提升智能座舱体验,但效果未达预期。行业共识是,仅接入大模型不够,需构建完整的场景化智能体验。阿里通义系列大模型能力领先,已服务超百万客户,成为众多车企开发智能座舱的首选。千问APP作为超级应用,整合阿里生态资源,能打通车载场景的各类需求,为用户提供端到端的智能服务。未来智能座舱的关键在于系统级玩家,能协同云端智能与生态,真正理解并减轻用户负担。

  • 苹果谷歌官宣合作:新一代Siri选定使用Gemini大模型

    苹果公司宣布将与谷歌展开深度合作,借助谷歌的人工智能技术为今年晚些时候推出的产品功能,尤其是Siri,提供强大的AI支持。 根据合作内容,谷歌将通过其先进的Gemini模型和成熟的云技术,为苹果未来的基础模型注入核心动力。苹果在官方声明中明确表示,经过审慎评估,谷歌的技术为苹果基础模型奠定了最为坚实的基础,公司对即将为用户带来的创新体验充满期待。

  • 苹果新一代Siri要来了!选定谷歌Gemini大模型提供支持

    苹果将与谷歌合作,为今年晚些时候推出的产品功能(如Siri)提供人工智能支持。 谷歌将通过Gemini模型和云技术,为苹果未来的基础模型提供动力。 苹果在声明中表示:经过仔细评估,我们认为谷歌的技术为苹果基础模型提供了最强大的基础,我们对它将为用户带来的创新体验感到兴奋。” 据悉,苹果拟每年支付谷歌约10亿美元,获取定制化Gemini模型使用权,核心版本为1.

  • AI日报:实时世界模型 PixVerse R1发布;Vidu发布AI一键生成MV功能;可灵AI ARR达2.4亿美元

    本期AI日报聚焦多项AI领域突破:爱诗科技发布全球首个通用实时世界模型PixVerse R1,实现虚拟世界实时交互;Vidu推出AI一键生成MV功能,打造“虚拟制片厂”;MiniMax发布编程智能体基准测试OctoCodingBench;快手可灵AI年化收入达2.4亿美元;智谱联合华为开源多模态模型GLM-Image,全链路跑通国产芯片;百川智能发布医疗大模型Baichuan-M3;谷歌重构电商未来,推出Agentic AI购物系统;谷歌开源医疗AI模型MedGemma 1.5与语音识别模型MedASR。

  • AI日报:字节推StoryMem系统;月之暗面再推多模态新模型;AI眼镜Pickle 1发布

    本期AI日报聚焦多项AI领域进展:字节跳动推出StoryMem系统,提升AI生成视频角色一致性28.7%;月之暗面计划2026年推出多模态模型K2.1/K2.5;智能眼镜Pickle 1实现“无限记忆”与主动交互;清华与OpenBMB开源音频模型评测框架UltraEval-Audio;OpenAI押注语音交互,整合团队重构音频系统;开源工具Antigravity支持多账号切换,突破AI使用限制;元象开源面向泛娱乐场景的大模型XVERSE-Ent;苹果回应“国行版AI功能阉割”传闻,提醒用户勿通过第三方强行激活。

  • 死了么APP付费人数翻200倍:活了么App也上线了

    一款名为死了么”的付费App走红网络,引发了年轻人对独居、孤独等话题的关注,短短两天就登上苹果应用商店付费榜第一的位置。 死了么”App创始人郭先生称,这几天付费人数翻了200倍,仍在持续增长,面对突如其来的泼天流量,郭先生称但没想到会这么火。

今日大家都在搜的词: