首页 > 业界 > 关键词  > 正文

EMO终于来了!通义APP推出照片唱歌功能:所有用户可免费使用

2024-04-25 19:56 · 稿源: 快科技

EMO AI现已登陆通义APP,免费开放给所有用户!

只需使用AI模型,就能轻松合成视频,让照片中的人开口唱歌或说话。无论是奥黛丽赫本演唱经典歌曲,还是陶俑仕女说唱嘻哈,甚至是爱因斯坦讲述中文笑话,一切皆有可能。

通过通义APP中的“全民舞台”频道,即可进入EMO产品页面“全民唱演”。从预设模板中选择歌曲、流行语或表情包,上传肖像照片,EMO即可瞬间生成视频。

目前,通义APP提供80多个EMO模板,涵盖热门歌曲、网络热梗等。用户可自由选择,创造个性化视频。

值得注意的是,目前通义APP仅支持使用预置音频合成视频,暂不支持用户自定义音频。

EMO是通义实验室研发的AI模型,采用了业界领先的弱控制设计,无需繁琐的3D建模,即可让肖像开口说话。不仅降低了视频生成成本,更提升了视频质量。

EMO能精准捕捉并编码人类表达情绪的能力,将音频内容与人物的表情、嘴型完美匹配。同时,还能将音频的语气和情绪色彩反映到人物微表情上。

今年2月,通义实验室公布相关论文,EMO迅速成为继SORA之后最受欢迎的AI模型之一。现在,通过通义APP,所有人都能免费体验这一前沿模型的创造力。

未来,EMO技术有望广泛应用于数字人、教育、影视、陪伴和直播等领域。

值得一提的是,通义APP不断推出爆款应用,如全民舞王”,曾引发社交平台热潮。背后的模型Animate Anyone同样出自通义实验室。

此外,通义APP还提供了超长文档解析、AI编码助手、AI会议助手等实用功能。通义大模型正逐渐成为用户不可或缺的超级AI助手。

举报

  • 相关推荐
  • 字节跳动发布 Seedream 4.0 图像创作模型,豆包App可免费体验

    字节跳动Seed团队推出豆包图像创作模型Seedream4.0,支持文生图、图像编辑及多图参考等功能,在专业评测中达到业界领先水平。该模型已上线豆包App、即梦AI等平台供用户免费体验,并通过火山引擎开放给企业客户。Seedream4.0具备多模态创意能力,可生成4K分辨率商用图像,适用于教育、电商、广告设计等场景。团队表示将持续探索实时交互生成体验,深度融合多模态推理与世界知识。

  • 基于通义万相 美图多款APP上线全新动漫特效、AI变身等视频生成功能

    今日,美图公司旗下美图秀秀、RoboNeo、Wink和开拍等多款产品,推出全新动漫特效、AI变身等视频生成功能。 据悉,新功能基于通义万相系列模型进行深度开发与训练,为美图的全球用户提供全新的创作体验。 近年来,美图加速布局生产力场景,不仅推出面向企业的AI算法服务和解决方案,旗下消费级产品也在快速集成大模型。 去年6月,美图就开始和阿里展开大模型合作。

  • 睡眠APP测评:谁能真正改善你的睡眠

    睡眠问题已成为全球健康难题,2021年中国超3亿人存在睡眠障碍。文章评测六款主流睡眠APP(AutoSleep、小睡眠、蜗牛睡眠、天悦康康、熊猫睡眠和潮汐),从监测技术、睡眠功能、数据分析、收费模式、用户体验和改善效果等维度进行深度测评。结果显示,依赖手机传感器或麦克风的应用虽便捷但准确性受限;结合智能穿戴设备的APP能提供更专业的睡眠分析和针对性改善方案。用户可根据自身需求,选择精准改善睡眠结构或仅作放松辅助的应用。

  • 苹果Apple Watch高血压通知功能上线

    苹果公司宣布将在全球150多个市场推出Apple Watch高血压通知功能,该功能将随watchOS 26和iOS 26系统更新正式推送。目前英国、法国、德国等地区用户已可体验,但加拿大等部分市场尚未开放,中国大陆地区仍需等待监管审批。该功能依托光学心率传感器,可实时监测用户血管对心跳的反应,识别慢性高血压迹象,并在检测到异常时发出提醒。系统会分析用户最近30天的数据,通过先进算法判断是否需要发出通知。

  • 苹果iOS 26普通照片秒变3D照上热搜 “空间场景”功能引热议

    苹果正式推送iOS 26系统,支持iPhone 11及以上机型。新系统引发用户吐槽,如LiquidGlass设计被指“丑出新高度”,升级后出现发烫、卡顿等问题。但“空间场景”功能广受好评,可将普通照片转换为裸眼3D效果,操作便捷,还能设为动态壁纸。不过该功能在不同屏幕上的表现存在差异,低刷屏会出现卡顿,高刷屏则效果更流畅逼真。

  • 预见到达!快递100以分钟级预测诠释国民 APP级核心价值

    自2007年智能手机兴起,移动互联网已走过18年。快递100作为一站式快递物流信息服务平台,连接全球3031家快递公司,提供实时查询与智能时效预估。通过221次迭代升级,实现分钟级预测和小时级确定性。2025年品牌升级为全球快递物流一站式数智服务平台,覆盖国内外主流及区域配送服务。利用AI+Data构建中国首个快递物流网络数智图谱,提供智能物流预测和异常提醒,持续优化用户体验,成为国民生活中不可或缺的应用。

  • 小米发布17 Pro/Pro Max「妙享背屏」功能演示视频

    今日小米官方又晒出了小米17Pro/Pro Max上背屏功能的精彩演示。 小米17Pro/Pro Max所搭载的这块背屏尺寸颇大,正因如此,其展示内容极为丰富。从各种风格的时间样式,到灵动鲜活的动态壁纸,再到可爱的卡通人物与动物形象,一应俱全。 不仅如此,它还具备无限屏模式,预计还能实现自定义显示图片、动图等效果,与小折叠设备上的背屏用途基本一致。用户可借助徕卡三摄�

  • 在Soul App,真爱不必一年一度

    Soul App通过七夕节日背景,讲述多对情侣跨越地域与时间障碍,在平台上相遇相爱的真实故事。文章强调平台作为“永不消散的鹊桥”,帮助用户实现灵魂匹配,让爱情不再受限于传统的一年一会。案例包括异地情侣通过诗歌、日常分享和共同成长最终走向婚姻,体现现代年轻人对真诚、平等与长期关系的追求。平台不仅缓解婚恋困境,更激发人们勇敢去爱、坚定相守的力量。

  • “Nerd之王”做的App,不到一个月登顶美国总榜

    本周,一款名为 Focus Friend 应用冲榜,笔者撰稿期间看着其先后超过 Grok、Google、ChatGPT,登顶美国 iOS 下载总榜。

  • AI日报:快手推出AI视频制作助手Kwali;字节跳动推出USO模型;OpenAI推出ChatGPT开发者模式

    本文介绍了AI日报栏目,聚焦AI领域最新动态。快手推出Kwali视频助手,简化视频制作流程;字节跳动发布USO模型,解决图像生成中风格与主题的矛盾;微软推出Copilot Audio音频模式,提供个性化语音交互;Stability AI升级Stable Audio 2.5,支持高质量音频生成;阿联酋推出开源大模型K2 Think,拥有320亿参数;微信上线智能回复功能,提升公众号运营效率;OpenAI推出ChatGPT开发者模式,支持AI控制外部工具;字节跳动Seed团队发布AgentGym-RL框架,提升语言模型决策能力;月之暗面开源Checkpoint Engine中间件,优化LLM推理效率;B站开源IndexTTS-2.0文本转语音系统,支持情感与时长控制;Replit推出Agent 3编程助手,自主性提升10倍。

今日大家都在搜的词: