AI日报：阿里对口型视频项目EMO开启内测；苹果官宣端侧小模型OpenELM；Open-Sora偷偷升级；微信发布AI工具小微助手

2024-04-25 15:25 · 稿源：站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解：https://top.aibase.com/

1、阿里对口型项目EMO开启内测可将照片转为唱歌视频

阿里推出的对口型项目EMO开启内测，用户只需提供一张照片和语音模型即可定制数字人像，实现低成本高效率的数字人出镜体验。EMO模型具有简便操作、低成本、广泛适用性和自然表达等特点，通过强大的技术实现让用户体验到全新的数字人出镜体验。

【AiBase提要:】
🎤 简便操作: 用户只需提供一张照片和语音模型即可定制数字人像。
💰 低成本: EMO模型提供免费高效的解决方案，与其他产品相比成本更低。
🎨 广泛适用性: 不仅限于写实人像，还能生成3D模型和二次元漫画风格视频，满足不同用户需求。
内测申请地址:https://www.wjx.top/vm/exOVbr1.aspx#

2、苹果发布OpenELM小型AI模型

苹果发布了OpenELM，一系列小型AI模型，标志着公司在本地AI运行领域的重要进展。这些小型模型比大多数轻量级AI模型更小，适合在手机和笔记本等设备上运行。苹果暗示将AI引入iPhone等设备，展示了公司在人工智能领域的雄心。

【AiBase提要:】
⭐ OpenELM是一系列非常小的语言模型，在文本相关任务上表现高效。
⭐ OpenELM比大多数轻量级AI模型更小，分为不同规格，适合在各种设备上运行。
⭐ 苹果暗示AI功能将登陆公司设备，公司发布了多个AI模型，展示对AI领域的投入。
详情链接:https://top.aibase.com/tool/openelm

3、Open-Sora悄悄升级支持16秒视频生成和720p分辨率

Open-Sora项目在开源社区悄悄更新，新增支持长达16秒的单镜头视频生成和720p分辨率，提供了多种视频生成需求的解决方案。技术报告详细介绍了新功能和模型架构，对STDiT架构进行了关键性改进，提高了训练稳定性和性能。项目在多阶段训练方法和统一的图生视频/视频生视频框架方面取得了显著进展。

【AiBase提要:】
🚀 Open-Sora新增支持16秒视频生成和720p分辨率，满足多种视频生成需求。
🔬 技术报告详细介绍了新功能和模型架构，改进了STDiT架构提高了训练稳定性和性能。
💡 项目采用多阶段训练方法和统一的图生视频/视频生视频框架，实现高质量视频生成。
详情链接:https://top.aibase.com/tool/open-sora

4、比Gemini Pro1.5强！可解读视频的多模态模型 Pegasus-1公测

Pegasus-1是视频语言基础模型的升级版本，在多个任务中取得显著成就，刷新了视频理解标准。该模型具有约17亿参数，通过数据优化、视频处理和训练技术提升，提供卓越的视频理解和生成文本能力。

【AiBase提要:】
🌟 Pegasus-1在视频理解领域取得新突破，比Gemini Pro1.5强，表现卓越。
🌟 产品特色功能包括数据优化、视频处理提升和训练技术改进，为模型性能提供强大基础。
🌟 在基准测试中，Pegasus-1胜过谷歌Gemini Pro等现有模型，在视频问答、对话和摘要等任务中展现出卓越性能。
详情链接:https://top.aibase.com/tool/pegasus-1API

5、微信发布桌面效率AI工具小微助手

微信最近推出了名为“小微助手”的桌面AI效率工具，通过自然语言处理技术提升用户工作效率。这款工具支持Windows和Mac操作系统，具备灵活搜索功能、内置实用工具和指尖助手功能，以及圈子功能和支持的对话服务。

【AiBase提要:】
🔍 小微助手提供灵活搜索功能，支持自然语言搜索电脑中指定文件夹的内容。
🛠️ 内置实用工具包括微信翻译、剪贴板管理、JSON魔方和闪念胶囊，增强日常助手功能。
🤖 指尖助手功能允许用户快速访问预设的快捷操作，如文本翻译和文本收藏，支持功能自定义。
详情链接:https://top.aibase.com/tool/xiaoweizhushou
注：目前微信已经在官网关闭了下载链接（具体原因未知）

6、超真实的虚拟试衣软件IDM-VTON 连衣服的褶子都那么真实

IDM-VTON虚拟试衣技术引起广泛关注，细节处理精细，用户能真实感受衣物质感和设计。技术高度真实感，复杂背景处理，一致性保持，纹理与图案精确再现。应用于时尚零售、个性化设计、在线试衣间等领域，为消费者提供便捷试衣方式，为设计师和零售商提供新展示销售手段。

【AiBase提要:】
👗 技术高度真实感，细节精细，带来接近现实的试衣体验。
🌟 复杂背景处理，保持试穿效果高质量，适用不同场景。
🔄 一致性保持，展示同一服装在不同体型下效果一致，纹理与图案精确再现。
项目地址：https://idm-vton.github.io/
试玩地址：https://top.aibase.com/tool/idm-vton

7、AI搜索引擎Perplexity.ai估值达10亿美元并发布新的企业产品

Perplexity.ai近期完成融资，估值达数十亿美元，推出企业服务“Enterprise Pro”，提高工作场所搜索准确性和效率。公司计划加速全球扩张，与SoftBank Corp.和德国电信合作推广人工智能功能。

【AiBase提要:】
⭐ 完成融资，估值达10亿美元，推出“Enterprise Pro”提高搜索准确性和效率
⭐ 与SoftBank Corp.和德国电信合作推广人工智能功能，加速全球扩张
⭐ 提供增强数据隐私、改善安全性、用户管理、SOC2认证、数据存储和单一登录等功能
详情链接:https://top.aibase.com/tool/perplexity-enterprise-pro

8、旷视发布HiDiffusion，SD生成速度更快，图片质量更高

旷视最近发布的HiDiffusion技术引起了业界广泛关注。这一技术能显著提升SD生成图像的分辨率和生成速度，允许图像分辨率高达4096×4096，同时提高生成速度1.5至6倍。HiDiffusion解决了对象重复和高计算负担问题，在生成高分辨率图像任务上取得卓越效果。

【AiBase提要:】
🚀 HiDiffusion技术提升SD生成图像分辨率和速度
🔍 HiDiffusion框架包含RAU-Net模块和MSW-MSA注意力机制
💡 应用HiDiffusion可将图像生成分辨率提高至4096×4096，速度提升1.5至6倍
详情链接:https://top.aibase.com/tool/hidiffusion

9、《这就是ChatGPT》登顶微信读书热搜榜第一名

这篇文章介绍了由斯蒂芬・沃尔夫拉姆（Stephen Wolfram）于2023年出版的《这就是ChatGPT》一书，深入剖析了OpenAI开发的人工智能聊天机器人程序ChatGPT，展示了它引起广泛关注的原因以及如何利用Wolfram|Alpha赋予其计算知识超能力。

【AiBase提要:】
🤖 ChatGPT是OpenAI开发的聊天机器人程序，于2022年11月发布。
📚 《这就是ChatGPT》解析了ChatGPT的内部机制和原理，以及如何生成有意义的文本。
💡 ChatGPT结合Wolfram|Alpha展示了其在计算知识方面的超能力。

10、AI电影制作平台Morph Studio正式向候补用户开放访问权限

Morph Studio正式向候补用户开放访问权限，引发广泛关注。平台新增视频生成角色一致性和配音生成功能，提升用户体验。用户可通过参考图像精细制作视频，使用音效模型丰富音频效果。Morph Studio与Stability AI合作，提供全新电影制作方式，一体化流程高效连贯。活跃用户社区是竞争优势，为平台发展提供动力。

【AiBase提要:】
🎥 视频生成角色一致性和配音生成功能提升用户体验
🖼️ 参考图像精细制作视频，音效模型丰富音频效果
🚀 与Stability AI合作，一体化流程高效连贯
产品入口：https://top.aibase.com/tool/morph-studio
点此加入候补名单：https://app.morphstudio.com/waitlist

11、AI视频生成工具ID-Animator：可保持角色一致生成视频动画

ID-Animator是一种零样本个性化视频生成方法，可根据单个参考面部图像生成个性化视频，无需额外训练。该方法结合控制网络，实现单帧或多帧控制图像与面部参考图像的融合生成视频。

【AiBase提要:】
⭐ 提出了一种零样本人类视频生成方法，可根据单个参考面部图像进行个性化视频生成
⭐ 引入面向身份的数据集构建流水线，提高身份信息在视频生成中的提取效率
⭐ 结合控制网络，实现单帧或多帧控制图像与面部参考图像的融合生成视频
详情链接:https://top.aibase.com/tool/id-animator

12、Nvidia CEO黄仁勋亲自向OpenAI交付第一台DGX H200

Nvidia CEO黄仁勋亲自向OpenAI交付首个Nvidia DGX H200，标志着AI技术和研究能力取得重大进展。这一举动彰显了人工智能行业两大巨头之间紧密的联系，为AI领域的发展带来新的希望和机遇。

【AiBase提要:】
⭐ Nvidia DGX H200作为最新、最先进的AI处理器，代表着人工智能技术的重要飞跃。
⭐ OpenAI获得DGX H200将提升研究能力，尤其在GPT-5模型的发展上。
⭐ DGX H200的推出将推动整个人工智能行业的进步，赋予研究人员和开发人员处理更雄心勃勃项目的能力。

13、LinkedIn调查显示：AI威胁下，女性工作更易被取代

在国际货币基金组织和LinkedIn的研究中发现，女性持有的工作更容易受人工智能影响，尤其在先进经济体中。女性面临更高风险，可能更容易被AI取代。文章指出，女性在快速发展的AI时代需要更多关注和支持以抵御工作变革和挑战。

【AiBase提要:】
⭐️ 女性持有的工作更容易受人工智能影响，尤其在先进经济体中。
⭐️ 约60%的工作可能受到AI影响，女性面临更高风险。
⭐️ 全球范围内，57%的女性工作可能被AI打乱，相较之下男性为43%。

（举报）

相关推荐

关键词：

见证巅峰对决，掠夺者携旗舰装备亮相IEM成都赛场

2025年IEM成都站总决赛在金融城演艺中心举行，宏碁掠夺者作为全球独家PC合作伙伴，为赛事提供高性能比赛设备，其全新IP多多DODO亮相见证。掠夺者通过顶尖硬件支持职业选手稳定发挥，并构建完整电竞生态：既赞助顶级职业赛事IEM，又举办大众赛事掠夺者联赛及女子电竞赛PL Girls，覆盖从职业到草根玩家。双十一期间推出战斧9、战斧Neo S、刀锋8三款主力设备，助力玩家征战赛场。

电竞英特尔极限大师赛掠夺者
新Siri或明年春季发布苹果公司或引入谷歌Gemini大模型 AI技术

苹果因自研大模型项目遇瓶颈，决定引入谷歌Gemini大模型升级Siri，计划每年支付约10亿美元获取定制化Gemini 2.5 Pro使用权。该模型拥有1.2万亿参数，将全面负责Siri的信息摘要、任务规划及复杂指令执行等核心功能，支持多模态交互和超长文本处理。升级版Siri预计2026年春季随iOS 26.4推送，后续将在WWDC大会展示进一步整合。苹果选择谷歌主要因成本优势、长期合作基础及Gemini领先性能。

苹果谷歌Gemini Siri升级
荐AI日报：谷歌发布Veo 3.1；通义千问推Qwen Chat Memory功能；Sora2免费用户可生成15秒视频

本期AI日报聚焦多项技术更新：谷歌Veo 3.1视频模型新增音频生成与精细化编辑功能；通义千问推出记忆功能提升对话连贯性；Sora2免费用户可生成15秒视频，Pro版支持25秒；百度文心助手升级8种创作模式；谷歌Flow工具增强视频光影编辑与音频合成能力；Anthropic发布高性价比Claude Haiku 4.5；北京查处首例AI虚假广告案，涉伪造主持人带货；阿里推出响应仅200毫秒的编程工具Qoder CLI。

AI 视频生成谷歌
被AI引用才是真的流量：写出让GPT、Gemini主动引用的AI搜索友好型内容（实操清单 + 工具推荐）

本文系统介绍生成式引擎优化(GEO)的核心方法，帮助内容从“给人看”升级为“AI友好型”。关键策略包括：1.采用结构化写作框架，在开头设置可直接回答问题的“黄金段落”；2.运用分步清单、数据标注、FAQ等模块提升内容引用率；3.通过多平台同步分发增加曝光；4.使用AIBase等工具量化监测内容被AI引用的频率与场景，并给出5天落地执行表。

AI搜索友好型内容创作 GEO Generative
荐AI日报：豆包视频1.0pro fast发布；谷歌Gemini新功能上线；百度推上体体育大模型 2.0

本期AI日报聚焦多项技术突破：火山引擎发布豆包视频生成模型1.0pro+fast，速度提升3倍且价格下降72%；百度与上海体育大学推出“上体体育大模型2.0”，拓展AI在运动员训练等场景应用；谷歌Gemini新增一键生成PPT功能；美团发布LongCat-Video模型，支持5分钟连贯视频生成；xAI推出虚拟女友Mika引发热议；MiniMax开源高性能M2编码模型；OpenAI上线企业知识管理功能；另报道20岁辍学生开发的AI笔记工具Turbo AI半年用户破500万，展现年轻创业者的技术影响力。

AI 视频生成火山引擎
Emoji

绘文字(日语：絵文字/えもじ emoji)是日本在无线通信中所使用的视觉情感符号，绘指图画，文字指的则是字符，可用来代表多种表情，如笑脸表示笑、蛋糕表示食物等。在中国大陆，emoji通常叫做“小黄脸”，或者直称emoji。在NTTDoCoMo的i-mode系统电话系统中，绘文字的尺寸是12x12 像素，在传送时，一个图形有 2 个字节。Unicode编码为E63E到E757，而在Shift-JIS编码则是从F89F到F9FC。基本的绘文字共有 176 个符号，在C-HTML4. 0 的?

emoji 表情包绘文字
emo是什么梗网络用语emo是什么意思

最近在各大社交论坛上出现一个“emo”的词语，很多朋友还不清楚这个emo到底是什么意思，下面就来为大家详细的介绍一下emo这个梗。很多人会误以为emo是拼音，也就是恶魔，但是事实上这个emo是英文Emotional Hardcore的缩写。Emotional Hardcore的意思是情感硬核或情感核音乐。EMO乐迷常追随情感核时尚，典型形象是穿紧身牛仔裤，蓄黑色长发，以冲动、敏感、忧郁为特征。所以网络语境下也常用emo来代表“丧”、“忧郁”、“伤感”等?

emo
疫情持续加剧群体性emo，“情绪伙伴”Emohaa在线“抱抱”拯救心灵

2021年10月8日，知名医学期刊《柳叶刀》发表系统综述，收集了各个国家和地区自2020年1月至2021年1月心理疾病患者的相关数据，对比研究发现疫情导致2020年抑郁症患者增加了约0.53亿，增加幅度约27.6%;焦虑症患者增加了约0.76亿，增加幅度约25.6%...国内的社会心理问题同样不容小觑...《2022数字化精神心理健康服务行业蓝皮书》显示，截止2020年底，中国约有4万名精神科医生，每10万人中仅有2.9名......

Emohaa 对话机器人 AI机器人
2021年将没有新Emoji表情为什么没有新Emoji表情？

Unicode联盟在4月8日宣布，因为新冠病毒影响，原定在今年秋季推出的第14版Unicode标准已被推迟至2021年 9 月发布。这也就是说新emoji表情可能要到2022年才能出现在iPhone和Android用户中。但第13版的 117 个新emoji不会受影响，应该会在2020年晚些时候推出。

Emoji表情 2021年将没有新Emoji表情
超赞！Emoji AI可为任何文本生成酷炫emoji表情

在自媒体内容和营销文案中使用emoji符号是一种增加趣味性和吸引力的方式，但有时我们可能会纠结于选择哪个emoji才最适合。不过别担心，这个网站可以解决你的困扰!它根据你的文本，为你找到最准确和合适的emoji符号!👌EmojiAI.com是一个人工智能emoji建议工具。用户只需输入一行文字，它就可以根据内容推荐相关emoji，让社交媒体帖子更具吸引力。

emoji AI头条

今日大家都在搜的词：

热文

3 天
7天

AI日报：阿里对口型视频项目EMO开启内测；苹果官宣端侧小模型OpenELM；Open-Sora偷偷升级；微信发布AI工具小微助手

见证巅峰对决，掠夺者携旗舰装备亮相IEM成都赛场

新Siri或明年春季发布苹果公司或引入谷歌Gemini大模型 AI技术

荐AI日报：谷歌发布Veo 3.1；通义千问推Qwen Chat Memory功能；Sora2免费用户可生成15秒视频

被AI引用才是真的流量：写出让GPT、Gemini主动引用的AI搜索友好型内容（实操清单 + 工具推荐）

荐AI日报：豆包视频1.0pro fast发布；谷歌Gemini新功能上线；百度推上体体育大模型 2.0

Emoji

emo是什么梗网络用语emo是什么意思

疫情持续加剧群体性emo，“情绪伙伴”Emohaa在线“抱抱”拯救心灵

2021年将没有新Emoji表情为什么没有新Emoji表情？

超赞！Emoji AI可为任何文本生成酷炫emoji表情

今日大家都在搜的词：

热文

焕新享界S9开卖72小时预订突破8000台

OPPO Reno15系列定档11月17日发布

华为Mate 70 Air维修备件价格公布：换主板2499元

AI日报：广电整治AI动画乱象；360发布大模型安全白皮书；百度推

特斯拉磁悬浮Cybertruck车模上架中国官网售价999元

鸿蒙智行：智界R7累计交付量破10万台

真我GT8 Pro阿斯顿马丁F1限量版正式开售售价5499元

小米手表S4 eSIM/Sport宣布支持开通中国移动一号双终端

特斯拉Model Y L上线外放电功能最高可输出2200瓦功率

小鹏机器人会走猫步太像人了！小鹏发布新一代人形机器人IRON

女性人形机器人里藏真人？何小鹏回应：并亲自证清白

iPhone 18 Pro或缩小灵动岛苹果正测试特殊挖孔方案

OPPO Reno15系列官宣11月10日发布

AI日报：Sora正式登陆Android；网易云音乐推AI调音大师；谷歌将

小米YU7全网首拆上热搜雷军回应：欢迎同行和专家指点

AI日报：HeyGen发布AI视频翻译引擎；科大讯飞推星火 X1.5；QQ浏

华为Mate70 Air官宣今日开启预售

AI日报：上海首例涉AI提示词著作权案宣判；Kimi K2 Thinking发

华为路由X3 Pro今日开启预售：售价1299元起

站长商机