首页 > 业界 > 关键词  > 腾讯最新资讯  > 正文

AI日报:腾讯发布新视频神器MOFA-Video;直播卖货大模型Streamer-Sales来了;机器人​Alter3会自拍了

2024-06-25 14:59 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://top.aibase.com/

1、腾讯开源新视频控制方式 MOFA-Video 可通过箭头控制视频运动方向

MOFA-Video是腾讯最新开源的视频控制技术,彻底改变了视频动画制作的认知,开启了创意革命。它的多功能性让用户能够通过箭头控制视频内容的运动方向,实现神奇的体验。同时,MOFA-Video还能迁移面部表情到新生成的人脸视频,创造全新角色和情感表达。

【AiBase提要:】

🔹支持通过箭头控制视频内容的运动方向,类似运动笔刷

🔹支持将原有视频的面部表情迁移到新生成的人脸视频上

🔹能够适应各种复杂的动画场景,无论是手动轨迹、人体标记序列还是音频驱动的面部动画,都能轻松应对

项目页:https://top.aibase.com/tool/mofa-video

2、AI进军电商直播!直播卖货大模型Streamer-Sales来了

Streamer-Sales是一款领先的直播带货AI模型,为直播销售带来革命性变化。它能自动生成商品文案、实时解答问题,成为主播的智能助手。该模型具有一键生成主播文案、推理加速技术、RAG技术生成精准文案、语音处理功能、数字人视频生成、实时信息查询等功能。基于InternLM2架构,项目已开源,提供模型下载链接和在线体验平台,为直播带货行业带来智能化和个性化新时代。

image.png

【AiBase提要:】

🚀 Streamer-Sales领先直播带货AI模型,自动生成商品文案、实时解答问题,提升销售效率。

💡 推理加速技术和RAG技术生成精准文案,提高模型运行速度和文案说服力。

🎙️ 支持语音处理、数字人视频生成、实时信息查询,提供高效、互动、富有情感的直播带货解决方案。

详情链接:https://top.aibase.com/tool/streamer-sales

3、日本开发人形机器人Alter3:采用GPT-4技术 自拍都学会了

日本东京大学与Alternative Machine公司合作研究开发的人形机器人系统Alter3利用GPT-4技术,能直接将自然语言指令映射到机器人行动。这一研究成果展示了基础模型与机器人系统结合的潜力,尽管尚未商业化,却推动了机器人研究的发展。Alter3在日常动作和模仿动作等多项测试中展现出了强大的行动规划和执行能力。

image.png

【AiBase提要:】

💡 Alter3是使用GPT-4技术进行推理的最新人形机器人,能直接映射自然语言指令到机器人行动。

💡 研究人员利用GPT-4技术的上下文学习能力,使机器人执行所需的行动步骤。

💡 增加人类反馈和记忆可以提高Alter3的性能,研究人员成功在机器人中模仿情感表达如羞耻和喜悦。

4、EvTexture:利用AI快速将模糊视频一键变高清

EvTexture技术通过捕捉高频动态细节,让视频的纹理质量得到质的飞跃,使每一帧画面变得更加清晰和真实。这项技术不仅提升了视频质量,更为视觉艺术带来革命性改变。

【AiBase提要:】

👀 EvTexture技术通过捕捉高频动态细节,让模糊视频变得更清晰和真实。

📷 EvTexture利用事件相机记录的细微变化,擅长处理树叶、衣服条纹等复杂细节

⏰ EVTexture 技术引入了更多细节处理,但它并没有明显增加处理视频所需的时间。

项目页:https://top.aibase.com/tool/evtexture

5、Synthesia发布全新2.0版本,推交互式AI视频和全身虚拟人物

Synthesia宣布推出全新2.0版本,引入了交互式视频和全身虚拟人物,为企业加速实施以视频为主的沟通倡议提供全面套件。新功能包括AI屏幕录制工具,简化企业创建操作指南流程。更新后的虚拟人物拥有更多肢体语言,增强数字角色的叙事能力。

image.png

【AiBase提要:】

⭐ Synthesia发布全新2.0版本,引入交互式视频和全身虚拟人物。

⭐ 更新后的虚拟人物拥有更多肢体语言,加强数字角色的叙事能力。

⭐ 新的交互式视频体验让用户能够创建可交互的视频内容,还有AI屏幕录制工具的推出。

详情链接:https://top.aibase.com/tool/synthesia

6、唱片公司联手起诉AI音乐生成公司Suno和Udio,指控侵犯版权

本文报道了多家知名唱片公司联合起诉两家AI初创公司,指控它们在未经许可的情况下使用受版权保护的音乐来训练音乐生成模型,侵犯商业作品版权的事件。唱片公司要求被告承认侵权、关闭AI服务,并支付高额赔偿金。AI音乐生成公司则表示其技术是变革性的,不是为了模仿,但唱片公司认为其使用了受版权保护的音乐,引发了法律纠纷。

QQ截图20240625115648.jpg

【AiBase提要:】

⭐ 唱片公司联合起诉两家AI音乐生成公司Suno和Udio,指控其使用受版权保护的音乐进行训练,侵犯了商业作品的版权。

⭐ 唱片公司要求被告承认侵权,关闭其AI服务,并为每一项侵权作品支付150,000美元的赔偿金。

⭐ AI音乐生成公司表示其技术是变革性的,不是为了模仿,但唱片公司认为其使用了受版权保护的音乐,引发了法律纠纷。

7、太尬了!Meta 错误地将真实照片标记为 “AI 生成”

在这篇文章中,多位摄影师抱怨 Meta 错误地将真实照片标记为 “Made with AI”,引发了广泛关注。这一事件凸显了 AI 技术在图像识别中的局限性和误判问题,也引发了摄影界对于标记准确性的讨论。

image.png

【AiBase提要:】

📸 摄影师遭遇 Meta 错误标记

🖼 编辑工具制作照片受影响

🤖 Meta 使用生成性 AI 工具错误标记

8、科学家也开始依赖ChatGPT

这篇文章揭示了科学界在学术写作中对ChatGPT等人工智能工具的依赖程度,以及其带来的影响和挑战。学术界在使用大型语言模型(LLMs)时取得了一定进展,但也面临着信息准确性和偏见强化等问题。需要制定明确政策规范LLM的使用,以确保学术写作的真实性和公正性。

【AiBase提要:】

⚙️ ChatGPT在学术写作中的普及程度逐渐增加,至少有10%的论文使用了LLMs

📊 不同领域和国家对LLMs的使用存在差异,计算机科学和生物信息学领域使用率最高

⚖️ 学术界需要制定明确政策规范LLMs的使用,以确保科学研究的高质量和可靠性

9、马斯克的xAI与英伟达、戴尔合作建造人工智能超级计算机

埃隆・马斯克的人工智能初创公司 xAI 宣布与戴尔、英伟达和 Supermicro 合作,建造据称将是世界上最大超级计算机。该项目将为初创公司提供大量的计算资源,减少对云服务的依赖。

【AiBase提要:】

⭐ xAI 与戴尔、英伟达和 Supermicro 合作建造据称世界上最大超级计算机,为初创公司提供大量计算资源支持其训练工作。

⭐ 戴尔的 AI 工厂概念利用液冷服务器和英伟达的新款 Blackwell GPU 支持高强度的人工智能工作负载,成为超级计算机基础设施的一部分。

⭐ xAI 计划从英伟达购买约30万台新的 Blackwell B200,融资60亿美元,估值240亿美元,还一直在收到为特斯拉预留的英伟达芯片的发货。

10、姚班天才组队又一力作!摸鱼小游戏《我把大模型玩坏了》悄悄上线

在忙碌的工作日中,寻找一种轻松的方式来放松自己已经成为许多人的新选择。《我把大模型玩坏了》是一款专为工作日想要偷偷休息的人们量身打造的游戏,由旷视科技研究总经理范浩强领衔开发。游戏结合了多模态和multi-Agent等技术支持,提供了多样化的游戏玩法,让玩家在挑战中放松身心。

1.jpg

【AiBase提要:】

⭐ 《我把大模型玩坏了》是专为工作日想要休息的人们打造的轻松游戏。

⭐ 游戏由旷视科技研究总经理范浩强领衔开发,背后得到野猫子工作室和阶跃星辰的强大支持。

⭐ 游戏结合了多模态和multi-Agent等技术支持,新增了成就列表、排行榜、AI评价等功能,提升玩家体验。

11、OpenAI收购远程协作平台Multi

OpenAI最近进行了一系列的收购行动,其中包括收购远程协作平台Multi。这次收购将进一步强化OpenAI在企业解决方案领域的实力,加速其人工智能技术在视频协作领域的应用。

【AiBase提要:】

📈 OpenAI进行收购行动,收购了远程协作平台Multi,加强企业解决方案实力。

📹 Multi提供视频聊天协作平台,支持多达10人同时进行屏幕共享,定制快捷方式等功能。

🤝 Multi团队将加入OpenAI,加速人工智能技术在视频协作领域的发展。

详情链接:https://top.aibase.com/tool/multi

12、苹果放弃将Meta AI模型整合到iPhone的计划

作为隐私保护的倡导者,苹果公司决定放弃与Meta合作将其AI模型整合到iPhone中的计划。这一举动展现了苹果对用户隐私的重视和坚持。

【AiBase提要:】

🔍 苹果放弃与Meta合作的AI模型整合计划,彰显对隐私的尊重与坚持。

📱 苹果推出自己的AI功能套件,与OpenAI合作在iPhone上调用ChatGPT。

🌐 Meta将依靠应用程序推广AI模型,而非直接整合到设备中。

举报

  • 相关推荐
  • 阿里发布Wan2.7-Video视频生成模型!从演迈向导 聚焦创作全链路

    阿里巴巴今日正式发布Wan2.7-Video视频生成系列模型,涵盖文生视频、图生视频、参考生视频和视频编辑四大模型。 新模型拥有全面的创作控制力,将AI的能力从单一素材生成扩至创作全链路,从演”迈向导”。

  • 爸爸举高高孩子180度翻转吓到发烧:后悔没控制好力度

    3月31日,新疆乌鲁木齐发生了一件让人又惊又怕的事儿。贾先生在家和自家宝宝玩举高高的游戏,本来是想逗孩子开心,给亲子时光增添点乐趣,可没想到,这一用力过猛,就出意外了。宝宝在空中直接来了个180度后翻转,这场景,把贾先生吓得够呛。 贾先生事后回忆起来还是心有余悸,他说当时看到孩子这样,整个人都懵了,大脑一片空白。结果呢,不知道是不是被这突如

  • 盛况空前!2026第十四届中国指挥控制大会5月启幕,引领军 事智能新征程

    第十四届中国指挥控制大会暨第十一届中国(北京)军事智能技术装备博览会将于2026年5月14日至16日在北京国家会议中心举行。大会以“无人具身智能引领,指挥控制体系赋能”为主题,聚焦网络信息体系建设与新质战斗力生成,汇聚顶尖专家、军工集团及高新技术企业代表,打造集学术交流、技术展示、成果转化于一体的国家级协同创新平台。同期举办的博览会规模空前,�

  • 抢占秋冬滋补风口!大健康滋补企业必赴 8 月 8 广州视频号爆品展

    2026年第32届沸点会暨广州视频号爆品展将于8月8-9日在广州保利世贸博览馆举办。展会聚焦大健康滋补产业,汇聚超千家展商、万款新品,精准匹配私域头部渠道与视频号达人资源,助力企业一站式选品对接。展区特设滋补品类专属主场,涵盖燕窝、参茸、阿胶等热门品类。现场设有百强渠道联合选品会,企业可直面采购方,快速敲定合作,抢占秋冬养生旺季市场先机。采用“论坛+展会+选品会”三位一体模式,为企业提供曝光、对接、招商多重收益,是年中布局“金九银十”及下半年销售爆发的关键平台。

  • 年轻人的影音刚需,Vidda 小钢炮 S Mini 用1999元一次性全满足

    文章指出,2026年选购Mini LED电视面临挑战:该技术虽在画质上远超普通LED,但成本高,中端市场常陷入“涨价”或“减配”的困境。Vidda推出小钢炮S Mini系列,以1999元起售价打破行业“高价低配”潜规则。它搭载AG+LR无倒影低反屏、180个独立分区、1.2L独立低音炮、180Hz高刷等旗舰配置,实现音画双绝,将高端体验拉至入门价位,为年轻人提供高性价比选择。

  • 前特斯拉团队杨硕创业首作登顶 SOTA:妙动科技使机器人控制效率提升10倍

    文章探讨了机器人学习物理直觉的难题。传统方法依赖静态图文数据,缺乏对物理动态的理解。妙动科技提出DiT4DiT模型,利用视频生成模型作为“物理老师”,通过两个扩散变换器串联,分别负责想象场景和执行动作。该方法在多项基准测试中刷新SOTA,仅需单目相机和消费级显卡即可实现高效实时推理,且零样本泛化能力突出,在未见过的测试场景中仍保持较高成功率。

  • 男媒婆占领短视频,婚恋赛道“变天了”

    2024年年初,河南开封万岁山武侠城,头戴红花、身着一袭红绿相间裙装、以经典媒婆形象亮相的“开封王婆 ”凭借一档现场说亲节目爆红网络,在抖音账号单月涨粉624万之余,也成功杀入年轻人相亲场,让“媒婆”这个古老的职业符号完成了年轻化转身。

  • Vidda杀疯了!新品小钢炮S Mini开售,1999元拿下顶配Mini LED 电视

    4月7日,Vidda小钢炮S Mini正式开启全渠道预售。作为专为年轻人打造的首台Mini LED电视,该产品打破中端市场“成本妥协、配置阉割”的行业潜规则,集旗舰抗光屏、MiniLED精准控光、独立低音炮、超高刷等硬核配置于一身,提供55、65、75英寸三大主流尺寸,最低1999元即可入手。产品搭载旗舰级AG+LR低反光屏幕,配备180个独立分区Mini LED背光,结合AI画质引擎实现精准控光,同时内置2.1声道独立低音炮系统,支持杜比与DTS双认证,配合180Hz超高刷新率与MEMC运动补偿,带来影院级音画体验。Vidda以极致性价比推动高端显示技术下沉,让年轻人无需妥协即可拥有全能影音终端。

  • 将发拆完车装回视频!雷军:新一代SU7锁单超4万辆

    新一代小米SU7依然很卖座,雷军透露了最新的销售数据。 昨晚,雷军在直播中宣布,新一代SU7锁单超4万辆。 4月1日,据小米汽车官方微博披露,2026年3月小米全系交付量超过20000台,其中3月23日开启交付的新一代SU7在9天内累计交付超7000台,日均交付量近800台。 此前小米官方曾透露,新一代SU7在开启预定后的短短34分钟内,锁单量就已经迅速达到了1.5万台。这种爆发式的增长

  • 从 RTX 到 Spark:NVIDIA 为本地代理式 AI 加速 Gemma 4

    Google推出小巧、快速且具备多模态能力的Gemma4模型家族,与NVIDIA合作优化,可在各类设备上高效本地运行。该系列涵盖E2B至31B多种变体,专为从边缘设备到高性能GPU的高效部署设计。Gemma4支持推理、编码、智能体及多模态交互等丰富任务,并兼容OpenClaw等应用,实现任务自动化。用户可通过Ollama或llama.cpp在NVIDIA RTX GPU和DGX Spark上免费运行。

今日大家都在搜的词: