首页 > 业界 > 关键词  > 腾讯最新资讯  > 正文

AI日报:腾讯发布新视频神器MOFA-Video;直播卖货大模型Streamer-Sales来了;机器人​Alter3会自拍了

2024-06-25 14:59 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://top.aibase.com/

1、腾讯开源新视频控制方式 MOFA-Video 可通过箭头控制视频运动方向

MOFA-Video是腾讯最新开源的视频控制技术,彻底改变了视频动画制作的认知,开启了创意革命。它的多功能性让用户能够通过箭头控制视频内容的运动方向,实现神奇的体验。同时,MOFA-Video还能迁移面部表情到新生成的人脸视频,创造全新角色和情感表达。

【AiBase提要:】

🔹支持通过箭头控制视频内容的运动方向,类似运动笔刷

🔹支持将原有视频的面部表情迁移到新生成的人脸视频上

🔹能够适应各种复杂的动画场景,无论是手动轨迹、人体标记序列还是音频驱动的面部动画,都能轻松应对

项目页:https://top.aibase.com/tool/mofa-video

2、AI进军电商直播!直播卖货大模型Streamer-Sales来了

Streamer-Sales是一款领先的直播带货AI模型,为直播销售带来革命性变化。它能自动生成商品文案、实时解答问题,成为主播的智能助手。该模型具有一键生成主播文案、推理加速技术、RAG技术生成精准文案、语音处理功能、数字人视频生成、实时信息查询等功能。基于InternLM2架构,项目已开源,提供模型下载链接和在线体验平台,为直播带货行业带来智能化和个性化新时代。

image.png

【AiBase提要:】

🚀 Streamer-Sales领先直播带货AI模型,自动生成商品文案、实时解答问题,提升销售效率。

💡 推理加速技术和RAG技术生成精准文案,提高模型运行速度和文案说服力。

🎙️ 支持语音处理、数字人视频生成、实时信息查询,提供高效、互动、富有情感的直播带货解决方案。

详情链接:https://top.aibase.com/tool/streamer-sales

3、日本开发人形机器人Alter3:采用GPT-4技术 自拍都学会了

日本东京大学与Alternative Machine公司合作研究开发的人形机器人系统Alter3利用GPT-4技术,能直接将自然语言指令映射到机器人行动。这一研究成果展示了基础模型与机器人系统结合的潜力,尽管尚未商业化,却推动了机器人研究的发展。Alter3在日常动作和模仿动作等多项测试中展现出了强大的行动规划和执行能力。

image.png

【AiBase提要:】

💡 Alter3是使用GPT-4技术进行推理的最新人形机器人,能直接映射自然语言指令到机器人行动。

💡 研究人员利用GPT-4技术的上下文学习能力,使机器人执行所需的行动步骤。

💡 增加人类反馈和记忆可以提高Alter3的性能,研究人员成功在机器人中模仿情感表达如羞耻和喜悦。

4、EvTexture:利用AI快速将模糊视频一键变高清

EvTexture技术通过捕捉高频动态细节,让视频的纹理质量得到质的飞跃,使每一帧画面变得更加清晰和真实。这项技术不仅提升了视频质量,更为视觉艺术带来革命性改变。

【AiBase提要:】

👀 EvTexture技术通过捕捉高频动态细节,让模糊视频变得更清晰和真实。

📷 EvTexture利用事件相机记录的细微变化,擅长处理树叶、衣服条纹等复杂细节

⏰ EVTexture 技术引入了更多细节处理,但它并没有明显增加处理视频所需的时间。

项目页:https://top.aibase.com/tool/evtexture

5、Synthesia发布全新2.0版本,推交互式AI视频和全身虚拟人物

Synthesia宣布推出全新2.0版本,引入了交互式视频和全身虚拟人物,为企业加速实施以视频为主的沟通倡议提供全面套件。新功能包括AI屏幕录制工具,简化企业创建操作指南流程。更新后的虚拟人物拥有更多肢体语言,增强数字角色的叙事能力。

image.png

【AiBase提要:】

⭐ Synthesia发布全新2.0版本,引入交互式视频和全身虚拟人物。

⭐ 更新后的虚拟人物拥有更多肢体语言,加强数字角色的叙事能力。

⭐ 新的交互式视频体验让用户能够创建可交互的视频内容,还有AI屏幕录制工具的推出。

详情链接:https://top.aibase.com/tool/synthesia

6、唱片公司联手起诉AI音乐生成公司Suno和Udio,指控侵犯版权

本文报道了多家知名唱片公司联合起诉两家AI初创公司,指控它们在未经许可的情况下使用受版权保护的音乐来训练音乐生成模型,侵犯商业作品版权的事件。唱片公司要求被告承认侵权、关闭AI服务,并支付高额赔偿金。AI音乐生成公司则表示其技术是变革性的,不是为了模仿,但唱片公司认为其使用了受版权保护的音乐,引发了法律纠纷。

QQ截图20240625115648.jpg

【AiBase提要:】

⭐ 唱片公司联合起诉两家AI音乐生成公司Suno和Udio,指控其使用受版权保护的音乐进行训练,侵犯了商业作品的版权。

⭐ 唱片公司要求被告承认侵权,关闭其AI服务,并为每一项侵权作品支付150,000美元的赔偿金。

⭐ AI音乐生成公司表示其技术是变革性的,不是为了模仿,但唱片公司认为其使用了受版权保护的音乐,引发了法律纠纷。

7、太尬了!Meta 错误地将真实照片标记为 “AI 生成”

在这篇文章中,多位摄影师抱怨 Meta 错误地将真实照片标记为 “Made with AI”,引发了广泛关注。这一事件凸显了 AI 技术在图像识别中的局限性和误判问题,也引发了摄影界对于标记准确性的讨论。

image.png

【AiBase提要:】

📸 摄影师遭遇 Meta 错误标记

🖼 编辑工具制作照片受影响

🤖 Meta 使用生成性 AI 工具错误标记

8、科学家也开始依赖ChatGPT

这篇文章揭示了科学界在学术写作中对ChatGPT等人工智能工具的依赖程度,以及其带来的影响和挑战。学术界在使用大型语言模型(LLMs)时取得了一定进展,但也面临着信息准确性和偏见强化等问题。需要制定明确政策规范LLM的使用,以确保学术写作的真实性和公正性。

【AiBase提要:】

⚙️ ChatGPT在学术写作中的普及程度逐渐增加,至少有10%的论文使用了LLMs

📊 不同领域和国家对LLMs的使用存在差异,计算机科学和生物信息学领域使用率最高

⚖️ 学术界需要制定明确政策规范LLMs的使用,以确保科学研究的高质量和可靠性

9、马斯克的xAI与英伟达、戴尔合作建造人工智能超级计算机

埃隆・马斯克的人工智能初创公司 xAI 宣布与戴尔、英伟达和 Supermicro 合作,建造据称将是世界上最大超级计算机。该项目将为初创公司提供大量的计算资源,减少对云服务的依赖。

【AiBase提要:】

⭐ xAI 与戴尔、英伟达和 Supermicro 合作建造据称世界上最大超级计算机,为初创公司提供大量计算资源支持其训练工作。

⭐ 戴尔的 AI 工厂概念利用液冷服务器和英伟达的新款 Blackwell GPU 支持高强度的人工智能工作负载,成为超级计算机基础设施的一部分。

⭐ xAI 计划从英伟达购买约30万台新的 Blackwell B200,融资60亿美元,估值240亿美元,还一直在收到为特斯拉预留的英伟达芯片的发货。

10、姚班天才组队又一力作!摸鱼小游戏《我把大模型玩坏了》悄悄上线

在忙碌的工作日中,寻找一种轻松的方式来放松自己已经成为许多人的新选择。《我把大模型玩坏了》是一款专为工作日想要偷偷休息的人们量身打造的游戏,由旷视科技研究总经理范浩强领衔开发。游戏结合了多模态和multi-Agent等技术支持,提供了多样化的游戏玩法,让玩家在挑战中放松身心。

1.jpg

【AiBase提要:】

⭐ 《我把大模型玩坏了》是专为工作日想要休息的人们打造的轻松游戏。

⭐ 游戏由旷视科技研究总经理范浩强领衔开发,背后得到野猫子工作室和阶跃星辰的强大支持。

⭐ 游戏结合了多模态和multi-Agent等技术支持,新增了成就列表、排行榜、AI评价等功能,提升玩家体验。

11、OpenAI收购远程协作平台Multi

OpenAI最近进行了一系列的收购行动,其中包括收购远程协作平台Multi。这次收购将进一步强化OpenAI在企业解决方案领域的实力,加速其人工智能技术在视频协作领域的应用。

【AiBase提要:】

📈 OpenAI进行收购行动,收购了远程协作平台Multi,加强企业解决方案实力。

📹 Multi提供视频聊天协作平台,支持多达10人同时进行屏幕共享,定制快捷方式等功能。

🤝 Multi团队将加入OpenAI,加速人工智能技术在视频协作领域的发展。

详情链接:https://top.aibase.com/tool/multi

12、苹果放弃将Meta AI模型整合到iPhone的计划

作为隐私保护的倡导者,苹果公司决定放弃与Meta合作将其AI模型整合到iPhone中的计划。这一举动展现了苹果对用户隐私的重视和坚持。

【AiBase提要:】

🔍 苹果放弃与Meta合作的AI模型整合计划,彰显对隐私的尊重与坚持。

📱 苹果推出自己的AI功能套件,与OpenAI合作在iPhone上调用ChatGPT。

🌐 Meta将依靠应用程序推广AI模型,而非直接整合到设备中。

举报

  • 相关推荐
  • AI日报:智谱AI发布AutoGLM 2.0;腾讯元宝接入腾讯视频;字节发布开源大语言模型 Seed-OSS

    本期AI日报聚焦多项AI技术突破:智谱发布革命性语音代理AutoGLM 2.0,实现全平台语音操控;腾讯元宝接入视频平台提升观影便捷性;字节跳动开源大模型Seed-OSS专注长文本处理;速卖通AI代理助力新品推广效率翻倍;微软测试Copilot智能文件搜索功能;Liquid AI推出低延迟视觉语言模型LFM2-VL;OpenAI月收入首破10亿美元;谷歌Pixel 10系列全面升级AI功能,包括情感识别和实时翻译;Pixel Buds Pro 2引入AI手势控制;ElevenLabs发布支持70+语言的文本转语音API。

  • 微信聊天可以引用部分文字了!还可用表情包回复

    今日,微信派正式对外宣布,微信聊天新增引用部分文字功能,为用户交流带来全新便捷体验。 在过去,微信用户进行引用回复时,存在明显局限,只能将整条文字消息完整引用。当好友发来大段文字,而自己仅想引用其中某段精华内容时,就显得十分不便。 如今,这一状况得到极大改善。用户收到好友发来的大段文字消息后,若只想引用其中特定部分,可手动进行选择,�

  • 自动化浏览器控制领域工具深度对比:NXNOS、TARS与Fellou性能与成本

    本文对比三款自动化浏览器控制工具:NXNOS、Agent+TARS和Fellou。从企业背景、技术架构、稳定性实测和硬件成本四个维度分析,NXNOS在复杂场景容错和长期运行稳定性上表现突出,硬件门槛低;Agent+TARS侧重跨设备自动化但资源需求高;Fellou适合轻量任务但复杂场景适配弱。建议用户根据场景复杂度、并发需求和预算选择,无绝对优劣,只有适用性差异。

  • 跨越四大洲的美丽探索:Vida Glow 十年创新,定义口服美容新范式

    Vida Glow是源自澳大利亚的口服美容品牌,2014年由Anna Lahey创立,以天然水解海洋胶原蛋白粉为核心产品。品牌通过法国专利水解技术提升吸收率,产品覆盖全球高端百货及医美机构,平均每4秒售出一罐,被誉为全球胶原蛋白领先品牌。目前产品线已扩展至日常护理、高级修护和女性健康系列,致力于以科技推动口服美容行业发展。

  • 新手爸爸抱娃紧张到失去表情管理 网友:好像抱着炸弹

    ​近日,河南郑州一位新手爸爸初次尝试抱娃的场景被记录下来,迅速在网络上引发热议。 画面中,这位新手爸爸小心翼翼地接过宝宝,却因过度紧张而面部表情失控,身体也显得异常僵硬,仿佛怀中抱着的不是柔软的小生命,而是一个随时可能“引爆”的定时炸弹。 这一幕被网友捕捉并分享后,立即引发了众多网友的共鸣与欢笑,大家纷纷留言表示:“这表情太真实了,好

  • 妈妈回应2岁萌娃自拍视频海外爆火:戳中大众童真情怀

    近日,一段2岁中国萌娃的自拍视频在海外社交平台上引发了轰动,点赞量迅速突破四千万大关,热度甚至超越了C罗与梅西世纪同框下棋的海报。视频中,这位来自中国深圳的萌娃“小汤圆”以独特的“蚊子视角”——将运动相机固定在帽檐上朝向面部拍摄,对着镜头露出了天真无邪的笑容,瞬间融化了无数网友的心。 面对女儿的意外走红,萌娃的妈妈汤女士表示非常惊喜和�

  • 大厂押注的AI和视频化,能成为播客的好出路吗?

    长期在国内市场不温不火的播客赛道,正在焕发出越来越蓬勃的新机。 8月15日,自带流量和多重话题标签的罗永浩入驻B站,并宣布将开启一档视频播客节目《罗永浩的十字路口》,8月19日,罗永浩发布了第一条视频播客,与理想汽车创始人李想进行了近4小时的深度对话,一度引发热议,在B站内的观看量超230万。 而由罗永浩掀起的这一波流量热潮背后,可以看出B站对于视频

  • 店员回应男子误将660万彩票洗成渣:表情极度痛苦 无法模仿

    ​2025年8月,深圳一位彩民以28元的机选票幸运中得福彩双色球660万元头奖,原本这是一件令人欣喜若狂的喜事,然而,却因一场意外让这份幸运化为泡影。该头奖的兑奖截止日为8月11日24时。 据投注站店员透露,中奖消息公布后不久,一名中年男子来到投注站,自称是那位幸运的中奖者。可令人惋惜的是,男子称自己将彩票遗忘在了衣袋中,不料衣物被放入洗衣机清洗,彩票

  • 长视频自己的音乐节:从一个人刷片,到七万人狂欢

    当夕阳余晖洒下,毛不易的歌词「一杯敬月光、一杯敬过往」在巨型竖屏出现,所有台下的合唱观众,感受到了一种强烈的共鸣。 同一刻、在一起,体验同一种情绪,成了用户与腾讯视频之间的「独家记忆」。 这是国内长视频平台首次把音乐节与内容紧密结合,通过一场线下活动,腾讯视频想要回应一个期待:为私密的、个人的线上观影行为,制造一种「共同在场感」。 无�

  • 乐牛明厨亮灶视频监控系统:构建校园餐饮的“透明后厨”新标杆

    乐牛明厨亮灶视频监控系统通过AI智能分析、防油污高清画质和环境数据联动三大核心技术,破解传统后厨监管难题。系统实现秒级违规预警、24小时无死角监控和全流程数据贯通,有效提升校园、企业及医院等场景的食品安全管理效率,事故率下降90%,助力构建透明可信的智慧厨房新生态。

今日大家都在搜的词: