首页 > 业界 > 关键词  > 腾讯最新资讯  > 正文

AI日报:腾讯发布新视频神器MOFA-Video;直播卖货大模型Streamer-Sales来了;机器人​Alter3会自拍了

2024-06-25 14:59 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://top.aibase.com/

1、腾讯开源新视频控制方式 MOFA-Video 可通过箭头控制视频运动方向

MOFA-Video是腾讯最新开源的视频控制技术,彻底改变了视频动画制作的认知,开启了创意革命。它的多功能性让用户能够通过箭头控制视频内容的运动方向,实现神奇的体验。同时,MOFA-Video还能迁移面部表情到新生成的人脸视频,创造全新角色和情感表达。

【AiBase提要:】

🔹支持通过箭头控制视频内容的运动方向,类似运动笔刷

🔹支持将原有视频的面部表情迁移到新生成的人脸视频上

🔹能够适应各种复杂的动画场景,无论是手动轨迹、人体标记序列还是音频驱动的面部动画,都能轻松应对

项目页:https://top.aibase.com/tool/mofa-video

2、AI进军电商直播!直播卖货大模型Streamer-Sales来了

Streamer-Sales是一款领先的直播带货AI模型,为直播销售带来革命性变化。它能自动生成商品文案、实时解答问题,成为主播的智能助手。该模型具有一键生成主播文案、推理加速技术、RAG技术生成精准文案、语音处理功能、数字人视频生成、实时信息查询等功能。基于InternLM2架构,项目已开源,提供模型下载链接和在线体验平台,为直播带货行业带来智能化和个性化新时代。

image.png

【AiBase提要:】

🚀 Streamer-Sales领先直播带货AI模型,自动生成商品文案、实时解答问题,提升销售效率。

💡 推理加速技术和RAG技术生成精准文案,提高模型运行速度和文案说服力。

🎙️ 支持语音处理、数字人视频生成、实时信息查询,提供高效、互动、富有情感的直播带货解决方案。

详情链接:https://top.aibase.com/tool/streamer-sales

3、日本开发人形机器人Alter3:采用GPT-4技术 自拍都学会了

日本东京大学与Alternative Machine公司合作研究开发的人形机器人系统Alter3利用GPT-4技术,能直接将自然语言指令映射到机器人行动。这一研究成果展示了基础模型与机器人系统结合的潜力,尽管尚未商业化,却推动了机器人研究的发展。Alter3在日常动作和模仿动作等多项测试中展现出了强大的行动规划和执行能力。

image.png

【AiBase提要:】

💡 Alter3是使用GPT-4技术进行推理的最新人形机器人,能直接映射自然语言指令到机器人行动。

💡 研究人员利用GPT-4技术的上下文学习能力,使机器人执行所需的行动步骤。

💡 增加人类反馈和记忆可以提高Alter3的性能,研究人员成功在机器人中模仿情感表达如羞耻和喜悦。

4、EvTexture:利用AI快速将模糊视频一键变高清

EvTexture技术通过捕捉高频动态细节,让视频的纹理质量得到质的飞跃,使每一帧画面变得更加清晰和真实。这项技术不仅提升了视频质量,更为视觉艺术带来革命性改变。

【AiBase提要:】

👀 EvTexture技术通过捕捉高频动态细节,让模糊视频变得更清晰和真实。

📷 EvTexture利用事件相机记录的细微变化,擅长处理树叶、衣服条纹等复杂细节

⏰ EVTexture 技术引入了更多细节处理,但它并没有明显增加处理视频所需的时间。

项目页:https://top.aibase.com/tool/evtexture

5、Synthesia发布全新2.0版本,推交互式AI视频和全身虚拟人物

Synthesia宣布推出全新2.0版本,引入了交互式视频和全身虚拟人物,为企业加速实施以视频为主的沟通倡议提供全面套件。新功能包括AI屏幕录制工具,简化企业创建操作指南流程。更新后的虚拟人物拥有更多肢体语言,增强数字角色的叙事能力。

image.png

【AiBase提要:】

⭐ Synthesia发布全新2.0版本,引入交互式视频和全身虚拟人物。

⭐ 更新后的虚拟人物拥有更多肢体语言,加强数字角色的叙事能力。

⭐ 新的交互式视频体验让用户能够创建可交互的视频内容,还有AI屏幕录制工具的推出。

详情链接:https://top.aibase.com/tool/synthesia

6、唱片公司联手起诉AI音乐生成公司Suno和Udio,指控侵犯版权

本文报道了多家知名唱片公司联合起诉两家AI初创公司,指控它们在未经许可的情况下使用受版权保护的音乐来训练音乐生成模型,侵犯商业作品版权的事件。唱片公司要求被告承认侵权、关闭AI服务,并支付高额赔偿金。AI音乐生成公司则表示其技术是变革性的,不是为了模仿,但唱片公司认为其使用了受版权保护的音乐,引发了法律纠纷。

QQ截图20240625115648.jpg

【AiBase提要:】

⭐ 唱片公司联合起诉两家AI音乐生成公司Suno和Udio,指控其使用受版权保护的音乐进行训练,侵犯了商业作品的版权。

⭐ 唱片公司要求被告承认侵权,关闭其AI服务,并为每一项侵权作品支付150,000美元的赔偿金。

⭐ AI音乐生成公司表示其技术是变革性的,不是为了模仿,但唱片公司认为其使用了受版权保护的音乐,引发了法律纠纷。

7、太尬了!Meta 错误地将真实照片标记为 “AI 生成”

在这篇文章中,多位摄影师抱怨 Meta 错误地将真实照片标记为 “Made with AI”,引发了广泛关注。这一事件凸显了 AI 技术在图像识别中的局限性和误判问题,也引发了摄影界对于标记准确性的讨论。

image.png

【AiBase提要:】

📸 摄影师遭遇 Meta 错误标记

🖼 编辑工具制作照片受影响

🤖 Meta 使用生成性 AI 工具错误标记

8、科学家也开始依赖ChatGPT

这篇文章揭示了科学界在学术写作中对ChatGPT等人工智能工具的依赖程度,以及其带来的影响和挑战。学术界在使用大型语言模型(LLMs)时取得了一定进展,但也面临着信息准确性和偏见强化等问题。需要制定明确政策规范LLM的使用,以确保学术写作的真实性和公正性。

【AiBase提要:】

⚙️ ChatGPT在学术写作中的普及程度逐渐增加,至少有10%的论文使用了LLMs

📊 不同领域和国家对LLMs的使用存在差异,计算机科学和生物信息学领域使用率最高

⚖️ 学术界需要制定明确政策规范LLMs的使用,以确保科学研究的高质量和可靠性

9、马斯克的xAI与英伟达、戴尔合作建造人工智能超级计算机

埃隆・马斯克的人工智能初创公司 xAI 宣布与戴尔、英伟达和 Supermicro 合作,建造据称将是世界上最大超级计算机。该项目将为初创公司提供大量的计算资源,减少对云服务的依赖。

【AiBase提要:】

⭐ xAI 与戴尔、英伟达和 Supermicro 合作建造据称世界上最大超级计算机,为初创公司提供大量计算资源支持其训练工作。

⭐ 戴尔的 AI 工厂概念利用液冷服务器和英伟达的新款 Blackwell GPU 支持高强度的人工智能工作负载,成为超级计算机基础设施的一部分。

⭐ xAI 计划从英伟达购买约30万台新的 Blackwell B200,融资60亿美元,估值240亿美元,还一直在收到为特斯拉预留的英伟达芯片的发货。

10、姚班天才组队又一力作!摸鱼小游戏《我把大模型玩坏了》悄悄上线

在忙碌的工作日中,寻找一种轻松的方式来放松自己已经成为许多人的新选择。《我把大模型玩坏了》是一款专为工作日想要偷偷休息的人们量身打造的游戏,由旷视科技研究总经理范浩强领衔开发。游戏结合了多模态和multi-Agent等技术支持,提供了多样化的游戏玩法,让玩家在挑战中放松身心。

1.jpg

【AiBase提要:】

⭐ 《我把大模型玩坏了》是专为工作日想要休息的人们打造的轻松游戏。

⭐ 游戏由旷视科技研究总经理范浩强领衔开发,背后得到野猫子工作室和阶跃星辰的强大支持。

⭐ 游戏结合了多模态和multi-Agent等技术支持,新增了成就列表、排行榜、AI评价等功能,提升玩家体验。

11、OpenAI收购远程协作平台Multi

OpenAI最近进行了一系列的收购行动,其中包括收购远程协作平台Multi。这次收购将进一步强化OpenAI在企业解决方案领域的实力,加速其人工智能技术在视频协作领域的应用。

【AiBase提要:】

📈 OpenAI进行收购行动,收购了远程协作平台Multi,加强企业解决方案实力。

📹 Multi提供视频聊天协作平台,支持多达10人同时进行屏幕共享,定制快捷方式等功能。

🤝 Multi团队将加入OpenAI,加速人工智能技术在视频协作领域的发展。

详情链接:https://top.aibase.com/tool/multi

12、苹果放弃将Meta AI模型整合到iPhone的计划

作为隐私保护的倡导者,苹果公司决定放弃与Meta合作将其AI模型整合到iPhone中的计划。这一举动展现了苹果对用户隐私的重视和坚持。

【AiBase提要:】

🔍 苹果放弃与Meta合作的AI模型整合计划,彰显对隐私的尊重与坚持。

📱 苹果推出自己的AI功能套件,与OpenAI合作在iPhone上调用ChatGPT。

🌐 Meta将依靠应用程序推广AI模型,而非直接整合到设备中。

举报

  • 相关推荐
  • AI日报:腾讯语音数字人模型HunyuanVideo-Avatar;Trae国际版开启付费订阅模式;Claude网页搜索功能全面开放

    本文汇总了AI领域最新动态:1)腾讯开源数字人模型HunyuanVideo-Avatar,支持图像转视频创作;2)Trae国际版开启付费订阅,首月3美元;3)Claude网页搜索功能向免费用户开放;4)印度AI初创Builder.ai破产,亏损超5亿美元;5)腾讯元宝接入微信读书平台;6)快手计划加大AI投入但预计影响利润率;7)Mistral推出智能代理API;8)Claude移动端上线语音对话测试版;9)OpenAI拟推ChatGPT第三方登录功能;10)掘金发布AI项目一键部署工具;11)多模态模型视觉推理能力评估显示准确率仅25.8%;12)中石油发布3000亿参数昆仑大模型,推动油气产业智能化。

  • AI日报:谷歌推最强AI全家桶Google AI Ultra;腾讯混元宣布模型矩阵全面升级;豆包·语音播客模型发布

    本文汇总了近期AI领域的重要动态:1)谷歌推出249.99美元/月的AI Ultra订阅计划,提供最强AI模型和高级功能;2)腾讯混元模型升级,新增视觉推理T1-Vision和语音对话模型;3)美图获阿里2.5亿美元投资,将在电商和AI领域合作;4)豆包推出语音播客模型,实现文本快速转音频;5)百度文心X1 Turbo获信通院最高评级;6)谷歌发布Flow AI剪辑工具,集成Veo3等三大模型;7)谷歌Veo3支持4K视频生成;8)Imagen4图像模型发布;9)Gemini2.5 Pro新增并行推理功能;10)谷歌推出虚拟试衣工具;11)公测AI编程助手Jules;12)苹果计划在iOS19开放AI模型;13)京东云推五大免费AI营销工具;14)字节开源多模态模型BAGEL;15)英伟达发布物理推理模型Cosmos-Reason1。

  • AI日报:夸克发布首个高考志愿大模型;Trae月活跃用户破100万;Manus推出免费无限聊天模式

    【AI日报】今日AI领域热点速览: 1. 夸克APP推出高考志愿大模型,免费提供个性化填报指导 2. Manus AI开放免费无限聊天模式,挑战行业巨头 3. Trae开发者平台月活破百万,累计交付60亿行代码 4. 迪士尼环球起诉Midjourney侵犯影视版权 5. 维基百科暂停AI生成摘要实验 6. 360发布"纳米AI超级搜索智能体",内置80多款大模型 7. PartCrafter项目实现单张图片生成高精度3D模型 8. Meta推出AI视频编辑工具,支持50多种预设效果 9. 阿里工程师放弃春节假期全力追赶DeepSeek技术 10. 火山引擎发布PromptPilot智能提示优化平台 11. OpenAI洽谈400亿美元融资,拓展AI生态系统 12. 新一代o3-pro推理模型发布并调整API定价策略

  • AI日报:阿里云通义灵码AI IDE上线;小米多模态大模型Xiaomi MiMo-VL开源;黑森林实验室推出FLUX.1Kontext

    【AI日报】今日AI领域重要动态:1)阿里云推出通义灵码AI IDE,集成千问3模型,显著提升编程效率;2)小米开源多模态大模型MiMo-VL-7B,性能超越更大规模闭源模型;3)黑森林实验室发布FLUX.1Kontext图像生成模型,支持文本和参考图像多次编辑;4)Midjourney V7渲染速度提升40%,新增用户投票功能;5)DeepSeek R1-0528大模型在AGI领域取得突破,性能超越xAI等公司;6)Hugging Face进军机器人市场,推出开源人形机器人HopeJR;7)字节跳动火山方舟接入DeepSeek最新大模型;8)Anthropic开源"电路追踪"工具,揭示大模型决策过程;9)阿里巴巴开源自主搜索AI智能体WebAgent;10)Hume发布低延迟语音语言模型EVI3;11)Manus Slides支持一键生成专业幻灯片;12)Runway Gen-4 References支持手机照片艺术化处理。

  • AI日报:腾讯混元3D 2.1大模型开源;字节跳动AI Lab负责人李航卸任;OpenAI Codex 全新升级

    本文介绍了AI领域最新动态:1)腾讯开源混元3D2.1大模型,提升3D生成质量;2)OpenAI Codex升级,优化代码生成功能;3)字节跳动AI Lab负责人李航卸任;4)微软发布700个AI应用案例;5)微软推出Code Researcher工具,解决58%系统崩溃问题;6)Observer AI实现屏幕操作自动化;7)Genspark发布AI浏览器;8)麻省理工用AI技术3.5小时修复15世纪名画;9)蚂蚁集团推出开源多模态GPT-4o模型Ming-Omni;10)MagicTryOn视频换衣框架;11)字节跳动发布实时互动AI视频生成模型Seaweed APT2;12)ChatGPT搜索功能升级;13)字节跳动与老凤祥合作开发AI智能眼镜。

  • AI日报:豆包大模型1.6发布;OpenAI推o3-pro模型、o3价格暴降80%;Figma官方MCP重磅上线

    【AI日报】今日AI领域重要动态:1)火山引擎发布豆包大模型1.6和视频生成模型Seedance1.0pro,性能显著提升;2)OpenAI推出o3-pro模型,专注可靠性但响应较慢;3)Figma推出Dev Mode MCP服务,实现设计到代码一键转换;4)Krea AI发布图像生成模型Krea1,解决传统AI绘图问题;5)火山引擎豆包日调用量突破16.4万亿次;6)法国Mistral发布推理模型Magistral;7)苹果系统整合ChatGPT图像生成功能;8)OpenAI大幅下调o3价格80%并推出o3-pro;9)Hugging Face开源榜单显示中国团队Qwen与DeepSeek进入全球前15;10)阿里开源MaskSearch框架,提升AI解决复杂问题能力。

  • AI日报:通义千问开源Qwen3向量模型;字节跳动图像编辑模型SeedEdit 3.0;ElevenLabs推v3语音模型

    本文汇总了近期AI领域的重要动态:1)通义千问发布Qwen3-Embedding系列模型,在多语言文本处理表现优异;2)字节跳动推出图像编辑模型SeedEdit3.0,提升细节保持能力;3)ElevenLabs发布情感语音合成系统Eleven v3 Alpha;4)Anthropic推出面向国家安全的Claude Gov模型;5)可灵AI月收入连续两月超1亿元;6)Meta公布智能眼镜Aria Gen2技术细节;7)爱诗科技上线AI视频工具"拍我AI";8)富国银行预测2030年ChatGPT广告收入将达千亿美元。

  • AI日报: ChatGPT免费开放记忆功能;华为WATCH 5智能手表接入双大模型;Claude Pro升级重磅功能

    本期AI日报主要报道了多项AI领域重要进展:1)OpenAI向所有ChatGPT用户免费开放记忆功能;2)蚂蚁集团推出"AI健康管家",服务4000万用户;3)Anthropic与DeepLearning.AI合作推出免费MCP课程;4)谷歌DeepMind开发无需3D模型即可生成逼真运动视频的新技术;5)Exa与OpenRouter合作为400+大模型提供实时网络搜索功能;6)中国知网推出CNKI AI学术研究助手;7)Anthropic推出Claude Explains博客项目;8)Claude Pro新增研究模式和远程MCP整合功能;9)Fish Audio发布基于200万小时数据训练的OpenAudio S1语音模型;10)OpenAI升级Codex编程工具;11)华为WATCH5接入盘古和DeepSeek双大模型。

  • AI日报:ChatGPT支持MCP和会议记录功能;Cursor 1.0 版本重磅发布;Midjourney视频功能将在本月上线

    本期AI日报聚焦多项AI领域突破:1)OpenAI为ChatGPT新增企业数据连接和会议记录功能;2)Cursor 1.0发布集成BugBot等开发工具;3)Midjourney即将推出视频生成功能;4)秘塔AI搜索新增PPT导出功能;5)Manus推出文本生成视频工具挑战Sora;6)法国Mistral发布企业级编程助手;7)英伟达推出文档处理专用AI模型;8)腾讯公益引入大模型提升互动体验;9)Firecrawl推出网页抓取API工具;10)Bland AI实现超真实语音克隆;11)报告显示AI训练成本逼近百亿美元;12)开源设计工具Jaaz支持批量图像生成;13)《逆水寒》手游接入AI实现图片动效玩法。

  • 全球首款生成式人形机器人运动大模型发布:可根据指令生成跑步、舞蹈等连贯动作

    今日上午,国家地方共建人形机器人创新中心联合复旦大学未来信息创新学院,正式发布了全球首款生成式人形机器人运动大模型 龙跃”(MindLoongGPT)。 龙跃大模型以自然语言驱动”为核心,构建了从多模态输入到高保真动作生成的完整闭环,颠覆传统运动控制范式。 也就是说,用户无需学习专业术语或操作复杂软件,仅需像与人类对话一样发出指令,例如以优雅的姿势递