首页 > 原创 > 关键词  > 人工智能最新资讯  > 正文

AI日报:阿里开源3D数字人项目MNN TaoAvatar;MiniMax Agent上线;罗永浩数字人直播再探“AI+IP”带货模式

2025-06-13 16:05 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、阿里开源在手机上运行的3D数字人应用:MNN TaoAvatar,可做虚拟客服、虚拟主播

阿里巴巴集团通过开源MNN TaoAvatar,将高保真的3D虚拟形象生成与实时交互能力引入移动设备,为直播、虚拟社交和AR应用带来全新可能性。

【AiBase提要:】

✨ MNN TaoAvatar支持真3D虚拟角色实时生成与驱动,能在手机上以90FPS流畅运行。

🌟 结合3D高斯溅射技术,实现毫米级精细控制,确保虚拟角色动作自然同步。

🌐 开源生态提供丰富API和工具,支持多模态输入,降低开发门槛,加速技术普及。

详情链接:https://github.com/alibaba/MNN

2、MiniMax Agent上线!图像生成+多语言支持 长任务处理更智能

MiniMax官方宣布其AI生产力工具MiniMax Agent迎来重大升级,新增智能图像搜索、稳定的图像生成、多语言支持及多样化文档导出功能,全面提升用户体验。

image.png

【AiBase提要:】

🌟新增智能图像搜索与生成功能,支持复杂场景和创意表达,适用于设计、营销和内容创作。

📚引入反思模式,增强长任务处理能力,特别适合需要深度推理的场景,如学术研究或代码调试。

🌍新增中文、日文、韩文支持,优化Python绘图功能,填补亚洲语言支持空白,提升本地化体验。

详情链接:https://agent.minimax.io

3、罗永浩数字人直播即将首秀百度电商,再探“AI+IP”带货新模式

知名电商主播罗永浩宣布其数字人形象将在百度电商平台开启直播带货,这是他首次尝试数字人直播,背后依托百度的技术支持,展现了‘AI+头部IP’模式的巨大潜力。

QQ20250613-102955.png

【AiBase提要:】

罗永浩数字人直播将于6月15日在百度电商开启,标志着头部主播与数字人技术的首次结合。

百度电商平台已有超10万数字人主播,数字人直播可使商家运营成本下降超80%,GMV平均提升62%。

此次尝试可能推动直播电商行业向智能化、高效率、低成本方向发展。

4、OpenAI员工套现潮达30亿美元,软银成最大‘接盘侠’

本文探讨了OpenAI员工通过多次股权出售累计套现近30亿美元的现象,分析了背后的原因及影响,并揭示了软银作为最大买家的角色。

【AiBase提要:】

自2021年以来,OpenAI员工通过多次股权出售累计套现近30亿美元,软银成为最大买家。

员工股权变现频率高,参与热情不减,但可能加速离职。

激烈的AI人才竞争中,OpenAI面临巨大压力,如何留住核心团队是关键挑战。

5、OpenAI重磅升级ChatGPT Projects:深度研究+语音模式

这次ChatGPT Projects的功能更新让人感到非常兴奋。深度研究和语音模式的加入让AI助手变得更加智能和易用,特别是在跨平台协作和移动办公方面有了显著提升。它让用户在处理复杂任务时更加得心应手。

image.png

【AiBase提要:】

深度研究支持:结合内外部数据,提供精准信息检索,适合复杂场景。

语音模式集成:通过语音交互提升移动办公便捷性,满足实时协作需求。

移动端增强:支持多模态交互,包括文件上传和实时共享,扩展使用场景。

详情链接:https://help.openai.com/en/articles/10169521-using-projects-in-chatgpt

6、Meta 新型模型助力机器人在未知环境中实现物体操控

Meta 推出的 V-JEPA2模型通过视频和物理交互构建世界模型,使机器人能在动态环境中进行预测和规划,尤其适用于物流和制造业。

image.png

【AiBase提要:】

🔍 V-JEPA2模型通过观察视频和物理交互构建世界模型,提升机器人在动态环境中的操作能力。

🤖 支持零-shot 机器人规划,机器人可操控陌生物体,无需额外训练。

📈 广泛应用于物流和制造业,提高机器人适应性并减少重编程需求。

详情链接:https://ai.meta.com/vjepa/

7、AMD 与 OpenAI 联合发布强大 AI 芯片:推理性能提升35倍

AMD 与 OpenAI 推出了最新的 Instinct MI400和 MI350系列 AI 芯片,MI350系列显著提升了 AI 计算性能,MI400系列则面向下一代旗舰 AI 计算需求。此外,ROCm7平台进一步推动了 AI 开发者的效率。

image.png

【AiBase提要:】

🚀 MI350系列 GPU 提供卓越的 AI 计算性能,内存带宽高达8TB/s,推理性能提升35倍。

🌟 MI400系列专为低精度计算优化,FP4性能可达40petaflops,UALink 技术实现 GPU 无缝互联。

🌐 ROCm7平台整合多个顶级 AI 平台,提供超过3.5倍推理性能提升,助力开发者高效工作。

8、Imagen4登陆Gemini!聊天秒变画廊,AI图像生成进入新纪元

Google旗下的Gemini平台通过集成最新一代的Imagen4图像生成模型,实现了从复杂细节到文本渲染的全面升级,同时支持聊天中直接生成和调整图像,为创意设计、营销及教育等领域提供强大支持。

QQ20250613-103026.jpg

【AiBase提要:】

✨ 细节呈现卓越:复杂织物、动物毛发等细节清晰逼真,媲美专业摄影。

💬 交互体验升级:聊天生成图像,支持实时调整,创作效率大幅提升。

🌟 应用场景广泛:适用于设计、营销、教育等,支持2K分辨率,满足多领域需求。

9、谷歌 AI 助力气候预测:打破传统模型的局限,精确到10公里!

本文介绍了谷歌研究人员结合物理建模与生成AI的新方法,通过动态生成下采样法和R2D2模型,将全球气候预测提升至约10公里的分辨率,大幅降低计算成本并提高预测准确性。

image.png

【AiBase提要:】

🌍 利用AI技术将全球气候预测转化为10公里分辨率的地方预测,缩小模型与实际需求间的差距。

⚡️ R2D2模型结合物理与AI优势,提升预测准确性且能高效推广至未见过的情景。

💰 新方法显著降低计算成本,仅为传统高分辨率模拟所需的一小部分,适用于更多领域。

详情链接:https://research.google/blog/zooming-in-efficient-regional-environmental-risk-assessment-with-generative-ai/

10、加速发展:Gartner 预测生成 AI 应用将实现50% 的交付时间缩减

Gartner 预测到2028年,80% 的生成 AI 商业应用将在现有数据管理平台上开发,这将使交付时间缩短50%。RAG 技术的应用能够显著提升生成 AI 模型的准确性和可靠性,同时简化数据治理过程。

【AiBase提要:】

🌟预计到2028年,80% 的生成 AI 商业应用将在现有数据管理平台上开发,交付时间缩短50%。

🚀检索增强生成(RAG)将成为开发生成 AI 应用的重要基础,提供灵活性和可解释性。

🔍Gartner 建议企业评估现有平台的转型潜力,整合 RAG 技术并利用元数据保护安全。

举报

  • 相关推荐
  • AI日报:腾讯语音数字人模型HunyuanVideo-Avatar;Trae国际版开启付费订阅模式;Claude网页搜索功能全面开放

    本文汇总了AI领域最新动态:1)腾讯开源数字人模型HunyuanVideo-Avatar,支持图像转视频创作;2)Trae国际版开启付费订阅,首月3美元;3)Claude网页搜索功能向免费用户开放;4)印度AI初创Builder.ai破产,亏损超5亿美元;5)腾讯元宝接入微信读书平台;6)快手计划加大AI投入但预计影响利润率;7)Mistral推出智能代理API;8)Claude移动端上线语音对话测试版;9)OpenAI拟推ChatGPT第三方登录功能;10)掘金发布AI项目一键部署工具;11)多模态模型视觉推理能力评估显示准确率仅25.8%;12)中石油发布3000亿参数昆仑大模型,推动油气产业智能化。

  • AI日报:腾讯混元图像2.0毫秒级生图;Windsurf重磅发布SWE-1系列;MiniMax Speech-02登顶全球TTS榜首

    本期AI日报重点报道了多项AI领域最新进展:1)腾讯发布混元图像2.0模型,实现毫秒级图像生成;2)Windsurf推出全流程软件工程AI模型SWE-1系列;3)DeepSeek发布V3模型论文,揭示低成本训练大模型方法;4)Manus推出图像生成Agent,支持多工具协同完成任务;5)ElevenLabs发布可定制音效控制面板工具;6)MiniMax语音模型Speech-02超越OpenAI和ElevenLabs;7)DeepL升级翻译服务并推出写作助手;8)OpenAI占据AI工具市场80%份额;9)Llamafile 0.9.3支持Qwen3模型;10)Hugging Face推出WebGPU驱动的实时摄像头AI SmolVLM;11)Hugging Face上线免费MCP教程;12)复旦与腾讯联合推出视频生成工具DICE-Talk。

  • Agent真的卷疯了,AI办公Agent也来了。

    ​我一直说,每个行业,都一定会有专门优化的垂直领域的Agent。 你看,通用Agent的王座上有Manus,研究类的有DeepResearch,旅游有飞猪问一问,设计类有Lovart。 那现在,办公领域的Agent也来了。 专为办公打造。 这玩意就是昆仑万维的Skywork Super Agents。

  • AI日报:DeepSeek开源新版R1-0528;字节发布图像Agent小云雀AI;可灵2.1重磅上线

    本期AI日报聚焦多项AI领域突破:1)DeepSeek发布R1-0528模型,支持128K上下文且性能媲美GPT-4;2)字节推出"小云雀AI"图像创作工具;3)可画2.1版本价格降65%性能提升;4)Opera发布全球首款AI浏览器Neon;5)Meta推出多模态空间理解模型;6)北大团队研发ZeroSearch框架降低大模型训练成本88%;7)字节推出AI视频剪辑应用"剪小映";8)MotionPro实现40ms/帧精准视频控制;9)xAI与Telegram达成3亿美元合作部署Grok聊天机器人;10)OpenAI重组架构为IPO铺路;11)像素蛋糕"方糖大模型"获国内首个影像行业备案;12)Paper2Poster实现论文自动转海报;13)Resemble AI开源TTS模型性能比肩ElevenLabs;14)蚂蚁集团开源对标GPT-4o的多模态模型Ming-lite-omni。

  • 如何用AI Agent让企业效率翻倍?

    2025年5月,红杉资本AI峰会在旧金山落下帷幕。这场汇聚150位全球顶尖AI公司创始人的大会达成重要共识:下一轮AI竞争的核心不再是工具本身,而是为用户创造的实际收益。在此背景下,Agent的重要性被前所未有的推至所有人的视野前沿。 硅谷大厂开启了第一波加速,微软CEO纳德拉在主题演讲中宣布:“我们已经进入了AI Agent时代,正在见证AI系统如何以全新方式帮助我们解决问�

  • 火山引擎Data Agent体验中心正式上线!企业级AI数据专家触手可及

    火山引擎数智平台开放企业级数据智能体Data Agent体验中心,用户可零门槛体验"企业数字专家"在数据垂直领域的深度能力。该产品定位为"企业第一位AI数据专家",已上线股票分析、经营复盘、营销策略等6大场景应用。通过"数据+知识"融合、人机协同等核心价值,突破传统分析工具边界,实现从描述性分析到行动建议的跨越。作为L3级智能体,它能将企业内外部信息转化为可量化数字资产,显著降低数据使用门槛,提升决策效率。Gartner预测到2028年至少15%的日常决策将由AI自主完成。火山引擎此举标志着企业数据应用正式进入"动态智能体"时代。

  • 腾讯AI数字人AvaMo落地商用,百度/微美全息加速虚拟人生态闭环构建

    腾讯与Offshore公司达成战略合作,推出面向日本市场的AI数字人视频生成服务"AvaMo"。该服务基于腾讯云智能数字人技术,仅需1-3分钟视频样本即可创建高保真数字人,支持实时交互,能将30秒视频制作时间从传统的12小时压缩至15分钟。同时,百度也在数字人领域发力,展示手语数字人、直播数字人等应用案例。我国数字人产业生态日益完善,相关企业已达114.4万家。微美全息等企业通过整合AI、计算机视觉等技术,显著降低商业化门槛,推动数字人在社交、娱乐等场景的个性化应用。随着生成式AI技术发展,数字人制作效率和多样性显著提升,用户可打造更具个性化的数字产品。

  • AI日报:Anthropic推最强编码AI模型Claude4;苹果计划推AI智能眼镜;QQ浏览器上线首个高考Agent

    【AI日报】今日AI领域重要动态:1)Anthropic发布Claude4系列AI模型,编程能力超越竞争对手;2)苹果计划2026年推出集成AI技术的智能眼镜;3)字节跳动与清华合作推出时序多模态大模型ChatTS;4)3DTown框架实现单张照片生成逼真3D场景;5)OpenAI秘密开发无屏幕AI设备;6)商汤科技推出儿童AI下棋机器人;7)微软记事本新增AI写作功能;8)深圳设立70亿元基金支持AI硬件初创企业;9)谷歌发布3D视频通信平台Beam;10)阿联酋推出"星际之门"计划,免费提供ChatGPT服务;11)法国Mistral推出开源模型Devstral;12)Anthropic API新增四大功能;13)美国众议院通过法案限制各州监管AI;14)QQ浏览器推出高考AI助手。

  • AI日报:通义千问3大模型全球爆火;即梦图片3.0智能参考全量上线;智谱AI企业级超级助手Agent CoCo上线

    【AI日报】今日AI领域重要动态:1.通义千问3大模型全球下载量超1250万,衍生模型13万+;2.即梦图片3.0上线,AI设计进入"零门槛"时代;3.智谱AI发布企业级超级助手Agent CoCo;4.百度推出金融行业大模型"千帆慧金";5.小红书开源首个大模型dots.llm1,含1420亿参数;6.Hugging Face开源LeRobot项目,降低机器人研发门槛;7.ChatGPT语音功能升级,支持更自然对话翻译;8.Google Gemini应用下载量超ChatGPT但活跃度不足;9.轻量级文档解析模型MonkeyOCR表现优异;10.Google Veo3推出高速视频生成模式;11.Google调整AI Studio政策,限制Gemini2.5Pro免费访问。

  • 数字人老罗也要交个朋友!“罗永浩数字人”将于15日亮相百度电商

    罗永浩今日在微博宣布自己的数字人”将在6月15日亮相百度电商直播。 罗永浩称这次直播就两件事儿:人虽然是我的数字人,但货还是老罗严选的好货;价格还是实惠厚道,数字人老罗也要交个朋友。 罗永浩解释:最近自己发现头部带货主播基本没做过数字人,于是就让百度给自己做一个,本周日晚17:00就开始带货。” 他表示:虽然相信百度的技术底子,但他还是不放心,