首页 > 原创 > 关键词  > 人工智能最新资讯  > 正文

AI日报:阿里开源3D数字人项目MNN TaoAvatar;MiniMax Agent上线;罗永浩数字人直播再探“AI+IP”带货模式

2025-06-13 16:05 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、阿里开源在手机上运行的3D数字人应用:MNN TaoAvatar,可做虚拟客服、虚拟主播

阿里巴巴集团通过开源MNN TaoAvatar,将高保真的3D虚拟形象生成与实时交互能力引入移动设备,为直播、虚拟社交和AR应用带来全新可能性。

【AiBase提要:】

✨ MNN TaoAvatar支持真3D虚拟角色实时生成与驱动,能在手机上以90FPS流畅运行。

🌟 结合3D高斯溅射技术,实现毫米级精细控制,确保虚拟角色动作自然同步。

🌐 开源生态提供丰富API和工具,支持多模态输入,降低开发门槛,加速技术普及。

详情链接:https://github.com/alibaba/MNN

2、MiniMax Agent上线!图像生成+多语言支持 长任务处理更智能

MiniMax官方宣布其AI生产力工具MiniMax Agent迎来重大升级,新增智能图像搜索、稳定的图像生成、多语言支持及多样化文档导出功能,全面提升用户体验。

image.png

【AiBase提要:】

🌟新增智能图像搜索与生成功能,支持复杂场景和创意表达,适用于设计、营销和内容创作。

📚引入反思模式,增强长任务处理能力,特别适合需要深度推理的场景,如学术研究或代码调试。

🌍新增中文、日文、韩文支持,优化Python绘图功能,填补亚洲语言支持空白,提升本地化体验。

详情链接:https://agent.minimax.io

3、罗永浩数字人直播即将首秀百度电商,再探“AI+IP”带货新模式

知名电商主播罗永浩宣布其数字人形象将在百度电商平台开启直播带货,这是他首次尝试数字人直播,背后依托百度的技术支持,展现了‘AI+头部IP’模式的巨大潜力。

QQ20250613-102955.png

【AiBase提要:】

罗永浩数字人直播将于6月15日在百度电商开启,标志着头部主播与数字人技术的首次结合。

百度电商平台已有超10万数字人主播,数字人直播可使商家运营成本下降超80%,GMV平均提升62%。

此次尝试可能推动直播电商行业向智能化、高效率、低成本方向发展。

4、OpenAI员工套现潮达30亿美元,软银成最大‘接盘侠’

本文探讨了OpenAI员工通过多次股权出售累计套现近30亿美元的现象,分析了背后的原因及影响,并揭示了软银作为最大买家的角色。

【AiBase提要:】

自2021年以来,OpenAI员工通过多次股权出售累计套现近30亿美元,软银成为最大买家。

员工股权变现频率高,参与热情不减,但可能加速离职。

激烈的AI人才竞争中,OpenAI面临巨大压力,如何留住核心团队是关键挑战。

5、OpenAI重磅升级ChatGPT Projects:深度研究+语音模式

这次ChatGPT Projects的功能更新让人感到非常兴奋。深度研究和语音模式的加入让AI助手变得更加智能和易用,特别是在跨平台协作和移动办公方面有了显著提升。它让用户在处理复杂任务时更加得心应手。

image.png

【AiBase提要:】

深度研究支持:结合内外部数据,提供精准信息检索,适合复杂场景。

语音模式集成:通过语音交互提升移动办公便捷性,满足实时协作需求。

移动端增强:支持多模态交互,包括文件上传和实时共享,扩展使用场景。

详情链接:https://help.openai.com/en/articles/10169521-using-projects-in-chatgpt

6、Meta 新型模型助力机器人在未知环境中实现物体操控

Meta 推出的 V-JEPA2模型通过视频和物理交互构建世界模型,使机器人能在动态环境中进行预测和规划,尤其适用于物流和制造业。

image.png

【AiBase提要:】

🔍 V-JEPA2模型通过观察视频和物理交互构建世界模型,提升机器人在动态环境中的操作能力。

🤖 支持零-shot 机器人规划,机器人可操控陌生物体,无需额外训练。

📈 广泛应用于物流和制造业,提高机器人适应性并减少重编程需求。

详情链接:https://ai.meta.com/vjepa/

7、AMD 与 OpenAI 联合发布强大 AI 芯片:推理性能提升35倍

AMD 与 OpenAI 推出了最新的 Instinct MI400和 MI350系列 AI 芯片,MI350系列显著提升了 AI 计算性能,MI400系列则面向下一代旗舰 AI 计算需求。此外,ROCm7平台进一步推动了 AI 开发者的效率。

image.png

【AiBase提要:】

🚀 MI350系列 GPU 提供卓越的 AI 计算性能,内存带宽高达8TB/s,推理性能提升35倍。

🌟 MI400系列专为低精度计算优化,FP4性能可达40petaflops,UALink 技术实现 GPU 无缝互联。

🌐 ROCm7平台整合多个顶级 AI 平台,提供超过3.5倍推理性能提升,助力开发者高效工作。

8、Imagen4登陆Gemini!聊天秒变画廊,AI图像生成进入新纪元

Google旗下的Gemini平台通过集成最新一代的Imagen4图像生成模型,实现了从复杂细节到文本渲染的全面升级,同时支持聊天中直接生成和调整图像,为创意设计、营销及教育等领域提供强大支持。

QQ20250613-103026.jpg

【AiBase提要:】

✨ 细节呈现卓越:复杂织物、动物毛发等细节清晰逼真,媲美专业摄影。

💬 交互体验升级:聊天生成图像,支持实时调整,创作效率大幅提升。

🌟 应用场景广泛:适用于设计、营销、教育等,支持2K分辨率,满足多领域需求。

9、谷歌 AI 助力气候预测:打破传统模型的局限,精确到10公里!

本文介绍了谷歌研究人员结合物理建模与生成AI的新方法,通过动态生成下采样法和R2D2模型,将全球气候预测提升至约10公里的分辨率,大幅降低计算成本并提高预测准确性。

image.png

【AiBase提要:】

🌍 利用AI技术将全球气候预测转化为10公里分辨率的地方预测,缩小模型与实际需求间的差距。

⚡️ R2D2模型结合物理与AI优势,提升预测准确性且能高效推广至未见过的情景。

💰 新方法显著降低计算成本,仅为传统高分辨率模拟所需的一小部分,适用于更多领域。

详情链接:https://research.google/blog/zooming-in-efficient-regional-environmental-risk-assessment-with-generative-ai/

10、加速发展:Gartner 预测生成 AI 应用将实现50% 的交付时间缩减

Gartner 预测到2028年,80% 的生成 AI 商业应用将在现有数据管理平台上开发,这将使交付时间缩短50%。RAG 技术的应用能够显著提升生成 AI 模型的准确性和可靠性,同时简化数据治理过程。

【AiBase提要:】

🌟预计到2028年,80% 的生成 AI 商业应用将在现有数据管理平台上开发,交付时间缩短50%。

🚀检索增强生成(RAG)将成为开发生成 AI 应用的重要基础,提供灵活性和可解释性。

🔍Gartner 建议企业评估现有平台的转型潜力,整合 RAG 技术并利用元数据保护安全。

举报

  • 相关推荐
  • 阿里巴巴回应千问崩了:状态良好 欢迎来问

    11月17日,阿里巴巴AI应用“千问”公测首日因用户涌入量过大,导致服务拥堵和中断,引发“千问崩了”话题登上热搜。官方迅速以轻松幽默语气回应“我好着呢”,并透露应用尚处初级版本,但已展现快速生成报告和PPT等“办事”能力。未来计划接入地图、外卖、办公等生活场景,拓展服务范围,提升用户体验。

  • 跨境支付的未来:人工智能、嵌入式金融和即时结算

    本文系统分析了人工智能、嵌入式金融与即时结算三大技术趋势如何重构跨境支付体系。人工智能通过智能填单、动态风控和预测性维护显著提升支付效率与安全性;嵌入式金融将支付功能无缝融入电商平台与供应链,实现“无跳转支付”;即时结算技术将跨境支付时间从数日缩短至秒级,并优化现金流。三大技术深度融合形成协同效应,推动跨境支付向更智能、高效、无缝�

  • “猝死风险AI筛查系统”亮相“2025人工智能+大会”,引领“AI+大健康”新浪潮

    在2025人工智能+大会“AI+大健康”论坛上,沃民高科发布“猝死风险AI筛查系统”。该系统通过30秒头部视频AI分析,实现无创快速筛查,为猝死预防提供新方案。中国是全球心源性猝死人数最多的国家,年轻化趋势明显。该系统部署简便,1分钟内完成评估,适合大规模普筛,已获行业认可,包括1.495亿元服务采购。沃民高科将持续深耕AI健康监测技术,助力全球健康事业发展。

  • 人工智能落地“最后一公里”,戴尔工作站助力AI应用提速

    AI应用落地面临“最后一公里”部署难题:传统流程繁琐耗时,从模型开发到上线需数周。英特尔携手戴尔与零克云打造“工作站-AI PC-云端”协同生态,通过本地工作站进行小规模测试验证,降低试错成本与数据泄露风险,再通过“一键部署”快速扩展至云端规模化落地。这种“先本地验证、后云端放大”的路径显著提升开发效率,释放团队创造力,让有价值的AI想法快速照进现实。

  • 简知科技“简智AI大模型”通过国家生成式人工智能服务备案,助力兴趣教育迈向智能化新阶段

    广州简知科技自主研发的“简智AI大模型”通过国家生成式人工智能服务备案,标志着该模型在安全性、合规性与可靠性方面达到国家级标准。作为兴趣教育领域AI应用的重要里程碑,该模型围绕用户兴趣成长周期设计,提供个性化学习支持:可为未明确兴趣方向的用户智能推荐内容,为入门用户规划学习路径,为基础扎实用户提供进阶训练与智能反馈。其技术能力在旗下“简小知”等品牌中已实现“学—练—评—测”全流程覆盖,并通过社群互动增强学习动力。公司未来将持续优化模型能力,联合行业伙伴构建完整培养体系,推动兴趣教育向个性化、高质量方向发展。

  • 微信小程序将在iOS端支持接入虚拟支付 苹果抽成15%

    微信宣布小程序将在iOS端支持虚拟支付,标志着其在苹果平台发展进入新阶段。微信欢迎苹果对开发者的支持,并对苹果推出的小程序合作伙伴计划持积极态度。该计划将符合条件的iOS小程序内购佣金率从30%降至15%,旨在平衡平台与开发者利益。苹果与腾讯就微信小程序内购分成达成共识,此举将增加开发者收入、丰富平台内容,为用户带来更优质体验,同时为行业处理平台与开发者关系提供新范本。

  • 聚焦量子计算基础软件体系构建,量子计算开源技术分论坛即将启幕

    2025年11月22日,中国移动将在开放原子开发者大会期间举办量子计算开源技术分论坛。论坛聚焦量子计算基础软件体系构建与国内量子软件生态发展,探讨开源技术价值、标准化路径及降低开发门槛。亮点包括发布国内首款覆盖操作系统、开发框架、量子算法的全栈开源产品“五岳纪源”,旨在推动行业标准形成,实现软硬件协同。大会汇聚领先机构,围绕主流技术路线展开研讨,诚邀全球从业者共促开放共赢的量子产业新生态。

  • 共建·共智·共享--新一代AtomGit平台暨人工智能开源社区发布

    10月28日,AtomGit平台在北京国家会议中心举行升级发布会,正式推出"开源+AI"一体化平台及人工智能开源社区。工信部副部长熊继军出席并致辞,强调建设AI开源社区对汇聚创新资源、把握科技革命机遇的重要意义。平台将整合开源模型、数据集及算力资源,打造开放中立的基础设施,计划于11月21日正式上线。华为、百度等企业代表分享了开源实践,多所高校签署了共建AI生态倡议。此举标志着我国开源生态迈向智能化时代的重要一步。

  • vivo S50全系标配3D超声波指纹

    vivo S50系列将于12月发布,全系标配第二代3D超声波指纹识别技术,成为同档位首款普及该功能的机型。该技术具备三大优势:湿手解锁灵敏、暗光无强光刺激、解锁区域上移更符合人体工学。防护性能突破行业常规,支持IP69与IP68双认证防水,可承受1.5米水深浸泡及高温高压冲洗。产品含标准版与Pro+mini版,搭载潜望式长焦镜头,其中Pro+mini版采用第五代骁龙8平台,跑分超300万。机身内置5500mAh电池,配合120W闪充,实现"充电10分钟,游戏3小时"的续航表现。

  • 卖家精灵加入中国人工智能产业发展联盟(AIIA),加速AI赋能跨境电商

    卖家精灵凭借在跨境电商智能化运营与AI大数据应用领域的领先实力,近日正式加入中国人工智能产业发展联盟(AIIA),成为该国家级AI产业生态重要成员。此次加入标志着其AI技术实力获权威认可,未来将携手联盟推动AI技术研发与产业化,助力中国品牌全球化。依托八年积累的海量电商数据与算法体系,卖家精灵已构建覆盖选品决策、市场分析等全链路AI解决方案,服务超百万跨境卖家,显著提升运营效率与决策精准度。

今日大家都在搜的词: