首页 > 原创 > 关键词  > 正文

A日报:Stability AI发布实时重建模型SPAR3D;火山引擎“奇美拉”数字人平台启动封测;京东重磅开源JoyAgent-JDGenie

2025-07-21 16:49 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://top.aibase.com/

1、Stability AI发布0.7秒单图像实时重建模型 SPAR3D,颠覆3D重建

SPAR3D 是 Stability-AI 推出的创新模型,能够在 0.7 秒内完成单图像 3D 重建,显著提升了速度和准确性。该模型结合了基于回归和生成式建模的优点,通过点采样和网格化阶段实现高效且高质量的重建。

image.png

【AiBase提要:】

🧠 SPAR3D 结合了基于回归和生成式建模的优势,有效提升重建速度与精度。

🌐 采用点扩散模型和三平面 Transformer 架构,实现高效的点云生成与纹理渲染。

📊 在 GSO 和 OmniObject3D 数据集上表现优异,证明其在几何形状和纹理质量上的卓越性能。

详情链接:https://github.com/Stability-AI/stable-point-aware-3d

2、GitHub获34000颗星!开源 AI 协作智能体 CrewAI 引领开发者潮流

CrewAI 是一个基于 Python 的开源 AI 智能体框架,因其出色的性能和易用性,在 GitHub 上获得了超过34,000颗星的关注,成为开发者热议的话题。该框架专注于智能体的自主性和协作,并提供高效的事件驱动任务管理功能,吸引了大量开发者的加入。

image.png

【AiBase提要:】

🤖 CrewAI 框架的核心由 Crews 和 Flows 两部分组成,专注自主协作和任务管理。

👥 超过10万名开发者已通过 CrewAI 认证,推动技术支持与资源共享。

🌟 CrewAI 框架在 GitHub 上获得超过34,000颗星,吸引大量开发者关注。

详情链接:https://github.com/crewAIInc/crewAI?tab=readme-ov-file

3、马斯克宣布推出儿童版AI聊天机器人“Baby Grok”,安全性质引关注

埃隆·马斯克宣布推出专为儿童设计的AI聊天机器人‘Baby Grok’,但其安全性和内容审核问题引发公众担忧。此前xAI的Grok因不当言论和成人内容功能受到批评,此次新产品的推出面临巨大挑战。

image.png

【AiBase提要:】

🤖 马斯克宣布推出儿童版AI聊天机器人‘Baby Grok’,专注于提供友好型内容。

⚠️ xAI因Grok的不当言论和成人内容功能受到安全质疑,引发公众担忧。

🔒 ‘Baby Grok’的安全保障措施成为业界和家长关注的焦点。

4、告别繁琐搭建!ComfyUI-C opilot让AI工作流一键生成,解锁60,000+模型的创意潜能

文章介绍了ComfyUI-C opilot这款智能助手工具,它通过自然语言交互和自动化功能简化了ComfyUI的工作流创建和调试过程。该工具内置丰富的节点、模型和工作流知识库,支持多种生成任务,并提供个性化推荐和错误诊断等功能。

image.png

【AiBase提要:】

🤖 智能助手降低使用门槛:用户可通过自然语言描述快速生成工作流,适合初学者。

⚡ 自动化与个性化提升效率:支持自动优化参数和灵活选择模型,提高创作效率。

🌐 开源社区驱动持续优化:项目在GitHub上获得广泛认可,团队持续更新并新增多语言支持等特性。

5、CNNIC权威发布: 我国346款生成式AI完成备案 渗透率达80.9%

文章指出,中国生成式人工智能领域迎来爆发式增长,346款服务完成备案,形成全球领先的人工智能产品体系。同时,生成式AI技术渗透到多个场景,推动了产业的快速发展,并在多个领域实现了深度融合。

image.png

【AiBase提要:】

🧠 生成式AI技术突破并加速应用普及

📈 我国生成式AI产业规模持续增长

🌐 国产AI产品在多领域实现深度融合

6、AI提示词管理工具AI Gist 上线,支持AI优化提示词并进行分类

AI Gist是一款注重用户隐私与数据安全的AI提示词管理工具,集成了丰富的管理功能,如变量替换、Jinja模板、AI生成与调优等。它支持多视图管理和快速筛选,帮助用户高效组织和使用提示词。同时,AI Gist还支持云端备份和多语言选项,适用于不同用户的需求。

image.png

【AiBase提要:】

💡 集成多种AI模型,提供自动生成和调优功能。

🔒 数据默认存储在本地,保障用户隐私与数据安全。

🌐 支持多平台使用,包括Windows、macOS和Linux。

详情链接:https://github.com/yarin-zhang/AI-Gist

7、开源版多邻国!WordPecker:AI语音对话+个性化词汇,3倍速学语言!

WordPecker是一款基于人工智能技术的开源语言学习工具,通过LLM和TTS技术提供个性化的词汇学习体验和沉浸式语音交互功能。其支持多种语言、灵活的学习模式以及社区驱动的创新,为用户带来高效且有趣的语言学习方式。

image.png

【AiBase提要:】

🧠 个性化学习:用户可根据兴趣选择主题和难度,系统生成匹配内容。

🗣️ 语音交互:集成OpenAI语音Agent,提供实时语音对话与发音反馈。

🌐 开源优势:项目托管于GitHub,允许开发者自由修改和优化,推动技术创新。

详情链接:https://github.com/baturyilmaz/wordpecker-app

8、斯坦福推出多工具协作 AI Agent,助力复杂推理任务

斯坦福大学推出的 OctoTools 是一款结合11种工具的 AI Agent,能够有效处理复杂的推理任务。它在多个领域表现出色,测试数据显示其准确率高,适用于数学、科学和医学等场景。该框架通过规划器、执行器和上下文验证器的协同工作,提升了系统的可靠性和可维护性。

image.png

【AiBase提要:】

🔧 OctoTools 结合11种工具,提升复杂推理任务的处理能力。

📊 测试数据显示,OctoTools 在多个领域的准确率非常高。

🧠 规划器和执行器的分离设计,使系统更可靠且易于维护。

详情链接:https://github.com/octotools/octotools

9、OpenAI 计划到2025年底启用100万个 GPU,展现技术扩容新愿景

OpenAI 首席执行官萨姆・奥尔特曼宣布计划到2025年底前上线超过100万个 GPU,展现了其在人工智能领域的雄心。同时,Stargate 项目将投资5000亿美元用于建设新的 AI 基础设施,目标是打造全球最大的 AI 训练集群。

image.png

【AiBase提要:】

🔥 OpenAI 计划到2025年底前启用100万个 GPU,推动 AI 技术发展。

💰 Stargate 项目将在未来四年内投资5000亿美元,用于建设 AI 基础设施。

📍 项目首站设在得克萨斯州阿比林市,目标是打造全球最大的 AI 训练集群。

10、火山引擎“奇美拉”数字人平台启动封测,字节跳动加速AI布局

火山引擎正在封闭测试其新一代数字人平台‘奇美拉’,该平台由字节跳动智能创作数字人团队打造,提供数字人生成、图片换装、视频翻译等服务。目前采用定向邀请模式,预计本月底启动公测,正式上线后将按使用次数或视频生成时长计费。

image.png

【AiBase提要:】

🔥 奇美拉平台依托火山引擎AI大模型技术,提供多种数字人服务。

💡 目前采取定向邀请模式,公测阶段免费,后续将按使用情况计费。

📈 火山引擎在数字人领域持续发力,已推出多款数字人产品方案并拓展应用场景。

11、京东重磅开源JoyAgent-JDGenie!GAIA准确率75.15%领跑多智能体系统

京东开源的JoyAgent-JDGenie在GAIA基准测试中以75.15%的准确率领先,展示了其强大的多智能体协作能力和开箱即用的特性。该框架支持多种任务处理和扩展功能,为开发者提供了构建AI应用的强大工具。

image.png

【AiBase提要:】

🚀 JoyAgent-JDGenie在GAIA基准测试中取得75.15%的准确率,表现优异。

💡 框架支持多模态输入输出,并具备跨任务记忆优化机制。

🔧 完全开源且模块化设计,便于开发者进行二次开发与部署。

详情链接:https://github.com/jd-opensource/joyagent-jdgenie

举报

  • 相关推荐
  • 国内首个!火山引擎推出融合国家级智库理论与大规模实战验证的 Data Agent 评测体系

    火山引擎推出国内首个融合国家智库理论框架与大规模实战验证的数据智能体评测体系,同步发布《2025数据智能体实践指南》。该体系直面传统评测重技术轻业务、预设答案难适配动态场景、局部能力检验不足三大痛点,确立业务关联性、可操作性与前瞻性设计原则。覆盖分析洞察、可视化呈现、鲁棒性三大核心维度,通过151道测试题量化智能体能力并划分达标/工业可用/专业研究三级标准。采用标准化闭环流程与自动化评分机制,为数字化转型深水区企业提供选型优化依据,推动产业智能化进入精准量化新阶段。

  • 软件定义汽车的质量革命:AI Agent如何终结座舱OTA的“路测噩梦”

    在“软件定义汽车”浪潮下,智能汽车竞争核心转向座舱体验、ADAS功能及OTA迭代质量。然而,传统软件测试模式成本高、耗时长,难以覆盖复杂场景,易导致漏洞。AI驱动的“无人测试”通过大模型与智能体技术实现三大突破:需求自主解析与测试规划、GUI自主探索与自愈维护、智能诊断与根因分析。这将催生“人机协同”新范式,测试工程师角色转向质量策略师。到2027年,超80%企业将集成AI测试工具,汽车行业2025年成为转型关键节点。

  • 从“实时分账”到“智能问数”:汇付天下以“Data Agent”重塑支付业务决策效率

    汇付天下作为技术驱动的数字化企业,践行“数字化+国际化”战略,为全球企业提供支付、账户、资金管理及数据集成解决方案。面对海量交易数据处理需求,公司依托火山引擎技术,构建湖仓一体架构,实现毫秒级风控响应与实时分账,并通过Data Agent智能平台支持自然语言查询与业务归因,推动数据驱动运营。该方案以流批一体能力优化数据处理效率,保障业务稳定与合规,助力企业实现全域增长与智能化风控协同。

  • 易鑫正式发布汽车金融行业首个Agentic大模型

    易鑫在2025世界互联网大会乌镇峰会上发布汽车金融行业首个Agentic大模型XinMM-AM1。该模型参数量约300亿,响应延迟低于200毫秒,支持语音实时交互,单卡吞吐达370 tokens/秒,可提升获客、风控与运营效率,解决行业周期长、交互多、决策复杂等难题。易鑫作为AI驱动的金融科技平台,研发投入超20亿元,率先实现AI全场景应用,将持续推动智能汽车金融生态建设。

  • AI日报:月之暗面开源AI新框架Kosong;百度发布新模型ERNIE-4.5-VL;GPT-5.1“隐身”登场

    本期AI日报聚焦多项技术突破:月之暗面开源AI代理框架Kosong,支持异步编排与插件化设计;Replit推出AI集成功能,可一键调用300+模型;商汤发布空间智能模型SenseNova-SI,性能超越GPT-5;百度推出多模态模型ERNIE-4.5-VL,新增图像思考能力;谷歌地图全面AI化,集成Gemini实现智能交互;ChatTutor上线可视化教学系统,覆盖多学科实时推演;新版Google Finance引入AI深度搜索与财报追踪;OpenAI低调上线Polaris Alpha模型,支持256K上下文并更新知识库至2024年10月。

  • 鲁大师10月新机性能/流畅/AI榜:骁龙8 Elite Gen5与天玑9500新机大混战

    10月手机圈迎来新机潮,19款新机扎堆发布。骁龙8 Elite Gen5和天玑9500新旗舰芯片成为性能核心,红魔11Pro+凭借满血硬件和主动水冷散热以198万+分数登顶性能榜。流畅度方面,iQOO Neo11凭借OriginOS6系统优化逆袭夺冠,OPPO、vivo多款机型占据前列。AI榜单因新芯片跑分波动暂未收录,但骁龙8 Elite Gen5的NPU性能提升显著。总体呈现“旗舰芯片定基调,系统优化决胜负”的竞争格局。

  • 零一万物联合开源中国推出OAK平台,目标打造Agent世界的“生态适配器”

    在GOT C 2025全球开源技术峰会上,零一万物CEO李开复博士发表演讲,强调开源模型是构建AI Agent的最佳选择。零一万物与开源中国联合发布一站式AI Agent开源开发平台OAK,支持对接多种开源大模型,旨在打破生态绑定限制,助力开发者实现“Agent开发自由”。该平台具备可视化编排、评估优化、数据管理等功能,未来将逐步推出四大核心模块,推动开放协作的AI Agent生态发展。

  • AI日报:百度发布文心5.0;可灵2.5Turbo模型上线“首尾帧”功能;微博推出 VibeThinker-1.5B

    本期AI日报聚焦多项技术突破:OpenAI推出GPT-5.1,提升对话自然度与响应速度;百度发布原生全模态大模型文心5.0,支持跨文本图像生成;微博开源VibeThinker-1.5B模型,以低成本实现高效推理;可控视频生成模型新增首尾帧控制功能;李飞飞团队推出商用3D世界生成工具Marble;东北大学开源多语言翻译模型支持60种语言;谷歌Gemini语音功能升级实现更自然交互;阿里启动“千问”项目对标ChatGPT,全面布局C端AI应用竞争。

  • AI日报:HeyGen发布AI视频翻译引擎;科大讯飞推星火 X1.5;QQ浏览器推出AI+小窗

    本期AI日报聚焦多项技术突破:HeyGen推出精准唇形同步的视频翻译引擎;科大讯飞发布星火X1.5大模型,提升多语言处理能力;QQ浏览器新增AI助手浮窗;科大讯飞推出软硬一体方案,实现高噪声环境精准识别;谷歌Gemini 3 Pro预览版支持百万级上下文窗口;Comfy Cloud让Stable Diffusion实现零门槛创作;谷歌Gemini新增深度研究功能,可整合邮件生成智能报告;上海AgiBot机器人10分钟完成复杂制造任务,重塑生产效率。

  • 没有Pro Max!一加Ace 6T命名敲定:首发骁龙8 Gen5

    此前有网友在机场拍到一加Ace 6 Pro Max包装盒,不少网友认为这就是一加即将推出的骁龙8 Gen5新机。 博主数码闲聊站表示,一加骁龙8 Gen5新机不叫Ace 6 Pro Max,而是命名为Ace 6T,这里的T不是Turbo,是一加纯正的性能基因,一加的Turbo系列也已在路上了。 对比一加Ace 6,一加Ace 6T处理器由骁龙8 Elite换成了骁龙8 Gen5,电池容量突破8000mAh,还将带来炫酷的联名。 该博主还爆料,高通

今日大家都在搜的词: