首页 > 原创 > 关键词  > 正文

AI日报:美图发布影像AI Agent RoboNeo;1.8bit量化Kimi K2模型上线;亚马逊推AI代码编辑器 Kiro

2025-07-15 16:57 · 稿源:aibase

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、美图RoboNeo上线:一句话搞定修图建站,AI影像处理进入全能时代

美图公司推出的AI影像Agent产品RoboNeo,该产品通过自然语言交互方式整合了图片精修、品牌设计、网页制作等功能,旨在降低视觉内容创作的技术门槛。其核心亮点在于自然语言指令系统,能够理解并执行复杂的影像处理需求,并在电商运营、品牌推广及中小商家中展现出显著的效率优势。

image.png

【AiBase提要:】

📷 RoboNeo支持自然语言指令,实现图片精修与细节处理。

🎨 提供品牌设计功能,可从Logo到门店装修一站式生成。

🌐 网页制作功能简化建站流程,助力小微企业搭建线上平台。

详情链接:https://www.roboneo.com/

2、Unsloth AI发布1.8bit量化Kimi K2模型,显著降低部署成本

Unsloth AI成功将Moonshot AI的Kimi K2模型量化为1.8bit版本,大幅压缩模型体积并降低成本。这一技术突破使Kimi K2从1.1TB缩减至245GB,同时保持了全部代码测试性能,推动了开源AI领域的发展。

image.png

【AiBase提要:】

🧠1.8bit量化技术显著优化模型存储需求,提升运行效率。

💻 支持内存卸载功能,可在有限硬件资源下运行模型。

🌐 开源属性和低成本部署潜力使其成为OpenAI和Anthropic的有力竞争者。

3、谷歌 Gemini 嵌入模型登顶 MTEB 排行榜,超越 OpenAI

谷歌发布的 Gemini 嵌入模型在 MTEB 排行榜中取得优异成绩,展现出强大的多语言能力和高效的嵌入技术,为独立创作者和自由职业者提供了经济的选择。

image.png

【AiBase提要:】

🧠 Gemini 嵌入模型在 MTEB 排行榜中以68.37分登顶,超越 OpenAI 的58.93分。

🌐 模型支持多语言,适用于全球非英语用户,具有广泛的应用潜力。

🔄 采用双向 Transformer 编码器架构和均值池化策略,提升模型适应性和性能。

详情链接:https://aistudio.google.com/prompts/new_chat

4、Amazon推AI代码编辑器 Kiro,可免费使用Claude4/3.7Sonnet

亚马逊推出全新AI驱动的集成开发环境Kiro,强调规范驱动开发,解决传统AI编码工具的问题。基于Code OSS平台,兼容性强,并支持多模态输入和自动化功能。

image.png

【AiBase提要:】

🔥 Kiro通过规范驱动开发革新软件流程,减少技术债务。

💻 基于Code OSS构建,兼容VS Code插件,支持多AI模型。

🚀 提供自动化机制与多模态输入,提升开发效率与灵活性。

详情链接:https://kiro.dev/

5、Claude重磅升级!一键链接MCP工具目录,AI工作流效率飙升

Claude通过新增的‘应用和工具目录’功能,简化了AI与外部工具的集成流程,支持Web端和桌面端的MCP服务,提升了用户体验和工作效率。

【AiBase提要:】

✅ MCP协议实现AI与外部工具的无缝连接,降低接入门槛。

🌐 支持Web端远程MCP和桌面端本地MCP,满足多样场景需求。

🚀 提升AI工作流效率,赋能开发者和企业用户多样化应用。

6、MiniMax 新一轮近3亿美元融资敲定,跻身三百亿大模型俱乐部

MiniMax 完成新一轮近3亿美元融资,投后估值超过40亿美元,成为国内仅有的两家估值达300亿元人民币的大模型公司之一。此次融资引入了上海国资作为新股东,这也是其首次获得拥有国资背景的资方参投。

【AiBase提要:】

📌 MiniMax 完成新一轮近3亿美元融资,投后估值超40亿美元。

📌 上海国资首次参投,标志着MiniMax获得国资背景支持。

📌 MiniMax 成为国内仅有的两家估值达300亿元人民币的大模型公司之一。

7、UTCP是什么?全新工具调用协议:让 AI 代理直接对接工具,降低延迟

UTCP作为一种全新的工具调用协议,旨在通过减少调用过程中的“包装税”,让AI代理能够直接对接工具的原生接口,从而降低延迟并提升效率。文章详细介绍了UTCP的核心理念、技术优势以及开发者如何快速上手,同时强调了其开放性和对开源社区的贡献。

image.png

【AiBase提要:】

🌟 UTCP 允许 AI 代理直接调用工具,减少了传统调用中的延迟和复杂性。

🔧 该协议支持多种接口类型,包括 HTTP、gRPC、WebSocket 和 CLI。

📚 开发者可以通过 TypeScript 和 Python SDK 快速上手,并参与到开源项目中。

详情链接:https://github.com/universal-tool-calling-protocol

8、马斯克宣布Grok推出动漫AI伴侣功能,动态语音与定制风格引领潮流

特斯拉和xAI首席执行官埃隆·马斯克宣布,Grok新增动漫风格AI伴侣功能,为用户提供虚拟互动角色,引发科技界和动漫爱好者的广泛关注。

【AiBase提要:】

✨ Grok推出动漫风格AI伴侣功能,用户可与3D虚拟角色互动。

🤖 新增角色包括Ani、Bad Rudy和即将推出的Chad,具有动态语音和自定义能力。

💰 该功能仅对SuperGrok订阅用户开放,费用为每月30美元。

9、xAI 放大招!Grok 网页版语音模式开启,挑战 ChatGPT 新高度

xAI 推出 Grok 网页版语音模式,提供多角色语音和屏幕共享功能,增强用户体验。该功能在网页端的推出标志着 xAI 在多平台 AI 体验整合上的重要进展。

image.png

【AiBase提要:】

🎤 Grok Voice for Web 提供五种独特语音选项,满足不同交互风格需求。

💻 支持屏幕共享功能,提升开发者与设计师的协作效率。

🌐 语音模式扩展至网页端,降低对移动设备的依赖,适合桌面办公场景。

详情链接:https://x.ai/grok

10、Kimi K2在 OpenRouter 的市场份额超过了 XAI

Kimi K2作为开源大语言模型,在OpenRouter平台的token消耗量迅速增长,超越了xAI的Grok4和OpenAI的GPT-4.1,成为AI领域的新焦点。其性能、低成本以及开源策略是其成功的关键。

image.png

【AiBase提要:】

🔥 Kimi K2凭借开源策略和低成本定价迅速提升市场份额。

💡 Kimi K2在编码、推理和工具使用方面表现出色,尤其在代理智能任务中表现突出。

🌐 开源模型的崛起对传统商业模型构成挑战,展示了社区支持与灵活性的优势。

举报

  • 相关推荐
  • AI日报:豆包推全自动多人配音系统;Adobe Firefly Image 5重磅升级;Soul语音模型SoulX-Podcast发布

    本期AI日报聚焦多项技术突破:豆包推出全自动有声剧系统,实现98%角色识别准确率;Adobe Firefly Image 5支持400万像素原生输出及AI音轨生成;Soul发布90分钟无中断播客生成模型;360推出全球首款L2-L4全栈智能平台;IBM发布可在普通设备运行的Granite 4.0 Nano模型。市场方面,移动端AI用户突破7亿,豆包领跑原生应用;PayPal与OpenAI合作使ChatGPT集成支付功能;谷歌推出AI营销工具Pomelli,可基于URL自动生成营销内容。

  • AI日报:豆包视频1.0pro fast发布;谷歌Gemini新功能上线;百度推上体体育大模型 2.0

    本期AI日报聚焦多项技术突破:火山引擎发布豆包视频生成模型1.0pro+fast,速度提升3倍且价格下降72%;百度与上海体育大学推出“上体体育大模型2.0”,拓展AI在运动员训练等场景应用;谷歌Gemini新增一键生成PPT功能;美团发布LongCat-Video模型,支持5分钟连贯视频生成;xAI推出虚拟女友Mika引发热议;MiniMax开源高性能M2编码模型;OpenAI上线企业知识管理功能;另报道20岁辍学生开发的AI笔记工具Turbo AI半年用户破500万,展现年轻创业者的技术影响力。

  • AI日报:美图RoboNeo上线首月MAU破百万;影视级音画同步模型Gaga AI发布;vivo蓝心3B端侧大模型发布

    本文汇总AI领域最新动态:美图通过组织变革推动AI应用RoboNeo月活破百万;vivo发布蓝心3B端侧大模型,性能超越8B模型;Gaga AI实现静态照片生成60秒电影级视频;ChatGPT周活用户突破8亿;Figma引入Gemini模型提升设计效率;印度试点AI聊天机器人购物;Figure AI推出第三代家用机器人Figure 03;谷歌推出Gemini Enterprise自动化工作流平台。显示AI正从工具向创作者跃升,加速渗透各行业。

  • ROBOT PHONE登场:荣耀为AI终端开了自进化的未来新局

    ​十年前,AI还停留在算力、模型与数据此消彼长的层面。如今,技术的发展早已超乎想象。 2025年上半年,Google DeepMind重磅推出的AlphaEvolve揭示了一个重要趋势:AI开始拥有“自我成长”的能力。 AlphaEvolve是一种典型的“自进化系统”,它结合了Gemini模型的创造性问题解决能力,以及自动化评估器(Evaluator)的反馈学习机制,能够判断“什么是好的”,并据此不断自我优化。 �

  • 墨刀AI Agent:更懂产品经理的超级智能体上线

    2025年AI将进入"智能体时代",从被动工具升级为能理解意图、辅助决策的伙伴。墨刀AI+Agent专为产品经理打造,具备三层核心能力:懂逻辑(理解需求生成原型)、懂场景(熟悉全流程工作)、懂协作(跨角色沟通优化)。它能贯穿调研、原型、文档、评审等环节,解放重复劳动,让产品经理专注高价值决策,实现从效率提升到决策升级的人机协作新模式。

  • AI日报:Hailuo 2.3发布;豆包AI编程史诗级升级;马斯克推出AI百科全书Grokipedia

    本期AI日报聚焦多领域突破:海螺AI 2.3实现视频生成技术跃升,支持双模式免费试用;豆包AI编程工具实现零基础可视化开发;马斯克推出AI百科Grokipedia;Mistral发布企业级AI开发平台;Anthropic推出金融版Claude,显著提升分析师效率;Pinterest升级AI购物助手功能;英伟达推出全能模型OmniVinci刷新性能纪录;DeepSeek模型在港大美股交易竞赛中以10.61%年化回报率夺冠。

  • MiniMax M2:所有坑都踩过,才能做出所有人都能用上的Agent

    最近一个月,基础模型似乎又有点多起来。但若仔细去看这些模型厂商的动作,大体还是走出了两条路。 一种是在诸多难点里选择一个死磕,成为这个单点上的SOTA。这种路线可以快速在开发者群体留下一个明确的印象,但也可能限制住了一家模型公司的“基座”属性。另一种则是在各个模态上全面前进,在一个最全面的基础模型蓝图里不停交出一个个关键拼图。 已经有了全

  • AI日报:OpenAI发布浏览器Atlas;通义Qwen3-VL新增2B、32B两个模型尺寸;百川发布循环证据增强大模型

    本文汇总AI领域最新动态:OpenAI推出集成ChatGPT的Atlas浏览器,实现多任务自主处理;阿里通义千问新增2B/32B视觉语言模型,手机可流畅运行;谷歌AI Studio升级Vibe Coding功能,简化应用开发流程;百川发布医疗大模型M2Plus,通过循证推理降低误诊率;奇瑞墨甲机器人实现L3级技术突破,计划多行业应用;YouTube推出AI肖像识别工具,打击虚假内容;三星宣布2026年推出AI眼镜,融合AR与语音助手;Claude客户端更新,支持截图分析和语音交互功能。

  • 数巅完成数亿元pre-A轮融资,领跑企业级AI Agent赛道

    北京数巅科技完成数亿元Pre-A轮融资,由济和创投与赛富基金领投。资金将用于产品研发、国内市场深耕及国际市场拓展,强化其Data Agent技术在行业落地方面的领先优势。数巅推出企业级Data Agent解决方案,通过模块化架构整合海量行业知识与企业数据,精准识别用户需求,实现秒级响应与深度推理,满足企业数据分析、智能报告生成及业务决策等需求。该方案已在多家央国企及金融机构落地,查数准确率超99%,成为国内企业级智能体应用的重要里程碑。

  • 卢伟冰:REDMI K系列持续向上 Turbo系列会逐步接棒K系列

    小米集团总裁卢伟冰转发博主对Redmi K90 Pro的评测,称K系列将通过科技创新持续提升体验,Turbo系列将逐步接棒。Redmi产品经理表示Turbo系列将在性能和性价比上带来惊喜。今年1月发布的Turbo 4起售价1999元,4月发布的Turbo 4 Pro同样1999元起。卢伟冰强调,随着小米高端化发展,K系列定位将持续上探,去年独立的Turbo系列正是为承接K系列上移后的定位空间。据悉,Redmi Turbo 5将于今年第四季度登场,首发联发科天玑8500,定位高性能、长续航,并升级金属中框和大R角设计,质感大幅提升。

今日大家都在搜的词: