首页 > 原创 > 关键词  > 人工智能最新资讯  > 正文

AI日报:月之暗面自主智能体Kimi-Researcher;MiniMax推音色设计功能;Jaaz发布Lovart AI本地化替代品

2025-06-23 16:39 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用

新鲜AI产品点击了解:https://top.aibase.com/

1:月之暗面发布首款自主智能体 Kimi-Researcher

月之暗面推出Kimi-Researcher,多轮搜索与推理能力强,在HLE测试中超越谷歌和OpenAI同类产品。

image.png

【AiBase提要:】

🌐 Kimi-Researcher基于k-系列模型,通过端到端强化学习训练。

📈 在HLE测试中Pass@1得分率26.9%,Pass@4准确率40.17%。

🔗 未来将开源基础预训练模型,助力AI社区发展。

2:MiniMax推出Voice Design音色设计功能,任意组合语言 、口音、音色

MiniMax推出Voice Design功能,用户可通过自然语言描述生成个性化语音,支持多种语言、口音和音色组合。

image.png

【AiBase提要:】

🎤 用户可自由选择语言、口音和音色,实现全自定义组合。

🌐 与Speech-02模型结合,满足特定场景下的细分需求。

🔗 降低了语音合成领域的音色匹配难度。

国内版:minimaxi.com/audio

海外版:minimax.io/audio

3:火山引擎上线"AI 智能推荐域名"功能

火山引擎上线AI智能域名推荐功能,依托方舟大模型平台,帮助企业快速找到符合品牌需求的热门域名。

image.png

【AiBase提要:】

🌐 用户输入关键词,AI生成关联性强、富有创意的域名。

📈 结合词语联想和市场趋势分析,提供多样化选择。

🔗 联动豆包AI助手,进一步简化域名注册流程。

体验地址:https://www.volcengine.com/product/domain-service

4:Anthropic未放弃Claude Code,强化VSCode集成引发热议!

Anthropic推出Claude Code for VSCode插件,优化开发者编码体验,强化在AI编码领域的战略布局。

image.png

【AiBase提要:】

💻 插件支持代码编辑、测试和Git工作流管理。

🔗 支持远程MCP服务器,扩展工具链覆盖范围。

📈 活跃用户群增长160%,显示强劲发展势头。

5:Google Gemini2.5Flash-Lite炸裂登场!点击瞬间生成UI,未来交互从此不同!

内容总结:Google推出Gemini2.5Flash-Lite模型,具备实时生成交互界面的能力,预示未来交互操作系统雏形。

image.png

【AiBase提要:】

📱 实时生成UI界面,响应用户需求。

🌐 支持多模态输入,内置可控思考预算功能。

🔗 在多个领域展现潜力,适合高吞吐量场景。

6:苹果欲以300亿美元收购 AI 新星 Perplexity,意图扭转搜索市场局势!

内容总结:苹果考虑以300亿美元收购AI初创公司Perplexity,旨在提升Siri和Safari服务,增强搜索市场竞争力。

【AiBase提要:】

🍎 苹果历史上最大规模并购计划。

🌐 Perplexity专注于对话式网络搜索平台。

📈 收购将填补苹果在AI搜索领域的空白。

7:月之暗面开源 Kimi-2506:多模态智能体,视觉理解能力重大升级

月之暗面开源Kimi-2506多模态模型,视觉理解能力显著增强,支持更高分辨率图像处理。

image.png

【AiBase提要:】

🌐 Kimi-2506在多模态推理和视觉理解方面表现出色。

📈 支持单张图像总像素达320万。

🔗 模型在多个应用领域展现强大功能。

8:Firecrawl即将推出Fireplexity,打造开源Perplexity克隆版

Firecrawl将推出开源AI问答引擎Fireplexity,依托其强大的网页抓取功能,为开发者提供低成本替代方案。

【AiBase提要:】

🌐 Fireplexity核心功能与Perplexity类似,支持定制。

📈 依托Firecrawl的网页抓取和处理能力。

🔗 开源特性有望吸引更多开发者参与AI搜索生态建设。

9:智能机器人公司银河通用获宁德时代领投超10亿元融资

银河通用完成超10亿元融资,由宁德时代领投,其首款具身大模型机器人Galbot G1已推出并实现应用。

【AiBase提要:】

🤖 银河通用是具身智能领域的佼佼者。

🌐 首款具身机器人Galbot G1侧重上肢操作能力。

📈 通过仿真数据驱动模型研发,未来有望与宁德时代形成战略协同。

10:字节发布了DreamActor-H1视频生成系统,只需输入商品和角色即可生成带货视频

字节跳动发布DreamActor-H1视频生成系统,采用扩散变换器技术,解决视频生成中真实性和自然性问题。

image.png

【AiBase提要:】

🌐 输入商品和角色照片,自动生成带货视频。

📈 采用成对人机交互参考信息和掩蔽交叉注意力机制。

🔗 在保持人和产品身份完整性方面优于现有技术。

11:Google Gemma 团队发布 Magenta RealTime:开源实时音乐生成模型

Google Gemma 团队推出 Magenta RealTime,一个开源 AI 音乐生成模型,专注于实时创作,助力音乐创作者和开发者。

image.png

【AiBase 提要:】

🎶 Magenta RealTime 基于 Transformer 架构,参数规模为8亿,适合快速音乐生成。

💡 该模型支持文本提示,实时调整音乐风格与情感,提升创作灵活性。

🌐 开源项目允许开发者自由使用,降低了音乐创作的门槛。

产品链接:https://huggingface.co/google/magenta-realtime

12:开源 AI 设计工具 Jaaz 发布 Lovart AI 的本地化替代品

一款名为 Jaaz 的开源 AI 设计工具利用先进 AI 技术,支持本地运行,为设计师提供灵活高效的创作体验。

image.png

【AiBase 提要:】

🌟 Jaaz 是 Lovart AI 的开源替代品,支持本地部署。

🎨 提供聊天式交互,简化设计流程。

⚙️ 兼容多种图像生成模型,具高兼容性。

Jaaz 项目地址:https://github.com/11cafe/jaaz

举报

  • 相关推荐
  • 秘塔AI也终于悄悄上线了DeepResearch。

    测试完以后,我觉得这玩意,还是值得我将近通宵写一篇的。 深度研究,也就是DeepResearch。 我过去写过很多次秘塔AI了,因为我自己的搜索习惯,现在基本就是,大活上ChatGPT用DeepResearch,常识问答直接找豆包,一般的AI搜索就是秘塔AI。 当然很多ChatBot产品都有AI搜索,但是我自己这两年,还是习惯用秘塔AI和Perplexity这样形态的原生AI搜索产品了,这可能就是习惯的力量吧。

  • AI日报:美图发布影像AI Agent RoboNeo;1.8bit量化Kimi K2模型上线;亚马逊推AI代码编辑器 Kiro

    【AI日报】今日AI领域重要动态:1)美图推出RoboNeo,通过自然语言指令实现图片精修、品牌设计等全能影像处理;2)Unsloth AI将Kimi K2模型量化至1.8bit,体积缩减78%保持性能;3)谷歌Gemini嵌入模型登顶MTEB榜单,超越OpenAI;4)亚马逊发布免费AI代码编辑器Kiro,集成Claude模型;5)Claude新增应用工具目录功能提升工作效率;6)MiniMax完成近3亿美元融资,估值超40亿美元;7)UTCP新协议让AI代理直

  • A日报:月之暗面开源大模型Kimi K2;智源全面开源RoboBrain2.0;通义千问发布Qwen Chat桌面客户端

    本期AI日报重点报道了多项AI领域突破性进展:1.月之暗面推出万亿参数开源大模型Kimi K2,展现强大智能能力;2.智源研究院开源RoboBrain2.0和RoboOS2.0机器人系统;3.通义千问发布桌面客户端Qwen Chat;4.IndexTTS2实现影视级语音合成;5.HuggingFace开源机器人Reachy Mini热销;6.Meta推出实时视频生成模型StreamDiT;7.PixVerse新增多关键帧视频生成功能;8.特斯拉推出仅支持AMD处理器的Grok AI助手;9.OpenAI推迟开源大模型发布以加强安全测试;10.Liquid AI开源边缘AI模型LFM2;11.AI"时间穿越"特效在社交媒体走红。

  • 最强Agent?3分钟看懂Kimi K2真的好用吗?

    Moonshot AI于2025年7月11日发布开源大模型Kimi K2,主打代码编写、数学推理和Agent工具调用功能。该模型采用MoE架构(1T参数,激活32B),在SWE-Bench等测试中表现优异,数学推理得分达97.4。支持128k上下文、工具调用和API集成,定价为输入4元/百万tokens、输出16元/百万tokens。相比闭源模型,Kimi K2具有开源免费、成本低等优势,适合开发者和企业使用。同时推荐AIbase平台,可系统比较�

  • AI日报:xAI 震撼发布Grok4;微软开源全新Phi-4-mini版本;上海累计82款大模型通过备案

    AI日报栏目聚焦人工智能领域最新动态:1)xAI发布旗舰模型Grok4,在数学推理和代码生成表现突出,同时推出开发者专用Grok4Code;2)微软开源Phi-4-mini模型,推理效率提升10倍,适合边缘设备;3)上海82款大模型完成备案,垂直领域应用取得突破;4)Hugging Face推出开源桌面机器人Reachy Mini,支持Python编程;5)Perplexity发布AI浏览器Comet挑战Chrome;6)OpenAI将首次发布开放权重模型,打破闭源惯例;7)谷歌医疗AI模型MedGemma系列上新,单个GPU即可运行;8)OpenAI以约65亿美元收购AI硬件公司io Products,正式进军硬件市场。

  • 全球优质AI语音大模型盘点:Whisper、Gemini Speech

    本文分析了当前主流AI语音大模型的核心优势与应用场景。全球顶尖模型包括:OpenAI Whisper(多语言识别与翻译)、Google Gemini(情感化语音生成)、Meta AudioCraft(音乐创作与风格转换)。国内讯飞星火(方言识别)、阿里通义(电商客服)、百度文心(车载场景)表现突出。技术突破点在于云端协同架构、零样本克隆和情感语音合成。选择模型需考虑语言支持、场景适配、部署

  • 「6月26日AI日报」可灵AI推全球首部AIGC单元剧;谷歌开源AI智能体Gemini CLI

    AI行业近期动态汇总:1)豆包AI编程升级为"应用创作1.0",支持可视化编辑和实时预览,降低开发门槛;2)谷歌开源Gemini CLI工具,集成Gemini 2.5 Pro模型,提供免费编程助手;3)Anthropic推出"Artifacts"功能,用户无需编程即可在Claude中创建AI应用;4)出门问问发布TicNote+硬件产品,内置Shadow AI技术;5)OpenAI将Codex CLI重构为Rust语言以提升性能;6)谷歌发布Imagen4文生图模型,突�

  • AI日报:智谱上线PPT生成功能AI Slides;可灵 AI 发布可图2.1模型

    本文介绍了AI日报栏目及近期AI领域多项突破性进展:1)智谱推出免费AI Slides工具,基于GLM模型快速生成高质量PPT;2)可灵AI发布可图2.1模型,支持180多种风格图像生成;3)NVIDIA推出DiffusionRenderer技术,实现视频到可编辑3D场景转换;4)墨刀AI新增30秒生成高保真原型功能;5)Higgsfield推出Soul ID工具,10张照片即可生成虚拟形象;6)谷歌DeepMind开源GenAI Processors工具库;7)谷歌Veo新增图像转视频功能;8)Mistral AI发布专为代码建模的Devstral2507系列模型。这些创新展示了AI在内容生成、3D建模、产品设计等领域的快速发展。

  • MasterAgent颠覆性上线:一键式生成智能体集群,分钟级构建专属AI协作网络

    全球首个L4+级智能体母系统MasterAgent在深圳发布,标志着AI从"被动执行工具"升级为能主动思考、跨界解决问题的"数字伙伴"。该系统突破性实现三大功能:一键生成智能体集群、多智能体自主协作、灵活定制优化。核心技术突破包括动态Agent生成框架将开发周期压缩至分钟级,以及去中心化多智能体协同机制,支持数百个智能体像"数字团队"一样高效协作。由深圳深元人工智能科技自主研发,其团队依托中国科学技术大学专家资源,已快速成长为国家级高新技术企业。这一突破让AI真正成为能创造实际价值的"新生产力单元"。

  • 办公娱乐两不误!会参谋MINI主机,打造智能家庭工作站与娱乐中心

    随着远程办公普及,迷你PC市场需求激增。会参谋推出LP1C基础版和LP5C升级版两款迷你主机:LP1C搭载英特尔N100处理器,重不足500g,支持4K输出,满足日常办公需求;LP5C采用i5-12450HX处理器,性能提升200%,支持双4K显示,适合专业创作。两款产品覆盖从基础办公到高性能需求场景,通过差异化配置精准满足不同用户需求,重新定义轻量化办公设备标准,展现智能办公领域创新实力。