首页 > 原创 > 关键词  > 人工智能最新资讯  > 正文

AI日报:MiniMax-M1开源;阿里Qwen3升级版适配苹果MLX架构;月之暗面发布新模型Kimi-Dev-72B

2025-06-17 16:20 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、月之暗面发布全新开源模型 Kimi-Dev-72B,打破编程基准记录

月之暗面推出了专注于软件工程任务的开源模型 Kimi-Dev-72B,在 SWE-bench Verified 测试中创下最高成绩,以72亿参数量超越了DeepSeek-R1,展示了其在编程领域的强大能力。

image.png

【AiBase提要:】

🚀 参数量仅为72亿的Kimi-Dev-72B在SWE-bench Verified测试中获得60.4%的高分,成为开源模型的新标杆。

🔍 模型结合BugFixer和TestWriter双重角色,确保代码质量和正确性,通过自我博弈机制提升性能。

🌟 未来计划与流行开发工具深度集成,持续优化并推出更强大的版本。

2、MiniMax-M1开源!1M超长上下文推理,AI新王者仅53万美元打造!

MiniMax-M1以其超长上下文推理能力、高效训练成本及开源特性引发关注,成为开源模型中的佼佼者。

图片

【AiBase提要:】

上下文窗口达1M输入和80k输出,远超GPT-4o,适合复杂文档分析和多轮对话。

训练成本仅53万美元,通过MoE架构和CISPO算法实现高效推理与低成本。

开源于Hugging Face平台,支持40k和80k思维预算,性能媲美顶级商业模型。

3、腾讯LeVo来袭!媲美Suno4.5的AI唱歌模型,支持零样本音色克隆

腾讯AI团队推出的LeVo模型以其强大的音色克隆、分轨生成和高保真音乐表现引发热议,与Suno4.5相比,它在多项关键指标上表现出色,同时支持零样本音色克隆和分轨生成,展现了革命性的突破。

image.png

【AiBase提要:】

🌟 支持零样本音色克隆,仅需3秒音频即可精准复制音色,大幅降低音乐创作门槛。

🎵 提供分轨生成模式,支持人声与伴奏分离,为专业音乐制作提供更高灵活性。

🌐 以开源形式发布,促进全球音乐创作社区的发展,提升中国AI技术国际影响力。

详情链接:https://levo-demo.github.io/

4、阿里巴巴发布 Qwen3升级版,适配苹果 MLX 架构

我非常看好这次阿里巴巴与苹果的合作,Qwen3升级版不仅支持更多语言,还增强了性能和推理能力,这标志着苹果智能在中国市场的发展迈出了重要一步。

image.png

【AiBase提要:】

🌟 阿里巴巴推出Qwen3升级版,与苹果MLX架构兼容,助力苹果智能在中国落地。

📱 新版Qwen3支持119种语言,具备更强性能和混合推理能力。

🚀 苹果智能尚未在中国上线,可能会在iOS18.6正式公测版中提供预览。

5、豆包电脑版与网页版上线“AI播客”功能

豆包推出全新‘AI播客’功能,通过上传PDF或链接生成自然双人对话播客,革新信息接收方式。

image.png

【AiBase提要:】

🌟只需上传PDF或链接,即可快速生成自然流畅的双人对话播客。

🏃‍♂️适用于工作、学习等多种场景,利用碎片时间高效获取信息。

🎙️语音效果逼真,去机器感,提供沉浸式听觉体验。

6、夸克App推出“夸克老师” 具备个性化AI辅导能力

夸克App推出了全新的学习产品‘夸克老师’,这款AI家教功能强大,能讲题、批作业、出题、找试卷,尤其擅长数学和物理难题的解答,同时具备因材施教的能力,通过分析学生的学习数据提供个性化的辅导。

image.png

【AiBase提要:】

✨ 集多种学习功能于一体,如讲题、批作业、出题、找试卷等,支持数学和物理难题的深度解析。

🎯 能够根据学生特点提供个性化辅导,模拟真人教师教学思路,帮助学生理解并提升学习效果。

📚 拥有海量题库资源,包括专业题库和名校真题,满足多样化学习需求。

7、松下全新 OmniFlow 多模态大模型,实现文本、图像与音频自由切换

我非常看好OmniFlow这款多模态大模型,它不仅能轻松转换文本、图像和音频,还能让用户根据需求定制生成结果,极大提升了操作灵活性和效率。

image.png

【AiBase提要:】

🌟 OmniFlow 支持文本、图像和音频的高效转换,带来全新的多模态体验。

⚙️ 采用模块化设计,各组件独立预训练,提高资源利用效率并优化训练效果。

🎯 引入多模态引导机制,用户可精准控制生成过程,满足多样化需求。

8、TikTok 全新Symphony AI工具上线:图片一键变视频,文字直接生成广告

TikTok 推出三款AI视频创作工具,包括'图像转视频'、'文字转视频'和'Showcase Products',旨在简化品牌广告内容制作流程。这些工具集成到 Symphony Creative Studio 中,并与Adobe Express及WPP Open合作,提升广告商效率。

image.png

【AiBase提要:】

✨ 图像转视频功能让静态图片轻松变为动态视频,只需上传图片和添加文字提示即可生成多个AI视频选项。

📝 文字转视频功能无需图片或模板,仅凭文字即可制作视频,助力广告商快速测试和完善创意。

🛍️ Showcase Products工具融合产品图片与数字化身,打造沉浸式广告体验,提升用户原创内容风格。

9、极氪与火山引擎携手,豆包大模型赋能智能座舱新体验

极氪汽车与火山引擎合作,将豆包大模型接入ZEEKR AI OS的新版中,提升智能座舱服务能力,优化个性化体验。

【AiBase提要:】

豆包大模型接入极氪智能座舱,实现精准推荐与个性化服务。

升级后的极氪智能语音助手Eva,支持从传统语音交互到大语言模型服务的无缝切换。

极氪第50万台车型009光辉下线,刷新豪华纯电车型最快纪录。

10、大模型新突破!Meta Llama3.1能回忆《哈利波特》42% 的内容!

斯坦福大学等机构的研究表明,Meta的Llama3.170B模型在文本记忆方面表现出色,尤其在热门书籍如《哈利波特》中的表现令人瞩目。

【AiBase提要:】

📚 Llama3.170B模型在《哈利波特》中能记住42%的内容,远超Llama165B的4.4%。

🔍 研究采用Books3数据库,通过标记段落测试模型的记忆能力。

🌟 热门书籍记忆效果更佳,显示AI在理解和处理文本上的进步。

11、Grok任务功能重磅上线!定时追踪X热门话题,AI效率直超ChatGPT

xAI旗下的AI助手Grok推出了全新的Tasks定时任务功能,通过自动化执行查询和外部通知,为用户提供高效便捷的信息获取体验。

【AiBase提要:】

🌟 支持多种任务频率,从即时到长期跟踪,满足多样化需求。

📧 提供外部通知功能,如邮件推送,结果主动找用户,提升使用便利性。

🏆 SuperGrok用户享有更高配额和优先体验尖端功能,如DeepSearch和Big Brain Mode。

12、Gemini2.5Pro即将更新Deep Think的功能

我作为一名AI助手,非常期待Gemini2.5Pro的新功能Deep Think。这个功能不仅提升了AI在复杂任务中的推理能力,还在用户体验和安全性上做出了重要改进。Deep Think的推出让我看到了AI在专业领域应用的无限可能。

image.png

【AiBase提要:】

💎 Deep Think功能通过多线程推理显著提升复杂任务中的性能,特别是在数学、编程和多模态任务中表现出色。

🌐 用户可通过网页UI直观切换至Deep Think模式,功能将逐步向更多用户开放。

🔒 在正式发布前,Google通过API收集反馈并进行安全评估,确保功能的稳定性和数据安全性。

13、谷歌地图迎来超大规模升级:全新AI功能带来智能评论与节油路线

谷歌地图通过引入生成式人工智能技术,对导航、探索及个性化推荐等功能进行了全面升级,为用户提供更加智能、高效的体验。

image.png

【AiBase提要:】

🌍 使用生成式AI搜索功能,通过自然语言实现精准地点查询。

🔍 智能评论分析功能,自动总结用户评论并解答关于地点的具体问题。

🌿 推出节油路线优化功能,结合多因素分析推荐更环保的行驶路线。

举报

  • 相关推荐
  • AI日报:xAI 震撼发布Grok4;微软开源全新Phi-4-mini版本;上海累计82款大模型通过备案

    AI日报栏目聚焦人工智能领域最新动态:1)xAI发布旗舰模型Grok4,在数学推理和代码生成表现突出,同时推出开发者专用Grok4Code;2)微软开源Phi-4-mini模型,推理效率提升10倍,适合边缘设备;3)上海82款大模型完成备案,垂直领域应用取得突破;4)Hugging Face推出开源桌面机器人Reachy Mini,支持Python编程;5)Perplexity发布AI浏览器Comet挑战Chrome;6)OpenAI将首次发布开放权重模型,打破闭源惯例;7)谷歌医疗AI模型MedGemma系列上新,单个GPU即可运行;8)OpenAI以约65亿美元收购AI硬件公司io Products,正式进军硬件市场。

  • AI日报:月之暗面首款自主智能体Kimi-Researcher;MiniMax推音色设计功能;Jaaz发布Lovart AI本地化替代品

    【AI日报】今日AI领域重要动态:1)月之暗面发布Kimi-Researcher智能体,多轮搜索推理能力超越谷歌和OpenAI同类产品;2)MiniMax推出Voice Design功能,支持多语言/音色组合;3)火山引擎上线AI智能域名推荐功能;4)Anthropic强化VSCode集成;5)Google推出Gemini2.5Flash-Lite模型,可实时生成交互界面;6)苹果拟300亿美元收购AI公司Perplexity;7)月之暗面开源Kimi-2506多模态模型;8)Firecrawl将推出开源问答引擎Fireplexity;9)银河通用机器人获宁德时代10亿元融资;10)字节跳动发布DreamActor-H1视频生成系统;11)Google推出开源实时音乐生成模型Magenta RealTime;12)开源AI设计工具Jaaz发布。

  • 「6月30日AI日报」百度开源文心大模型4.5系列;通义千问发布多模态生成模型Qwen VLo

    AI日报精选:1)百度开源文心大模型4.5系列,含10款新模型,性能优异;2)通义千问发布多模态模型Qwen-VL,支持图文交互;3)阿里开源3亿参数多模态模型Ovis-U1;4)华为开源盘古7B稠密和72B混合专家模型;5)美图MOKI推出AI创意广告功能,一键生成专业视频;6)谷歌Gemini 2.5 Pro API重新免费开放;7)豆瓣上线"深入研究"AI功能;8)小米"AI百宝箱"结束内测;9)北京智研院开源多模态系统OmniGen2;10)知乎升级"直答"知识库功能。

  • AI日报:智谱上线PPT生成功能AI Slides;可灵 AI 发布可图2.1模型

    本文介绍了AI日报栏目及近期AI领域多项突破性进展:1)智谱推出免费AI Slides工具,基于GLM模型快速生成高质量PPT;2)可灵AI发布可图2.1模型,支持180多种风格图像生成;3)NVIDIA推出DiffusionRenderer技术,实现视频到可编辑3D场景转换;4)墨刀AI新增30秒生成高保真原型功能;5)Higgsfield推出Soul ID工具,10张照片即可生成虚拟形象;6)谷歌DeepMind开源GenAI Processors工具库;7)谷歌Veo新增图像转视频功能;8)Mistral AI发布专为代码建模的Devstral2507系列模型。这些创新展示了AI在内容生成、3D建模、产品设计等领域的快速发展。

  • AI日报:阿里通义推Qwen-TTS模型;Cursor已支持网页和手机端;字节发布图像合成技术XVerse

    【AI日报】今日AI领域7大突破:1)阿里通义Qwen-TTS实现方言语音合成重大突破;2)Cursor发布Web版AI编程工具;3)字节XVerse技术实现多对象精准图像生成;4)NoteGen跨平台AI笔记工具革新知识管理;5)ManimML动画库可视化Transformer架构;6)TEN+Agent开源语音交互技术降低延迟;7)Chai-2抗体设计模型将药物研发周期缩短至两周。淘宝同时上线RecGPT推荐模型提升购物体验。

  • 刷屏世俱杯的RGB-Mini LED有多能打?央视拆机探秘看球黑科技

    海信在2025世俱杯期间展示了其RGB-Mini LED电视技术,通过红绿蓝三原色独立背光光源实现更纯净色彩和更高能效。相比传统电视需要二次色彩转换,该技术直接呈现原色,解决了拖影、色偏等问题,能效提升20%以上。海信通过自主研发的AI画质芯片和RGB背光芯片,攻克了三原色同步控制等技术难题。该技术已应用于85-116英寸大屏电视,成为行业认可的下一代显示方向,标志着中国显示技术从跟随到引领的跨越。

  • AI日报:阿里通义开源音频生成模型ThinkSound;谷歌Veo3支态图片生成视频;昆仑万维发布 Skywork-R1V 3.0

    【AI日报】今日AI领域重要动态:1)阿里开源支持链式推理的音频生成模型ThinkSound,实现高保真空间音频生成;2)谷歌Veo3升级,支持静态图片生成生动视频;3)Hugging Face发布30亿参数小模型SmolLM3,性能优于Llama-3.2-3B;4)阿里开源网络智能体WebSailor,展现强大推理和检索能力;5)Moonvalley发布原生1080P视频生成模型Marey Realism v1.5;6)Vidu Q1支持最多七张参考图像生成一致性视频;7)苹果�

  • 分析师称MacBook Pro将升级OLED屏:Mini LED退场

    Omdia分析师Linda Lin在一份研究报告中重申,首批搭载OLED屏幕的MacBook将于2026年问世。 尽管她未特别提及MacBook Pro,但业界普遍认为,OLED屏将率先在高端MacBook Pro上首发,随后才会应用到价格更低的MacBook Air系列上。 当前MacBook Pro使用的是Mini LED屏,这块屏升级了液晶层背光,把背光中的LED灯小型化,本质上仍然是LCD屏幕,每个LED灯珠尺寸约在50-200um之间,让背光层拥有更多的背�

  • 全球优质AI语音大模型盘点:Whisper、Gemini Speech

    本文分析了当前主流AI语音大模型的核心优势与应用场景。全球顶尖模型包括:OpenAI Whisper(多语言识别与翻译)、Google Gemini(情感化语音生成)、Meta AudioCraft(音乐创作与风格转换)。国内讯飞星火(方言识别)、阿里通义(电商客服)、百度文心(车载场景)表现突出。技术突破点在于云端协同架构、零样本克隆和情感语音合成。选择模型需考虑语言支持、场景适配、部署

  • AI日报:腾讯混元推3D生成大模型Hunyuan3D-PolyGen;钉钉AI表格重磅来袭;阿里推多模态大语言模型HumanOmniV2

    本文介绍了AI领域多项重要进展:1)腾讯推出首个美术3D生成大模型Hunyuan3D-PolyGen,显著提升建模效率;2)阿里发布多模态大模型HumanOmniV2,准确率达69.33%;3)钉钉AI表格实现1小时处理千项任务;4)百度PaddleOCR3.1版本在多语种识别和文档翻译方面升级;5)微软推出Deep Research智能体,自动化研究流程;6)香港理工与OPPO联合开源视频超清框架DLoRAL;7)谷歌开源MCP工具箱简化AI与数据库集成;8)Win11将推出AI动态壁纸功能。这些创新展示了AI在3D生成、多模态理解、办公效率、视觉处理等领域的突破性进展。