首页 > 原创 > 关键词  > 人工智能最新资讯  > 正文

AI日报:MiniMax-M1开源;阿里Qwen3升级版适配苹果MLX架构;月之暗面发布新模型Kimi-Dev-72B

2025-06-17 16:20 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、月之暗面发布全新开源模型 Kimi-Dev-72B,打破编程基准记录

月之暗面推出了专注于软件工程任务的开源模型 Kimi-Dev-72B,在 SWE-bench Verified 测试中创下最高成绩,以72亿参数量超越了DeepSeek-R1,展示了其在编程领域的强大能力。

image.png

【AiBase提要:】

🚀 参数量仅为72亿的Kimi-Dev-72B在SWE-bench Verified测试中获得60.4%的高分,成为开源模型的新标杆。

🔍 模型结合BugFixer和TestWriter双重角色,确保代码质量和正确性,通过自我博弈机制提升性能。

🌟 未来计划与流行开发工具深度集成,持续优化并推出更强大的版本。

2、MiniMax-M1开源!1M超长上下文推理,AI新王者仅53万美元打造!

MiniMax-M1以其超长上下文推理能力、高效训练成本及开源特性引发关注,成为开源模型中的佼佼者。

图片

【AiBase提要:】

上下文窗口达1M输入和80k输出,远超GPT-4o,适合复杂文档分析和多轮对话。

训练成本仅53万美元,通过MoE架构和CISPO算法实现高效推理与低成本。

开源于Hugging Face平台,支持40k和80k思维预算,性能媲美顶级商业模型。

3、腾讯LeVo来袭!媲美Suno4.5的AI唱歌模型,支持零样本音色克隆

腾讯AI团队推出的LeVo模型以其强大的音色克隆、分轨生成和高保真音乐表现引发热议,与Suno4.5相比,它在多项关键指标上表现出色,同时支持零样本音色克隆和分轨生成,展现了革命性的突破。

image.png

【AiBase提要:】

🌟 支持零样本音色克隆,仅需3秒音频即可精准复制音色,大幅降低音乐创作门槛。

🎵 提供分轨生成模式,支持人声与伴奏分离,为专业音乐制作提供更高灵活性。

🌐 以开源形式发布,促进全球音乐创作社区的发展,提升中国AI技术国际影响力。

详情链接:https://levo-demo.github.io/

4、阿里巴巴发布 Qwen3升级版,适配苹果 MLX 架构

我非常看好这次阿里巴巴与苹果的合作,Qwen3升级版不仅支持更多语言,还增强了性能和推理能力,这标志着苹果智能在中国市场的发展迈出了重要一步。

image.png

【AiBase提要:】

🌟 阿里巴巴推出Qwen3升级版,与苹果MLX架构兼容,助力苹果智能在中国落地。

📱 新版Qwen3支持119种语言,具备更强性能和混合推理能力。

🚀 苹果智能尚未在中国上线,可能会在iOS18.6正式公测版中提供预览。

5、豆包电脑版与网页版上线“AI播客”功能

豆包推出全新‘AI播客’功能,通过上传PDF或链接生成自然双人对话播客,革新信息接收方式。

image.png

【AiBase提要:】

🌟只需上传PDF或链接,即可快速生成自然流畅的双人对话播客。

🏃‍♂️适用于工作、学习等多种场景,利用碎片时间高效获取信息。

🎙️语音效果逼真,去机器感,提供沉浸式听觉体验。

6、夸克App推出“夸克老师” 具备个性化AI辅导能力

夸克App推出了全新的学习产品‘夸克老师’,这款AI家教功能强大,能讲题、批作业、出题、找试卷,尤其擅长数学和物理难题的解答,同时具备因材施教的能力,通过分析学生的学习数据提供个性化的辅导。

image.png

【AiBase提要:】

✨ 集多种学习功能于一体,如讲题、批作业、出题、找试卷等,支持数学和物理难题的深度解析。

🎯 能够根据学生特点提供个性化辅导,模拟真人教师教学思路,帮助学生理解并提升学习效果。

📚 拥有海量题库资源,包括专业题库和名校真题,满足多样化学习需求。

7、松下全新 OmniFlow 多模态大模型,实现文本、图像与音频自由切换

我非常看好OmniFlow这款多模态大模型,它不仅能轻松转换文本、图像和音频,还能让用户根据需求定制生成结果,极大提升了操作灵活性和效率。

image.png

【AiBase提要:】

🌟 OmniFlow 支持文本、图像和音频的高效转换,带来全新的多模态体验。

⚙️ 采用模块化设计,各组件独立预训练,提高资源利用效率并优化训练效果。

🎯 引入多模态引导机制,用户可精准控制生成过程,满足多样化需求。

8、TikTok 全新Symphony AI工具上线:图片一键变视频,文字直接生成广告

TikTok 推出三款AI视频创作工具,包括'图像转视频'、'文字转视频'和'Showcase Products',旨在简化品牌广告内容制作流程。这些工具集成到 Symphony Creative Studio 中,并与Adobe Express及WPP Open合作,提升广告商效率。

image.png

【AiBase提要:】

✨ 图像转视频功能让静态图片轻松变为动态视频,只需上传图片和添加文字提示即可生成多个AI视频选项。

📝 文字转视频功能无需图片或模板,仅凭文字即可制作视频,助力广告商快速测试和完善创意。

🛍️ Showcase Products工具融合产品图片与数字化身,打造沉浸式广告体验,提升用户原创内容风格。

9、极氪与火山引擎携手,豆包大模型赋能智能座舱新体验

极氪汽车与火山引擎合作,将豆包大模型接入ZEEKR AI OS的新版中,提升智能座舱服务能力,优化个性化体验。

【AiBase提要:】

豆包大模型接入极氪智能座舱,实现精准推荐与个性化服务。

升级后的极氪智能语音助手Eva,支持从传统语音交互到大语言模型服务的无缝切换。

极氪第50万台车型009光辉下线,刷新豪华纯电车型最快纪录。

10、大模型新突破!Meta Llama3.1能回忆《哈利波特》42% 的内容!

斯坦福大学等机构的研究表明,Meta的Llama3.170B模型在文本记忆方面表现出色,尤其在热门书籍如《哈利波特》中的表现令人瞩目。

【AiBase提要:】

📚 Llama3.170B模型在《哈利波特》中能记住42%的内容,远超Llama165B的4.4%。

🔍 研究采用Books3数据库,通过标记段落测试模型的记忆能力。

🌟 热门书籍记忆效果更佳,显示AI在理解和处理文本上的进步。

11、Grok任务功能重磅上线!定时追踪X热门话题,AI效率直超ChatGPT

xAI旗下的AI助手Grok推出了全新的Tasks定时任务功能,通过自动化执行查询和外部通知,为用户提供高效便捷的信息获取体验。

【AiBase提要:】

🌟 支持多种任务频率,从即时到长期跟踪,满足多样化需求。

📧 提供外部通知功能,如邮件推送,结果主动找用户,提升使用便利性。

🏆 SuperGrok用户享有更高配额和优先体验尖端功能,如DeepSearch和Big Brain Mode。

12、Gemini2.5Pro即将更新Deep Think的功能

我作为一名AI助手,非常期待Gemini2.5Pro的新功能Deep Think。这个功能不仅提升了AI在复杂任务中的推理能力,还在用户体验和安全性上做出了重要改进。Deep Think的推出让我看到了AI在专业领域应用的无限可能。

image.png

【AiBase提要:】

💎 Deep Think功能通过多线程推理显著提升复杂任务中的性能,特别是在数学、编程和多模态任务中表现出色。

🌐 用户可通过网页UI直观切换至Deep Think模式,功能将逐步向更多用户开放。

🔒 在正式发布前,Google通过API收集反馈并进行安全评估,确保功能的稳定性和数据安全性。

13、谷歌地图迎来超大规模升级:全新AI功能带来智能评论与节油路线

谷歌地图通过引入生成式人工智能技术,对导航、探索及个性化推荐等功能进行了全面升级,为用户提供更加智能、高效的体验。

image.png

【AiBase提要:】

🌍 使用生成式AI搜索功能,通过自然语言实现精准地点查询。

🔍 智能评论分析功能,自动总结用户评论并解答关于地点的具体问题。

🌿 推出节油路线优化功能,结合多因素分析推荐更环保的行驶路线。

举报

  • 相关推荐
  • Razer(雷蛇)在新加坡设立AI CENTER OF EXCELLENCE,加速人工智能投资布局

    雷蛇宣布在新加坡设立全球AI卓越中心,并计划在欧洲和美国建立类似机构,推动游戏与开发者工具领域的创新。新加坡中心将招聘150名AI工程师,专注于下一代AI游戏技术研发。雷蛇还推出AI工具套件,包括Game Co-AI和QA Co-AI,帮助开发者提升游戏质量和开发效率。该战略布局正值全球游戏市场快速增长期,预计2033年AI游戏市场规模将达280亿美元。新加坡数字产业发展局表示,此举将巩固该国作为区域AI创新中心的地位。

  • 润和软件携丰富金融行业实践成果亮相2025世界人工智能大会

    润和软件在2025世界人工智能大会(WAIC2025)上展示了JettoAI+智能助手平台等系列智慧金融解决方案,包括测试智能助手、消保助手、研报助手等创新产品。作为金融科技领域领先企业,润和软件深耕AI与金融业务融合,已服务6大国有银行、12家股份制银行及超280家中小金融机构。报告显示中国金融科技市场预计将以13.3%复合增长率高速增长,2028年科技投入或突破6500亿元。润和软件�

  • 星辰聚智·才启未来:2025世界人工智能大会中国电信发布系列前沿能力及AI产品

    7月27日,TeleAI科技前沿论坛在上海模速空间举办,主题为"星辰聚智·才启未来"。论坛汇聚全球行业专家、青年学者及企业家,探讨AI创新趋势。中国电信发布多项AI成果:1)TeleAI研究院凭借大模型创新获2025SAIL之星奖;2)提出"智传网"三大定律(信容律、同源律、集成律)及生成式智能传输等创新技术;3)发布"星小辰"智能终端,整合高德地图、航旅纵横等服务;4)推出首款智能眼镜"天翼AI智镜",具备物体识别、实时翻译等功能;5)启动"青年智算计划",投入超600P算力支持AI创新。论坛展示AI在终端、机器人等领域的深度应用,体现中国电信"云改数转智惠"战略布局。

  • AI日报:阿里新发布Qwen3-4B模型;小红书发布开源模型dots.vlm1;MiniMax Speech 2.5语音生成模型上线

    AI日报栏目聚焦人工智能领域最新动态:1)阿里发布Qwen3-4B轻量级模型,手机端可运行;2)小红书开源多模态大模型dots.vlm1,在图表推理方面表现突出;3)MiniMax推出语音生成模型Speech2.5,多语种表现提升;4)Midjourney推出HD视频模式,提升专业影像质量;5)Cursor1.4版本增强异步任务处理能力;6)谷歌否认AI搜索影响网站流量,但数据显示用户行为改变;7)MiniCPM-V4.0开源发布,号称"手机上的GPT-4V";8)AMD与高通宣布支持OpenAI的gpt-oss系列模型;9)腾讯开源WeKnora文档智能解析工具;11)疑似GPT-5信息在GitHub泄露;12)FlowSpeech实现书面语转口语的TTS技术突破。

  • AI 大模型选型指导:一文实测 Kimi‑K2‑Turbo‑Preview 与 Qwen3‑Coder‑Flash

    本文对比分析了Kimi-K2-Turbo-Preview和Qwen3-Coder-Flash两款AI大模型在开发者选型中的表现。K2-Turbo采用MoE架构,激活参数32B,支持128K上下文,在代码调试和自动化流程方面表现突出;Qwen3-Coder为480B参数的MoE模型,原生支持256K上下文,擅长大规模代码库理解和API集成。二者在中级任务表现接近,但K2在复杂可视化任务更优,Qwen3在多轮Agent调用更稳定。建议根据需求选择:注重调试自动化选K2,需要长上下文支持选Qwen3。推荐使用AIbase模型广场进行高效选型对比。

  • 加佳科技亮相世界人工智能大会,参与浦东重点项目签约并发布创新技术成果

    2025世界人工智能大会(WAIC)7月26日在上海开幕。加佳智云的"曦源一号"项目入选浦东新区人工智能重点项目并签约合作协议。加佳科技首次发布"数字商务智能体训练场"创新技术平台,与多家企业达成战略合作。浦东新区人工智能产业规模超1600亿元,占全市40%。加佳科技通过"曦源一号"训练场基础底座平台,为行业提供"硬件+软件+产业解决方案"一体化服务,推动AI与产业深度融合。大会期间,加佳科技展示其核心成果"数字商务智能体训练场"平台,该平台依托国产替代算力,提供全生命周期开发运营服务,降低企业AI应用门槛。加佳科技还与多家企业达成合作,加速构建开放共生的AI产业生态。

  • OpenAI发布2款开源模型:gpt-oss系列 能力接近o3和o4-mini

    OpenAI发布开源模型系列GPT-OSS,包含120B和20B两个版本。120B旗舰模型适配单H100 GPU架构,20B轻量版适合边缘计算。两款模型均开放完整推理链监控接口,支持动态参数调节和任务微调优化,性能接近闭源的GPT-O3和O4-mini。该系列突破性地支持代理功能,包括网页交互和Python代码执行,在标准化测试中表现优异。开源策略为开发者提供高性能替代方案,重新定义了AI模型的应用边界。

  • AI日报:混元推四款小尺寸开源模型;昆仑万维发布新推理大模型MindLink;谷歌Gemini 2.5 Deep Think发布

    【AI日报】汇总了最新AI领域动态:1)腾讯开源混元系列小尺寸模型,适用于消费级显卡;2)昆仑万维发布推理大模型MindLink,提升回答透明度;3)B站推出AI原声翻译功能,保留UP主音色;4)谷歌Gemini 2.5在数学奥赛夺金,展现强大推理能力;5)OpenAI展示GPT-5网络信息整合特性;6)苹果组建AI团队挑战ChatGPT;7)高德地图推出全球首个AI原生地图应用;8)Adobe推出AI图像合成工具Harmonize;9)NVIDIA发布革命性视频渲染技术;10)谷歌推出Android Studio免费AI编程助手;11)开源结构化信息提取工具LangExtract;12)Figma开发者模式升级提升设计转代码效率。

  • 零门槛数字IP上线,邦彦Nuwaai掀起世界人工智能大会(WAIC)互动体验热潮​

    邦彦技术在2025世界人工智能大会发布Nuwaai数字人平台,主打"3分钟创建AI数字IP"概念。该平台通过三大核心模块(形象塑造、才艺赋能、个性养成)实现数字人全流程创作,支持古风、职业装等多种风格定制,并能加载营销、直播等专业技能。相比传统方案,Nuwaai将开发成本降至8元起,交付周期缩短至3分钟,支持按需加载功能。平台定位"数字人生产力工具",覆盖营销、社交、娱乐等多场景应用,旨在推动数字人技术从概念探索迈向实用化。目前官网已开放注册,面向个人创作者和企业用户提供低成本数字IP解决方案。

  • Checkout.com项尧受邀参与 WAIC2025 共话人工智能时代跨境支付新机遇

    2025世界人工智能大会(WAIC)于7月26-28日在上海举办,全球领先支付解决方案提供商Checkout.com受邀参与"无界人工智能:深化中英合作"主题论坛。其大中华区总经理项尧与行业专家探讨AI赋能跨境商业生态的创新实践,重点分享公司在代理电商平台(Agentic Commerce)领域的支付技术创新,包括与Mastercard、Visa合作构建支持AI代理交易的技术框架。作为支付行业领军者,Checkout.com通过智能支付网络帮助电商平台优化交易管理,支持多币种支付,每年为客户解锁数亿美元收入潜力。本届WAIC展览面积首次突破7万平方米,吸引800余家企业参展,涵盖40余款大模型及60余款智能机器人。

热文

  • 3 天
  • 7天