首页 > AI头条  > 正文

​微软推首款自家研发AI模型MAI-Voice-1和MAI-1-preview,与OpenAI竞争

2025-08-29 09:27 · 来源: AIbase基地

近日,微软的人工智能部门正式发布了其首个自家研发的 AI 模型,命名为 MAI-Voice-1和 MAI-1-preview。这标志着微软在人工智能领域的进一步发展,尤其是在与 OpenAI 的竞争中。

image.png

MAI-Voice-1是一个语音模型,能够在不到一秒的时间内生成一分种的音频,只需一块 GPU 即可实现。微软表示,MAI-Voice-1已经应用于多个功能之中,例如 “Copilot Daily”,这个功能可以让 AI 主持人为用户朗读当天的头条新闻,并生成类似播客的讨论,以帮助解释各种主题。

用户可以在 Copilot Labs 中体验 MAI-Voice-1,输入想让 AI 模型说的话,并可选择不同的声音和演讲风格。此外,微软还推出了 MAI-1-preview 模型,该模型在大约15,000块 Nvidia H100GPU 上进行训练,主要针对需要能够遵循指令并提供日常查询帮助的用户。

微软 AI 首席官 Mustafa Suleyman 曾在去年接受采访时表示,公司的内部 AI 模型并不专注于企业级的应用案例。他强调,微软致力于创造对消费者非常有用的产品,并在广告和消费者行为数据方面拥有丰富的预测能力。未来,MAI-1-preview 将应用于 Copilot AI 助手的一些文本使用场景,目前该助手还依赖于 OpenAI 的大型语言模型。

微软在其博客中表示:“我们对未来的发展抱有雄心,不仅会追求进一步的进步,还相信通过协调一系列不同用户意图和使用场景的专业模型,将释放巨大的价值。”

官方博客:https://microsoft.ai/news/two-new-in-house-models/

划重点:

🌟 微软推出 MAI-Voice-1和 MAI-1-preview 两款自家开发的 AI 模型,提升与 OpenAI 的竞争力。

🗣️ MAI-Voice-1可以快速生成音频,已应用于 Copilot Daily 等多个功能。

🚀 MAI-1-preview 将用于 Copilot AI 助手的文本处理,标志着微软在消费级 AI 领域的新进展。

  • 相关推荐
  • OpenAI的开源模型现已在IBM watsonx.ai上提供

    OpenAI发布两款开源AI模型GPT-OSS-120B和GPT-OSS-20B,允许开发者自由下载、运行和定制。其中120B模型已部署在IBM Watsonx.ai平台,采用专家混合架构,支持本地或云端部署,不受商业用途限制。模型具备高透明度,输出完整推理链,在多项基准测试中表现优异。此次发布标志着OpenAI首次加入开源生态,IBM强调其开放战略,为企业提供灵活、安全的AI开发选择。

  • AI日报:海螺AI首尾帧功能上线;元石科技发布问小白5;OpenAI发布全新语音模型GPT-Realtime

    AI日报栏目每日提供人工智能领域热点内容,聚焦开发者,帮助洞悉技术趋势、了解创新AI产品应用。最新动态包括:MiniMax海螺AI首尾帧功能上线;元石科技发布问小白5挑战GPT-5;OpenAI推出语音模型GPT-Realtime;谷歌Gemini AI优化表格处理;腾讯黑科技实现AI配音;百度计划培养千万AI人才;MathGPT.ai反作弊功能推广;苹果Xcode集成Claude Sonnet4;微软发布自研AI模型MAI系列;xAI推出高效编码模型Grok Code Fast1;SuperCLUE多模态评测Gemini-2.5-Pro居首;9月1日起AI内容标识新规实施,违规将承担法律风险。

  • AI与数字化变革费率3年连降,海尔智家H1再优化0.1pct

    海尔智家2025上半年业绩逆势增长,营收1564.94亿元,同比增长10.2%;净利润120.33亿元,增长15.6%。核心驱动因素为数字化转型与AI技术应用,通过全流程降本增效,销售管理费用率连续三年下降。国内聚焦明星爆品与多品牌协同,海外坚持本土化运营,实现各区域加速增长。AI驱动的产品创新打造多个行业爆款,带动高端品牌卡萨帝增长超20%。未来将持续深化数字化变革,开拓新发展空间。

  • 再次定义行业创新范式 跃然创新推出全球首款端到端 AI 玩具 CocoMate

    8月26日,跃然创新推出全球首款搭载端到端语音模型的AI玩具CocoMate系列。该产品采用可拆卸设计,配备3000mAh电池,支持4G和WiFi网络。依托端到端技术,具备丰富交互表现和拟人化情感能力,支持多重唤醒、主题游戏及聊天室等功能。新品将于8月27日开售,首发包含奥特曼及原创IP“泡泡”等角色,后续还将上线财神爷、塔罗猫等系列,目标人群从儿童延伸至成年人。

  • AI日报:字节视频模型Waver 1.0发布;百度AI搜索APP“梯子AI”发布;谷歌推全新Gemini 2.5 Flash图像编辑模型

    本文汇总了AI领域最新动态:谷歌推出Gemini 2.5 Flash图像编辑模型,字节发布Waver 1.0视频生成工具;百度“梯子AI”提供无广告搜索;文心快码新增终端编码功能;腾讯游戏VISVISE工具集提升动画制作效率;自动驾驶配送机器人RM5进军外卖行业;DeepSeek V3.1出现字符Bug已修复;谷歌翻译升级实时同传和AI陪练;全球首现AI勒索软件PromptLock威胁网络安全;Anthropic推出Chrome浏览器AI助手Claude。

  • 奥尔特曼称自己不适合担任CEO OpenAI上市后或卸任

    OpenAI首席执行官Sam Altman近日接受采访时透露,虽然公司正推进数万亿美元级的计算基础设施投资计划,但他对上市后继续担任CEO持保留态度。 Altman坦言,尽管主导着OpenAI多项战略级项目,但自认缺乏上市公司CEO所需的核心管理素质与市场敏感度。 他特别强调,上市企业领导者需具备应对复杂投资者关系与监管环境的综合能力,而自己可能并非最优人选。

  • 卡萨帝AI之眼冰箱将上市,夯实高端TOP1地位

    卡萨帝9月将推出搭载“AI之眼”的鉴赏家冰箱,通过图像识别技术自动识别食材并联动氮氧智控系统精准保鲜。该产品能根据用户健康需求生成专属膳食方案,支持高血压、控糖等个性化场景。采用平嵌设计实现无缝融入橱柜,重新定义高端厨居美学。作为行业首款可定制AI健康营养冰箱,未上市已引发期待,将巩固卡萨帝在高端市场的领先地位。

  • OpenAI CEO:GPT-6将具备个性化记忆 记住用户偏好习惯

    OpenAI的首席执行官萨姆奥尔特曼(Sam Altman)在近日的一次专访中,透露了下一代大模GPT-6的最新进展。他表示,GPT-6 的开发正在积极推进中,其发布节奏将比从GPT-4到GPT-5的周期更快。 奥尔特曼特别强调,GPT-6将不再局限于单纯回答问题,而是朝着与用户深度适配”的方向演进。他举例描述

  • AI日报:腾讯推音效生成工具AudioGenie;阿里推智能体WebWatcher;我国首个法律垂直大模型“小包公”发布

    本文介绍了AI领域最新动态:1)腾讯推出电影级音频生成工具AudioGenie,展现中国AI技术实力;2)阿里开源多模态智能体WebWatcher,突破现有系统局限;3)港大等高校联合推出3D建模技术OmniPart,实现模型组件独立性和清晰度;4)Meta发布无需标注数据的通用图像处理模型DINOv3;5)国内首个法律大模型"小包公"发布;6)ChatGPT移动端收入突破20亿美元;7)安卓厂商借鉴灵动岛设计,新芯片推动AI功能普及;8)欧洲AI公司推出仅94MB的超小模型;9)Claude Code新增编程教学模式;10)AI技术被滥用于电商恶意退款;11)IDC报告显示2024年中国AI公有云服务市场将快速增长。

  • 微软发布AI截图工具,截图一键转PPT

    微软电脑管家推出全新“智能圈选”功能,通过AI技术实现截图内容的智能识别与重构。用户只需圈选截图区域,即可一键完成文字提取、多语言翻译及PPT转换等操作,大幅提升办公和学习效率。该功能支持100多种语言,保留原始格式,并能智能修复遮挡内容,彻底改变了传统截图处理方式。

今日大家都在搜的词: