首页 > 原创 > 关键词  > AI最新资讯  > 正文

AI日报:海螺AI首尾帧功能上线;元石科技发布问小白5;OpenAI发布全新语音模型GPT-Realtime

2025-08-29 15:35 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://app.aibase.com/zh

1、MiniMax海螺AI首尾帧功能在网页版和APP双端正式上线

海螺AI推出的首尾帧功能在网页版和APP双端正式上线,并开放仅尾帧玩法。该技术通过更强的指令理解、更丝滑的动态效果和更大胆的想象力,全面提升行业首尾帧能力的上限。

image.png

【AiBase提要:】

🧠 最强复杂指令遵循能力,精确理解和执行每一个细节

🎬 极限复杂物理动态生成,如打斗、体操等高能动作的丝滑连招

🎨 超预期想象力功能,实现首尾帧跨度大或缺乏指令时的超纲发挥

2、元石科技发布问小白5,挑战 GPT-5,国产AI新标杆来袭

元石科技最新推出的旗舰产品问小白5在多项性能测试中接近GPT-5,标志着国产大模型技术的重要突破。该系统具备动态思维模式,适用于多个领域,并在STEM能力、前沿知识和代码编程等方面表现出色。

image.png

【AiBase提要:】

✨ 问小白5在多项性能测试中接近GPT-5,成为国产AI的新标杆。

🧠 具备动态思维模式,智能判断何时快速响应或深入思考。

📊 在STEM能力、前沿知识和代码编程方面表现优异,综合评分超越同类产品。

3、OpenAI 发布全新语音模型 GPT-Realtime,专为语音AI Agent设计

OpenAI 发布了全新的语音模型 GPT-Realtime,该模型专为语音 AI Agent 设计,能够生成自然流畅的语音,并支持图像输入和多语言切换。其在推理能力和指令遵循准确率方面有显著提升,同时提供了强大的安全防护功能,适用于多个行业领域。

image.png

【AiBase提要:】

🎙️ GPT-Realtime 是 OpenAI 发布的多模态语音模型,专为语音 AI Agent 设计。

🧠 该模型具备推理和指令遵循能力,提升了语音交互的智能化水平。

🔒 Realtime API 配备了安全防护措施,保障用户隐私与数据安全。

4、告别繁琐!谷歌Gemini AI让表格处理变得轻松无比

谷歌引入Gemini AI助手,使Google Sheets的数据处理更加智能和高效,提升了用户的使用体验。

image.png

【AiBase提要:】

📊 谷歌Gemini AI助手为Google Sheets带来智能化的数据处理功能。

💡 新增的“转换为表格”功能能自动分析并整理数据,提升工作效率。

🔄 用户可自定义公式表达式,适应数据变化,无需手动调整公式。

5、AI配音革命来了!腾讯黑科技让机器秒变金牌说书人,一句话生成好莱坞级音效

文章介绍了腾讯ARC实验室推出的AudioStory技术,该技术能够根据文字描述生成高质量的音频内容,具有强大的叙事能力。它通过分而治之策略和解耦式连接机制,实现了复杂的音频生成任务。

image.png

【AiBase提要:】

✨ AudioStory技术能根据文字描述生成电影级音频内容。

🧠 采用分而治之策略,将复杂故事拆解为有序音频事件。

🔄 解耦式连接机制确保了音频质感与语义的精准匹配。

详情链接:https://arxiv.org/pdf/2508.20088

6、百度未来五年计划培养 1000 万 AI 人才

文章介绍了百度在未来五年内计划培养1000万AI人才,同时展示了其在人工智能领域的持续投入和创新成果。此外,文章还提到百度的AI新业务收入表现亮眼,显示出其在市场中的竞争力。

【AiBase提要:】

🌟 百度计划在未来五年内再培养1000万AI人才,推动行业发展。

📈 百度2025年第二季度财报显示AI新业务收入突破100亿元,同比增长34%。

🎓 人才培养将通过高校合作、企业培训和在线教育等多种方式进行。

7、反作弊AI导师横空出世!MathGPT.ai在美国30所高校试点成功,今秋将大规模推广

MathGPT.ai通过苏格拉底式教学法和教师主导的控制机制,重新定义了AI在数学教育中的角色。该平台不仅提供反作弊导师服务,还支持大学水平的数学课程,并与主流学习管理系统集成,确保无障碍访问。

image.png

【AiBase提要:】

🧠 MathGPT.ai采用苏格拉底式提问技术,鼓励学生批判性思考而非直接获取答案。

🔒 教师可控制学生使用AI工具的方式,包括指定AI是否提供辅导支持。

🌐 平台已与Canvas、Blackboard和Brightspace集成,并兼容屏幕阅读器,提升无障碍访问体验。

8、苹果Xcode重磅集成Claude Sonnet4:iOS开发迎来AI革命时代

苹果在Xcode26Beta7中正式集成Claude Sonnet4AI模型,为iOS开发者带来智能编程体验。该模型能够生成高质量代码、定位错误并自动修复,同时新增的inline playgrounds功能让开发者可以直接在代码行运行和测试代码,提升开发效率。

image.png

【AiBase提要:】

🍎 集成Claude Sonnet4AI模型,提升代码生成与错误修复能力。

🧪 新增inline playgrounds功能,支持实时运行代码示例。

🔒 基于Apple官方扩展接口实现,确保功能稳定性和安全性。

9、微软推首款自家研发AI模型MAI-Voice-1和MAI-1-preview,与OpenAI竞争

微软推出了其首款自主研发的AI模型MAI-Voice-1和MAI-1-preview,这标志着微软在人工智能领域的重要进展,并增强了其与OpenAI的竞争实力。MAI-Voice-1能够快速生成音频,已被应用于Copilot Daily等功能;而MAI-1-preview则专注于日常查询帮助,未来将用于Copilot AI助手的文本处理。

image.png

【AiBase提要:】

🗣️ MAI-Voice-1可以快速生成音频,已应用于 Copilot Daily 等多个功能。

🚀 MAI-1-preview 将用于 Copilot AI 助手的文本处理,标志着微软在消费级 AI 领域的新进展。

🌟 微软推出 MAI-Voice-1和 MAI-1-preview 两款自家开发的 AI 模型,提升与 OpenAI 的竞争力。

详情链接:https://microsoft.ai/news/two-new-in-house-models/

10、xAI隆重推出Grok Code Fast1:快速、经济的高效代理编码模型

xAI推出了Grok Code Fast1,这是一款专为软件开发设计的快速且经济高效的大型语言模型。该模型在推理能力和代码生成性能方面表现出色,并已在多个主流智能编程平台上免费开放使用。

【AiBase提要:】

🚀 Grok Code Fast1采用了全新轻量化模型架构,提升了服务速度和缓存命中率。

🌐 支持GitHub Copilot、Cursor等多平台,提供免费试用以吸引开发者体验。

💰 定价策略具有竞争力,每百万输入令牌0.20美元,输出令牌1.50美元,适合预算有限的开发者。

详情链接:https://x.ai/news/grok-code-fast-1

11、SuperCLUE多模态视觉8月评测榜:Gemini-2.5-Pro位居第一

在8月28日发布的中文多模态视觉语言模型测评基准(SuperCLUE-VLM)榜单中,Gemini-2.5-Pro以74.99分位列第一,OpenAI的GPT-5(high)以68.59分排名第二。该榜单围绕基础认知、视觉推理和视觉应用三大维度构建评测体系,旨在为多模态视觉语言模型提供客观、公正的评估标准。

image.png

【AiBase提要:】

🧠 Gemini-2.5-Pro在SuperCLUE-VLM榜单中以74.99分位居第一,展现强大的多模态能力。

📊 评测涵盖15个多模态模型,包括Claude-Opus-4.1、GPT-5(high)等国内外主流模型。

🏆 百度ERNIE-4.5-Turbo-VL与其他国内模型并列,显示出强劲的市场竞争力。

12、9月1日AI内容标识新规!不合规直接承担法律风险,从业者速看避雷指南

文章详细介绍了《人工智能生成合成内容标识方法》国家标准GB45438-2025的实施背景和核心要求。该标准对AI生成内容的标识方式、责任主体认定及违规后果进行了明确规定,强调了AI内容治理的重要性。

【AiBase提要:】

📌 显式标识要求AI生成内容在文本、图片、视频等不同形式中明确标注AI属性。

🔍 隐式标识通过文件元数据嵌入AIGC标识符,确保内容来源可追溯。

⚖️ 违规后果严重,包括限流、整改、下架以及法律风险,企业需立即进行合规准备。

举报

  • 相关推荐
  • 迎“人工智能+”政策东风!2025中国智能产业大会&吴文俊人工智能创新大会即将落地常州

    在全球AI竞争加剧背景下,国务院印发《关于深入实施“人工智能+”行动的意见》,推动AI与经济社会深度融合。中国人工智能学会主办的“2025第十四届中国智能产业大会暨吴文俊人工智能创新大会”将于8月30-31日在常州举行,聚焦破解AI产业“卡脖子”难题。大会设置15场专题会议和3场特色活动,覆盖基础技术突破、核心应用落地、交叉学科融合等领域,为产学研各界搭建高

  • 下一个爆款在哪儿?2025英特尔人工智能创新应用大赛获奖名单揭晓

    8月16日,2025英特尔人工智能创新应用大赛总决赛在深圳落幕。40支优秀团队从2817支队伍中脱颖而出,围绕工业、教育、心理健康、游戏等领域展开对决。大赛展示了AI从云端走向边缘的趋势,依托酷睿Ultra处理器和低代码开发工具,推动AI应用本地化落地。获奖作品包括动力电池机器人协作拆卸系统和AI生成PPT服务,体现AI与产业需求的深度融合。英特尔与联想、惠普等合作伙伴共同为开发者提供全栈支持,加速AI技术普及和商业化进程。

  • 海尔冰箱唯一获批“制冷家电人工智能技术山东省工程研究中心”

    海尔冰箱在人工智能领域取得新突破,主导建设的"制冷家电人工智能技术山东省工程研究中心"成为2025年山东省工程研究中心认定名单中唯一入选的冰箱品牌。该中心聚焦人工智能、物联网、大数据等技术方向,开发了全空间智慧保鲜舱冰箱等140多项行业首创产品,近三年获授权发明专利803件。海尔冰箱还推出行业首款接入DeepSeek的AI全空间保鲜冰箱,具备方言识别、降噪技术等功能,显著提升用户体验。市场数据显示,2023年1-7月海尔冰箱以47%市场份额稳居行业第一。通过AI技术赋能,海尔冰箱正引领行业向精准、智能保鲜时代跨越。

  • 北电数智亮相世界人工智能大会,“四链融合”推动AI产业落地

    2025世界人工智能大会“人工智能+”战略领军人才与创新发展论坛圆满落幕。论坛聚焦“人才领航智启未来”主题,汇聚中科院、社科院专家及中国联通、腾讯云等机构代表,围绕“人工智能+”行动分享经验,为AI高质量发展筑牢人才根基、激发创新动能。北电数智CMO杨震出席并发表演讲,分享AI行业落地实践,强调紧跟国家战略,推进产业、创新、人才、资本四链融合,打造面向不同场景的AI解决方案,全方位助力AI产业发展。

  • 微算法科技(NASDAQ:MLGO)基于人工智能优化构建混合ARIMA模型,提高比特币价格预测准确性

    随着数字资产市场兴起,比特币等加密货币价格预测成为焦点。传统模型难以准确捕捉其非线性波动,微算法科技引入AI技术优化ARIMA模型,结合LSTM网络构建混合模型,提升预测准确性。通过AI算法自动处理数据缺失、异常值检测及参数优化,实现更可靠的比特币价格预测,为投资者提供决策支持。

  • AI产品栏目推荐:2025年值得关注的全球AI创新动态与前沿工具盘点

    AIbase是一个全球AI创新观察平台,收录了来自100多个国家和地区的2万多个AI产品。它提供实时更新、全球热门排行和精细筛选功能,帮助用户发现全球最新AI趋势。平台不仅展示产品信息,还提供技术说明、定价等详细数据,支持中文呈现,降低信息获取门槛。对投资者、研究人员和产品经理等不同用户群体都具有重要价值,是连接全球AI创新脉搏的重要枢纽。

  • ISC.AI 2025 人工智能安全治理与创新实践论坛圆满召开

    ISC.AI2025人工智能安全论坛在北京召开,聚焦AI安全治理与创新实践。论坛汇集顶尖专家,探讨大模型安全评估与防护、智能体安全、AI治理等前沿议题。360集团张向征指出,随着Agent技术爆发式应用,AI安全已成为产业核心焦点。专家们强调需构建AI安全防护体系,应对大模型直接访问核心系统带来的全新挑战。中国电子院彭健提出企业合规建设需关注九大要素,清华大学苏航揭示智能体安全风险远超传统AI。华为云范建军倡导端到端大模型安全防护,中国信通院杨哲超呼吁构建协同治理框架。论坛为构建安全、普惠、负责任的人工智能未来贡献智慧。

  • AIbase资讯:每天五分钟,全面掌握AI技术变革与工具动态

    AIbase资讯平台致力于为AI从业者、创业者和技术爱好者提供全面准确的全球AI动态。平台实时监控数百个AI新闻源,覆盖技术论文、产业政策、产品更新和行业事件,确保信息跨学术、应用、技术、市场等多维度。通过专业整合和实时更新,帮助用户快速掌握大语言模型、生成式AI、计算机视觉、智能体开发等关键赛道进展。平台还提供强大的AI工具导航功能,收录大量国内外工具与应用,覆盖文本生成、图像处理、代码开发等多个类别。每日五分钟,全面了解AI动态,掌握行业关键信息。

  • 最新AI资讯哪里看?AI技术人员如何从论文到产业应用全覆盖?

    文章指出,ArXiv、ACL和NeurIPS等论文库是AI开发者获取前沿技术的重要来源,但仅依赖论文库已不足以构建完整竞争力。作者强调需要超越论文本身,关注技术落地、产业应用及生态动态。推荐利用AIbase等技术资讯平台作为补充,提供筛选整合、趋势解读和产业视角,帮助开发者高效把握技术动态,避免闭门造车,构建复合型信息摄入体系。

  • 寒武纪:聚焦技术创新 持续深耕智能芯片领域

    寒武纪在投资者平台声明,网上传播的公司订单、收入预测、新产品、客户及供应链等信息均为不实,提醒投资者提高信息辨别能力,以官方披露为准。公司专注AI芯片研发,产品覆盖云服务器、边缘计算及终端设备芯片,2024年营收增长65.56%,2025年一季度同比增230.22%,连续两季度盈利。研发投入持续加大,优化芯片架构与软件生态,提升产品竞争力,未来将聚焦技术创新,推动芯片向大模型及垂直领域延伸。

今日大家都在搜的词: