AI日报：阿里开源数学模型Qwen2-Math；豆包上线音乐功能；苹果将推AI服务；谷歌机器人挑战巴黎奥运

2024-08-09 15:22 · 稿源：站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、阿里开源最新数学模型Qwen2-Math 数学能力秒杀GPT-4o

阿里云推出的Qwen2-Math系列大型语言模型在数学领域展现出强大的解题能力，超越了开源和闭源模型，成为AI数学界的黑马。该模型经过精心设计的数学专业语料库深度预训练，特别是Qwen2-Math-Instruct模型采用创新的训练方法，提升了数学解题能力。未来，团队计划推出支持多语言的版本，并持续优化模型。Qwen2-Math的出现为AI在数学领域的应用带来新的可能性，将在教育、科研、工程等领域发挥重要作用。

【AiBase提要:】
⚙️ Qwen2-Math系列模型展现出强大的数学解题能力，超越开源和闭源模型，成为AI数学界的黑马。
📚 Qwen2-Math基于精心设计的数学专业语料库深度预训练，特别是Qwen2-Math-Instruct模型采用创新训练方法提升了数学解题能力。
💡 阿里云团队计划推出支持多语言的Qwen2-Math版本，并持续优化模型以解决更复杂数学问题。
详情链接:https://top.aibase.com/tool/qwen2-math

2、字节跳动AI助手豆包app、电脑版上线音乐生成功能

最近，字节跳动旗下豆包AI助手推出了音乐生成功能，用户可以轻松创作独特的歌曲。这项服务提供多种音乐风格和情绪状态，旨在满足用户的情感表达需求。豆包希望通过音乐激发创造力，让用户分享自己的故事，开启音乐创作之旅。

【AiBase提要:】
🎶 用户可在豆包app或电脑版中生成独特歌曲，选择曲风、氛围和人声，歌词限制在200字以内。
🎵 提供11种不同音乐风格和多种情绪状态选择，包括民谣、嘻哈、R&B，用户可选择男声或女声演唱。
🎤 用户可一键生成完整歌词，下载并分享生成的歌曲和封面。音乐生成功能仍在不断完善中，豆包鼓励用户用音乐分享故事，激发创造力。

3、抠抠搜搜!ChatGPT 现在允许免费用户每天生成两张由 DALL-E3制作的图像

OpenAI宣布，免费用户现在每天可以使用DALL-E3模型生成最多两张图片，为用户带来更多创作可能性。DALL-E3能利用ChatGPT生成的提示制作图像，让用户更容易上手。新功能正在逐步推出，部分用户已体验到便捷的创作体验，激发更多创作者的灵感。

【AiBase提要:】
🌟 ChatGPT的免费用户每日可以生成两幅DALL-E3图片!
🎨 DALL-E3通过ChatGPT生成的提示，让图像制作变得更简单。
📅 此功能正在逐步推出，部分用户已能体验到这一新功能。

4、模型也套娃？苹果开源新型图像生成模型MDM

苹果公司最新推出的套娃扩散模型（MDM）展现了其强大的技术创新能力，通过套娃的概念实现了图像和视频的无缝生成，提升了图像质量和生成效率，为AI图像生成领域带来新的技术风潮。

【AiBase提要:】
🎨 MDM采用套娃扩散模型，实现不同分辨率下图像处理，生成高质量图像
🧠 MDM核心架构NestedUNet强化套娃概念，逐步处理小规模输入，提高学习和生成效率
✨ MDM在高分辨率图像生成上展现出色，具有零样本泛化能力，拓展了AI图像生成技术应用范围
详情链接:https://top.aibase.com/tool/ml-mdm

5、GPT-4o半夜突然发出怪叫?OpenAI发布32页安全报告

在一份新的“红队”报告中，OpenAI记录了对GPT-4o模型优势和风险的调查，并揭示了GPT-4o的一些奇特怪癖。报告描绘了通过各种缓解措施和保障措施变得更安全的AI模型的总体画面。

【AiBase提要:】
🔍 GPT-4o在高背景噪音环境中会模仿用户的语音
🔊 GPT-4o生成令人不安的非言语声音和音效
🎵 GPT-4o可能侵犯音乐版权
详情链接:
https://openai.com/index/gpt-4o-system-card/
https://techcrunch.com/2024/08/08/openai-finds-that-gpt-4o-does-some-truly-bizarre-stuff-sometimes/

6、字节跳动豆包大模型支持实时语音通话

字节跳动旗下云服务平台火山引擎宣布，豆包大模型已支持实时语音通话新功能。火山引擎提供的对话式 AI 实时交互解决方案简化了语音到文本和文本到语音的转换过程，实现了高效的语音数据采集、处理和传输，提供了卓越的智能对话和自然语言处理能力。火山引擎的大模型多模态实时交互服务为头部 AI 虚拟人物聊天应用提供了 AI 实时语音能力，带来了全新的互动体验。

【AiBase提要:】
🔥 火山引擎提供实时语音通话新功能，简化语音到文本和文本到语音转换过程，提供高效的语音数据处理和传输。
🚀 火山引擎RTC基于音频3A处理技术，解决“双讲”现象，确保语音识别准确性和实时性。
💡 火山引擎提供灵活、多样化的接入方案，满足不同企业的需求，为企业带来创新的AI实时音视频体验。

7、苹果或将推出Apple Intelligence高级AI服务

苹果公司计划推出全新的Apple Intelligence服务，这将是其在人工智能领域的大胆尝试。服务可能以每月高达20美元的价格向用户开放，显示了苹果对AI技术的信心和在服务领域的扩展野心。尽管尚未得到官方确认，但若实现，用户将享受到更高级、个性化的AI服务，巩固苹果在科技服务市场的领导地位。

【AiBase提要:】
🚀 苹果计划推出全新的Apple Intelligence服务，可能月费高达20美元。
💡 苹果有意将人工智能技术成本转嫁给用户，显示对AI技术的信心。
💰 可能整合进现有Apple One服务包中，进一步巩固苹果在科技服务市场的领导地位。

8、谷歌机器人挑战巴黎奥运正反手灵活转换，还打赢专业教练

作为一名乒乓球爱好者，我对谷歌机器人Agent在乒乓球比赛中的表现感到惊叹。这款机器人不仅具备高超的技能，还能与人类选手展开激烈对决，展现出机器人技术的巨大潜力。

【AiBase提要:】
🏓 谷歌发布首个达到人类竞技水平的机器人Agent，挑战乒乓球赛场。
🔥 机器人通过学习大量乒乓球状态数据，掌握了正手上旋球、反手瞄准等技能，展现出高速运动和实时精确性。
🤖 机器人在与不同技能水平选手的比赛中取得一定成绩，展现出与人类对手直接竞争的能力。
详情链接:https://sites.google.com/view/competitive-robot-table-tennis/home

9、逐际动力发布最新人形机器人CL-1可以帮快递站搬货了

逐际动力公司最新发布的人形机器人CL-1展示了出色的自主行走和执行任务能力，引领智能机器人领域发展。公司完成A轮融资，获得资本市场认可，阿里巴巴等巨头投资引人注目。CL-1成功展示了稳定抓取和搬运货物的能力，预示着中国智能机器人竞争力增强。未来，逐际动力有望在智能制造和物流领域发挥更大作用，带来创新和变革。

【AiBase提要:】
🤖 CL-1展示出色自主行走和任务执行能力
💰 逐际动力完成A轮融资，获得数十亿元人民币资金
🚚 CL-1稳定抓取和搬运货物，预示中国智能机器人竞争力增强

10、雷军:小米旗舰设备国际版将接入谷歌AI大模型Google Gemini

雷军宣布小米旗舰设备国际版将整合谷歌AI大模型Google Gemini，旨在提供更智能和直观的用户体验。这一举措将使小米手机拥有先进的多模态AI能力，提升用户体验和功能性。

【AiBase提要:】
🔍 Google Gemini是先进的多模态AI模型，能深入理解图像、音频、视频，并具备数学推理能力。
🚀 Gemini在多领域展现卓越性能，超过OpenAI的GPT-4模型，包括自然图像理解、音频处理、数学推理等方面。
📱 小米15系列国际版将搭载Google Gemini AI大模型，预计将在10月发布，为用户带来最新AI技术体验。

11、新血液!OpenAI 任命卡内基梅隆大学教授为董事会成员

OpenAI 近日宣布任命卡内基梅隆大学的 Zico Kolter 教授为董事会成员，为公司未来发展注入新活力。Kolter 教授在安全和安全委员会中将发挥重要作用，助力项目安全性和决策过程。他的加入契合 OpenAI 使命，强调技术发展的安全保障。

【AiBase提要:】
🧑‍🏫 OpenAI 任命卡内基梅隆大学的 Zico Kolter 教授为董事会成员。
🔒 Kolter 教授将加入董事会的安全和安全委员会，专注于项目的安全性。
🌐 Kolter 教授的研究方向与 OpenAI 的使命高度契合，预示着未来技术发展的安全保障。

12、谷歌云调查显示:86% 的企业通过生成 AI 实现了6% 的收入增长

最近，谷歌云与国家研究集团联合进行调查，发现使用生成 AI 的企业获得显著投资回报。企业在一年内看到回报，收入增长达6% 以上，AI 成为业务增长驱动力。然而，部分员工认为生产力未提升，缺乏相关培训。企业需制定全面战略，重视员工培训。

【AiBase提要:】
🌟74% 的企业使用生成 AI 看到了一年的投资回报。
📈86% 的企业报告收入增长达到6% 或以上。
🧠63% 的企业认为 AI 是业务增长的重要驱动力。

（举报）

相关推荐

关键词：

Qwen2-Math

荐AI日报：谷歌发布Veo 3.1；通义千问推Qwen Chat Memory功能；Sora2免费用户可生成15秒视频

本期AI日报聚焦多项技术更新：谷歌Veo 3.1视频模型新增音频生成与精细化编辑功能；通义千问推出记忆功能提升对话连贯性；Sora2免费用户可生成15秒视频，Pro版支持25秒；百度文心助手升级8种创作模式；谷歌Flow工具增强视频光影编辑与音频合成能力；Anthropic发布高性价比Claude Haiku 4.5；北京查处首例AI虚假广告案，涉伪造主持人带货；阿里推出响应仅200毫秒的编程工具Qoder CLI。

AI 视频生成谷歌
荐AI日报：阿里发布紧凑型Qwen3-VL模型；科大讯飞AI翻译耳机全球首发；Gemini代码惊现Veo3.1

阿里巴巴发布紧凑型Qwen3-VL多模态模型，推动边缘设备AI应用；科大讯飞推出全球首款AI翻译耳机，支持60种语言实时翻译；谷歌NotebookLM集成图像生成功能，可将笔记转为动态视频；ChatGPT将于12月向成人开放限制内容并推出自定义交互功能；谷歌Gemini代码泄露Veo3.1视频模型升级迹象；马斯克宣布X平台将全面转向AI推荐系统；巨人网络与清华联合开源多方言语音合成框架DiaMoE-TTS；vivo公布X200系列影像升级计划；字节跳动开源文本驱动高保真人脸生成模型FaceCLIP。

AI技术多模态模型边缘计算
IBM与Anthropic达成战略合作，为企业软件开发注入AI赋能的安全和治理

IBM与Anthropic达成战略合作，将Claude大语言模型集成至IBM软件产品及开发工具中，旨在加速企业级AI开发进程。该合作聚焦提升开发效率，在IBM全新AI集成开发环境中率先应用，支持代码生成、测试部署等全生命周期任务。内部测试显示生产力提升45%，同时确保代码质量与安全合规。双方强调将为企业提供安全可靠的AI解决方案，推动行业标准化发展。

IBM Claude大语言模型企业级AI
影视飓风Tim突然送给罗永浩iPhone 17 Pro Max 2TB 本人非常惊喜

罗永浩预告他的新一期播客节目邀请到了影视飓风Tim。在播客录制现场，Tim突然送了罗永浩一台iPhone17 Pro Max 2TB。罗永浩表示，非常感谢这个礼物，在现场收到非常惊喜，至于手机本身，明天中午12点来看影视飓风Tim带来的这个惊喜礼物。

罗永浩影视飓风Tim iPhone17
卡萨帝小炫风Max烟机京东首发，28小时斩获销额TOP1

9月30日，卡萨帝小炫风Max烟机首发即创佳绩：京东平台28小时销量突破2400套，稳居油烟机品类榜首，并在4500元以上高端价位段表现强势。其成功源于两大差异化优势：设计上实现超薄平嵌，完美融入橱柜；科技上搭载FPA直驱变频电机与AI降噪系统，静音强吸双突破，重新定义高端烟机标准，印证了以用户为中心的高端战略路径。

卡萨帝小炫风Max 油烟机
红米REDMI K90 Pro Max定档10月23日发布

Redmi K90 Pro+ Max将于10月23日发布，这是该系列首款Pro Max机型。新机采用横向大模组设计，右侧配有圆形结构，功能未知。影像系统大幅升级，搭载5000万像素1/1.3英寸主摄，支持OIS光学防抖，并首次配备潜望长焦镜头。品牌总经理卢伟冰表示，K系列将突破价格限制，直接与小米竞争，定位4K价位市场。分析认为，K90 Pro+ Max可能在某些方面超越小米17标准版，加剧两者市场竞争。

REDMI K90Pro Max
2699元起！荣耀MagicPad 3 12.5发布：第三代骁龙8+10100mAh电池

荣耀MagicPad 3于10月15日发布，12.5英寸LCD屏，售价2699元起。采用家族式多彩设计，厚5.88mm，重528g。屏幕支持165Hz刷新率、3048×2032分辨率、1000nit峰值亮度，搭载第三代骁龙8处理器，配备10100mAh电池与66W快充。后置1300万+200万双摄，支持Wi-Fi 7与MagicOS 10.0系统。提供三种存储版本可选。

荣耀MagicPad3 12.5英寸平板第三代骁龙8
AI日报：微软发布首款自研图像生成模型 MAI-Image-1；百度世界大会时间公布；AI大牛开源nanochat教学工具

微软发布首款自研图像生成模型MAI-Image-1，跻身LMArena前十，注重实用性与光影效果；百度世界2025大会将聚焦大模型与AI全球化战略；Meta新技术使RAG推理速度提升30倍；开源项目nanochat实现低成本构建聊天AI；谷歌NotebookLM新增动漫视频生成功能；中国农大发布神农大模型3.0助力智慧农业；腾讯启动"青云奖学金"培养AI人才；苹果FS-DFM模型长文本生成效率提升128倍；谷歌Lens整合AI图像编辑功能；港大与美团提出CodePlot-CoT方法，通过代码绘图解决数学难题，性能提升21%。

AI 图像生成微软
Qwen3-Max成阿里通义“地表最强”：性能超GPT5 数学推理直接满分

9月24日，2025云栖大会开幕，阿里通义千问旗舰模型Qwen3-Max重磅亮相，性能超越GPT-5、Claude+Opus 4等，跻身全球前三。该模型包含指令和推理两大版本，预训练数据量达36T tokens，总参数超万亿，具备极强编程和工具调用能力。在SWE-Bench测试中，指令版斩获69.6分全球第一；Tau2-Bench工具调用测试达74.8分，超越同类模型。推理增强版Qwen3-Max-Thinking在数学推理测试中获满分，国内首次突破。通义千问系列已实现全尺寸覆盖，包含三百多个模型。即日起，用户可在QwenChat免费体验Qwen3-Max，或通过阿里云百炼平台调用API服务。

云栖大会 Qwen3-Max 通义千问
见所未见百微新生索尼发布首款G大师微距镜头FE 100mm F2.8 Macro GM OSS

索尼将于2025年10月发布首款1G大师系列微距镜头FE 100mm F2.8 Macro GM OSS。新品实现1.4倍放大率，搭配增距镜可达2.8倍，配备4个XD线性马达使自动对焦性能提升1.9倍。采用11片圆形光圈与第二代纳米AR镀膜技术，搭载专为微距设计的光学防抖系统。镜头重646克，具备防尘防潮设计，建议零售价9,299元。

索尼微单微距镜头 G大师系列

今日大家都在搜的词：

热文

3 天
7天

AI日报：阿里开源数学模型Qwen2-Math；豆包上线音乐功能；苹果将推AI服务；谷歌机器人挑战巴黎奥运

荐AI日报：谷歌发布Veo 3.1；通义千问推Qwen Chat Memory功能；Sora2免费用户可生成15秒视频

荐AI日报：阿里发布紧凑型Qwen3-VL模型；科大讯飞AI翻译耳机全球首发；Gemini代码惊现Veo3.1

IBM与Anthropic达成战略合作，为企业软件开发注入AI赋能的安全和治理

影视飓风Tim突然送给罗永浩iPhone 17 Pro Max 2TB 本人非常惊喜

卡萨帝小炫风Max烟机京东首发，28小时斩获销额TOP1

红米REDMI K90 Pro Max定档10月23日发布

2699元起！荣耀MagicPad 3 12.5发布：第三代骁龙8+10100mAh电池

AI日报：微软发布首款自研图像生成模型 MAI-Image-1；百度世界大会时间公布；AI大牛开源nanochat教学工具

Qwen3-Max成阿里通义“地表最强”：性能超GPT5 数学推理直接满分

见所未见百微新生索尼发布首款G大师微距镜头FE 100mm F2.8 Macro GM OSS

今日大家都在搜的词：

热文

AI日报：谷歌发布Veo 3.1；通义千问推Qwen Chat Memory功能；S

卢伟冰官宣REDMI K90系列下周发布：不排斥和小米竞争

微信回应出朋友圈访客功能：可能会让用户产生焦虑重申不会推出

苹果华为OPPO将推出eSIM手机 OPPO Find X9系列已确认将支持

知乎崩了上热搜：网页端完全无法进入 App端也未能幸免

华为nova 14活力版、nova Flip S官宣明天发布

REDMI K90 Pro Max外观公布：后置BOSE认证扬声器

红米REDMI K90 Pro Max丹宁色亮相采用第三代科纳皮设计

王腾发文祝REDMI K90 Pro Max大卖王化回复“拥抱”表情

苹果14英寸MacBook Pro发布：售价12999元起首发苹果M5芯片

微信员工回应好友互删后互动清除：并非新版本特性

AI日报：LiblibAI 2.0正式上线；通义千问、豆包开启记忆功能；

董明珠称格力向特斯拉提供服务已有近14万项专利技术

微信回应人去世了朋友圈会消失吗：长时间不使用账号已不再回收

卢伟冰调侃还有小米6钉子户：小米6机主宣布换机小米17

京东回应下场造车：不直接涉及制造三方联合推出

库克下月满65岁苹果或迎特努斯时代：有望执掌十年以上

Windows 10即将“停服”上热搜微软建议用户升级Win 11

AI日报：阿里发布紧凑型Qwen3-VL模型；科大讯飞AI翻译耳机全球

小米推出短剧App围观短剧：主打无广告免费看

站长商机