AI日报：对标Cursor！字节推AI编程工具Trae；MiniMax海螺语音全球上线；OpenAI将发布o3-mini

2025-01-20 15:15 · 稿源：站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、MiniMax海螺语音全球同步上线包含T2A-01-Turbo等模型

2025年1月20日，上海稀宇科技有限公司旗下的MiniMax推出了全新升级的T2A-01系列语音模型，标志着其在语音合成技术上的又一重要进展。该系列包括T2A-01-HD和T2A-01-Turbo模型，支持17种语言和300多种音色，满足企业和个人用户的多样化需求。

【AiBase提要:】
🎤 T2A-01系列语音模型支持17种语言，提供清晰音质和自然韵律。
🌍 海螺语音在多语种合成能力上领先同类产品，情感理解能力强。
🎶 用户可从300多种音色中选择，并进行个性化调整，满足不同场景需求。
详情链接:https://hailuoai.com/audio

2、字节跳动推出针对中文开发者AI IDE产品Trae 性能对标Cursor

字节跳动推出的Trae是一款专为中文开发者设计的AI集成开发环境（IDE），旨在提升中文开发者的编程体验。Trae通过全面优化中文界面和代码注释支持，解决了现有工具在中文用户使用时的不便。此外，Trae还集成了先进的AI模型，提供智能代码生成和逻辑优化功能。

【AiBase提要:】
💻 Trae IDE专为中文开发者设计，优化了中文界面和代码注释支持，提升使用体验。
🤖 集成Claude3.5和GPT-4o等主流AI模型，具备智能代码生成和逻辑优化功能。
🔧 提供强大的Builder功能，用户可生成完整代码项目，但需手动确认AI生成的代码。
详情链接:https://top.aibase.com/tool/trae

3、商汤日日新融合大模型交互版开放商用实时音视频对话限时免费

商汤科技的SenseNova-5o交互版正式推出，标志着其在AI领域的重要进展。该模型具备强大的实时音视频对话能力，支持超长多模态交互记忆，能够精准记录和回忆用户对话内容。SenseNova-5o还提供个性化设置，适应多种沟通场景，已成功应用于多种智能设备，展现了商汤在AI技术应用方面的潜力与创新。

【AiBase提要:】
🎤 SenseNova-5o具备超长的多模态交互记忆，能够精准记录用户对话并快速回忆相关内容。
💬 该模型展现出高效的多轮对话能力，交互延迟缩短至2秒，几乎与人类自然交流无异。
🎭 用户可根据偏好自由设定交流风格，甚至可以让AI扮演特定角色进行对话。

4、Krea升级版实时生成，支持FLUX实时图片生成，创意拼贴组合

Krea在图像融合领域的创新达到了一个新的高度，推出了升级版实时生成，支持FLUX实时图片生成。用户可以通过上传多张图片，进行抠图和3D转换，创造出独特的拼贴画效果。这种新型的交互方式不仅解决了AI图片生成的随机性问题，还允许用户在生成过程中自由调整元素的角度，极大提升了创作的灵活性和趣味性。

【AiBase提要:】
🖼️ Krea推出的FLUX实时图片生成支持用户上传多张图片进行创意拼贴。
🔄 用户可以对生成的3D元素进行自由旋转，找到最佳展示角度。
✨ 该功能允许用户先生成奇幻风格的图片，再进行抠图和拼贴，创作出大片效果。
详情链接:https://www.krea.ai/

5、OpenAI几周内发布 o3-mini，性能略逊于 o1-pro

OpenAI CEO 山姆・奥特曼近日宣布，备受期待的 o3-mini 将在几周内发布。这款大模型的蒸馏版将推出高、中、低三个版本，满足不同用户需求。尽管性能略逊于前代 o1-pro，但 o3-mini 在速度上有所提升，特别适合编程使用。此外，AGI 实现所需的872兆瓦计算功率引发了对人工智能未来的热议。

【AiBase提要:】
🌟 o3-mini 将在几周内正式发布，提供高、中、低三个版本供选择。
⚡️ 尽管性能不及 o1-pro，但 o3-mini 在速度上有所提升，更适合编程。
🔋 AGI 实现需要872兆瓦的计算功率，引发对人工智能未来发展的广泛讨论。

6、阶跃星辰上线Step-2mini、Step-2文学大师版语言模型

2025年1月20日，上海阶跃星辰智能科技有限公司推出了Step系列语言模型的新成员Step-2mini和Step-2文学大师版，旨在满足开发者在不同创作场景中的需求。Step-2mini以轻量化设计实现了高效性能和快速响应，而Step-2文学大师版则专注于内容创作，能够生成逻辑严密且富有独特风格的作品。

【AiBase提要:】
⚡️ Step-2mini是一款轻量级模型，保留了Step-2超过80%的性能，同时显著提升了生成速度和性价比。
🖊️ Step-2文学大师版专注于内容创作，能够生成逻辑严密且富有思想的作品，展现出卓越的创作实力。
🌐 开发者可通过阶跃星辰开放平台调用Step-2mini的API接口，提供高效的语言处理服务。
详情链接:https://yuewen.cn

7、Runway推全新AI图像生成器Frames，打造电影级视觉表现

Runway公司最近推出了其最新的文本生成图像模型Frames，旨在提升创意工作者的视觉表现。Frames以其高精度的提示系统和多样的预设风格，受到用户的广泛好评，特别是在生成电影般的视觉效果方面。该模型不仅支持静态图像生成，还能与Runway的图像转视频模型无缝对接，为创意专业人士提供了更多灵活性。

【AiBase提要:】
🌟 Runway推出AI图像生成器Frames，旨在提升创意工作者的视觉表现。
🎨 Frames提供多种预设风格，用户可定制生成具有特定视觉特征的图像。
🔒 公司重视内容安全与伦理问题，包含内容审核及水印功能以防止滥用。

8、为了让人类多活10年 OpenAI 推出新模型 GPT-4b micro

OpenAI推出了其首个专注于生物数据的人工智能模型GPT-4b micro，旨在延长人类寿命，目标是让人类多活10年。该模型与Retro Biosciences合作，专注于开发抵抗细胞衰老的新药，利用“山中因子”提高细胞重编程效率。初步实验结果显示，模型建议的改造方案效果显著。

【AiBase提要:】
🧪 GPT-4b micro模型旨在通过改进细胞重编程技术，帮助人类延长寿命。
🔬 OpenAI与Retro Biosciences合作，专注于开发抵抗细胞衰老的新药，利用“山中因子”。
🚀 初步实验表明，模型建议的改造方案效果提升超过50倍，显示出显著优势。

9、Windsurf发布Wave2版本:支持联网和存储上下文

Windsurf团队推出的Wave2更新为编辑器带来了多项重大升级，包括Web搜索、自动记忆、代码执行改进及问题标签功能。这些新功能旨在提升开发者的工作效率和个性化体验。Web搜索允许用户实时获取互联网信息，而自动记忆则能根据用户的使用模式进行学习，提供更贴心的支持。

【AiBase提要:】
🌐 Web搜索: Cascade现在可以实时从互联网获取信息，增强开发者的工作效率。
🧠 自动记忆: Cascade能自动学习用户的工作模式，提供更个性化的支持。
💻 代码执行改进: 更好地执行命令，并与开发容器深度集成，提升使用体验。

10、微软推出 Windows AI 搜索功能测试，提升文件查找体验

微软最近在 Windows11Insider 测试者的最新开发频道版本中推出了一项 AI 驱动的 Windows 搜索功能。这项功能旨在通过语义索引技术，帮助用户以更自然的语言搜索本地文件。用户需要拥有 C o p i l o t Plus PC 才能使用该功能，且支持多种文件格式，未来还将扩展到云数据。

【AiBase提要:】
🌟 微软正在为 Windows11测试新 AI 搜索功能，允许用户以更自然的语言查找本地文件。
💻 当前功能仅适用于 C o p i l o t Plus PC，支持多种文件格式且无需联网。
📈 未来将扩展到云数据并支持更多类型的 C o p i l o t Plus 计算机。

11、芒果超媒推出AI Agent平台 “芒果西米露”，已搭建70个智能体

芒果超媒近期在投资者互动平台上宣布推出全新AI Agent平台“芒果西米露”，进一步拓展其在人工智能领域的布局。该平台的推出旨在提升内容创作与审核的效率，标志着公司在AI技术方面的持续投资与创新。通过“芒果西米露”，芒果超媒已成功搭建超过70个智能体。

【AiBase提要:】
🎨 超过70个智能体已在“芒果西米露”平台上搭建，涵盖多个业务场景。
⚙️ 平台旨在提升内容创作与审核的效率，优化内部工作流程。
🌟 用户将享受到更加高效和个性化的服务体验。

12、ChatGPT API存在安全漏洞，可能被滥用发起DDoS攻击

最近，德国安全研究员本杰明・弗莱施在微软的 GitHub 上发布了一份报告，揭示了 OpenAI 的 ChatGPT API 存在严重的安全漏洞，可能被攻击者利用发起 DDoS 攻击。该漏洞允许攻击者通过简单的 HTTP 请求，向特定网站发送大量请求，可能导致目标网站瘫痪。

【AiBase提要:】
🚨 OpenAI 的 ChatGPT API 被发现存在安全漏洞，可能被用于发起 DDoS 攻击。
📈 攻击者可以通过一个请求发送数千个指向同一网站的链接，导致目标网站被淹没。
❗ 该漏洞已经报告给 OpenAI 和微软，但未收到任何回应，显示出安全管理的疏忽。

13.AI 海报生成再升级！美图 WHEE 突破文字排版难题

美图公司推出的 WHEE 图像工具实现了海报生成的重大升级，特别在文字排版上取得突破，用户可自由调整文字布局和样式。此外，WHEE 内置丰富模板，并支持一键生成贴图素材，大幅提升了海报制作的效率和便捷性。

【AiBase 提要：】
✨ WHEE 支持文字单独编辑，用户可精准控制排版。
🎨 内置多种场景模板，满足不同用户需求。
🖌️ 提供 “免抠素材” 功能，快速生成风格各异的贴图。

（举报）

相关推荐

关键词：

微算法科技(NASDAQ：MLGO)基于人工智能优化构建混合ARIMA模型，提高比特币价格预测准确性

随着数字资产市场兴起，比特币等加密货币价格预测成为焦点。传统模型难以准确捕捉其非线性波动，微算法科技引入AI技术优化ARIMA模型，结合LSTM网络构建混合模型，提升预测准确性。通过AI算法自动处理数据缺失、异常值检测及参数优化，实现更可靠的比特币价格预测，为投资者提供决策支持。

比特币价格预测混合ARIMA-LSTM模型数字资产市场
大模型技术赋能声音创作：逗哥配音引领AI语音合成新浪潮‌

逗哥配音作为国内领先的AI配音平台，凭借自主研发的语音合成大模型技术，已服务超千万创作者，累计生成音频量突破270亿次。其核心技术突破包括：1）支持40种语言，语音质量MOS分提升0.25，拟人度超83%；2）首创"AI分角功能"，将多角色配音效率提升90%以上；3）建成覆盖近千款发音人的全球声库，包含方言、外语及影视角色音；4）创新"真人声纹+AI增强"模式，

人工智能大模型技术 AI配音
北电数智亮相世界人工智能大会，“四链融合”推动AI产业落地

2025世界人工智能大会“人工智能+”战略领军人才与创新发展论坛圆满落幕。论坛聚焦“人才领航智启未来”主题，汇聚中科院、社科院专家及中国联通、腾讯云等机构代表，围绕“人工智能+”行动分享经验，为AI高质量发展筑牢人才根基、激发创新动能。北电数智CMO杨震出席并发表演讲，分享AI行业落地实践，强调紧跟国家战略，推进产业、创新、人才、资本四链融合，打造面向不同场景的AI解决方案，全方位助力AI产业发展。

人工智能人才领军创新发展
海尔冰箱唯一获批“制冷家电人工智能技术山东省工程研究中心”

海尔冰箱在人工智能领域取得新突破，主导建设的"制冷家电人工智能技术山东省工程研究中心"成为2025年山东省工程研究中心认定名单中唯一入选的冰箱品牌。该中心聚焦人工智能、物联网、大数据等技术方向，开发了全空间智慧保鲜舱冰箱等140多项行业首创产品，近三年获授权发明专利803件。海尔冰箱还推出行业首款接入DeepSeek的AI全空间保鲜冰箱，具备方言识别、降噪技术等功能，显著提升用户体验。市场数据显示，2023年1-7月海尔冰箱以47%市场份额稳居行业第一。通过AI技术赋能，海尔冰箱正引领行业向精准、智能保鲜时代跨越。

人工智能海尔冰箱科技创新
下一个爆款在哪儿？2025英特尔人工智能创新应用大赛获奖名单揭晓

8月16日，2025英特尔人工智能创新应用大赛总决赛在深圳落幕。40支优秀团队从2817支队伍中脱颖而出，围绕工业、教育、心理健康、游戏等领域展开对决。大赛展示了AI从云端走向边缘的趋势，依托酷睿Ultra处理器和低代码开发工具，推动AI应用本地化落地。获奖作品包括动力电池机器人协作拆卸系统和AI生成PPT服务，体现AI与产业需求的深度融合。英特尔与联想、惠普等合作伙伴共同为开发者提供全栈支持，加速AI技术普及和商业化进程。

人工智能创新应用大赛
荐AI日报：字节视频模型Waver 1.0发布；百度AI搜索APP“梯子AI”发布；谷歌推全新Gemini 2.5 Flash图像编辑模型

本文汇总了AI领域最新动态：谷歌推出Gemini 2.5 Flash图像编辑模型，字节发布Waver 1.0视频生成工具；百度“梯子AI”提供无广告搜索；文心快码新增终端编码功能；腾讯游戏VISVISE工具集提升动画制作效率；自动驾驶配送机器人RM5进军外卖行业；DeepSeek V3.1出现字符Bug已修复；谷歌翻译升级实时同传和AI陪练；全球首现AI勒索软件PromptLock威胁网络安全；Anthropic推出Chrome浏览器AI助手Claude。

AI Gemini 2.5
ISC.AI 2025 人工智能安全治理与创新实践论坛圆满召开

ISC.AI2025人工智能安全论坛在北京召开，聚焦AI安全治理与创新实践。论坛汇集顶尖专家，探讨大模型安全评估与防护、智能体安全、AI治理等前沿议题。360集团张向征指出，随着Agent技术爆发式应用，AI安全已成为产业核心焦点。专家们强调需构建AI安全防护体系，应对大模型直接访问核心系统带来的全新挑战。中国电子院彭健提出企业合规建设需关注九大要素，清华大学苏航揭示智能体安全风险远超传统AI。华为云范建军倡导端到端大模型安全防护，中国信通院杨哲超呼吁构建协同治理框架。论坛为构建安全、普惠、负责任的人工智能未来贡献智慧。

人工智能安全大模型安全 AI治理
荐AI日报：即梦上线智能多帧功能；可灵2.1首尾帧升级；钉钉推语音识别大模型Fun-ASR

AI日报栏目汇总近期AI领域重要进展：腾讯元宝接入DeepSeek V3.1提升智能助手能力；即梦AI推出多帧功能简化视频制作；可灵AI首尾帧功能升级效果提升235%；钉钉与通义实验室联合发布Fun-ASR语音识别大模型；腾讯CodeBuddy IDE国内版公测；Vercel发布AI Gateway简化模型调用；Anthropic整合Claude Code强化企业开发；阿里发布Mobile-Agent-v3突破GUI自动化；Qoder平台革新编程模式；清华团队GUAVA框架实现0.1秒3D化身生成；谷歌搜索新增AI Agent功能；VAST推出Tripo 3.0推动3D内容创作。

AI 腾讯元宝 DeepSeek
当GPT-5遇上Gemini 2.5，谁更适合你的业务？这份对比报告说了算

某跨境电商CTO复盘会上展示：GPT-5 Standard处理百万级商品描述时，费用比Gemini 2.5 Flash-Lite高35%，响应速度慢0.8秒。大模型选型面临参数迷雾、场景错配、隐藏成本三重困境。AIbase选型对比平台通过真实数据测试，提供透明价格拆解和性能雷达图，帮助规避预算陷阱。实测显示GPT-5在合同逻辑分析准确率高3.2%，而Gemini表格解析速度快40%、月总成本低26%。工具可动态追踪官方调价，生成定制化决策报告，用数据替代经验主义，提升技术选型效率。

大模型选型参数迷雾场景错配
别再猜了！手把手教你用数据选择AI模型，我的Gemini 2.5 Flash-Lite vs DeepSeek选型心得

开发者分享模型选择心路历程：从盲目试错到数据驱动。曾因追求低价模型导致成本飙升，后通过AIbase平台对比Gemini 2.5 Flash-Lite和DeepSeek-V3，基于价格、上下文长度和代码能力等数据，最终选择更适合代码生成任务的DeepSeek-V3。强调没有“最好”的模型，只有“最适合”的模型，建议开发者善用专业工具进行数据驱动决策，避免隐性成本。

今日大家都在搜的词：

热文

3 天
7天

AI日报：对标Cursor！字节推AI编程工具Trae；MiniMax海螺语音全球上线；OpenAI将发布o3-mini

微算法科技(NASDAQ：MLGO)基于人工智能优化构建混合ARIMA模型，提高比特币价格预测准确性

大模型技术赋能声音创作：逗哥配音引领AI语音合成新浪潮‌

北电数智亮相世界人工智能大会，“四链融合”推动AI产业落地

海尔冰箱唯一获批“制冷家电人工智能技术山东省工程研究中心”

下一个爆款在哪儿？2025英特尔人工智能创新应用大赛获奖名单揭晓

荐AI日报：字节视频模型Waver 1.0发布；百度AI搜索APP“梯子AI”发布；谷歌推全新Gemini 2.5 Flash图像编辑模型

ISC.AI 2025 人工智能安全治理与创新实践论坛圆满召开

荐AI日报：即梦上线智能多帧功能；可灵2.1首尾帧升级；钉钉推语音识别大模型Fun-ASR

当GPT-5遇上Gemini 2.5，谁更适合你的业务？这份对比报告说了算

别再猜了！手把手教你用数据选择AI模型，我的Gemini 2.5 Flash-Lite vs DeepSeek选型心得

今日大家都在搜的词：

热文

2025民营企业500强揭晓：京东第一

SpaceX第10次试飞成功马斯克：星舰这次没有空中爆炸

小米澎湃OS3发布会官宣首批Beta版招募机型公布

AI日报：字节视频模型Waver 1.0发布；百度AI搜索APP“梯子AI”

罗永浩播客节目爆火：24小时播放量超2000万晒成绩单求合作

AI日报：Wan 2.2-S2V模型即将发布；字节跳动内测3D Model Ge

何小鹏回应小鹏命名：称有人说小鹏改名销量翻倍

iPhone17标准版或上高刷苹果2025秋季发布会定档9月10日

网易云音乐：没有“访客记录”功能也不会有其他形式呈现

realme真我15000mAh电池容量手机亮相

2025民营企业500强揭晓：京东第一

SpaceX第10次试飞成功马斯克：星舰这次没有空中爆炸

AI日报：钉钉十周年发布8.0版本；微信悄悄上线AI播客；阿里开源

iPhone17Pro爆料汇总：橙色版本成最大亮点或迎12项升级

20周年版iPhone或成苹果首款曲面机：一体环绕玻璃+曲面机身

小米澎湃OS3发布会官宣首批Beta版招募机型公布

AI日报：字节视频模型Waver 1.0发布；百度AI搜索APP“梯子AI”

罗永浩播客节目爆火：24小时播放量超2000万晒成绩单求合作

AI日报：Wan 2.2-S2V模型即将发布；字节跳动内测3D Model Ge

24. 98 万起标配华为ADS 4！鸿蒙智行智界 R7 车型上市

站长商机