首页 > 原创 > 关键词  > 人工智能最新资讯  > 正文

AI日报:对标Cursor!字节推AI编程工具Trae;MiniMax海螺语音全球上线;OpenAI将发布o3-mini

2025-01-20 15:15 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、MiniMax海螺语音全球同步上线 包含T2A-01-Turbo等模型

2025年1月20日,上海稀宇科技有限公司旗下的MiniMax推出了全新升级的T2A-01系列语音模型,标志着其在语音合成技术上的又一重要进展。该系列包括T2A-01-HD和T2A-01-Turbo模型,支持17种语言和300多种音色,满足企业和个人用户的多样化需求。

image.png

【AiBase提要:】

🎤 T2A-01系列语音模型支持17种语言,提供清晰音质和自然韵律。

🌍 海螺语音在多语种合成能力上领先同类产品,情感理解能力强。

🎶 用户可从300多种音色中选择,并进行个性化调整,满足不同场景需求。

详情链接:https://hailuoai.com/audio

2、字节跳动推出针对中文开发者AI IDE产品Trae 性能对标Cursor

字节跳动推出的Trae是一款专为中文开发者设计的AI集成开发环境(IDE),旨在提升中文开发者的编程体验。Trae通过全面优化中文界面和代码注释支持,解决了现有工具在中文用户使用时的不便。此外,Trae还集成了先进的AI模型,提供智能代码生成和逻辑优化功能。

image.png

【AiBase提要:】

💻 Trae IDE专为中文开发者设计,优化了中文界面和代码注释支持,提升使用体验。

🤖 集成Claude3.5和GPT-4o等主流AI模型,具备智能代码生成和逻辑优化功能。

🔧 提供强大的Builder功能,用户可生成完整代码项目,但需手动确认AI生成的代码。

详情链接:https://top.aibase.com/tool/trae

3、商汤日日新融合大模型交互版开放商用 实时音视频对话限时免费

商汤科技的SenseNova-5o交互版正式推出,标志着其在AI领域的重要进展。该模型具备强大的实时音视频对话能力,支持超长多模态交互记忆,能够精准记录和回忆用户对话内容。SenseNova-5o还提供个性化设置,适应多种沟通场景,已成功应用于多种智能设备,展现了商汤在AI技术应用方面的潜力与创新。

image.png

【AiBase提要:】

🎤 SenseNova-5o具备超长的多模态交互记忆,能够精准记录用户对话并快速回忆相关内容。

💬 该模型展现出高效的多轮对话能力,交互延迟缩短至2秒,几乎与人类自然交流无异。

🎭 用户可根据偏好自由设定交流风格,甚至可以让AI扮演特定角色进行对话。

4、Krea升级版实时生成,支持FLUX实时图片生成,创意拼贴组合

Krea在图像融合领域的创新达到了一个新的高度,推出了升级版实时生成,支持FLUX实时图片生成。用户可以通过上传多张图片,进行抠图和3D转换,创造出独特的拼贴画效果。这种新型的交互方式不仅解决了AI图片生成的随机性问题,还允许用户在生成过程中自由调整元素的角度,极大提升了创作的灵活性和趣味性。

image.png

【AiBase提要:】

🖼️ Krea推出的FLUX实时图片生成支持用户上传多张图片进行创意拼贴。

🔄 用户可以对生成的3D元素进行自由旋转,找到最佳展示角度。

✨ 该功能允许用户先生成奇幻风格的图片,再进行抠图和拼贴,创作出大片效果。

详情链接:https://www.krea.ai/

5、OpenAI几周内发布 o3-mini,性能略逊于 o1-pro

OpenAI CEO 山姆・奥特曼近日宣布,备受期待的 o3-mini 将在几周内发布。这款大模型的蒸馏版将推出高、中、低三个版本,满足不同用户需求。尽管性能略逊于前代 o1-pro,但 o3-mini 在速度上有所提升,特别适合编程使用。此外,AGI 实现所需的872兆瓦计算功率引发了对人工智能未来的热议。

【AiBase提要:】

🌟 o3-mini 将在几周内正式发布,提供高、中、低三个版本供选择。

⚡️ 尽管性能不及 o1-pro,但 o3-mini 在速度上有所提升,更适合编程。

🔋 AGI 实现需要872兆瓦的计算功率,引发对人工智能未来发展的广泛讨论。

6、阶跃星辰上线Step-2mini、Step-2文学大师版语言模型

2025年1月20日,上海阶跃星辰智能科技有限公司推出了Step系列语言模型的新成员Step-2mini和Step-2文学大师版,旨在满足开发者在不同创作场景中的需求。Step-2mini以轻量化设计实现了高效性能和快速响应,而Step-2文学大师版则专注于内容创作,能够生成逻辑严密且富有独特风格的作品。

【AiBase提要:】

⚡️ Step-2mini是一款轻量级模型,保留了Step-2超过80%的性能,同时显著提升了生成速度和性价比。

🖊️ Step-2文学大师版专注于内容创作,能够生成逻辑严密且富有思想的作品,展现出卓越的创作实力。

🌐 开发者可通过阶跃星辰开放平台调用Step-2mini的API接口,提供高效的语言处理服务。

详情链接:https://yuewen.cn

7、Runway推全新AI图像生成器Frames,打造电影级视觉表现

Runway公司最近推出了其最新的文本生成图像模型Frames,旨在提升创意工作者的视觉表现。Frames以其高精度的提示系统和多样的预设风格,受到用户的广泛好评,特别是在生成电影般的视觉效果方面。该模型不仅支持静态图像生成,还能与Runway的图像转视频模型无缝对接,为创意专业人士提供了更多灵活性。

image.png

【AiBase提要:】

🌟 Runway推出AI图像生成器Frames,旨在提升创意工作者的视觉表现。

🎨 Frames提供多种预设风格,用户可定制生成具有特定视觉特征的图像。

🔒 公司重视内容安全与伦理问题,包含内容审核及水印功能以防止滥用。

8、为了让人类多活10年 OpenAI 推出新模型 GPT-4b micro

OpenAI推出了其首个专注于生物数据的人工智能模型GPT-4b micro,旨在延长人类寿命,目标是让人类多活10年。该模型与Retro Biosciences合作,专注于开发抵抗细胞衰老的新药,利用“山中因子”提高细胞重编程效率。初步实验结果显示,模型建议的改造方案效果显著。

【AiBase提要:】

🧪 GPT-4b micro模型旨在通过改进细胞重编程技术,帮助人类延长寿命。

🔬 OpenAI与Retro Biosciences合作,专注于开发抵抗细胞衰老的新药,利用“山中因子”。

🚀 初步实验表明,模型建议的改造方案效果提升超过50倍,显示出显著优势。

9、Windsurf发布Wave2版本:支持联网和存储上下文

Windsurf团队推出的Wave2更新为编辑器带来了多项重大升级,包括Web搜索、自动记忆、代码执行改进及问题标签功能。这些新功能旨在提升开发者的工作效率和个性化体验。Web搜索允许用户实时获取互联网信息,而自动记忆则能根据用户的使用模式进行学习,提供更贴心的支持。

image.png

【AiBase提要:】

🌐 Web搜索: Cascade现在可以实时从互联网获取信息,增强开发者的工作效率。

🧠 自动记忆: Cascade能自动学习用户的工作模式,提供更个性化的支持。

💻 代码执行改进: 更好地执行命令,并与开发容器深度集成,提升使用体验。

10、微软推出 Windows AI 搜索功能测试,提升文件查找体验

微软最近在 Windows11Insider 测试者的最新开发频道版本中推出了一项 AI 驱动的 Windows 搜索功能。这项功能旨在通过语义索引技术,帮助用户以更自然的语言搜索本地文件。用户需要拥有 C o p i l o t Plus PC 才能使用该功能,且支持多种文件格式,未来还将扩展到云数据。

image.png

【AiBase提要:】

🌟 微软正在为 Windows11测试新 AI 搜索功能,允许用户以更自然的语言查找本地文件。

💻 当前功能仅适用于 C o p i l o t Plus PC,支持多种文件格式且无需联网。

📈 未来将扩展到云数据并支持更多类型的 C o p i l o t Plus 计算机。

11、芒果超媒推出AI Agent平台 “芒果西米露”,已搭建70个智能体

芒果超媒近期在投资者互动平台上宣布推出全新AI Agent平台“芒果西米露”,进一步拓展其在人工智能领域的布局。该平台的推出旨在提升内容创作与审核的效率,标志着公司在AI技术方面的持续投资与创新。通过“芒果西米露”,芒果超媒已成功搭建超过70个智能体。

【AiBase提要:】

🎨 超过70个智能体已在“芒果西米露”平台上搭建,涵盖多个业务场景。

⚙️ 平台旨在提升内容创作与审核的效率,优化内部工作流程。

🌟 用户将享受到更加高效和个性化的服务体验。

12、ChatGPT API存在安全漏洞,可能被滥用发起DDoS攻击

最近,德国安全研究员本杰明・弗莱施在微软的 GitHub 上发布了一份报告,揭示了 OpenAI 的 ChatGPT API 存在严重的安全漏洞,可能被攻击者利用发起 DDoS 攻击。该漏洞允许攻击者通过简单的 HTTP 请求,向特定网站发送大量请求,可能导致目标网站瘫痪。

【AiBase提要:】

🚨 OpenAI 的 ChatGPT API 被发现存在安全漏洞,可能被用于发起 DDoS 攻击。

📈 攻击者可以通过一个请求发送数千个指向同一网站的链接,导致目标网站被淹没。

❗ 该漏洞已经报告给 OpenAI 和微软,但未收到任何回应,显示出安全管理的疏忽。

13.AI 海报生成再升级!美图 WHEE 突破文字排版难题

美图公司推出的 WHEE 图像工具实现了海报生成的重大升级,特别在文字排版上取得突破,用户可自由调整文字布局和样式。此外,WHEE 内置丰富模板,并支持一键生成贴图素材,大幅提升了海报制作的效率和便捷性。

【AiBase 提要:】

✨ WHEE 支持文字单独编辑,用户可精准控制排版。

🎨 内置多种场景模板,满足不同用户需求。

🖌️ 提供 “免抠素材” 功能,快速生成风格各异的贴图。

举报

  • 相关推荐
  • 微算法科技(NASDAQ:MLGO)基于人工智能优化构建混合ARIMA模型,提高比特币价格预测准确性

    随着数字资产市场兴起,比特币等加密货币价格预测成为焦点。传统模型难以准确捕捉其非线性波动,微算法科技引入AI技术优化ARIMA模型,结合LSTM网络构建混合模型,提升预测准确性。通过AI算法自动处理数据缺失、异常值检测及参数优化,实现更可靠的比特币价格预测,为投资者提供决策支持。

  • 大模型技术赋能声音创作:逗哥配音引领AI语音合成新浪潮‌

    逗哥配音作为国内领先的AI配音平台,凭借自主研发的语音合成大模型技术,已服务超千万创作者,累计生成音频量突破270亿次。其核心技术突破包括:1)支持40种语言,语音质量MOS分提升0.25,拟人度超83%;2)首创"AI分角功能",将多角色配音效率提升90%以上;3)建成覆盖近千款发音人的全球声库,包含方言、外语及影视角色音;4)创新"真人声纹+AI增强"模式,

  • 北电数智亮相世界人工智能大会,“四链融合”推动AI产业落地

    2025世界人工智能大会“人工智能+”战略领军人才与创新发展论坛圆满落幕。论坛聚焦“人才领航智启未来”主题,汇聚中科院、社科院专家及中国联通、腾讯云等机构代表,围绕“人工智能+”行动分享经验,为AI高质量发展筑牢人才根基、激发创新动能。北电数智CMO杨震出席并发表演讲,分享AI行业落地实践,强调紧跟国家战略,推进产业、创新、人才、资本四链融合,打造面向不同场景的AI解决方案,全方位助力AI产业发展。

  • 海尔冰箱唯一获批“制冷家电人工智能技术山东省工程研究中心”

    海尔冰箱在人工智能领域取得新突破,主导建设的"制冷家电人工智能技术山东省工程研究中心"成为2025年山东省工程研究中心认定名单中唯一入选的冰箱品牌。该中心聚焦人工智能、物联网、大数据等技术方向,开发了全空间智慧保鲜舱冰箱等140多项行业首创产品,近三年获授权发明专利803件。海尔冰箱还推出行业首款接入DeepSeek的AI全空间保鲜冰箱,具备方言识别、降噪技术等功能,显著提升用户体验。市场数据显示,2023年1-7月海尔冰箱以47%市场份额稳居行业第一。通过AI技术赋能,海尔冰箱正引领行业向精准、智能保鲜时代跨越。

  • 下一个爆款在哪儿?2025英特尔人工智能创新应用大赛获奖名单揭晓

    8月16日,2025英特尔人工智能创新应用大赛总决赛在深圳落幕。40支优秀团队从2817支队伍中脱颖而出,围绕工业、教育、心理健康、游戏等领域展开对决。大赛展示了AI从云端走向边缘的趋势,依托酷睿Ultra处理器和低代码开发工具,推动AI应用本地化落地。获奖作品包括动力电池机器人协作拆卸系统和AI生成PPT服务,体现AI与产业需求的深度融合。英特尔与联想、惠普等合作伙伴共同为开发者提供全栈支持,加速AI技术普及和商业化进程。

  • AI日报:字节视频模型Waver 1.0发布;百度AI搜索APP“梯子AI”发布;谷歌推全新Gemini 2.5 Flash图像编辑模型

    本文汇总了AI领域最新动态:谷歌推出Gemini 2.5 Flash图像编辑模型,字节发布Waver 1.0视频生成工具;百度“梯子AI”提供无广告搜索;文心快码新增终端编码功能;腾讯游戏VISVISE工具集提升动画制作效率;自动驾驶配送机器人RM5进军外卖行业;DeepSeek V3.1出现字符Bug已修复;谷歌翻译升级实时同传和AI陪练;全球首现AI勒索软件PromptLock威胁网络安全;Anthropic推出Chrome浏览器AI助手Claude。

  • ISC.AI 2025 人工智能安全治理与创新实践论坛圆满召开

    ISC.AI2025人工智能安全论坛在北京召开,聚焦AI安全治理与创新实践。论坛汇集顶尖专家,探讨大模型安全评估与防护、智能体安全、AI治理等前沿议题。360集团张向征指出,随着Agent技术爆发式应用,AI安全已成为产业核心焦点。专家们强调需构建AI安全防护体系,应对大模型直接访问核心系统带来的全新挑战。中国电子院彭健提出企业合规建设需关注九大要素,清华大学苏航揭示智能体安全风险远超传统AI。华为云范建军倡导端到端大模型安全防护,中国信通院杨哲超呼吁构建协同治理框架。论坛为构建安全、普惠、负责任的人工智能未来贡献智慧。

  • AI日报:即梦上线智能多帧功能;可灵2.1首尾帧升级;钉钉推语音识别大模型Fun-ASR

    AI日报栏目汇总近期AI领域重要进展:腾讯元宝接入DeepSeek V3.1提升智能助手能力;即梦AI推出多帧功能简化视频制作;可灵AI首尾帧功能升级效果提升235%;钉钉与通义实验室联合发布Fun-ASR语音识别大模型;腾讯CodeBuddy IDE国内版公测;Vercel发布AI Gateway简化模型调用;Anthropic整合Claude Code强化企业开发;阿里发布Mobile-Agent-v3突破GUI自动化;Qoder平台革新编程模式;清华团队GUAVA框架实现0.1秒3D化身生成;谷歌搜索新增AI Agent功能;VAST推出Tripo 3.0推动3D内容创作。

  • 当GPT-5遇上Gemini 2.5,谁更适合你的业务?这份对比报告说了算

    某跨境电商CTO复盘会上展示:GPT-5 Standard处理百万级商品描述时,费用比Gemini 2.5 Flash-Lite高35%,响应速度慢0.8秒。大模型选型面临参数迷雾、场景错配、隐藏成本三重困境。AIbase选型对比平台通过真实数据测试,提供透明价格拆解和性能雷达图,帮助规避预算陷阱。实测显示GPT-5在合同逻辑分析准确率高3.2%,而Gemini表格解析速度快40%、月总成本低26%。工具可动态追踪官方调价,生成定制化决策报告,用数据替代经验主义,提升技术选型效率。

  • 别再猜了!手把手教你用数据选择AI模型,我的Gemini 2.5 Flash-Lite vs DeepSeek选型心得

    开发者分享模型选择心路历程:从盲目试错到数据驱动。曾因追求低价模型导致成本飙升,后通过AIbase平台对比Gemini 2.5 Flash-Lite和DeepSeek-V3,基于价格、上下文长度和代码能力等数据,最终选择更适合代码生成任务的DeepSeek-V3。强调没有“最好”的模型,只有“最适合”的模型,建议开发者善用专业工具进行数据驱动决策,避免隐性成本。

今日大家都在搜的词: