AI日报：通义千问开源Qwen3向量模型；字节跳动图像编辑模型SeedEdit 3.0；ElevenLabs推v3语音模型

2025-06-06 16:09 · 稿源：站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、通义千问正式发布Qwen3-Embedding系列模型

我作为一名AI助手，对通义千问团队推出Qwen3-Embedding系列模型感到非常兴奋。这款新模型不仅在多语言文本理解和检索任务上表现出色，而且提供了灵活的配置选项和强大的多语言支持，展现了其在文本处理领域的领先地位。

【AiBase提要:】
📚 Qwen3-Embedding系列基于Qwen3基础模型，提供从0.6B到8B参数规模的三种配置，适用于不同场景下的性能与效率需求。
🌍 支持超过100种语言，具备强大的多语言、跨语言及代码检索能力，采用双塔和单塔结构设计。
🌟 在MTEB多语言榜单中得分70.58，性能超越众多商业API服务，展现卓越的文本表征和排序能力。
详情链接:https://modelscope.cn/collections/Qwen3-Embedding-3edc3762d50f48

2、字节跳动发布图像编辑模型SeedEdit3.0细节保持能力进一步提升

SeedEdit3.0是基于 Seedream3.0开发的图像编辑模型，通过多样化数据融合和专用奖励模型，大幅提升了主体保持、背景细节处理及指令遵循能力，尤其在人像编辑、背景更换和复杂光影处理方面表现卓越。

【AiBase提要:】
✨ 引入高效数据融合策略与专用奖励模型，显著提升图像编辑保持效果。
🌟 支持4K分辨率编辑，处理复杂场景如人像、光影变换时展现强大细节处理能力。
🚀 推理加速至10秒级，23类编辑任务评测领先，可用率提升至56.1%。
详情链接:https://seed.bytedance.com/seededit

3、地表最强AI语音来了!Eleven v3Alpha版震撼发布，会说话还能‘演戏’

ElevenLabs推出的Eleven v3Alpha版以其卓越的情感表达、多语言支持和自然对话能力成为TTS领域的里程碑，重新定义了文本转语音技术。

【AiBase提要:】
🌟 Eleven v3Alpha版引入音频标签，可精确控制情感、语速并添加音效，使语音更真实且富有表现力。
🌐 支持70多种语言，具备多角色对话能力，适用于影视配音、教育及客户服务等多场景。
🚀 技术升级后，文本理解与对话生成能力显著提升，自动标签功能简化创作流程，助力非专业人士轻松生成高质量语音内容。

4、Anthropic 发布专为国家安全定制的 AI 模型，获亚马逊和谷歌支持

Anthropic 推出 Claude Gov 模型套件，专为国家安全机构设计，增强涉密材料处理能力，获得亚马逊和谷歌战略支持，但面临 Reddit 的法律诉讼。

【AiBase提要:】
🌐 Claude Gov 模型套件专为国家安全机构设计，提升涉密材料处理能力。
🤝 产品获亚马逊和谷歌支持，仅限最高安全许可机构使用。
⚖️ Anthropic 面临 Reddit 提起的法律诉讼，指控其未经授权使用用户数据训练模型。

5、可灵AI月度付费金额连续两个月超1亿元，用户规模破2200万

可灵AI在推出10个月后年化收入运行率突破1亿美元，P端付费订阅会员贡献主要收入，全球用户规模突破2200万。

【AiBase提要:】
✨ 可灵AI年化收入运行率突破1亿美元，仅10个月达成。
💰 P端付费订阅会员贡献近70%营业收入。
👥 全球用户规模突破2200万，为企业客户提供API服务。

6、Meta发布Aria Gen2技术细节:四摄像头加持，续航8小时挑战苹果Vision Pro

Meta首次全面披露Aria Gen2研究眼镜的技术细节，相比初代产品，它在硬件设计、传感器技术和AI处理能力等方面实现了全面升级。

【AiBase提要:】
四摄像头加持，全局快门传感器解决运动失真问题，深度测量精度显著提高。
新增接触式麦克风，鼻托内置结构声传导技术，嘈杂环境下仍能清晰拾音。
AI处理能力大幅增强，支持六自由度位置追踪、眼动追踪及3D手部追踪，为未来AR交互奠定基础。

7、爱诗科技PixVerse国内版“拍我AI”正式上线

爱诗科技旗下的PixVerse国内版“拍我AI”正式上线，支持网页端和移动端，并提供API开放平台，大幅降低视频制作成本与时间。

【AiBase提要:】
拍我AI通过AI特效和WoW发射器助力用户轻松创作个性化视频内容。
国内版支持V4.5版本，提供便捷的视频生成解决方案，满足多种需求。
拍我AI开放平台与多家头部企业合作，为企业用户提供高效视频生成工具。
详情链接:https://pai.video

8、富国银行大胆预测:2030年 ChatGPT 广告收入将达千亿美元

富国银行分析师预测，到2030年ChatGPT将占据全球搜索广告市场30%份额，年收入接近1000亿美元，这将对谷歌的主导地位构成挑战。

【AiBase提要:】
截至2030年，ChatGPT预计占据全球搜索广告市场30%份额，年收入接近1000亿美元。
目前，谷歌在搜索广告领域占据超90%市场份额，但预计到2030年将降至约60%。
ChatGPT的商业化进程可能受到与手机制造商合作及反垄断裁决的推动。

9、王自如感谢董明珠雷军将以AI测评UP主身份二次创业

知名科技博主王自如宣布复更并更名为‘王自如AI’，专注AI内容创业，助力传统产业数字化转型，同时分享了在格力的经历及对董明珠和雷军的感激。

【AiBase提要:】
🚀6月6日，王自如的B站账号复更并更名为‘王自如AI’，开启AI测评UP主的二次创业。
💼 他曾在格力重塑销售体系，得益于董明珠和雷军的鼓励，怀揣理想继续前行。
💡 选择AI领域创业是因为看到其巨大潜力，认为能快速获得回报。

10、智源发布RoboOS2.0与RoboBrain2.0:首个支持MCP机制的机器人

在北京智源大会上，北京智源人工智能研究院发布了具身智能操作系统RoboOS2.0与大模型RoboBrain2.0，开源推动具身智能生态发展。

【AiBase提要:】
首个支持MCP机制的机器人操作系统RoboOS2.0，降低开发门槛并提升多机器人协作能力。
RoboBrain2.0任务规划准确率提升74%，在空间推理与智能调度方面表现卓越。
已与多家企业合作，共同构建开放、协同的智能机器人生态体系。

11、谷歌重磅新作!Portraits让你与虚拟专家对话，解锁沟通与领导力秘籍

谷歌推出的Portraits是一款基于AI技术的创新产品，用户能与虚拟专家实时互动学习沟通与领导力等技能，具有高度个性化和交互性的特点。

【AiBase提要:】
🌟沉浸式对话学习体验，与虚拟专家互动掌握实用技能。
🌐AI驱动个性化学习，动态调整内容确保针对性。
🌍应用场景广泛，从职场到教育，助力个人与职业发展。

12、OpenAudio 发布开源 TTS 模型 S1-Mini:0.5B 参数打造超自然 AI 语音

Fish Audio 推出基于 S1模型的轻量化版本 S1-Mini，参数仅0.5B，却具备高表现力和多语言支持，开源后大幅降低开发门槛，为教育、娱乐等领域带来创新可能。

【AiBase提要:】
🌟 轻量化设计:0.5B 参数，适配边缘设备，支持14种语言与50+情感表达。
🌐 开源赋能:免费下载，降低开发门槛，促进全球技术普及与创新。
🚀 性能卓越:媲美行业巨头，尤其在多语言和复杂对话场景表现突出。
详情链接:https://huggingface.co/fishaudio/openaudio-s1-mini

13、AI驱动本地视频编辑工具Diffusion Studio Pro，号称“CapCut + Cursor”结合

AI驱动的视频编辑工具Diffusion Studio Pro正式亮相，以其强大的AI功能和本地化设计受到广泛关注。它结合了CapCut和Cursor的优势，提供多模态AI赋能的非线性编辑体验，同时支持免费使用，极大降低了创作门槛。

【AiBase提要:】
🌟 多模态AI赋能非线性编辑，内置智能代理侧边栏实现自动化工作流，显著提升创作效率。
🔒 本地优先设计保护隐私，免费无限层级模式吸引独立创作者和小型团队。
🌍 支持广泛应用场景，从短视频到专业制作，提供从创意到上线的全链条支持。

14、智源研究院推出Emu3等‘悟界’系列大模型

在第七届‘北京智源大会’上，智源研究院发布了‘悟界’系列大模型，包括Emu3、见微 Brainμ、RoboOS2.0、RoboBrain2.0和OpenComplex2，涵盖多模态智能技术，推动人工智能应用落地。

【AiBase提要:】
🚀 Emu3作为原生多模态世界模型，整合视觉、听觉和触觉数据，提升机器对世界的理解能力。
🧠 见微 Brainμ结合神经科学成果，为机器智能发展提供生物学支持。
🤖 RoboOS2.0和RoboBrain2.0推动具身智能协作框架，加速机器人技术进步。

15. Luma Labs 发布 Modify Video:AI 视频后期一键改风格、换场景

Luma Labs 推出 Modify Video 工具，利用 AI 技术简化视频后期制作，实现风格重塑、场景替换等功能。

【AiBase 提要:】
🌟 风格重塑:通过文本改变视频艺术风格。
🌍 场景替换:将背景换为新的场景，增强视觉效果。
🎭 角色编辑:调整人物外观和表演，无需重新拍摄。

（举报）

相关推荐

关键词：

跨境支付的未来：人工智能、嵌入式金融和即时结算

本文系统分析了人工智能、嵌入式金融与即时结算三大技术趋势如何重构跨境支付体系。人工智能通过智能填单、动态风控和预测性维护显著提升支付效率与安全性；嵌入式金融将支付功能无缝融入电商平台与供应链，实现“无跳转支付”；即时结算技术将跨境支付时间从数日缩短至秒级，并优化现金流。三大技术深度融合形成协同效应，推动跨境支付向更智能、高效、无缝�

全球支付生态数字化浪潮跨境支付体系
人工智能落地“最后一公里”，戴尔工作站助力AI应用提速

AI应用落地面临“最后一公里”部署难题：传统流程繁琐耗时，从模型开发到上线需数周。英特尔携手戴尔与零克云打造“工作站-AI PC-云端”协同生态，通过本地工作站进行小规模测试验证，降低试错成本与数据泄露风险，再通过“一键部署”快速扩展至云端规模化落地。这种“先本地验证、后云端放大”的路径显著提升开发效率，释放团队创造力，让有价值的AI想法快速照进现实。

AI部署模型上线服务器配置
简知科技“简智AI大模型”通过国家生成式人工智能服务备案，助力兴趣教育迈向智能化新阶段

广州简知科技自主研发的“简智AI大模型”通过国家生成式人工智能服务备案，标志着该模型在安全性、合规性与可靠性方面达到国家级标准。作为兴趣教育领域AI应用的重要里程碑，该模型围绕用户兴趣成长周期设计，提供个性化学习支持：可为未明确兴趣方向的用户智能推荐内容，为入门用户规划学习路径，为基础扎实用户提供进阶训练与智能反馈。其技术能力在旗下“简小知”等品牌中已实现“学—练—评—测”全流程覆盖，并通过社群互动增强学习动力。公司未来将持续优化模型能力，联合行业伙伴构建完整培养体系，推动兴趣教育向个性化、高质量方向发展。

简智AI大模型生成式人工智能兴趣教育
登榜LMArena！文心大模型5.0-Preview文本能力国内第一

11月8日，文心全新模型ERNIE-5.0-Preview-1022在LMArena大模型竞技场排名中位列全球第二、中国第一。该模型在创意写作、复杂长问题理解和指令遵循方面表现突出，超越多款国内外主流模型。创意写作可高效生成文章、营销文案等内容；复杂长问题理解适用于学术问答、报告分析等任务；指令遵循能力支持智能助理、代码生成等场景，为多领域内容生产提供高效支撑。

文心模型 ERNIE-5.0 创意写作
荐AI日报：美团LongCat-Flash-Omni发布；Qwen3-Max上线深度思考功能；百度“文心”5.0重磅回归

本期AI日报聚焦多领域技术突破：美团发布全模态交互模型LongCat-Flash-Omni；阿里通义千问Qwen3-Max上线深度思考功能；百度文心5.0升级多模态生成能力；谷歌确认Gemini3年内发布并整合至苹果Siri；OpenAI向多国开放Sora2视频工具；云存储与AI开发工具持续优化，展现行业加速迭代态势。

AI 多模态实时交互
人工智能巨头OpenAI拟上市估值或高达1万亿美元

OpenAI正积极推进上市计划，据知情人士透露，该公司可能最早于2026年下半年向证券监管机构提交上市申请，目标在2027年正式上市。此次IPO的估值有望达到约1万亿美元，或将跻身全球规模最大的IPO之列。在初步讨论中，OpenAI曾考虑通过上市筹集至少600亿美元资金，实际融资规模可能进一步扩大。

OpenAI IPO 上市计划
共建·共智·共享--新一代AtomGit平台暨人工智能开源社区发布

10月28日，AtomGit平台在北京国家会议中心举行升级发布会，正式推出"开源+AI"一体化平台及人工智能开源社区。工信部副部长熊继军出席并致辞，强调建设AI开源社区对汇聚创新资源、把握科技革命机遇的重要意义。平台将整合开源模型、数据集及算力资源，打造开放中立的基础设施，计划于11月21日正式上线。华为、百度等企业代表分享了开源实践，多所高校签署了共建AI生态倡议。此举标志着我国开源生态迈向智能化时代的重要一步。

开源社区人工智能 AtomGit
厚植AI创新沃土！麒麟信安打造人工智能孵化器，赋能创业梦想

10月28日，麒麟信安人工智能孵化器在长沙启动，旨在汇聚AI领域人才、技术与资本，构建开放协同的创新生态。该项目获湖南省多部门支持，已吸引60余个项目入围，组建了首批30余位专家导师团，并与多家顶尖机构共建联合体，通过政策扶持、资本对接等多维度赋能，培育优质AI项目在湘落地发展，助力区域打造人工智能产业创新高地。

人工智能孵化器麒麟信安创新创业
卖家精灵加入中国人工智能产业发展联盟（AIIA），加速AI赋能跨境电商

卖家精灵凭借在跨境电商智能化运营与AI大数据应用领域的领先实力，近日正式加入中国人工智能产业发展联盟（AIIA），成为该国家级AI产业生态重要成员。此次加入标志着其AI技术实力获权威认可，未来将携手联盟推动AI技术研发与产业化，助力中国品牌全球化。依托八年积累的海量电商数据与算法体系，卖家精灵已构建覆盖选品决策、市场分析等全链路AI解决方案，服务超百万跨境卖家，显著提升运营效率与决策精准度。

人工智能跨境电商 AI大数据
行业首个！海尔冰箱获ISO/IEC 42001人工智能管理体系认证

2025年10月，海尔冰箱成为全球首个通过ISO/IEC42001人工智能管理体系认证的家电企业，标志着其AI技术研发与管理达国际领先水平。该认证覆盖语音交互、视觉识别、健康保鲜等核心功能全流程，确保用户数据安全与隐私保护。目前AI系统已应用于博观、麦浪等高端产品，推动智能冰箱行业规范化发展。未来海尔将持续优化AI技术，为用户提供更安全、智能的健康饮食体验。

冰箱品牌人工智能技术海尔冰箱

今日大家都在搜的词：

热文

3 天
7天

AI日报：通义千问开源Qwen3向量模型；字节跳动图像编辑模型SeedEdit 3.0；ElevenLabs推v3语音模型

跨境支付的未来：人工智能、嵌入式金融和即时结算

人工智能落地“最后一公里”，戴尔工作站助力AI应用提速

简知科技“简智AI大模型”通过国家生成式人工智能服务备案，助力兴趣教育迈向智能化新阶段

登榜LMArena！文心大模型5.0-Preview文本能力国内第一

荐AI日报：美团LongCat-Flash-Omni发布；Qwen3-Max上线深度思考功能；百度“文心”5.0重磅回归

人工智能巨头OpenAI拟上市估值或高达1万亿美元

共建·共智·共享--新一代AtomGit平台暨人工智能开源社区发布

厚植AI创新沃土！麒麟信安打造人工智能孵化器，赋能创业梦想

卖家精灵加入中国人工智能产业发展联盟（AIIA），加速AI赋能跨境电商

行业首个！海尔冰箱获ISO/IEC 42001人工智能管理体系认证

今日大家都在搜的词：

热文

影视飓风CEO在相亲角被大妈吐槽网友：大妈不识货

腾讯发布2025第三季度财报：营收1928.69亿元同比增长 15%

小米澎湃OS 3第三批正式版推送：支持小米14、K70系列等

荣耀500系列开启预约：Pro版外观首次亮相

AI日报：百度发布文心5.0；可灵2.5Turbo模型上线“首尾帧”功能

iPhone Pocket正式开售：联名三宅一生售价1299元起

微信小程序将在iOS端支持接入虚拟支付苹果抽成15%

1899元苹果手机包卖完了！iPhone Pocket在吐槽声中销售火爆

AI日报：李飞飞Marble 3D世界模型公测；OpenAI首次推出ChatGPT

苹果回应输入法宁死不屈：具备记忆功能与学习机制

iPhone Pocket被吐槽像保温水瓶套网友：韭菜太好割

影视飓风CEO在相亲角被大妈吐槽网友：大妈不识货

腾讯发布2025第三季度财报：营收1928.69亿元同比增长 15%

雷军回应小米双11战绩：谢谢大家支持

卢伟冰：小米手机双11连续三年国产销量第一

AI日报：广电整治AI动画乱象；360发布大模型安全白皮书；百度推

小米澎湃OS 3第三批正式版推送：支持小米14、K70系列等

OPPO Reno15系列定档11月17日发布

AI日报：月之暗面开源AI新框架Kosong；百度发布新模型ERNIE-4.

腾讯回应QQ群最早是为了员工约饭：是一个朴实无华的需求

站长商机