首页 > 原创 > 关键词  > 人工智能最新资讯  > 正文

AI日报:通义千问开源Qwen3向量模型;字节跳动图像编辑模型SeedEdit 3.0;ElevenLabs推v3语音模型

2025-06-06 16:09 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、通义千问正式发布Qwen3-Embedding系列模型

我作为一名AI助手,对通义千问团队推出Qwen3-Embedding系列模型感到非常兴奋。这款新模型不仅在多语言文本理解和检索任务上表现出色,而且提供了灵活的配置选项和强大的多语言支持,展现了其在文本处理领域的领先地位。

image.png

【AiBase提要:】

📚 Qwen3-Embedding系列基于Qwen3基础模型,提供从0.6B到8B参数规模的三种配置,适用于不同场景下的性能与效率需求。

🌍 支持超过100种语言,具备强大的多语言、跨语言及代码检索能力,采用双塔和单塔结构设计。

🌟 在MTEB多语言榜单中得分70.58,性能超越众多商业API服务,展现卓越的文本表征和排序能力。

详情链接:https://modelscope.cn/collections/Qwen3-Embedding-3edc3762d50f48

2、字节跳动发布图像编辑模型SeedEdit3.0细节保持能力进一步提升

SeedEdit3.0是基于 Seedream3.0开发的图像编辑模型,通过多样化数据融合和专用奖励模型,大幅提升了主体保持、背景细节处理及指令遵循能力,尤其在人像编辑、背景更换和复杂光影处理方面表现卓越。

image.png

【AiBase提要:】

✨ 引入高效数据融合策略与专用奖励模型,显著提升图像编辑保持效果。

🌟 支持4K分辨率编辑,处理复杂场景如人像、光影变换时展现强大细节处理能力。

🚀 推理加速至10秒级,23类编辑任务评测领先,可用率提升至56.1%。

详情链接:https://seed.bytedance.com/seededit

3、地表最强AI语音来了!Eleven v3Alpha版震撼发布,会说话还能‘演戏’

ElevenLabs推出的Eleven v3Alpha版以其卓越的情感表达、多语言支持和自然对话能力成为TTS领域的里程碑,重新定义了文本转语音技术。

【AiBase提要:】

🌟 Eleven v3Alpha版引入音频标签,可精确控制情感、语速并添加音效,使语音更真实且富有表现力。

🌐 支持70多种语言,具备多角色对话能力,适用于影视配音、教育及客户服务等多场景。

🚀 技术升级后,文本理解与对话生成能力显著提升,自动标签功能简化创作流程,助力非专业人士轻松生成高质量语音内容。

4、Anthropic 发布专为国家安全定制的 AI 模型,获亚马逊和谷歌支持

Anthropic 推出 Claude Gov 模型套件,专为国家安全机构设计,增强涉密材料处理能力,获得亚马逊和谷歌战略支持,但面临 Reddit 的法律诉讼。

【AiBase提要:】

🌐 Claude Gov 模型套件专为国家安全机构设计,提升涉密材料处理能力。

🤝 产品获亚马逊和谷歌支持,仅限最高安全许可机构使用。

⚖️ Anthropic 面临 Reddit 提起的法律诉讼,指控其未经授权使用用户数据训练模型。

5、可灵AI月度付费金额连续两个月超1亿元,用户规模破2200万

可灵AI在推出10个月后年化收入运行率突破1亿美元,P端付费订阅会员贡献主要收入,全球用户规模突破2200万。

image.png

【AiBase提要:】

✨ 可灵AI年化收入运行率突破1亿美元,仅10个月达成。

💰 P端付费订阅会员贡献近70%营业收入。

👥 全球用户规模突破2200万,为企业客户提供API服务。

6、Meta发布Aria Gen2技术细节:四摄像头加持,续航8小时挑战苹果Vision Pro

Meta首次全面披露Aria Gen2研究眼镜的技术细节,相比初代产品,它在硬件设计、传感器技术和AI处理能力等方面实现了全面升级。

image.png

【AiBase提要:】

四摄像头加持,全局快门传感器解决运动失真问题,深度测量精度显著提高。

新增接触式麦克风,鼻托内置结构声传导技术,嘈杂环境下仍能清晰拾音。

AI处理能力大幅增强,支持六自由度位置追踪、眼动追踪及3D手部追踪,为未来AR交互奠定基础。

7、爱诗科技PixVerse国内版“拍我AI”正式上线

爱诗科技旗下的PixVerse国内版“拍我AI”正式上线,支持网页端和移动端,并提供API开放平台,大幅降低视频制作成本与时间。

image.png

【AiBase提要:】

拍我AI通过AI特效和WoW发射器助力用户轻松创作个性化视频内容。

国内版支持V4.5版本,提供便捷的视频生成解决方案,满足多种需求。

拍我AI开放平台与多家头部企业合作,为企业用户提供高效视频生成工具。

详情链接:https://pai.video

8、富国银行大胆预测:2030年 ChatGPT 广告收入将达千亿美元

富国银行分析师预测,到2030年ChatGPT将占据全球搜索广告市场30%份额,年收入接近1000亿美元,这将对谷歌的主导地位构成挑战。

【AiBase提要:】

截至2030年,ChatGPT预计占据全球搜索广告市场30%份额,年收入接近1000亿美元。

目前,谷歌在搜索广告领域占据超90%市场份额,但预计到2030年将降至约60%。

ChatGPT的商业化进程可能受到与手机制造商合作及反垄断裁决的推动。

9、王自如感谢董明珠雷军 将以AI测评UP主身份二次创业

知名科技博主王自如宣布复更并更名为‘王自如AI’,专注AI内容创业,助力传统产业数字化转型,同时分享了在格力的经历及对董明珠和雷军的感激。

【AiBase提要:】

🚀6月6日,王自如的B站账号复更并更名为‘王自如AI’,开启AI测评UP主的二次创业。

💼 他曾在格力重塑销售体系,得益于董明珠和雷军的鼓励,怀揣理想继续前行。

💡 选择AI领域创业是因为看到其巨大潜力,认为能快速获得回报。

10、智源发布RoboOS2.0与RoboBrain2.0:首个支持MCP机制的机器人

在北京智源大会上,北京智源人工智能研究院发布了具身智能操作系统RoboOS2.0与大模型RoboBrain2.0,开源推动具身智能生态发展。

【AiBase提要:】

首个支持MCP机制的机器人操作系统RoboOS2.0,降低开发门槛并提升多机器人协作能力。

RoboBrain2.0任务规划准确率提升74%,在空间推理与智能调度方面表现卓越。

已与多家企业合作,共同构建开放、协同的智能机器人生态体系。

11、谷歌重磅新作!Portraits让你与虚拟专家对话,解锁沟通与领导力秘籍

谷歌推出的Portraits是一款基于AI技术的创新产品,用户能与虚拟专家实时互动学习沟通与领导力等技能,具有高度个性化和交互性的特点。

【AiBase提要:】

🌟沉浸式对话学习体验,与虚拟专家互动掌握实用技能。

🌐AI驱动个性化学习,动态调整内容确保针对性。

🌍应用场景广泛,从职场到教育,助力个人与职业发展。

12、OpenAudio 发布开源 TTS 模型 S1-Mini:0.5B 参数打造超自然 AI 语音

Fish Audio 推出基于 S1模型的轻量化版本 S1-Mini,参数仅0.5B,却具备高表现力和多语言支持,开源后大幅降低开发门槛,为教育、娱乐等领域带来创新可能。

image.png

【AiBase提要:】

🌟 轻量化设计:0.5B 参数,适配边缘设备,支持14种语言与50+情感表达。

🌐 开源赋能:免费下载,降低开发门槛,促进全球技术普及与创新。

🚀 性能卓越:媲美行业巨头,尤其在多语言和复杂对话场景表现突出。

详情链接:https://huggingface.co/fishaudio/openaudio-s1-mini

13、AI驱动本地视频编辑工具Diffusion Studio Pro,号称“CapCut + Cursor”结合

AI驱动的视频编辑工具Diffusion Studio Pro正式亮相,以其强大的AI功能和本地化设计受到广泛关注。它结合了CapCut和Cursor的优势,提供多模态AI赋能的非线性编辑体验,同时支持免费使用,极大降低了创作门槛。

【AiBase提要:】

🌟 多模态AI赋能非线性编辑,内置智能代理侧边栏实现自动化工作流,显著提升创作效率。

🔒 本地优先设计保护隐私,免费无限层级模式吸引独立创作者和小型团队。

🌍 支持广泛应用场景,从短视频到专业制作,提供从创意到上线的全链条支持。

14、智源研究院推出Emu3等‘悟界’系列大模型

在第七届‘北京智源大会’上,智源研究院发布了‘悟界’系列大模型,包括Emu3、见微 Brainμ、RoboOS2.0、RoboBrain2.0和OpenComplex2,涵盖多模态智能技术,推动人工智能应用落地。

【AiBase提要:】

🚀 Emu3作为原生多模态世界模型,整合视觉、听觉和触觉数据,提升机器对世界的理解能力。

🧠 见微 Brainμ结合神经科学成果,为机器智能发展提供生物学支持。

🤖 RoboOS2.0和RoboBrain2.0推动具身智能协作框架,加速机器人技术进步。

15. Luma Labs 发布 Modify Video:AI 视频后期一键改风格、换场景

Luma Labs 推出 Modify Video 工具,利用 AI 技术简化视频后期制作,实现风格重塑、场景替换等功能。

【AiBase 提要:】

🌟 风格重塑:通过文本改变视频艺术风格。

🌍 场景替换:将背景换为新的场景,增强视觉效果。

🎭 角色编辑:调整人物外观和表演,无需重新拍摄。

举报

  • 相关推荐
  • 2026年GEO优化服务商推荐:针对跨境场景与多语言痛点深度评测

    本文对2026年生成式AI优化(GEO)服务市场进行了评估。核心结论是,服务商已基于行业特性与技术专长呈现分化趋势。入选的五家头部服务商各具优势:大树科技深耕工业制造领域,构建垂直知识图谱;香榭莱茵科技擅长跨语言与跨文化场景优化,助力品牌出海;莱茵优品聚焦消费零售,提升品牌在生活化AI交互中的渗透率;号速通科技强调对海量数据与多平台算法的快速响应与适配能力;添伯益则专注于法律、金融等高知识密度行业,确保回应的专业性与准确性。企业选型应优先考量服务商技术穿透力与自身业务场景的匹配度。

  • Meta调整薪酬结构:为聚焦人工智能 员工股权激励缩水5%

    为给巨额人工智能投入腾出资金,Meta正推进新一轮成本控制措施,包括将数万名员工的股权激励缩减5%。这是该公司连续第二年削减员工薪酬。去年已削减股票期权分配约10%,此次再下调5%。扎克伯格正加大AI领域投入,希望与OpenAI、谷歌等对手竞逐前沿模型开发,同时安抚尚未看到AI投资回报的投资者。他还在其他业务领域持续裁员,今年1月就在持续亏损的元宇宙部门裁减约1500个岗位。不过知情人士透露,尽管股权激励普遍下调,Meta今年仍在改革绩效考核体系,为业绩优异者提供更丰厚奖励。这意味着公司整体薪酬预算并未下降,而是进行了结构性调整。一名员工表示,考虑到当前科技行业就业市场不景气,而Meta薪酬水平仍然具备竞争力,员工大概率不会因这一变化而选择离职。

  • AI日报:MiniMax公布上市后首份财报;千问开源Qwen3.5小型模型系列;Claude Code官方语音模式上线

    本期AI日报涵盖多项重要动态:MiniMax发布上市后首份财报,展示其AI平台战略进展;阿里通义千问开源Qwen3.5小型模型系列,支持多模态处理,适用于边缘设备;Google NotebookLM上线信息图自定义样式功能,简化知识可视化流程;Claude Code推出语音模式,提升编程协作效率;疑似GPT-5.4细节泄露,或具备超长上下文和状态化能力;Zopia实现多智能体协作自动化视频制作;QM发布2025年AI应用榜,豆包、DeepSeek、元宝等位列前五;DeepSeek V4 Lite凭借2000亿参数展现顶尖性能,成为国产模型新标杆。整体显示AI技术正快速向多模态、轻量化、场景化方向演进。

  • AI日报:谷歌发布Gemini3.1Pro;Claude Code远程控制功能上线;Qwen3.5开源家族新增多款模型

    本期AI日报汇总了人工智能领域的最新动态。谷歌发布Gemini 3.1 Pro,推理能力显著提升,多项基准测试超越GPT-4o。Anthropic为Claude Code推出“远程控制”功能,实现移动设备无缝管理电脑编码任务。OpenAI发布深度融合推理能力的编程模型GPT-5.3-Codex。通义千问Qwen3.5开源家族新增多款模型并上线托管服务。Meta开源GPU集群监控工具GCM,精准定位硬件故障。Anthropic发布企业级插件,将Claude深度集成至Office全家桶。谷歌AI虚拟形象支持24种语言,提升跨语言沟通效率。阿里云Coding Plan推出低价订阅服务,降低开发者使用成本。

  • 阿里千问上线全新一代大模型Qwen3.5-Plus

    据千问微信号消息,阿里正式发布全新一代大模型千问Qwen3.5-Plus。用户可通过千问APP及PC端切换模型进行体验。基于强大的多模态与推理能力,千问3.5还能自主操作手机与电脑,显著提升跨应用任务处理与自动化流程执行的效率。

  • 阿里除夕夜甩出王炸!千问Qwen3.5重磅发布 登顶全球最强开源模型

    没有预热、没有铺垫,阿里巴巴在除夕夜甩出王炸”。据阿里云”公众号介绍,今日,阿里巴巴开源全新一代大模型千问Qwen3.5-Plus,登顶全球最强开源模型。千问3.5还实现了视觉理解与代码能力的原生融合,结合图搜和生图工具,可将手绘界面草图直接转为可用的前端代码,一张截图就能定位并修复UI问题,让视觉编程真正成为生产力工具。

  • 4.9元果蔬汁起名爱情的味道 商家回应:味道无法用语言形容

    花4.9元就能买到爱情的味道”? 近日,电商平台一款名为爱情的味道”的气泡果蔬汁在社交媒体引发热议,不少网友好奇:这到底是什么味道。 在平台搜索发现,这款气泡果蔬汁每瓶定价4.9元。 其配料包括水、浓缩苹果汁、梅子汁、苦瓜原浆、柠檬原汁、火龙果浓缩浆、老姜浓缩液、柠檬浓缩汁、食用盐等。

  • 定义AI时代的品牌语言:“八大黄金维度”比谷歌EEAT更适配GEO未来

    文章探讨了在生成式搜索兴起的背景下,品牌营销评估体系的重构。重点对比了谷歌的EEAT框架(经验、专业、权威、可信)与聚界智能提出的“面向AI权威信源的八大黄金维度”。后者专为AI时代设计,包含真实性、科普性、结构性、权威性、热点性、多模态、时效性、一致性八个维度。文章指出,八大维度不仅定义了优质内容,更提供了让AI理解并信任品牌的系统方法,强调从被动评估转向主动构建,从单点优化转向系统协同,更契合企业品牌传播的本质需求,是定义AI时代品牌语言的关键。

  • 阿里已批准林俊旸离职 将成立基础模型支持小组

    今天上午,阿里巴巴内部流传出一封CEO吴泳铭的邮件,该邮件针对林俊旸离职一事作出回应。 3月4日(周三)凌晨,阿里Qwen(千问)团队技术负责人林俊旸在社交媒体上发布状态“me stepping down.bye my beloved qwen.”(我辞职了,再见了我爱的Qwen),这一动态引发了内部关注。

  • 百惠金控:金融创科迎新局 港股人工智能IPO受热捧

    接近农历,港股市场交易气氛依然炽热。百惠金控观察到,科创板块已成为带动大市上行的核心引擎,尤其是人工智能(AI)相关股份持续受资金青睐,板块热度持续攀升。香港特区政府财政司司长近日表示,香港作为国际金融中心,将凭借“金融联动创科”的效应乘势而上,进一步放大香港的制度优势。市场对科创板块的积极情绪,在年初新股表现中得以充分印证。2026年1月2

今日大家都在搜的词: