AI视野：Stable Diffusion3发布；剪映海外版CapCut推文生视频；微软win10、win11照片应用增加AI橡皮擦功能；OpenAI更新GPT商店

2024-02-23 15:06 · 稿源：站长之家

欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解：https://top.aibase.com/

QQ截图20240223152418.png

🤖📱💼AI应用

Stable Diffusion3发布文字渲染能力超强，图像生成质量超越Midjourney

【AiBase提要:】
⭐️ Stable Diffusion3发布，具有强大的文字渲染、多主题提示和图像质量能力。
⭐️ 技术方面结合了扩散型transformer架构和flow matching技术。
⭐️ 公测开放的Stable Video提供文生视频和图生视频功能。
排队地址:https://top.aibase.com/tool/stable-diffusion-3

剪映海外版CapCut推文生视频功能每人每天可免费生成5个视频

【AiBase提要:】
⭐ 支持AI自动转换文字描述为视频
⭐ 多镜头组合剪辑，生成丰富视频效果
⭐ 每人每天免费生成5个视频，适用人群广泛
官方入口:https://top.aibase.com/tool/capcutwenshengshipin

微软Windows10和 Windows11的照片应用增加AI橡皮擦功能

【AiBase提要:】
⚙️ Generative Erase功能类似魔术橡皮擦，为照片编辑带来全新体验。
📷 用户可轻松进行图像中的AI移除操作，提高编辑便捷性和效果。
💡 微软通过Generative Erase持续创新图像处理，提供更丰富编辑工具和体验。

创新性3D数据合成模型，微软推出EgoGen

【AiBase提要:】
⭐ EgoGen能够适用于多个自我中心感知任务，使用创新的人体运动合成模型来合成高质量数据。
⭐ 通过双阶段强化学习方案，EgoGen无缝结合自我感知视觉线索和身体运动，实现更加自然的运动。
⭐ EgoGen在人称感知任务上取得了显著成果，提升了现有算法在头戴式摄像头建图和定位等任务中的性能。
论文地址:https://arxiv.org/abs/2401.08739
即将开源地址:https://github.com/ligengen/EgoGen

智源研究院推出新一代多模态小模型Bunny-3B

【AiBase提要:】
⭐ 通过数据浓缩技术获得高质量训练数据
⭐ 将LAION-2B压缩成2M核心集
⭐ Bunny-3B小模型在多模态任务上表现优异
项目地址:https://github.com/BAAI-DCAI/Bunny

强大代码解释器OpenCodeInterpreter 可运行生成的代码

【AiBase提要:】
⭐️ 自动创建代码段，完成编程任务
⭐️ 运行生成的代码验证预期工作
⭐️ 根据执行结果和反馈生成更优质代码
项目地址:https://top.aibase.com/tool/opencodeinterpreter
模型:
https://huggingface.co/collections/m-a-p/opencodeinterpreter-65d312f6f88da990a64da456

📰🤖📢AI新鲜事

OpenAI更新GPT商店，增加用户评分和扩展构建者资料

【AiBase提要:】
⭐ 用户现在可以为第三方GPT进行评分
🤖 GPT构建者的个人资料更丰富，包括链接和评分信息
🔄 OpenAI未实现根据GPT使用频率分享收益的计划

Midjourney计划在6个月内开放API 视频功能会推迟到V7模型

【AiBase提要:】
⭐ Midjourney计划在未来六个月内开放API
⭐ V7模型将生成视频，产品即将在中国推出
⭐ Midjourney的发展前景看好，值得期待

Reddit通过与AI公司合作的数据授权收入达2.03亿美元

【AiBase提要:】
🤖 Reddit强调与AI供应商的关系，特别是与OpenAI等公司的合作对上市前景产生积极影响。
🌐 Reddit数据对AI模型培训的重要性，以及AI公司通过授权协议获取数据的焦点。
📈 Reddit通过数据授权实现巨额收入，凸显数据在AI领域的关键作用。

Chrome 获得由 Gemini 提供支持的内置 AI 写作工具

【AiBase提要:】
⭐ Chrome浏览器推出新的AI写作生成器
⭐ Gemini驱动，可帮助写各种文本内容
⭐ 实验阶段，仅在Windows、Mac、Linux提供英文版本

（举报）

相关推荐

关键词：

StableDiffusion3

颠覆Diffusion局限！Utopai双模型耦合架构，攻克AI影视长叙事核心难题

Utopai Studios推出专为影视制作设计的AI模型与工作流，区别于主流视频生成模型，其核心能力在于理解剧本、规划镜头及生成场景，通过自回归模型负责叙事规划与一致性约束，扩散模型专注高质量画面渲染。该系统能解决跨镜头元素漂移难题，提升制作效率与作品品质。目前工作流仅用于公司自有项目，强调AI作为创作者协作者的角色，并遵循行业道德与版权规范。

AI影视制作 Utopai Studios
TabTab 登顶模力工场 AI 应用榜榜首，把 AI 数据分析师装进口袋，关键结论更快抵达！

TabTab是一款全链路AI数据分析助手，核心功能包括多源数据连接（支持文档、数据库、电商平台等）、自动化采集清洗、内置分析模型及可视化呈现。其优势在于通过多智能体系统实现自然语言交互，降低分析门槛，让非技术人员也能快速完成客户洞察、销售业绩等分析，显著提升效率。产品定位中立，致力于构建多元化AI效率提升生态。

数据驱动效率提升智能体
算力无界，AI无距！超聚变发布FusionXpark™随身智能体开发平台

10月24日，超聚变公司发布FusionXpark™智能体开发平台，实现AI算力从云端下沉至桌面设备。该平台搭载GB10架构，提供1PFLOPS本地算力，支持200B参数模型推理，助力开发者在边缘端运行高参数模型。发布会展示了政务、金融、工业等五大行业的30类“超级员工”智能体应用，通过私有化部署保障数据安全。专家指出，这一创新将推动AI普惠化，重塑产业生态。

AI原生计算智能体开发平台 FusionXpark
小鹏将推出3款全球化Robotaxi 2026年同步开启试运营

小鹏汽车在2025科技日宣布，将于2026年推出三款全栈自研L4级Robotaxi，同步开启试运营。该车型搭载4颗图灵AI芯片，算力达3000TOPS，配备第二代VLA模型，具备强大泛化学习能力，能自适应全球不同交通习惯。作为中国首款全栈自研Robotaxi，无需额外改装，不依赖高精地图即可实现量产。车辆提供两套智驾方案，分别侧重通勤效率与极致安全，并在六大关键系统采用双冗余设计，确保行驶安全。小鹏还将开放Robotaxi SDK，与高德地图等伙伴共建全球服务生态。

小鹏Robotaxi L4级自动驾驶全栈自研
软件定义汽车的质量革命：AI Agent如何终结座舱OTA的“路测噩梦”

在“软件定义汽车”浪潮下，智能汽车竞争核心转向座舱体验、ADAS功能及OTA迭代质量。然而，传统软件测试模式成本高、耗时长，难以覆盖复杂场景，易导致漏洞。AI驱动的“无人测试”通过大模型与智能体技术实现三大突破：需求自主解析与测试规划、GUI自主探索与自愈维护、智能诊断与根因分析。这将催生“人机协同”新范式，测试工程师角色转向质量策略师。到2027年，超80%企业将集成AI测试工具，汽车行业2025年成为转型关键节点。

软件定义汽车智能汽车座舱体验
一图读懂FusionXpark™随身智能体开发平台

文章搜索核心标签内容检索
数据智能体 TabTabAI 正式上线，零门槛上手，让 “数据分析” 人人可用

AI数据智能体TabTabAI正式上线，以“零门槛交互+全流程自主处理”为核心优势，打破数据分析技术壁垒。该工具通过自然语言对话，支持多源数据采集、智能处理、深度洞察与可视化，让普通职场人无需编程背景即可完成复杂分析任务。其多智能体协同架构与自动化能力，覆盖从数据收集到决策建议的全链路，助力用户将原始数据高效转化为精准决策依据，真正实现“人人都是数据分析师”。

数据分析数据驱动 AI数据智能体
重磅预告：全链路自主进化 AI 数据分析师 TabTab 将于10月24日上线

灵快科技推出的AI数据分析师TabTab将于10月24日上线。该产品通过Multi-Agent系统实现全链路自动化数据分析，覆盖数据获取、建模到可视化全流程。用户可用自然语言交互，系统自主规划任务并输出可维护结果，支持Excel、PPT等多种报告格式。核心定位为智能数据分析助手，旨在降低分析门槛，助力企业高效挖掘数据价值，适用于数据分析师、营销人员等各类用户。

AI数据分析 Multi-Agent系统数据可视化
国内首个！火山引擎推出融合国家级智库理论与大规模实战验证的 Data Agent 评测体系

火山引擎推出国内首个融合国家智库理论框架与大规模实战验证的数据智能体评测体系，同步发布《2025数据智能体实践指南》。该体系直面传统评测重技术轻业务、预设答案难适配动态场景、局部能力检验不足三大痛点，确立业务关联性、可操作性与前瞻性设计原则。覆盖分析洞察、可视化呈现、鲁棒性三大核心维度，通过151道测试题量化智能体能力并划分达标/工业可用/专业研究三级标准。采用标准化闭环流程与自动化评分机制，为数字化转型深水区企业提供选型优化依据，推动产业智能化进入精准量化新阶段。

数据智能体评测体系多模态数据
畅玩《战地6》，双11电脑DIY装机配置推荐

双11期间恰逢《战地6》等热门游戏发布，是升级主机的绝佳时机。推荐一套专为FPS电竞优化的硬件组合：AMD锐龙7 9800X3D处理器凭借大缓存实现帧率爆发，技嘉B850M电竞主板配备一键超频与散热技术确保稳定输出，搭配技嘉RTX 5070魔鹰显卡支持DLSS4技术，游戏帧率最高提升6倍。三款产品性能超值，组合购买享优惠，注册后更享4年质保与免费维修服务。

游戏主机硬件推荐 FPS电竞

今日大家都在搜的词：

热文

3 天
7天

AI视野：Stable Diffusion3发布；剪映海外版CapCut推文生视频；微软win10、win11照片应用增加AI橡皮擦功能；OpenAI更新GPT商店

颠覆Diffusion局限！Utopai双模型耦合架构，攻克AI影视长叙事核心难题

TabTab 登顶模力工场 AI 应用榜榜首，把 AI 数据分析师装进口袋，关键结论更快抵达！

算力无界，AI无距！超聚变发布FusionXpark™随身智能体开发平台

小鹏将推出3款全球化Robotaxi 2026年同步开启试运营

软件定义汽车的质量革命：AI Agent如何终结座舱OTA的“路测噩梦”

一图读懂FusionXpark™随身智能体开发平台

数据智能体 TabTabAI 正式上线，零门槛上手，让 “数据分析” 人人可用

重磅预告：全链路自主进化 AI 数据分析师 TabTab 将于10月24日上线

国内首个！火山引擎推出融合国家级智库理论与大规模实战验证的 Data Agent 评测体系

畅玩《战地6》，双11电脑DIY装机配置推荐

今日大家都在搜的词：

热文

特斯拉磁悬浮Cybertruck车模上架中国官网售价999元

华为Mate 70 Air维修备件价格公布：换主板2499元

OPPO Reno15系列定档11月17日发布

鸿蒙智行：智界R7累计交付量破10万台

特斯拉Model Y L上线外放电功能最高可输出2200瓦功率

真我GT8 Pro阿斯顿马丁F1限量版正式开售售价5499元

小鹏机器人会走猫步太像人了！小鹏发布新一代人形机器人IRON

女性人形机器人里藏真人？何小鹏回应：并亲自证清白

iPhone 18 Pro或缩小灵动岛苹果正测试特殊挖孔方案

AI日报：Sora正式登陆Android；网易云音乐推AI调音大师；谷歌将

小米YU7全网首拆上热搜雷军回应：欢迎同行和专家指点

OPPO Reno15系列官宣11月10日发布

AI日报：HeyGen发布AI视频翻译引擎；科大讯飞推星火 X1.5；QQ浏

华为Mate70 Air官宣今日开启预售

AI日报：上海首例涉AI提示词著作权案宣判；Kimi K2 Thinking发

华为路由X3 Pro今日开启预售：售价1299元起

站长商机