首页 > 业界 > 关键词  > 百度搜索最新资讯  > 正文

百度升级文心助手AIGC创作能力:支持8种模态 一键调用多工具

2025-10-15 21:36 · 稿源: 快科技

快科技10月15日消息,据媒体报道,百度搜索近日宣布对文心助手进行全面升级,显著增强其AIGC多模态创作与智能任务解决能力。

目前,该平台已支持AI图片、视频、音乐、播客等8种内容形态的生成,并支持用户一键调用多种工具,应对生活、健康、教育、工作等多场景需求。

数据显示,百度搜索用户通过文心助手日均生成的AIGC内容量已突破千万。与此同时,百度还发布了行业首个开放式实时互动数字人智能体,具备高逼真形象、低延时交互与情感识别能力,可提供专业内容与服务陪伴。

在内容创作方面,文心助手实现了从短内容到长视频的全链路覆盖。用户输入一段话,即可生成一部3分钟的剧情短片,AI自动完成情节设计、角色塑造、场景搭建、镜头调度及配乐全过程。

此外,助手还集成一句话写歌”MV制作”名场面模仿秀”等创意功能,并提供超过30种特效模板。未来还将上线音乐数字人分身,进一步拓展创作边界。

在视频生成技术上,百度自研模型蒸汽机”(文心专精)实现重大突破,率先在行业内支持AI长视频的实时交互生成。该模型基于流式视频技术,突破传统AI视频10秒左右的时长限制,实现无限时长”生成,速度也领先于国内主流同类模型。

用户只需上传一张图片并输入提示词,即可启动生成流程,实时预览推理画面,并可在任意节点暂停或修改提示词,实现对剧情、画面与转场的全程干预。这一能力标志着AI视频从单向生成”迈入双向共创”阶段,打造出真正意义上的无限画布”式创作体验。

本次升级还同步推出了可交互数字人与开放世界动态构建两大功能。数字人支持双向沉浸互动,适用于AI导购、教育、陪伴等场景;开放世界则允许用户在AI生成的地图、景点甚至宇宙空间中自由探索,进一步拓展AIGC在虚实融合场景中的落地可能性。

举报

  • 相关推荐
  • AI日报:美团LongCat-Flash-Omni发布;Qwen3-Max上线深度思考功能;百度“文心”5.0重磅回归

    本期AI日报聚焦多领域技术突破:美团发布全模态交互模型LongCat-Flash-Omni;阿里通义千问Qwen3-Max上线深度思考功能;百度文心5.0升级多模态生成能力;谷歌确认Gemini3年内发布并整合至苹果Siri;OpenAI向多国开放Sora2视频工具;云存储与AI开发工具持续优化,展现行业加速迭代态势。

  • Sora App的AI视频社交,给了百度们新希望

    Sora2发布两周后,百度的蒸汽机AI视频模型,和谷歌Veo3.1撞了档期。 两家公司选择同期发布并非有多默契,而是Sora2带来的压迫感促使它们不得不加快脚步。 奥尔特曼将形容Sora2为“创意领域的ChatGPT3.5时刻”,不仅在物理逻辑、画面连贯性、真实感和音画同步等方面实现了质的飞跃,还把Sora从一个“文本到视频”的工具进化成一个“创意到生态”的平台。 这无疑是扔在AI视�

  • 百度旗下小度AI眼镜Pro正式开售:售价2299元

    站长之家(ChinaZ.com)11月10日 消息:今日,百度旗下备受瞩目的小度 AI 眼镜 Pro 正式开启发售,售价定为2299元,这一消息迅速吸引了众多科技爱好者和消费者的目光。在外观设计上,小度 AI 眼镜 Pro 提供了波士顿和猫眼两种时尚款式,满足了不同消费者的审美需求。镜片方面,用户既可以选择墨镜款式,也能挑选光致变色镜片,而且支持直接配近视镜片,无需采用夹片设计,为

  • AI日报:月之暗面开源AI新框架Kosong;百度发布新模型ERNIE-4.5-VL;GPT-5.1“隐身”登场

    本期AI日报聚焦多项技术突破:月之暗面开源AI代理框架Kosong,支持异步编排与插件化设计;Replit推出AI集成功能,可一键调用300+模型;商汤发布空间智能模型SenseNova-SI,性能超越GPT-5;百度推出多模态模型ERNIE-4.5-VL,新增图像思考能力;谷歌地图全面AI化,集成Gemini实现智能交互;ChatTutor上线可视化教学系统,覆盖多学科实时推演;新版Google Finance引入AI深度搜索与财报追踪;OpenAI低调上线Polaris Alpha模型,支持256K上下文并更新知识库至2024年10月。

  • AI日报:广电整治AI动画乱象;360发布大模型安全白皮书;百度推出小度AI眼镜Pro

    国家广电总局宣布自2026年3月起全面整治AI生成内容,要求AIGC作品纳入分类分层审核体系。360发布《大模型安全白皮书》,提出全链路AI安全防线应对新型威胁。百度推出2299元小度AI眼镜Pro,集成智能翻译等多项功能。StepFun开源音频编辑模型Step-Audio-EditX,实现文本化语音编辑。Grok新增纯文本生成视频功能,17秒可生成带特效视频片段。研究发现谷歌Veo-3模型能生成逼真手术视频但缺乏医学逻辑。阿里Qwen3-Max-Thinking在全球数学竞赛夺冠,并在加密货币交易中取得显著回报。OpenAI推出轻量化GPT-5 Codex Mini模型,优化开发者体验。

  • 百度智能云联合昆仑芯、HAMi,落地双模式算力调度方案,提升算力利用率

    百度智能云联合昆仑芯与CNCF开源项目HAMi,推出基于昆仑芯P800的XPU/vXPU双模式算力调度方案。该方案已在金融客户集群落地,支持智能客服、营销辅助等十余类AI业务,兼顾稳定性与灵活性。XPU整卡模式通过拓扑寻优调度保障大规模训练性能,vXPU虚拟化模式以多粒度切分实现单卡多任务,最大化资源利用率。双模式协同让国产算力高效匹配业务需求,同时提供自动化调度与人工调节结合的灵活管理能力。

  • 免费神器!一键检测你的内容在AI搜索中的可见度,抢占品牌曝光先机

    文章指出AI搜索时代,品牌若未被ChatGPT、文心一言等主流AI模型抓取推荐,将面临流量流失、品牌曝光下降及营销成本增加的风险。为解决这一问题,推荐使用AIBase平台的免费GEO排名查询工具,可检测品牌在各大AI搜索中的可见度、排名及竞品对比,并提供优化建议,帮助提升AI曝光率,抢占流量高地。

  • 北汽元境智能正式发布 车辆升级“全域智能体”

    10月28日,北汽极狐全新阿尔法T5上市发布会举行,北汽集团正式发布“北汽元境智能”技术架构。该架构覆盖从底层到体验、从真实到仿真世界的技术体系,实现研发到量产落地,展现北汽在智能网联汽车领域的最新成果。其核心为“全域融合”,通过三大层次——舱驾融合、跨生态AI融合、真实与虚拟世界融合,打破技术边界,提升智能驾驶与座舱体验。同时推出元境智驾和元境智舱两大产品,覆盖L2至L4全阶智驾,并强调安全开发理念,累计测试超5000万公里。北汽以开放平台与伙伴合作,推动智能出行技术进化。

  • 免费 AI 可见度检测器工具推荐:监控你品牌在生成式搜索中的曝光

    AI搜索时代,58.5%的Google搜索已成"零点击",ChatGPT日查询超10亿次。品牌若未出现在AI工具推荐中,将错失新流量入口。文章提出GEO(生成引擎优化)概念,强调需监控品牌在豆包、DeepSeek等AI平台的曝光排名,并推荐AIBase工具实现数据可视化。建议企业建立监测基线,聚焦高价值问题优化内容,形成"监控-优化-验证"闭环,抢占AI推荐流量先机。

  • 国内大模型GEO优化全攻略:免费工具教你监测品牌在文心一言、通义千问等AI平台的可见度

    AI搜索时代,品牌若未出现在AI回答中就等于"不存在"。GEO(生成引擎优化)成为新战场,核心是让AI在回答用户问题时优先引用企业内容。文章详解国内主流AI模型特点:文心一言整合百度生态、通义千问依托阿里电商数据、小众模型在垂直领域更易被引用。提出三大优化策略:内容结构化呈现、建立行业权威背书、布局高权重平台。推荐使用AIBase免费工具实时监测品牌在各大AI平台的曝光情况,通过数据驱动优化策略。

今日大家都在搜的词: