首页 > AI头条  > 正文

Vidu Q1 系列 API 正式开放 同时上线文生音频模型

2025-05-10 09:58 · 来源: AIbase基地

近日, Vidu Q1系列 API 已正式面向全球开放。开发者与企业用户可借此契机,通过调用 API 体验 Vidu Q1模型所具备的多样化功能。

此次开放的 Vidu Q1系列模型在视频生成能力上实现了显著升级。在图生视频方面,它能够依据用户提供的图像,快速生成与之相关且富有创意的视频内容,为图像赋予动态生命力;首尾帧功能则让用户可以精准控制视频的起始与结束画面,使视频呈现更加符合预期的叙事节奏;文生视频能力更是强大,用户只需输入文字描述,模型就能将抽象的文字转化为生动形象的视频,为创意表达提供了全新的途径。

微信截图_20250510095720.png

在画质、镜头与风格表现上,Vidu Q1系列模型也有着出色的表现。它支持更高清的画质输出,让视频中的每一个细节都清晰可见;镜头运用更加流畅自然,无论是推、拉、摇、移还是跟镜头,都能实现平滑过渡,增强了视频的观赏性;风格稳定性也得到了提升,能够始终保持用户所期望的风格特色,确保视频整体风格的一致性。

值得一提的是,除了视频生成能力,Vidu AI 此次还上线了文生音频模型。这一功能为用户带来了更多的创作可能性,支持时段自定义,用户可以根据视频的具体需求,在特定时间段生成对应的音频内容;音效叠加功能则进一步丰富了音频的表现力,用户能够轻松将多种音效进行组合,营造出更加逼真的听觉效果。

Vidu AI 表示,欢迎全球开发者与企业用户接入 Vidu Q1系列 API,共同探索创意表达的新边界。用户可通过访问 https://platform.vidu.cn/ ,立即开启这场创意之旅。

  • 相关推荐
  • 微软上线GPT-image-1模型 通过API向开发者开放使用

    OpenAI于4月24日发布全新图像生成模型GPT-image-1,通过API向全球开发者开放。该模型支持生成高质量图像,具备多级定制功能,包括控制敏感度、生成效率、背景、输出格式等参数,并推出"吉卜力模式"生成独特风格图像。Adobe、Figma等多家企业已将其集成到产品中。API定价按token计算,低质量图像生成成本约0.02美元/张。OpenAI CEO Sam Altman高度评价该模型,认为其为开发者带来更大创意空间。

  • 海尔智家Q1超预期,企业做的多,用户给的多

    海尔智家2025年Q1业绩超预期,营收791.2亿元同比增长10%,归母净利润54.9亿元增长15%。其成功源于全球化战略与用户思维:1)本土化创新满足全球差异化需求,如欧洲节能洗衣机、东南亚省电空调、中东耐高温空调;2)AI技术重构家电价值,推出三筒分区洗衣机、智能家电生态平台等创新产品。通过"本土化创新+场景化生态"双轮驱动,海尔在北美高端市场增长超10%,南亚/东南亚/中东非市场分别增长30%/20%/50%。IDC预测2030年全球AI家电市场规模将突破5000亿美元,海尔凭借技术储备与产能布局已抢占先机。

  • 超预期!海尔智家Q1营收增10%、利润增15%

    海尔智家2025年一季度业绩亮眼:营收791.2亿元同比增长10%,归母净利润54.9亿元增长15%。卡萨帝品牌收入增长超20%,冰箱、洗衣机等核心品类市场份额持续提升。公司加速AI技术应用,推出全球首套搭载"AI之眼"的艺术家电系列,并通过三翼鸟场景方案推进智慧生活落地。海外市场表现稳健,整体收入增长13%,北美高端品牌收入增长超10%,东南亚、南亚等新兴市场增速达20%-50%。数字化成效显著,销售费用率优化0.1个百分点,用户满意度提升25%。

  • 618必买高画质投影来了 Vidda C3系列开启首销超多惊喜!

    5月8日,Vidda正式推出C3系列4K三色激光投影新品。该系列搭载新一代激光器、光学变焦和MT9681芯片,全线支持杜比视界。其中C3 Ultra和C3 Pro实现行业最宽1.67倍光学变焦,重新定义专业家庭影院标准。C3 Ultra采用全球首发的MCL 39激光器,实测亮度达3200CVIA,配备2×10W JBL定制音响和20W低音炮。全系列支持HDR亮度映射、杜比视界和IMAX认证,色彩表现超越传统LED投影。硬件方面搭载MT9681旗舰芯片,C3 Ultra配备8GB+128GB内存,支持千兆网口和HDMI 2.1接口。AI方面引入DeepSeek深度思考智能体,支持18大AI功能。首发价格从6399元至11999元不等,即日起开启预售。

  • 打造健康社交环境:Soul Q1 生态报告彰显平台责任与成效

    Soul App发布2025年第一季度生态安全报告,展示平台在反诈治理、未成年人保护、内容生态建设等方面的显著成效。平台通过AI技术构建智能反诈系统,诈骗风险下降20%;升级青少年保护机制,新增51条策略,假成年人识别率达99%;处理违规账号超19万个,拦截低质内容日均超10万条。报告显示,Soul持续优化社交礼仪体系,日均引导文明发言23.8万次,签署友善互动声明的用户超21万。平台还通过更新《社区公约》、强化警企联动、开展专项治理等举措,构建起技术防控与用户共治相结合的多维生态安全体系,致力于打造清朗网络空间。

  • 卡萨帝厨电Q1收入增31%,行业最快!Q2搭载AI之眼产品全面上市

    海尔智家2025年一季度财报显示,公司实现营收791.2亿元(同比+10%),归母净利润54.9亿元(同比+15%)。其中卡萨帝厨电收入增长31%,增速领跑行业。这得益于其"让家电主动理解用户"的创新理念,通过AI之眼科技实现智能烹饪:自动识别食材、匹配最佳烹饪方案,解决传统烹饪需时刻盯火候的痛点。该技术还能智能防溢锅,自动调节火力。卡萨帝同步推出三翼鸟厨房改造服务,最快3小时完成定制化方案。未来将持续深耕高端智能厨电领域,引领智慧厨房新潮流。

  • Vidda发布年度重磅新品 贴贴壁纸电视+C3系列三色激光投影

    5月8日,Vidda发布两款重磅新品:贴贴壁纸电视和C3系列三色激光投影。贴贴壁纸电视采用29.9mm超薄设计,配备独家极黑低反屏,支持300Hz疾速高刷,提供65-100英寸多尺寸选择,100英寸款拥有2640分区背光,售价5499元起。C3系列投影全系升级新一代激光引擎,其中C3 Ultra和C3 Pro实现行业最宽1.67倍光学变焦,亮度达3200CVIA流明,支持杜比视界,售价6399元起。两款产品均搭载DeepSeek智能系统,具备AI创作功能。Vidda同时预告即将推出20万元内最强家用投影C5无界,双11前限量预售。

  • AI日报:阿里通义千问Qwen3问鼎全球开源模型;Kimi长思考模型API发布;OpenAI发布新一代GPT-4.1模型

    【AI日报】汇总了近期AI领域重要动态:1)阿里通义千问3开源模型上线7天即登顶全球开源模型榜首,在指令遵循和推理能力上超越闭源模型;2)月之暗面推出Kimi长思考模型API,可解决复杂代码和数学问题;3)OpenAI发布GPT-4.1模型,性能提升显著;4)Google推出Gemini2.5Pro模型,提升开发者编码能力;5)联想发布"天禧超级智能体",具备多模态感知能力;6)腾讯元宝上线"对话分

  • AI日报:Kimi全新音频基础模型Kimi-Audio;阶跃星辰开源图像编辑模型Step1X-Edit;​夸克AI超级框上线 “拍照问夸克”

    本期AI日报聚焦多项AI技术突破与应用:1)Moonshot AI推出开源音频模型Kimi-Audio,基于13亿小时训练数据,支持语音识别等任务;2)阶跃星辰开源图像编辑模型Step1X-Edit,展现强大生成能力;3)夸克AI上线"拍照问夸克"功能,实现视觉问答;4)苹果iOS18.5将在中国推送,带来智能功能;5)谷歌发布601个生成式AI应用案例,覆盖多行业;6)微软推出深度整合Windows的UFO²自动化系统;7)OpenAI升级ChatGPT至GPT-4o版本,提升STEM领域能力;8)Ema公司推出高性价比语言模型EmaFusion;9)Liquid AI发布面向边缘设备的Hyena Edge模型;10)LemonAI推出实时音视频数字人产品Slice Live。此外,国内方面,智谱与生数科技达成战略合作推动大模型发展,宝马中国宣布新车将接入DeepSeek技术。

  • 基于公共API网关的WEEX机器人部署指南

    WEEX是一家成立于2018年的中心化交易所(CEX),凭借其信誉和稳定的用户活跃度吸引了众多散户交易者。2024年10月日均交易量接近24亿美元,提供多样化的衍生品交易和网格交易(GRID)等稳定盈利策略。虽然WEEX在2024年4月才推出公共API网关,但已朝着自动化交易迈出重要一步。文章介绍了三种适用于WEEX的AI交易机器人供应商:CryptoHopper的自动调整仓位网格机器人、GunBot的内置LLM代码生成功能,以及WunderTrading的高效套利机器人。此外还推荐了HummingBot等开源工具和3Commas等优秀供应商,帮助投资者实现自动化交易。WEEX的优势在于信誉良好、深度现货市场和低廉费率,但缺乏灵活的自动化工具是其显著缺点。

今日大家都在搜的词: