首页 > 业界 > 关键词  > 大模型最新资讯  > 正文

国内首个音视频多媒体大模型万兴“天幕”发布:支持AI剪辑

2024-01-30 17:43 · 稿源: 快科技

**万兴发布国内领先音视频大模型**

万兴科技近期发布了国内首屈一指的音视频多媒体大模型“天幕”,并宣布其研发中心将落户马栏山。

“天幕”专注于数字创意创作,依托音视频生成式人工智能技术,支持多种语言,提供一站式音视频创作解决方案。其能力已在全球广泛应用。

万兴科技利用“天幕”大模型的数字人、文字视频剪辑等能力,迅速推出Wondershare Virbo等人工智能创意产品,完善其产品矩阵。

万兴科技董事长吴太兵指出,大模型已迈入2.0时代,特征是垂直解决方案、本土化算力和数据。万兴“天幕”将打造基于大模型架构的人工智能生成内容(AIGC)应用基础,全方位赋能全球创作者。

此外,万兴科技表示,其大模型训练使用的是国内算力和服务器,并未涉及境外云服务。

举报

  • 相关推荐
  • 京东自研AI毛绒玩具上架:支持情绪感知 搭载JoyAI大模型

    京东近日推出首款自研AI毛绒玩具,主打无屏幕实体交互,旨在减少儿童对电子屏幕的依赖。该玩具基于京东JoyAI大模型技术,具备讲故事、知识问答和互动沟通功能,内置280本有声书资源,并能识别儿童情绪变化。此次共推出13款AI产品,覆盖多个品类,其中AI毛绒玩具系列凭借个性化设计受到市场欢迎,部分款式迅速售罄。

  • 拒绝做“套金属壳”的伪AI:看“大模型国家队”如何啃下硬骨头

    人工智能成为资本市场热点,随之而来的是鱼龙混杂的乱象。简单包装、打着AI旗号卖高价的“套壳”现象层出不穷。科大讯飞董事长刘庆峰强调,发展人工智能要有长期主义精神,告别“虚火”,把根扎在国产算力的土壤里。下半场比拼的不再是概念堆砌,而是全栈自主可控的硬实力与赋能千行百业的真本事。可靠与安全才是基石,算力是最大瓶颈。企业需构建安全底座并解决真实痛点,才能穿越周期。科大讯飞坚持“顶天立地”战略,既要在源头技术上领先,又要在产业应用上解决民生刚需,展示了AI技术“落地”的正确姿态。

  • AI不再健忘!红熊AI发布“记忆熊”,给大模型装上“海马体”

    当前大模型虽能力惊人,却普遍存在“记忆缺失”问题,制约了AI应用的深度与用户体验。红熊AI推出的开源记忆系统“记忆熊”,旨在突破这一瓶颈。它基于认知科学原理,构建了包含存储层、编排层和应用层的三层架构,模拟人类记忆的感知、提炼、关联与遗忘全周期,为智能体提供长期记忆框架。该系统不仅显著提升了任务性能与效率,降低了幻觉生成,更标志着AI设计从“即时响应”向“持续认知”的关键转变。记忆系统的完善,将驱动AI在医疗、教育、企业服务等领域实现更深度的智能化升级,开启人机协作的新时代。

  • AI日报:可灵AI全量上线O1视频大模型;千问APP接入万相Wan2.5

    本文汇总了AI领域的最新动态:可灵AI发布O1视频大模型,支持多模态输入一键生成视频;千问APP接入万相Wan2.5,提升视频创作能力;PixVerse V5.5实现音画同步,简化视频制作;深度求索推出DeepSeek-V3.2,引入稀疏注意力机制降低成本;Runway发布Gen-4.5模型,增强视觉质量;谷歌优化AI搜索体验,Gemini 3 Pro扩展国际市场;Lovart推出Touch Edit功能,实现零门槛图像编辑;蚂蚁数科Agentar入选中国智能体开发赛道第一梯队,展现技术实力。

  • 可灵AI O1正式上线:号称全球首个统一多模态视频大模型

    可灵AI正式发布全新O1视频大模型,被誉为全球首个统一多模态视频大模型。该模型基于创新的多模态视觉语言交互架构,用户可在单一输入框内无缝融合文字、图像、视频等多种指令,实现跨模态内容的高效创作。其技术突破解决了传统视频生成工具功能割裂、操作复杂的痛点,并攻克了视频中主体特征漂移的行业难题,支持长达310秒的自由生成时长。目前用户可通过可灵App及官网体验。

  • 易鑫开源汽车金融业首个Agentic大模型,加速AI生态共建

    易鑫集团(02858.HK)宣布开源其自主研发的Agentic大模型YiXin-Agentic-Qwen3-14B,成为汽车金融行业首个开源此类模型的企业。该模型基于通义千问Qwen3-14B深度优化,具备卓越推理、复杂任务处理及多方协作的智能体能力,在多项性能测试中位列榜首,推理成本较行业平均水平降低三分之一。模型搭载金融领域专属知识体系与工具集,覆盖语音交互、车辆评估、风控、欺诈识别等功能,形成全链路智能支撑体系。易鑫提出“底座开放-社区共建-能力迭代-企业部署-生态繁荣”的开源共建模式,通过提供低代码私有化模板,帮助企业快速落地AI应用。此次开源与之前发布的行业首个开源推理大模型YiXin-Distill-Qwen-72B形成“垂直底座+Agentic大脑”双轮技术矩阵,填补了汽车金融领域专业开源AI工具链的空白。

  • 行业首家!易鑫正式开源Agentic大模型,定义汽车金融AI新范式

    易鑫宣布开源自主Agentic大模型YiXin-Agentic-Qwen3-14B,成为汽车金融行业首个开源此类模型的企业。该模型基于Qwen3-14B,参数规模140亿,通过多阶段训练体系深度优化,在智能体协作、函数调用、推理等能力上可比肩参数200B以上的商用大模型。多项专业评测显示,其在金融专业知识理解方面显著优于DeepSeek V3.1、Kimi-K2等主流模型,并在智能体工具使用任务中同样表现卓越,位居同尺寸模型性能测试首位。该模型既展现出强劲的专业理解力与协作推理能力,又兼具高实用性与经济效益,将为汽车金融及各类专业场景提供高效、可靠的智能引擎。易鑫以技术创新为核心驱动力,持续引领行业迈向智能化转型。

  • 大模型推理部署新路径!趋境科技 KTransformers+SGLang,单卡消费级硬件攻克万亿模型难题

    11月6日,月之暗面发布Kimi-K2-Thinking模型,其落地使大模型推理部署的硬件门槛问题再成焦点。趋境科技与清华大学开源的高性能异质推理框架KTransformers第一时间完成适配,支持单卡环境流畅推理,并与主流框架SGLang深度合作,打破依赖昂贵多卡GPU的固有认知,为大模型落地提供高性价比、易操作的全新路径。该框架已入选SOSP2025顶尖技术成果,技术实力获国际认可,目前已被Qwen、Kimi等头部开源模型推荐为推理引擎,加速大模型产业级落地进程。

  • 逗哥配音ai软件|创新升级:自研大模型引领声音创作新浪潮

    在短视频蓬勃发展的当下,AI配音软件“逗哥配音”凭借自主研发的大模型技术引发关注。该软件拥有近千种风格的发声人资源,覆盖多语言及方言,通过精准的节奏控制和情感表达优化,显著降低高质量音频制作门槛。其创新的声音克隆技术仅需少量数据即可生成高度相似的人工语音,结合人声分离、文案提取等实用工具,为创作者提供跨领域音频解决方案,推动数字内容生态向多元化、个性化发展。

  • 通用医学影像大模型iMedImage赋能临床多场景应用

    第五届全国医院智能化建设大会将于2025年11月在成都召开,聚焦智慧护理、智能数据中心等方向。德适生物协办的医学影像AI分论坛上,宋宁教授发布通用医学影像大模型iMedImage™,实现从图像到决策的一体化闭环,覆盖筛查—诊断—治疗全周期管理。其应用案例显示:染色体核型分析系统准确率达99.86%,宫颈超声早产风险评估等前沿领域成效显著。模型可扩展至26个专科、4000种疾病场景,助力精准诊疗。国家政策提出2030年二级以上医院普及影像AI辅助诊断,德适生物将持续推动多模态数据融合与临床创新。

今日大家都在搜的词: