首页 > 传媒 > 关键词  > TeleAI大模型最新资讯  > 正文

中国电信发布全自研视频生成大模型 完成全模态体系构建

2024-12-04 13:40 · 稿源: 站长之家用户

12 月 3 日,在中国电信“ 2024 数字科技生态大会”期间,首届“TeleAI 开发者大会”在广州举办。会上,TeleAI发布视频生成大模型、视觉大模型产用一体化平台、具身智能、智传网等一系列创新技术、产品及科研成果,并发布开发者产业联盟计划。中国电信总经理梁宝俊出席并致辞,CTO、首席科学家、人工智能研究院(TeleAI)院长李学龙作主旨演讲。

梁宝俊总经理表示,随着信息技术的迅猛发展,人工智能已成为新一轮科技革命和产业变革的重要力量,主要国家和地区纷纷入局竞争。党的二十届三中全会吹响了以进一步全面深化改革、开辟中国式现代化广阔前景的时代号角。人工智能作为驱动新质生产力的重要引擎,成为推进中国式现代化的先锋力量。中国电信牢记使命担当,全面深化改革,强化科技自主创新和技术攻关,率先布局人工智能战略发展,积极推进“AI+”行动。中国电信将携中电信人工智能公司和TeleAI研究院,持续突破人工智能的技术攻关、持续为各类客户提供更加智能的产品方案、持续向开发者提供更优的生态环境和研发平台。

头个央企全自研视频生成大模型

本次发布的视频生成大模型创新地打造了“VAST(Video As Storyboard from Text)二阶段视频生成技术”,通过文本描述准确勾勒出包含视频构图、主体目标位置及人物姿态等关键信息的“故事板”(Storyboard),进而生成对应的视频内容。

得益于 VAST 的创新能力,视频生成大模型可以保证单个或多个主体人物在各视频片段中的外观一致性,实现对复杂动作和交互式动作的比较准确控制,并让角色和目标物体的运动符合物理规律。基于此,通过语义、语音、文生图、文生视频等全栈大模型能力打通短剧及影视制作的各个环节,覆盖文字脚本撰写、分镜脚本绘制、视频拍摄及剪辑、配音及音效合成等全流程,实现降本增效。目前,TeleAI 视频生成大模型在保障视频生成评测榜单VBench中排名首先。

基于知识的视图万物布控视觉大模型

视觉大模型现已升级至TeleSearch 2.0-基于知识的视图万物布控,实现动态知识挂载和行业事件认知,并驱动复杂逻辑理解。TeleSearch 2. 0 目标打破模态间的信息孤岛,支持上百个专业知识文档挂载,在理解文档内容的基础上,可根据复杂长语句准确检索图片和视频,从而完成跨模态复杂语义准确理解及超万种目标准确检索。它实现了对传统检索类目的指数级提升,以及对十亿级目标检索的秒级响应。

依托TeleSearch 2.0,中国电信构建了视觉大模型产用一体化平台,通过算法冷启动回流数据,摆脱了传统模型对大量数据的依赖,实现 0 训练数据直接推理,显著降低算法应用的准入门槛。同时,平台还支持小样本训练,仅需 100 个样本数据就能训练出高精度模型,实现模型生产的全自动化过程。目前,该平台已成功应用于多省应急项目,沉淀了 20 余个应急全流程感知场景,提升对灾害研判与应急响应的核心能力。

随着本次视频生成大模型和视觉大模型的发布,星辰大模型系列进一步完成了其全模态能力的构建。

首届 TeleAI 开发者大会,共建 AI开发新生态

李学龙院长以“当梦想照进现实”为题进行分享,并发布星海AI中台、天翼AI开放平台、星辰智能体平台等开放平台,助力开发者大幅降低开发门槛,构建低成本、有效率的创新开发生态。同时,介绍了 TeleAI 在大模型全模态、全尺寸、全国产化体系构建的比较新进展,及让智能可以像水一样流动到任何地方的智传网技术前瞻布局。

大会期间,TeleAI 还宣布与华为、中兴、亚信科技等在内的 19 家合作伙伴发布中国电信人工智能开发者产业联盟计划,旨在聚合各方力量,加快推动人工智能产业发展,提升技术能力与应用水平,并为全球开发者赋能。

此外,在本次数字科技生态大会的线下展台,TeleAI 还展示了一系列在具身智能方向的创新成果,包括可以用于生活服务的人形机器人、面向商场及展会场景的星小辰服务机器人、为视障人士提供导盲服务的智能机器狗,及整合了一系列大模型能力的AI智能眼镜。展出了星辰软件工厂、星辰慧记、星辰智能体产品、中国电信家庭小管家、星辰大模型一体机等一系列智能产品,让现场观众真实感受未来以来,AI 就在每个人的身边。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 云天畅想荣获中国电信天翼云「云端领航者奖」

    5月29日,天翼云与云畅想在广州联合举办"云智共享·'翼'展未来"供应链协同合作交流会。作为央企云国家队,天翼云凭借自主可控技术架构和全国覆盖的基础设施网络,与云畅想在技术赋能产业理念上高度契合。双方将在云游戏、云电竞、AI等新兴领域深化合作,共同投入研发资源打造智能化解决方案,构建开放共享的供应链生态体系,为数字经济发展注入新动能。此次合作突破传统云服务模式,实现优势互补与价值升级。

  • 对标Sora!谷歌发布AI视频生成器Veo 3:可同时生成视频和音效

    谷歌在I/O开发者大会上发布第三代视频生成模型Veo+3,对标OpenAI的Sora。该模型不仅能基于文本和图像生成高质量视频,还能为人物对话、鸟鸣等场景自动匹配音效,实现更逼真的视听体验。目前Veo+3面向美国Gemini Ultra订阅用户,月费249.99美元,并将纳入企业级Vertex AI平台。谷歌同期还发布了升级版图像模型Imagen 4、电影制作工具Flow等AI产品。值得注意的是,谷歌在AI图像生成领域并非一帆风顺,此前Imagen 3曾因生成含历史错误的图像引发争议。

  • 必应引入OpenAI的Sora视频生成器,完全免费使用

    微软表示:“Bing 视频生成器体现了我们让 AI 视频创作变得全民可及的努力。我们相信,创造力应当轻松且人人可用,从而助力你的探索与表达。”

  • 多模态2025:技术路线“神仙打架”,视频生成冲上云霄

    一场大会,聚集了中国多模态大模型的“半壁江山”。 智源大会2025为期两天的论坛中,汇集了学界、创业公司和大厂等三方的热门选手,关于多模态的集中讨论达到了前所未有的热度。其中,创业公司就有爱诗科技、生数科技、Sand.ai、智象未来、Luma AI、智谱等六家公司创始人、CEO分享心得;隶属大厂队的字节、腾讯、百度的多模态技术负责人,以及学术界的人大和MIT(麻省�

  • 豆包大模型1.6发布:全球第一梯队!可生成1080p高品质视频

    字节跳动旗下豆包大模型正式升级为1.6版,在推理、数学、指令遵循、Agent等方面的能力均有较大提升,同时豆包视频生成模型Seedance 1.0 pro、豆包语音播客模型也正式发布。 豆包大模型1.6包括三部分,分别是豆包1.6、豆包1.6-thinking、豆包1.6-flash。 其中,豆包1.6支持on/off/auto三种思考模式,豆包1.6-thinking强化了思考能力,支持多模态,在多个权威测评集上达到了全球第一梯队�

  • AI日报:QQ浏览器升级为AI浏览器;OpenAI全新编程智能体Codex;B站团队推动漫视频生成模型AniSora

    本文介绍了AI领域多项最新进展:1)B站团队推出开源动漫视频生成模型AniSora,支持多种风格创作;2)OpenAI发布编程智能体Codex,提升开发效率;3)Google测试AI问答功能AI Mode;4)ChatGPT将整合MCP协议,支持第三方AI服务对接;5)阿里推出ZeroSearch框架,减少对搜索引擎的依赖;6)Stability AI与Arm合作推出手机端音频生成AI;7)Qwen发布WorldPM系列大模型;8)GPT-5将整合多款产品功能;9)ListenHub上线AI播客生成工具;10)QQ浏览器升级为AI浏览器;11)数学建模AI助手MathModelAgent面世;12)GenSpark推出全球首个智能下载代理;13)谷歌NotebookLM将推出视频摘要功能。这些创新展现了AI技术在各领域的快速发展和广泛应用。

  • 全球首款生成式人形机器人运动大模型发布:可根据指令生成跑步、舞蹈等连贯动作

    今日上午,国家地方共建人形机器人创新中心联合复旦大学未来信息创新学院,正式发布了全球首款生成式人形机器人运动大模型 龙跃”(MindLoongGPT)。 龙跃大模型以自然语言驱动”为核心,构建了从多模态输入到高保真动作生成的完整闭环,颠覆传统运动控制范式。 也就是说,用户无需学习专业术语或操作复杂软件,仅需像与人类对话一样发出指令,例如以优雅的姿势递

  • “人工智能强化学习可持续发展计划”发布,“教育普惠+标准共建”助力全球人工智能体系构建

    6月11日,第二届"一带一路"科技交流大会人工智能赋能可持续发展论坛在成都举行。腾讯联合多家机构发起"人工智能强化学习可持续发展计划",包含AI教育普惠和强化学习标准共建两大板块。该计划将面向全球高校开放《人工智能通识课》和《人工智能强化学习专业课》教学资源,助力构建高质量AI教学体系。同时,腾讯开悟人工智能全球公开赛颁奖典礼作为"学赛研产"联动的重要环节,吸引了19个国家和地区的近400所高校队伍参赛。2025年赛事将首次联合全国高校计算机能力挑战赛,围绕AI前沿产业真实场景设置赛题。腾讯还通过"青云计划"为全球顶尖AI人才提供就业机会,推动人才与产业高质量发展。北京大学等机构牵头制定了强化学习系统系列技术标准,填补了领域内标准空白。

  • Baidu Steamer-I2V推动视频生成技术突破,擎舵平台赋能原生创意营销

    百度推出全球领先的视频生成模型Baidu Steamer-I2V,以89.38%综合评分登顶VBench榜单。该模型通过精准画面控制、高清画质和中文语义优化,能将静态图像转化为连贯动态视频。百度营销平台迎来2周年,已服务超13万家企业,日均生产素材超10万+。在"AI驱动营销全链路升级"主题下,百度与核心代理商共同探讨AIGC技术突破与创意升级,推出"AI创"原生创意大赛。百度商业体系表示将持续巩固传统广告优势,同时突破创意边界,实现营销效果飞跃。未来百度将优化模型性能,拓展应用场景,推动营销行业迈向"一杯咖啡时间完成创意生产"的全智能化时代。

  • 中文大模型忠实性幻觉评测:豆包大模型幻觉率仅4%,位居全球收之首

    SuperCLUE+最新评测显示,豆包大模型1.5Pro以仅4%的幻觉率和96%的准确率位居全球榜首,超越DeepSeek、Gemini-2.5-pro和GPT-4o等主流模型。该模型在文本摘要、多文本问答等关键任务中表现优异,尤其在中文理解任务上国内领先。基于MoE架构设计,其综合性能超过多款超大规模预训练模型,推理成本显著降低。截至2025年3月,豆包大模型日均调用量达12.7万亿tokens,是一年前的106倍。IDC报告指出火山引擎以46.4%市场份额领跑中国公有云大模型市场。据悉,6月11日将发布豆包大模型最新升级进展。