首页 > 传媒 > 关键词  > 正文

腾讯云视频云解决方案“七连冠”,推动中国技术出海

2024-04-15 18:07 · 稿源: 站长之家用户

4月12日,国际数据公司(IDC)发布《中国视频云市场跟踪(2023下半年)》报告,腾讯云音视频的解决方案份额连续七次获得市场较高排名。其中,在视频直播、生产创作与媒资管理赛道也位列首位,在实时互动赛道保持高增长,为企业在全真互联时代的高质量发展提供了坚实的数字化助力。

报告指出,“疫后线上娱乐需求回退”、“降本增效”成为每一个互联网平台和视频云服务商面临的挑战,更高的资源复用水平、更高的编码效率、更多样化的资源使用成为供需两侧共同努力的方向。另一方面,“音视频出海”、“视频短剧兴起”、“热播剧对流量市场的短期拉动”、“下沉体育赛事直播”等驱动因素带来了2023年视频云市场为数不多的增量。

IDC中国行业云服务研究经理魏云峰预测,未来两年中国视频云市场将回归音视频服务的主线,即“视频社会化”和“全场景视频化”,未来AIGC背景下视频生产也将创造更多可能。

面向全球的最全产品线,腾讯云音视频产品技术竞争力保持全球领先

据了解,基于腾讯在音视频通信领域20多年的技术积累,腾讯云已经构建了全面、易用、稳定、成熟的音视频解决方案,包括MPaaS、CPaaS与EdgeOne等产品能力,为国际市场、全球企业和开发者提供给了更加智能化的视频云服务,满足泛娱乐、电商、教育等各类客户需求。

其中,在视频直播方面,腾讯云为企业提供一站式的音视频直播解决方案。其中,云直播 CSS基于腾讯云全球2800+加速节点和领先的音视频AI技术,可根据大规模实时观看、超低延时直播、便捷云端导播等不同的直播场景需求,为企业提供标准直播、快直播、云导播台等多种服务。不仅如此,腾讯云作为超低延时直播技术的主导和引领者,还首创将WebRTC技术引入直播领域,推动直播延时降低90%以上,降低到500ms以内。

围绕生产创作与媒资管理,腾讯云媒体处理(MPS)具备全球领先的自研智能编码内核,核心视频处理引擎拥有超百项新一代国际编解码专利,在编码技术、实时音视频画质增强、媒体框架开放性以及生态等方面具备领先的优势,满足企业各种场景下对视频的处理需求,并在 2020-2022连续3年在MSU世界编码大赛上斩获第 一。

在实际应用上,可根据不同视频场景实现动态编码,助力企业节省50%以上的存储和带宽成本。同时还结合云渲染和AIGC互动,支持生成直播间礼物或弹幕特 效等直播互动新玩法。而在此前《IDC MarketScape:实时云渲染解决方案,2023年厂商评估》报告中,腾讯云还凭借领先的技术和落地实践经验,入选云渲染领 导者类别,产品综合能力排名领先,实力获市场认可。

目前,MPS已实现了国内头部音视频客户的全面覆盖,支撑全 网超过50%的实时媒体处理量。比如,MPS已支持南亚头部在线视频平台ARY ZAP超百场重要赛事直播,将实现直播延时控制到秒级,在保证高清画质的同时,压缩超30%的码率和带宽消耗,大幅提升用户观看体验并实现降本增效。

此前腾讯云音视频能力也多次获得国际认可。其中,腾讯云成为中国头家且唯 一入选的代表厂商入选Gartner《Market Guide for Video Platform Services》(《视频平台服务市场指南》。此外,在Gartner 首 次发布的《Magic Quadrant for Communications Platform as a Service》报告,腾讯云获评CPaaS“挑战者”,凭并在4项Gartner 用例(Use Case)中获中国厂商最 高分。

国际化拓展卓有成效, 持续深耕数实融合

腾讯云音视频在领跑国内市场的同时, 也在加快中国行业经验和先进技术的对外输出。在泛娱乐、电商和传媒等行业保持领先,并在亚太、中东北非等关键区域市场斩获多个标杆客户,为企业国际化提供高质量服务。其中,面向全球推出的边缘安全加速平台EdgeOne,采用了全球领先的All in One技术架构,可以将服务下沉至最接近全球各地用户的边缘节点,为各类企业提供安全加速一体化服务,已成为中国企业进军国际市场的首 选。

目前,腾讯云已和包括日本头部视频平台smash.LIVE、日本直播平台MIXCHANNEL、流媒体服务商BeLive、日本顶 级直播服务公司Mildom、韩国游戏巨头Nexon、印尼传媒巨头TribunNews、社交媒体KipasKipas、南亚头部在线视频平台ARY ZAP、非洲音乐流媒体平台Boomplay等多家海外企业达成紧密合作并稳定提供技术支持。

在助力数字融合方面,腾讯云音视频低代码TUIKit方案和腾讯云联络中心TCCC能够实现快速被集成,降低开发门槛,在医疗、出行、教育等传统场景,提升开发者和企业运营效率,为社会公共服务提效。

例如,西门子医疗基于微信小程序和腾讯云音视频打造了一系列基于5G的远程医疗应用,基本覆盖了从放射扫描助手到远程放射专家再到远程介入大师、以及远程放疗计划等资源。有效解决了偏远地区的医疗资源分配不均、医疗设备检测或扫描拍片缺乏专业技师人才储备等问题。目前,腾讯云音视频联合西门子支持了2.7万次的远程扫描服务,包括全国424家医疗机构的CT、核磁和PET。

腾讯云作为音视频行业领先的服务商,未来将持续打磨音视频核心技术,提升音视频产品能力,将音视频技术与各行各业、各类场景深度融合,为千行百业的高质量发展提供助力。同时,加快技术与行业经验的对外输出,为企业国际化的发展提供数字化升级与业务创新。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 大家在看
  • Tap4 AI:提供免费 AI 工具目录,汇集各类 AI 工具并为用户提供最佳选择。

    Tap4 AI Directory 是一个提供免费 AI 工具目录的工具,旨在收集所有 AI 工具并为用户提供最佳选择。用户可以在 Tap4 AI 目录中找到各类 AI 工具,助力工作效率和创意。

  • Carteisa Sonic:低延迟语音模型,生成逼真语音

    Sonic是由Carteisa团队开发的低延迟语音模型,旨在为各种设备提供逼真的语音生成能力。该模型利用了创新的状态空间模型架构,以实现高分辨率音频和视频的高效、低延迟生成。Sonic模型的延迟仅为135毫秒,是同类模型中最快的。Carteisa团队专注于优化智能的效率,使它更快、更便宜、更易于访问。Sonic模型的发布,标志着实时对话式AI和长期记忆的计算平台的初步进展,预示着未来AI在实时游戏、客户支持等领域的新体验。

  • ViViD:视频虚拟试穿技术

    ViViD是一个利用扩散模型进行视频虚拟试穿的新框架。它通过设计服装编码器提取精细的服装语义特征,并引入轻量级姿态编码器以确保时空一致性,生成逼真的视频试穿效果。ViViD收集了迄今为止规模最大、服装类型最多样化、分辨率最高的视频虚拟试穿数据集。

  • xinsir:深度学习、表示学习、细粒度分类

    xinsir (qi) 是一个关于深度学习、表示学习和细粒度分类的产品。它提供了强大的功能和技术,具有主要优点和背景信息。该产品具有多个模型可供选择。

  • 腾讯元宝:是一个多功能工具,帮助用户轻松工作和享受多彩生活。

    腾讯元宝是一款集成了多种实用工具和服务的生产力工具,旨在提高用户工作效率和生活品质。其背景信息是由腾讯公司推出,定位为全面满足用户工作和生活需求的综合性工具。腾讯元宝提供了丰富的功能和服务,包括日程管理、文件存储、社交聊天、视频会议等,用户可以在一个平台上完成各种任务。

  • GPTResearcher:AI助力的快速洞察和全面研究助手

    GPT Researcher是一个领先的自主研究代理,专为多代理框架设计,提供实时、准确和事实性的结果。它能够简化数据收集,通过一个函数调用提供可信赖、聚合和策划的结果。它支持超过100种不同的大型语言模型(LLMs),并且可以与任何搜索引擎协作,从Google到DuckDuckGo。用户可以轻松搜索本地文档和文件,并生成超过2000字的长篇报告,支持多种格式的导出,如PDF、Word、Markdown、JSON和CSV。

  • DenserRetriever:先进的AI检索器,用于RAG。

    DenserRetriever是一个开源的AI检索模型,专为RAG(Retrieval-Augmented Generation)设计,利用社区协作的力量,采用XGBoost机器学习技术有效结合异构检索器,旨在满足大型企业的需求,并且易于部署,支持docker快速启动。它在MTEB检索基准测试中达到了最先进的准确性,并且Hugging Face排行榜上也有其身影。

  • Groqbook:使用Groq和Llama3快速生成整本书

    Groqbook是一个基于Streamlit的应用程序,它利用Llama3在Groq上从一行提示快速构建书籍。它适用于非小说类书籍的创作,并能在几秒钟内生成每一章节。该应用程序混合使用Llama3-8b和Llama3-70b模型,利用较大的模型生成结构,较小的模型创造内容。目前,模型仅使用章节标题的上下文来生成章节内容。未来,这将扩展到书籍的完整上下文,以允许Groqbook生成高质量的小说书籍。

  • MusePose:虚拟人物生成的图像到视频框架

    MusePose是由腾讯音乐娱乐的Lyra Lab开发的一款图像到视频的生成框架,旨在通过姿势控制信号生成虚拟人物的视频。它是Muse开源系列的最后一个构建块,与MuseV和MuseTalk一起,旨在推动社区向生成具有全身运动和交互能力的虚拟人物的愿景迈进。MusePose基于扩散模型和姿势引导,能够生成参考图像中人物的舞蹈视频,并且结果质量超越了当前几乎所有同一主题的开源模型。

  • Codestral-22B-v0.1:一款支持80+编程语言的AI代码生成模型

    Codestral-22B-v0.1是由Mistral AI Team开发的大型语言模型,它经过了80多种编程语言的训练,包括Python、Java、C、C++、JavaScript和Bash等。该模型能够根据指令生成代码,或对代码片段进行解释、重构等。它还支持Fill in the Middle (FIM)功能,用于预测代码中的中间部分,特别适合软件开发工具的插件使用,如VS Code。该模型目前没有内容审查机制,但开发团队正在寻求社区合作,以实现在需要内容审查的环境中部署。

  • Fryderyk:AI辅助的音乐创作伙伴

    Fryderyk是一个集成了AI助手的音乐制作网页应用程序,它提供了一个浏览器内的音乐创作环境,支持即插即用,连接麦克风或任何MIDI乐器。用户可以访问广泛的虚拟乐器库,应用混响、失真、延迟等效果和混合工具,进行音频编辑、录制和编辑音频。Fryderyk还提供云存储功能,项目自动保存并同步至所有设备。它的内置生成性AI能够扩展用户的想法或在用户遇到创作瓶颈时提供新的想法。

  • Codestral:是为代码生成任务设计的AI模型。

    Codestral是Mistral AI团队推出的首个代码生成AI模型,它能够通过共享指令和完成API端点帮助开发者编写和与代码交互。它在80多种编程语言上进行了训练,包括Python、Java、C、C++、JavaScript和Bash等,能够完成编码功能、编写测试和使用中间填充机制完成部分代码。Codestral在性能上设立了新的标准,它拥有32k的上下文窗口,比竞争对手的4k、8k或16k更大,从而在RepoBench上超越了所有其他模型。此外,它还提供了专用的API端点codestral.mistral.ai,允许用户在IDE中使用Instruct或Fill-In-the-Middle路由,并且提供了8周的免费beta期。Codestral还集成到了LlamaIndex和LangChain等应用框架中,以及VSCode和JetBrains环境中,使得开发者可以在这些环境中生成和与代码进行交互。

  • PCM:一种新的文本条件高分辨率生成模型

    Phased Consistency Model(PCM)是一种新型的生成模型,旨在解决Latent Consistency Model(LCM)在文本条件高分辨率生成中的局限性。PCM通过创新的策略在训练和推理阶段提高了生成质量,并通过广泛的实验验证了其在不同步骤(1步、2步、4步、8步、16步)下与Stable Diffusion和Stable Diffusion XL基础模型的结合效果。

  • Qaiz:创建和参与多玩家知识问答游戏

    Qaiz是一个在线平台,利用AI技术快速生成各种主题的互动式问答游戏,让用户可以与朋友和家人实时竞争,同时跟踪分数并享受实时评论。它提供了一个有趣的方式来测试和分享知识,同时具有社交和娱乐的双重属性。

  • Trip Tunes:自动生成适合旅行的个性化音乐播放列表

    Trip Tunes是一款为旅行者设计的应用程序,能够自动创建与旅行氛围相匹配的音乐播放列表。用户只需输入旅行的基本信息和音乐偏好,应用程序就会利用算法精心挑选出符合当地音乐场景和旅行风格的曲目。该应用特别适合那些希望在旅途中享受个性化音乐体验的用户。

  • Backseat AI:与Tyler1一起在《英雄联盟》中获得专业级实时指导

    Backseat AI是由Tyler1联合创立的应用程序,它通过先进的AI技术为《英雄联盟》玩家提供实时的指导、洞察和评论。它旨在通过专业级的游戏分析帮助玩家提高游戏表现,同时保持电脑性能不受影响。Backseat AI是免费的,玩家可以选择升级到高级订阅以获得无广告体验和额外功能。

  • Tonic Textual:安全数据湖,为生成式AI开发提供数据

    Tonic Textual 是全球首个为大型语言模型(LLMs)设计的Secure Data Lakehouse。它通过自动化流程,帮助企业从云存储中提取、治理、丰富和部署非结构化数据,以支持生成式AI的发展。该产品强调数据隐私保护,利用其专有的命名实体识别(NER)模型自动检测和去标识化敏感信息,同时通过数据合成保持数据的语义真实性。它支持多种数据格式,并通过AWS Marketplace、Google Cloud Marketplace和Snowflake Marketplace提供服务。

  • Outtloud:AI语音助手,将文档转换为自然语音

    Outtloud是一款AI语音助手,可以将用户文档或文本转换成自然流畅的高保真AI语音。它支持超过10种语言和口音,提供100多种AI高级人声。用户可以以高达4倍的速度听书,节省阅读时间,同时在驾驶、通勤、锻炼等任何时间任何地点进行学习。它还具备添加笔记和书签的功能,支持在焦点模式下高亮显示正在播放的段落,以便用户跟随阅读。

  • llama3v:基于llama3 8B的SOTA视觉模型

    llama3v是一个基于Llama3 8B和siglip-so400m的SOTA(State of the Art,即最先进技术)视觉模型。它是一个开源的VLLM(视觉语言多模态学习模型),在Huggingface上提供模型权重,支持快速本地推理,并发布了推理代码。该模型结合了图像识别和文本生成,通过添加投影层将图像特征映射到LLaMA嵌入空间,以提高模型对图像的理解能力。

  • Open LLM Leaderboard:开放的大型语言模型排行榜

    Open LLM Leaderboard是一个由Hugging Face提供的空间,旨在展示和比较各种大型语言模型的性能。它为开发者、研究人员和企业提供了一个平台,可以查看不同模型在特定任务上的表现,从而帮助用户选择最适合自己需求的模型。

今日大家都在搜的词: