首页 > 传媒 > 关键词 > 视频技术最新资讯 > 正文

Open Talk 2018音视频技术沙龙·深圳站顺利落地

2018-06-14 11:46 · 稿源:站长之家用户投稿

2018年6月10日,又拍云Open Talk | 2018音视频技术沙龙·深圳站落地深圳触梦空间。炎热的天气挡不住音视频技术大牛散发的魅力,活动吸引了100多位到场观众。

短视频、在线教育、在线狼人杀、直播竞答等各类形式的互动应用越来越广泛,音视频技术的不断升级支撑了这些互动应用的普及。

又拍云Open Talk | 2018音视频技术沙龙是又拍云Open Talk推出的专题活动,追求音视频技术、方案的落地经验。又拍云Open Talk | 2018音视频技术沙龙·深圳站是系列活动的第一站,集合了腾讯、虎牙直播、糗事百科、又拍云等多家知名公司的优秀讲师,奉献了一场干货十足的音视频技术盛宴。

又拍云Open Talk | 2018音视频技术沙龙后续将陆续登陆上海、北京、杭州等城市,目前上海站已定档6月24日。

WebP2P是P2P网络的未来

△ 又拍云PrismCDN项目负责人 凌建发

又拍云PrismCDN项目负责人凌建发。曾在WebRTCon 2018上做了《又拍云低延时的P2P直播实践》分享,受到现场观众的热烈好评。此次,对P2P、流媒体技术有较深入研究的凌建发也将广受好评的分享带到了又拍云Open Talk | 2018音视频技术沙龙·深圳站上。

凌建发从FlashP2P的困境出发,以及SDKP2P在PC端的不足,认为WebP2P才是P2P的未来;详细介绍了树状P2P网络和网状P2P网络的发展现状和不足:高延迟、不稳定。

最后凌建发介绍了又拍云PrismCDN网络的组网思路和实践成果。又拍云PrismCDN放弃了树状、网状的组网结构,只通过路由器、光猫、机顶盒、智能电视等P2P雾节点进行一次转发,加上由CDN网络智能补充数据流,实现了低延迟、高稳定的目的,能够满足目前游戏直播、体育直播、娱乐直播等直播场景对延迟的要求。

智能设备离不开语音交互

△ 资深音频专家 高毅

随着Amazon Echo的爆红,Google、Apple、阿里巴巴、京东、小米等巨头陆续进入智能音箱领域,此领域的创业公司也层出不穷。语音交互已经被视为除了键盘+鼠标、触屏输入之外又一大输入方式,已经应用于办公、汽车、家庭等需要解放双手的场景。要做到语音交互,首先要让设备听得懂人话。资深音频专家高毅在活动中做了《智能设备中的语音处理和交互》的主题演讲。

语音交互场景

高毅在分享中详细介绍了目前智能设备进行语音信号处理和实现语音唤醒的技术细节,包括ASR(自动语音识别)、自然语言理解、Dialog Management(对话管理)、自然语言生成等技术。

自动语音识别是一种通过声学模型和语言模型,将人的语音识别为文本的技术。

自然语言理解通过各项技术完成指代消解、否定判断、语句泛化、口语归一化、ASR纠错等工作,识别人机对话中的领域和意图,获得对话任务的语义信息。目前为止最成功的自然语音理解是“框架语义(Frame Semantics)”,采用领域(Domain)、意图(Intent)和词槽(Slot)来表示语义结果。

对话管理是对话式交互系统的核心,负责控制整个对话过程。主要包括对话上下文(Dialog Context)、对话状态跟踪(Dialog State Tracking)和对话策略(Dialog Policy)几部分。

自然语言生成是对话生成的技术。模板中的回复信息可由词槽或通过内容服务得到的数据来替换。对话生成的原则是符合自然语言交互的习惯,易于用户理解,最快完成对话。

在语音处理方面,高毅从语音产生和感知、语音采集、回声消除等多个环节的应用技术,分析了Amazon Echo和Google Home两大智能硬件在语音采集方面的不同。

高毅还介绍了我国各大厂商在研发智能设备对唤醒词的定义规则:3到5个字、只支持中文、避免使用敏感词和口语化词汇,以及唤醒词要易开口、响度大。

糗百教你避开直播业务的坑

△ 糗事百科视频软件工程师 刘鹏

糗事百科是国内知名的原创糗事笑话分享社区,也涉足了直播业务。来自糗事百科的视频软件工程师刘鹏在活动中分享了《直播SDK的技术实践》,介绍了糗事百科在做直播过程中遇到的各类坑。

在分享中,刘鹏选择了播放器、拉流、推流等直播的各个技术环节,分别进行了详细的介绍。

在拉流的介绍中,刘鹏详细介绍了RTMP与HTTP-FLV的优劣势,并针对秒开、卡顿、追赶三个具体场景介绍了糗事百科的经验。

推流阶段,实时美颜、码率自适应、视频编码、音频参数设置是刘鹏认为需要直播业务必须关注的板块。“码率自适应的原则是把数据尽快发出去,根据不同画质和码率划分档数。”刘鹏分析道。

在互动问答节点,刘鹏介绍了音频、视频同步的三种方式:音视频同步需要一个同步语言,可以是音频时间戳或视频时间戳,也可以是Web时间源。糗事百科一般采用音频时间戳作为同步语言来进行同步

监控数万名主播的直播稳定,虎牙没问题

△ 虎牙直播运维研发架构师 张波

虎牙直播同时在线的主播数有数万个,同时虎牙接入了非常多的CDN厂商,这么大体量的主播上行通过CDN做到自动化监控,是困扰虎牙比较久的一个问题,在今年上半年,虎牙设计了一个比较好的解决方案。虎牙直播基础保障部的张波在《基于CDN推流日志的主播上行实时监控及其自动化解密》的分享中,将这个解决方案做了详细的介绍。

有多种方案可以监控数万名主播上行是否稳定、流畅,比如弹幕监控、第三方拨侧监控、端上数据监控、机房运营商网络监控等。虎牙主要采用了弹幕监控和端上数据监控,同时通过机房运营商网络监控摘掉有问题的节点。

除了常规的监控方案外,虎牙开发了基于CDN日志的主播上行质量实时监控平台,通过对CDN日志的系统分析,“1秒一条数据,5秒一次上报”能够实现主播上行真实用户体验的管理。主播上行质量实时监控平台,还能够应用于CDN入围测试、CDN运行监控、节点质量管理、主播上行运营分析等场景。

免责声明:“站长之家”的传媒资讯页面文章、图片、音频、视频等稿件均为自媒体人、第三方机构发布或转载。如稿件涉及版权等问题,请与我们联系删除或处理。稿件内容仅为传递更多信息之目的,不代表本网观点,亦不代表本网站赞同其观点或证实其内容的真实性,更不对您的投资构成建议。我们不鼓励任何形式的投资行为、购买使用行为。

  • 相关推荐
  • 大家在看
  • 唐桥科技实现60帧音视频技术,音视频技术的新基准

    今日,唐桥科技宣布实现60帧音视频技术突破。区别于当前广泛应用的30帧技术,高刷率可以帮助远程医疗打破音画清晰度的局限,一些更深部位疾病的远程诊疗,例如心脏、脑部、血管等人体内部细微构造的远程超声也将在60帧技术的协助下得到进一步发展与应用。远程医疗的1.0时代随着网络连接和智能设备的加速发展,远程医疗行业得到前所未有的发展机遇。我国在远程医疗领域起步较晚,直到20世纪80年代末,我国才开始进行研究性远程医疗试验探索

  • 短视频的现状行业分析,秘乐魔方借助技术的创新,推动短视频进一步发展

    最近几年,短视频发展相当火爆,短视频是全民娱乐运动,没有年龄、地域差别。在当下,作为新兴的热门行业,短视频以后要走的路还很长。根据 2019 年中国短视频行业研究报告显示,短视频用户规模迅速增长, 2019 年上半年用户8. 57 亿人,成为仅次于即时通讯的第二大应用类型。秘乐魔方短视频上线半年期间注册量就超5000W,可见用户增长速度非常迅速。资料来源:Fastdata极数《 2019 中国网络视听发展研究报告》前瞻产业研究院整理根

  • 魅族17解锁新彩蛋 支持全场景视频防抖技术

    DoNews 6月9日消息(记者 丁凡)今日上午,魅族在官方微博上发布消息称魅族17系列在影像技术上不断深耕,又解锁一枚新彩蛋:魅族 17 系列新增「全场景视频防抖技术」,为主摄、前摄、超广角、长焦镜头带来更稳定的视频拍摄体验,覆盖全分辨率、全帧率,该功能将在后续 OTA 中推送升级。之前魅族在固件更新上解锁了120Hz高刷新率尝鲜模式,支持视频HDR。

  • 专访融云CPO任杰 实时音视频全新升级背后的产品技术策略

    毋庸置疑,随着5G时代的到来,实时音视频技术将会上升到一个全新的高度。5G时代发生巨变的远远不止网速,凭借5G网络的高带宽,低延迟和大并发性,音视频应用场景不断突破现有局限实现巨大飞跃,从而带动了开发者们对于RTC能力需求的热潮。顺应5G时代发展,为解决开发者在应用开发中的音视频需求,近期,全球通信云服务商融云对实时音视频技术进行了全面升级。对此,阿丹有幸采访到融云CPO 任杰,将就此次升级、技术解析、赋能开发?

  • 魅族17系列喜迎Flyme升级:全场景视频防抖技术来了

    6月16日消息,今天魅族17系列迎来第二轮媒体固件更新,带来之前官宣的“全场景视频防抖技术”,本次加入主摄、超广角、前置的视频防抖支持,更多场景正在陆续适配中。魅族17系列在影

  • 又解锁一枚彩蛋!魅族17系列将新增全场景视频防抖技术

    6月9日消息,魅族科技官方宣传,魅族17系列在影像技术上不断深耕,又解锁一枚新彩蛋:魅族17系列新增“全场景视频防抖技术”,为主摄、前摄、超广角、长焦镜头带来更稳定的视频拍摄体

  • 西瓜视频剪辑视频教程 西瓜视频剪辑用什么软件好?

    西瓜视频的剪辑可以使用自家字节跳动出口的抖音官方认证的剪辑神器「剪映」app,它的使用就如它的slogan一样,「轻而易剪」。以下是西瓜视频搭配剪映的基础功能介绍。

  • 多项重磅技术首次落地!小米宣布声学语音技术实现全面自研

    近日,小米发布了小爱音箱Art,作为小米推出的第9款智能音箱,小米小爱音箱Art背后的声学语音技术也重磅升级,搭载第三代小爱同学,支持情感化语音交互、全屋播放及就近唤醒等。今日,小米官方

  • 西瓜视频百万奖金征集“重启”视频

    【TechWeb】6月29日消息,近日,西瓜视频为鼓励优质内容创作,特设立100万元奖金,征集一支以“重启”为主题的视频。相关负责人表示,“重启”就是心怀勇气迎接挑战和机遇,开启新生活。这是继免费开放4K功能、推出“活字计划”后,西瓜视频在这方面的最新动作。即日起,用户打开西瓜视频App,搜索“重启”,便可参与投稿。活动期为1个月,2020年7月31日将公布评选结果。

  • 聚焦大健康场景技术,科沃斯参与推动行业技术标准建立

    近日,由中国家用电器研究院与高端智能家电制造业创新中心共同主办,《家电科技》与《轻工标准与质量》共同承办的“《中国家电大健康场景技术发展白皮书》发布暨面向大健康场景的优势家电产品推介活动”在线举办。作为家用服务机器人领域领先品牌,科沃斯全程参与到白皮书的编制过程中,同时科沃斯旗下空气净化机器人产品沁宝ANDY和AVA也双双入选“ 2020 年面向大健康场景的优势家电产品”榜单。 聚焦大健康场景技术 携手推动行业

  • 视频号改版了?视频号变微博号?

    听说安卓的视频号改版了,但是我试了好几个安卓手机,都没有被灰度到。于是我就上网搜索了下。结果发现这些文章的标题还挺有意思的。

  • 好看视频视频审核不通过怎么办

    好看视频中如果发布视频不合规的话会显示审核不通过,但是有的人明明觉得自己发布的视频是合规的,为什么还会审核不通过呢?遇到了审核不通过的情况应该怎么办呢?下面就来为大家一一介绍一下。

  • 井贤栋:区块链是重构生产关系的技术 其他技术都只是改进生产力

    【TechWeb】6月19日消息,在第十二届陆家嘴论坛上,蚂蚁集团董事长井贤栋谈及区块链时表示,“区块链是解决数字化时代的信任问题的最佳解决方案,区块链是重构生产关系的技术,其他技术都只是改进生产力。”在他看来,当前正是新一轮数字技术变革的时刻。全球蔓延的新冠疫情带来社会和经济发生变化,数字化生活习惯正在更广泛深入地养成,企业生产经营行为全面走向数字化,城市治理、城市运营正在全面数字化。而在这种背景下,区?

  • 频繁布局的西瓜视频,能为视频创作者带来什么?

    用苏格拉底的“麦穗理论”和近代数学的“秘书问题”推导找到真命天子概率、用统计学算出考清华和中500万哪个更难、用费米悖论探讨外星人是否存在……<br/>

  • “我在抖音看了一宿视频,发现视频营销号的买卖内幕”

    短视频行业发展的如火如荼,催生了冉冉升起的直播风口,无数人挤破头想要进来分一杯羹。有人试水做直播,从零开始。有人走捷径,涉足灰产,靠买卖账号牟利。也有人把短视频平台当舞台,靠演技割韭菜,轻轻松松年入百万。

  • “闯入者”西瓜视频

    正如字节跳动旗下的多数产品一样,西瓜视频再次“挑衅”了几乎所有的对手。自年初以来,西瓜视频一边耗巨资购买《囧妈》、《大赢家》、《无限》等独家影视版权,一边从B站挖走赶海天团、敖厂长等知名UP主,这一“闯入者”的高调姿态打了B站和优爱腾们一个猝不及防。

  • 我们看到一些知乎大V 开始拍视频了

    【TechWeb】最近几个月,不少用户反映,越来越多自己关注的以图文为主要创作形式的大V都开始做视频了。图文作者增加视频内容正成为一种标配。TechWeb注意到,很早就在知乎进行图文创作的@大梦Power最近也开始创作视频内容,目前共发布5个视频,粉丝达到13万。此外,@老爸测评、@普外科曾医生、@庄明浩等知乎大V也都转型开启视频创作。内容视频化的浪潮在2020年奔涌得尤其猛烈,不做视频的自媒体已经越来越少。事实上,图文创作者?

  • 抖音门店视频管理

    抖音门店的视频在哪里可以进行管理,包括上传、删除、置顶等操作在什么地方可以进行,对于商家来说,抖音门店是最直接展示店铺信息的方式,这里我们来看下抖音门店视频的管理方法。

  • VE视频引擎推出跨平台的视频剪辑解决方案

    据艾瑞、极数等咨询公司发布的中国短视频行业报告显示。国内的短视频用户数已达 8 亿之多,并且用户数还处在一个持续增长的过程中。在如此庞大的市场规模下,必然会产生海量的PGC(专家生产内容),UGC(用户生产内容)视频内容。PGC生产内容的方式需要专业的视频拍摄团队按照剧本拍摄,然后拍摄后的视频交付视频后期团队进行视频剪辑、视频包装。UGC生产内容是方式主要是用户拍摄一段生活场景视频。然后通过视频剪辑的APP去完成二次编

  • 从新技术到健康生态,华米科技通过AI技术改善用户健康

    6月15日,华米科技(NYSE:HMI)在安徽合肥举办主题为「AI to Decode Future」的首届AI创新大会,为我们带来了诸多AI技术研究与相关应用。次日,华米科技还举办了AI技术开放日活动,邀请业内专家与高校院校学生共同探讨国内外人工智能话题,探索人工智能未来发展的趋势方向。 AI创新大会:华米自研新技术、新硬件惊喜不断在本届AI创新大会上,华米科技正式发布了新一代智能可穿戴芯片“黄山2号”、第二代PPG?物追踪光学传感器BioTrack

  • 参与评论
文明上网理性发言,请遵守新闻评论服务协议