首页 > 传媒 > 关键词 > 腾讯TechoPark开发者大会最新资讯 > 正文

2020 Techo Park开发者大会召开,作业帮分享拍搜系统架构演变历程

2020-12-23 10:58 · 稿源:站长之家用户投稿

12月19日至20日,由腾讯主办的2020 Techo Park开发者大会于北京召开。据悉,本次大会邀请了全球超200位顶级技术专家来到现场,与数千位参会者就云计算、大数据和人工智能等前沿技术话题展开深度交流,为中国及全球云计算爱好者、从业者、开发者提供最具参考价值的创新分享。

图片3.jpg

作业帮视觉智能实验室架构负责人程童受邀参加大会,并发表了题为《作业帮拍照搜题系统架构的演变》的主题演讲,系统地介绍了作业帮拍搜系统概况、不同阶段面临的问题和应对方法,以及GPU服务虚拟化的实践经历和取得的迁移效果。

底层技术加持,作业帮拍搜助力用户精准获取全面信息

作为中国最大的K12在线教育公司,作业帮致力于用科技助力教育普惠,解决教育领域痛点,旗下拥有作业帮、作业帮直播课、作业帮口算、鸭鸭AI课、智能硬件喵喵机等多款教育产品,总日活用户超5000万,月活用户超1.7亿,累计激活用户设备超8亿。其中,作业帮APP是进入中国应用市场Top30的唯一一款教育类APP,作业帮直播课是中国在线教育领军品牌,累计服务学员已超6500万。

在作业帮的整套产品链条中,拍搜系统提供了底层的技术支持。据程童介绍,作业帮拍搜系统拥有多项OCR、检索、系统专利,率先在业界实现“随手一拍,秒出答案”。与此同时,随着拍搜功能的不断拓展,作业帮完成了从单题到整页再到猜你想拍,从搜索到批改再到打分的全方位搜题场景设定,充分帮助学生提高学习效率。

据了解,作业帮拍搜算法架构主要分为OCR和检索两部分。其中,OCR系统主要任务是将所拍内容识别成文本,由多个策略&预处理模块,以及大量使用GPU作为运算设备的深度学习在线推理服务组成;而检索系统的主要任务是通过识别出的文本检索答案,包含策略层、正排系统、倒排系统和离线建库四个主要部分,针对拍照搜题这个垂直领域进行了大量的策略优化。

程童表示:“针对用户在不同使用场景下可能出现的模糊、倾斜、低像素、干扰等各类拍照问题,作业帮在持续5年以上的自主研发和数据积累中,不断进行算法迭代和架构完善。”

在一次完整的文字识别流水线中,作业帮拍搜系统拥有超30种不同的神经网络各司其职,平均一次识别可运行260次以上的神经网络预测。此外,通过构建大规模的并行GPU集群,平均只需要200毫秒,便可完成一次完整的识别流程,且作业帮系统在一分钟可完成百万次这样的搜题请求。对于识别出的题目内容,系统可以在索引量超过3亿的题库搜索引擎中进行匹配,确保用户获取更全面和准确的信息。

从更快更准到快速应变,有限算力下的极限探索

程童在演讲中提到,在过去的六年里,作业帮拍搜系统以两年为进化周期,大致可分为三个发展阶段,每个阶段因业务场景和系统规模不同,面临的问题也有所不同。2015年至2016年属于第一阶段,作业帮拍搜系统业务刚起步,需要解决的核心问题是更快和更准。更快是为了提供更好的用户体验,更准则容易形成口碑传播,吸引更多用户。

为了实现“随手一拍,秒出答案”的效果,作业帮视觉智能实验室工程架构团队从并行计算、调度策略、工程实现三方面做出了努力。团队率先将GPU用于在线推理服务:使用CPU做预处理,利用GPU强大的并行运算能力运行深度神经网络,上线后取得了10倍的加速效果,平均耗时从3秒以上缩短至300多毫秒,后续持续优化到平均200毫秒。团队还自研轻量级RPC框架,设计适合多GPU协同的线程池和调度策略,高峰期GPU利用率达到90%以上。

伴随业务流量的持续上涨,作业帮拍搜系统在2017年至2018年进入发展的第二阶段,不断扩张的业务引入了更多的算法模型,需要不断开发交付新的服务;算力需求的快速上涨又带来了成本上的压力。这两年,团队在开发和运维双线面临挑战。

团队迅速调整策略,制定应对方案。首先,优先满足业务发展需求,尽快交付服务,确保算法模型的快速上线;同时,尽力优化系统环境,减少技术债务。例如,针对环境异构的问题,团队通过升级接入层,优化自研RPC客户端,满足多机房、多机型负载均衡以及实验分流需求;通过迁移服务器的机会收敛异构机型和环境;不断根据业务情况调整优化系统部署,将日常操作自动化,提高管理效率。

经过技术团队不懈努力,在业务不断扩展、流量持续增加的情况下,系统有力支撑了作业帮拍照搜题类业务的发展,自身也成长到了一定规模。

虚拟化突破两大矛盾,显著迁移效果激发更多可能性

2019-2020年系统进入到第三阶段,针对前期发展过程中的各种问题,程童和团队没有停留于表面,而是不断回顾、总结和深挖,认为之前出现的很多问题,表现出的形式是性能和稳定性相关,但实际上是因为系统灵活性不足。在人力有限的前提下,以物理机(bare metal,裸金属服务器)作为资源分配和系统管理的最小单位,无法突破两个矛盾,即日益频繁的变动与系统管理之间的矛盾,和日益增长的需求与资源管理之间的矛盾。为了突破这一瓶颈,团队选择了虚拟化,具体实现形式是K8s和容器。

对于为什么选择K8s,程童解释道:“在最关键的资源分配环节,K8s突破了机器的边界,将资源抽象整合为资源池,应用按需申请,由调度器分配,解决了资源管理的矛盾;而通过抽象出pod、deployment、service等概念,可低成本实现应用整个生命周期的自动化,解决了系统管理的矛盾。”

为了减小系统迁移的风险,团队制定了渐进式的迁移步骤,首先对环境进行标准化,对一些不适合容器环境使用的组件或功能进行改造;之后将整个系统容器化运行,了解和掌握相关数据;最后实现灰度环境验证和线上系统迁移。针对K8s原生不支持按显存调度的问题,团队也通过研发调度插件给出了解决方案。

从目前的迁移效果来看,通过更细颗粒度的资源分配和服务混部,部分集群迁移后节省了50%的机器资源,资源利用率也大大提升;而通过迁移获得的弹性伸缩能力,可以让系统在应对流量高峰时更游刃有余;相比于集群调整平均需要2小时的物理机时代,如今平均只需要10分钟即可完成;而在故障处理方面,也从原来的平均20分钟缩短至平均5分钟,对于简单故障,系统可以实现无人工介入。

图片4.jpg

在程童看来,迁移效果远不止如此,虚构化改造所带来的灵活性,让之前许多不方便的事情变得更加便捷,创造了许多可能性。未来,作业帮技术团队将持续搭建先进技术系统,不断突破在线教育发展所遇到的技术难题,真正实现以科技赋能在线教育创新发展。

免责声明:“站长之家”的传媒资讯页面文章、图片、音频、视频等稿件均为自媒体人、第三方机构发布或转载。如稿件涉及版权等问题,请与我们联系删除或处理。稿件内容仅为传递更多信息之目的,不代表本网观点,亦不代表本网站赞同其观点或证实其内容的真实性,更不对您的投资构成建议。我们不鼓励任何形式的投资行为、购买使用行为。

  • 相关推荐
  • 大家在看
  • 作业帮,一家科技公司

    “7岁了,继续奔跑。”1月15日,作业帮创始人、CEO侯建彬在朋友圈里感慨。过去一年,作业帮发展尤其迅速,一年拿到两轮融资,给原本热闹的K12在线教育市场再添了一把火。2015年的时候,作业帮还是一个很小的APP,团队也很小,一张照片就放得下。6年后的今天,作业帮已经成为中国唯一月活用户过亿、唯一进入全网top30的教育类APP,员工总数超过35000人。作业帮团队.2015年K12在线教育正身处风口。iMedia Research预计,政策利好、技

  • 技术赋能家庭教育,作业帮名师随时随地答疑解惑

    对于许多家长而言,辅导孩子作业算得上是一个大难题。家长对孩子遇到的问题讲解不清,或者由于知识遗忘而根本无法辅导,不仅孩子理解不了,往往也增加了家长的焦虑情绪。作为在线教育头部平台,作业帮旗下产品一直以新技术、新工具持续赋能个性化教学,成为家庭教育的有力补充。河南在线学习报告发布,作业帮拍搜技术为中小学生答疑解惑近日,北京师范大学统计学院与作业帮联合发布《河南省中小学生在线学习大数据学情报告》,详细

  • 以科技革新学习场景,作业帮拍搜让难题错题“拍”立解

    “7岁了,继续奔跑。”1月15日,作业帮创始人、CEO侯建彬在朋友圈里感慨。7年来,作业帮敏锐抓住了K12教育的风口,着力提升拍照搜题的效率和准确性,从一张照片就放得下的小团队,成长为中国唯一月活用户过亿、唯一进入全网top30的教育类APP,员工总数超过35000人。对于K12教育行业来说,2013年可谓一个转折年。这一年,辞去世纪佳缘CEO的龚海燕创办的梯子网吸引了大众的关注,也搅起了BAT对在线教育的好奇心。彼时,在百度内部,?

  • 冬奥冠军武大靖携手作业帮:为每一分,付出100分

    2月4日,北京冬奥会倒计时一周年之际,全球用户规模最大的在线教育公司作业帮宣布中国短道速滑队队长、冬奥冠军武大靖为其“冠军代言人”,双方将携手共同陪伴中国青少年成长。此前,作业帮已与中国女排达成战略合作,并签约中国女排队长朱婷。作业帮表示,“为每一分,付出100分”是作业帮和武大靖在各自领域共同的追求与实践。作业帮对教育、成长的理解与武大靖在体育竞技领域的精神内核高度一致,希望借此次合作,携手亿万中国中小学生,?

  • 借AI技术升级在线课堂 作业帮直播课让“云同桌”进行“云对话”

    2020年1月,作业帮行业内首家在“直播大班课”中上线“小组直播间”,对大班课的学员进行分组。在“小组直播间”中,学员进入课堂可自由选择伙伴,6人一组,6组之间进行PK。一些小学生还会将课堂上的这种伙伴关系延伸到课下。在对“小组直播间”的用户产品调研中,作业帮小学产品负责人了解到,在辅导老师的家长群里,妈妈们会帮孩子寻找小伙伴的妈妈“加微信”,结成一起学习的小伙伴。2021年1月27日,根据用户调研问卷中学员和家

  • 用AI科技铸就心理健康防线,作业帮为未成年人打造“幸福校园”

    学业、考试带来的压力,青春期的困惑,来自家庭方面的问题,在校园生活中与同学、老师相处中出现的问题,留守儿童问题等,在成长的过程中,不同年龄段、不同群体的孩子都可能存在这样那样的心理方面的问题。基于此,作业帮在2018年9月上线了国内首个青少年信息安全综合防护平台——寸功平台,它借助作业帮大数据科技,通过“AI赋能信息审核”“全量数据监测和预警”“数据分析及适当干预”“综合防护”四大功能,全面守护青少年信?

  • 作业帮小组直播间集体发言功能升级,以AI技术驱动在线教育行业发展

    为全方位模拟线下教育高频互动场景,更好地促进学员间的“开口互动”,1月27日,中国用户规模最大的K12在线教育平台作业帮对其小学直播课产品中的集体发言功能进行升级。升级后,在作业帮直播课的“小组直播间”场景中,“小组直播间”内的6名组员将在集体发言环节中听到“同学”的声音,主讲老师也可以任选其中一组,听到该组6名同学的“集体表达”。行业内首家在大班课中上线“小组直播间”据了解,集体发言功能是作业帮直播课产

  • 华为应用市场AppGallery Connect研习社·直播:百万开发者打造优质应用的奥秘

    如何快速构建移动应用后端?不升级应用,如何修改应用的行为和外观?如何快速发现、定位并解决应用崩溃?2月4日19点,华为应用市场AppGallery Connect专家团队将在线为大家带来丰富干货解读:涵盖云函数、远程配置、崩溃服务、性能管理、华为分析5个单服务,帮助开发者提升应用质量与开发效率。·云函数:提供Serverless化的代码开发与运行平台,您只需聚焦业务逻辑,使用函数开发核心业务代码并上传到平台,平台接管函数的运行并保证资源的

  • 有开发者成功在M1 Mac Mini上运行Linux系统

    对于不想使用苹果macOS系统但又想体验最新M1硬件的人来说,有机会尝试M1Mac上运行Linux 系统了。专注于 Arm 软件虚拟化的公司Corellium,已经成功让Linux在M1Mac Mini运行起来了。

  • 苹果将开设一个新的开发者学院 以对抗种族主义

    作为苹果去年宣布的耗资1亿美元种族平等和正义计划(REJI)的一部分,苹果正在密歇根州开设一个开发者学院,并帮助在乔治亚州建立一个教育中心。

  • 苹果要求开发者退还DTK Mac mini,可获200美元M1芯片设备赠金

    据9to5Mac报道,当苹果宣布从英特尔处理器向Apple Silicon芯片过渡时,苹果公司提供了一款带有A12Z仿生芯片的定制Mac mini,以便开发者就可以更新他们的macOS应用程序以支持新的ARM平台。

  • 《中国企业家》专访:环信,坚韧品质缔造SDK覆盖30万APP服务40万开发者

    当今时代,科技进步和创新已成为经济社会发展的决定性力量。对于企业而言,“服务至上、效率争先”至关重要。尤其在数字化转型进程中,更需要借力数字化加速企业发展。作为国内领行的企业级软件服务提供商,环信是国内较早覆盖云通讯、云客服、智能机器人的一体化产品技术储备企服公司,作为国内全媒体智能云客服倡领者,在中国移动端SaaS客服市场环信市场占有率高达77.4%,在中国即时通讯云市场环信也始终保持着客户数量领先优势?

  • iOS 14.4 Beta2第二个开发者测试版发布,增强HomePod接力体验

    苹果今天发布了 iOS14.4 第二个开发者测试版,距离首个测试版相隔一个月的时间。iOS14.4 增强了 HomePod 接力体验。现在开发者可以通过苹果开发者中心进行下载,已经加入 Beta 测试项目的用户也可以通过 OTA 方式进行更新。

  • Facebook起诉两家Chrome扩展开发者 偷偷抓取用户数据

    日前,Facebook在葡萄牙对两名当地公民提起诉讼,指控他们开发的Chrome扩展会窃取Facebook用户数据。Facebook平台诉讼主管表示“当人们在他们的浏览器上安装这些扩展时,实质上是在安装隐藏代码,这些代码旨在从Facebook网站上收集他们的信息,以及从用户的浏览器上收集与Facebook无关的信息——所有这些都是在他们不知情的情况下。”

  • 云+社区2020年度优秀创作者榜单揭晓,共建开发者生态

    回首不平凡的2020年,技术力量越来越受到重视,技术从业者的责任也越来越重大。突发事件、流量洪峰、协同开源……一轮又一轮的挑战背后,是技术从业者们默默的努力。然而,技术的发展,不仅需要默默努力,更需要站出来发声,以文字发声,以演讲发声,分享自己的实践经验,推进技术整体的进步,更是十分珍贵。2020年,云+社区携手业界各方专家、一线开发者,真诚分享、多方交流,让技术的声音传递给更多人:在这一年里,数百位来自?

  • 专家直播AppGallery Connect开发类服务集成过程

    如何快速高效地构建安全可靠的用户认证系统?如何使用托管服务助力网站快速上线?如何提升用户留存及活跃度?1月21日19点,华为应用市场AppGallery Connect专家团队将在线为大家带来丰富干货解读:涵盖认证服务、云托管、应用内消息三个单服务,帮助开发者更好地集成AppGallery Connect开发类服务,提高开发效率。·认证服务:基于预构建的托管式认证系统,更有效率地保护您的移动和Web用户的数据安全。·云托管:网页托管服务,一键式部署,安

  • 直播干货总结:如何高效集成AppGallery Connect开发服务

    直播干货总结:如何高效集成AppGallery Connect开发服务

  • Check Point Quantum Spark 安全网关助力中小型企业抵御高级网络威胁

    网关产品进一步扩充,可提供屡获殊荣的自动化威胁防御功能和开箱即用的集成式安全性,其零接触管理特性可满足中小型企业的独特需求2021 年 2 月 3 日 — 全球领先网络安全解决方案提供商 Check Point 软件技术有限公司(纳斯达克股票代码:CHKP)今日宣布中小型企业 (SMB) 安全网关 Quantum Spark 全系列产品正式上市。该系列产品包括六种网关,支持轻松部署和管理,并且无需专业技能即可实现卓越安全,为中小型企业的高级网络攻击防护树立

  • 科学家正开发新人工智能设备,要来帮大家戒烟了!

    科学家们正在开发一种人工智能设备“Level”,通过预测人们何时有烟瘾进而帮助人们戒烟。据悉,Level系统可以精确监控吸电子烟的行为,它被设计用来帮助使用者控制他们的烟瘾或减少他们吸入的尼古丁的量。

  • True Partner article: 未来不再是曾经的样子……对一个充满不确定性的世界之观察

    回顾及展望 新年好!对于个人和金融市场而言,都有一种解脱般的共识:“至少2020年总算过去了”。但在写这篇文章时,华盛顿特区的幕后正经历一场前所未有的事件,且Covid-19的严峻数据依然不断被刷新,人们很快就意识到一年只不过是界定时间的概念,而新一年的到来,并未改变目前的现状。但它仍然是一个新的机会,从新的视角去反思、总结、展望。我们从2020学到了什么?我们又应该期待怎样的2021? 回首2020,它在许多方面都如此异乎

  • 参与评论
文明上网理性发言,请遵守新闻评论服务协议
  • 热门标签