猿题库李勇:如何从一万套试卷中生产出一套“只为你定制”?

2013-08-29 09:18 稿源:钛媒体  0条评论

编者注:考试服务,在国内被做到了极致。中国内地特色的考试市场,多年来一直是块吸引创业者的大蛋糕,鼎鼎大名的新东方就是从热门的留学资格类考试起家。如今,国家公务员考试当属最热门考试,据媒体报道,2013年国家公务员考试报名人数突破200万人,潜在的备考人员已经形成了一个百万级的用户市场。看准了市场的创业者们,已经在开始探索新的考试服务,希望颠覆过去买书、买资料、上培训班的主流备考方式。比如龚海燕的91外教网、91UP以及今天我们要分享的创业公司猿题库。

猿题库创始团队是典型的“网易帮”,从CEO李勇到创始团队的帅科、李鑫、郭常圳都是从网易出走的老员工。这是一家基于数据推荐的习题库应用,包括网络在线社区和移动端App。基于大数据推荐的产品模式、海量的潜在用户,被认为是这类应用的先天优势。

然而,钛媒体对这类创业公司保持观望。毕竟,把线下用户抢夺到移动端,并改变他们的消费习惯(从免费到付费)是最大的挑战,再好的体验也无法弥补用户不愿意付费的窘境;另外,习题——相当于非版权内容,被盗用的风险很高,这些,都必然迫使团队不断提高以“服务”为重点的核心竞争力。宏观来看,国内的在线教育(MOOC)实践,还停留在“学步”阶段。猿题库所代表的创业项目,是希望颠覆“习题备考”服务的移动互联网应用,还远远称不上高端大气上档次的MOOC。如果国内的在线教育繁荣,未来将寄希望于“考试服务”,从这事还是让人有点悲哀。

来看看猿题库在“大数据”推荐上的探索和他们对未来新模式的更多想法。以下为钛媒体特约作者、长期关注互联网及传媒领域的行业资深记者杨晓音 采写的报道:

“考试拿高分是个从猿到人痛苦的过程,而猿题库则可以把这个过程变的简然有趣。” 这是猿题库创始人兼CEO李勇。

作为一个产品为习题库的创业者,这一回,李勇给自己出了一个不大不小难题。

李勇曾经创办针对教育行业的互联网社区粉笔网,尽管得到投资人的青睐,但被他自己评价为“过于理念化的产品”,粉笔网发展并不顺利。然而,很快新点子来了,基于数据推荐的在线习题库应用“猿题库”于今年2月18日正式上线了。如今,李勇的团队已先后推出公务员行测、公务员申论、国家司法考试、考研政治、一级建造师、企业法律顾问和初级会计职称题库。

据猿题库最新数据显示,使用手机客户端的用户是网站用户的2倍。在线做题,尤其是用智能手机等智能终端做题备考,已被考生广泛接纳并成为趋势。在李勇心中,一场关于习题的革命正潜行蓄势。

大数据推荐:“一万套试卷中产生出一套专属你的卷子”

当考生李田田在猿题库上注册自己的私人帐号时,并开始进行“行测”的第一轮测试时,他已经开始了自己在猿题库的数据旅行。

由于第一套题是根据专家的标注,给出的固定的15道题,因此和李田田一样,其他240060名用户也都经过这样一个测试。而因为测试结果的不同,这些用户拿到了属于自己的第二套题——而这套题则是大数据运算的产物。

猿题库联合创始人兼产品技术总监郭常圳向记者详细解释了第二套题的生成过程:

“因为第一套是从1500道题里挑选15道题,产生一份试卷,用户完成后,系统会根据你练习的掌握情况,包括知识点、难度等,自动生成100套题,然后根据遗传基因算法,两两适配,这个时候,题目从100套变成200套,系统对200套卷子根据你的情况打分,过滤掉一半,从而留下100套卷子再进行打分评价,再两两组合并挑选得分高的一半试题,重复以上步骤100次。这样几乎是从一万套试卷中产生一套专属你的卷子。”

也就是说,在这个过程中,每个用户的行为就是大数据运算的来源,用户接受运算结果,继续做题的同时,也给数据库充入新的数据源。用户做题越多,系统对他能力的评估就越精准,越能给用户量体裁衣推送题目。

“这就像是玩一款游戏一样,你参与进来以后,通过你的做题表现,实际上形成了自己的做题进程,这个时候你就很难抛弃而要一直做下去,因为这里有你的数据,这些数据对你认识自己的能力很重要。”

那么,问题来了,如何保证准确?

郭常圳挑选了IRT项目反应理论作为数据模型的基础。IRT理论目前广泛地应用在心理和教育测量领域,是一套用来分析考试成绩或者问卷调查数据的数学模型。

能够真实地反映考生能力水平,是郭常圳看重IRT项目理论的最重要原因。简单的说,就是做同样分值的10道题后,即使A考生和B考生同时对了5道题,但是依据IRT理论的算法得出的成绩也会有所不同。这是因为IRT能够根据每道题的难易程度和考生做题的先后顺序对成绩加以区分。

这个系统能够测试出用户的实际能力,但准确度取决于考生做题的数量。郭常圳解释说,过程是这样的:在用户做完第一轮题目后,系统会根据答题情况形成初步的能力估值数;第二轮时系统则会挑选出用户的易错题,减少用户做对的题的出现频率。随着做题的次数增多,系统会自动调整用户能力的估值数,直到整体数值趋于某一个固定数值。这相当于一个求极限的过程,用户做的题目越多,系统越能正确地预测用户的实际考试考分。

另外,这套系统还设置有自动提醒功能。也就是说,如果10个系统认定高分的考生都错在同一道简单题上,那么后台将会自动提示“这道题答案可能错了”,工作人员会及时对该题进行核查。因此,对猿题库的整体系统和算法而言并不是封闭和死板的,而是可以不断优化,去弥补现在的遗漏之处。

有好的文章希望站长之家帮助分享推广,猛戳这里我要投稿

相关文章

相关热点

查看更多