首页 > 动态 > 关键词 > 腾讯工程师最新资讯 > 正文

腾讯工程师提议用中文索引算法创建DNA搜索引擎

2010-07-02 08:24 · 稿源:Solidot

科学家解码了越来越多的基因组,但对遗传学家或研究人员来说,寻找有机体的共享基因组是一件十分艰巨的任务——因为要对比的DNA字母难以计数。如何快速搜索巨大的生物信息学数据库?多数研究人员使用的是BLAST或FASTA算法,它们本质上逐一比较每个基因组。现在中国第三大搜索引擎、腾讯旗下搜搜(SOSO.com)的一位计算机科学家王亮(Wang Liang)提出应用中文索引算法去检索生物信息。

王亮指出,中文的每个字之间没有留下间隔,因此索引中文文档的一种方法是将文本分解成N个片段(n-grams),N代表字数,1-grams表示一个汉字,2-grams表示两个汉字,3-grams表示三个汉字,一些中文搜索引擎就只索引2-grams。王亮称,DNA序列的统计分布应该遵循齐夫定律(Zipf‘s law)。齐夫定律是指一个单词出现的频率与它在频率表里的排名成反比,频率最高的单词出现的频率大约是出现频率第二位的单词的2倍,而出现频率第二位的单词则是出现频率第四位的单词的2倍。王亮应用同样标准去寻找拟南芥、曲霉、果蝇和老鼠的基因组字母平均长度,他发现平均长度为12个字母,因此用12-gram索引基因组数据也许最优。

  • 相关推荐
  • 大家在看
  • 分析师认为苹果应该收购DuckDuckGo搜索引擎 以向谷歌施压

    伯恩斯坦公司(Bernstein)分析师Toni Sacconaghi在分享的一份研究报告中表示,苹果应该收购一家搜索引擎公司,向谷歌施加压力。

  • 百度回应腾讯告老干妈涉某搜索引擎:手里的瓜突然不香了

    7月1日,随着贵阳警方发布了腾讯与老干妈千万广告费纠纷案是因为3人伪造印章与腾讯签合同,也让这件事情真相大白。但网上传闻“腾讯状告老干妈拖欠广告费提及某搜索引擎”,对此百度官方回应称“手里的瓜突然就不香了”。

  • 谷歌前广告主管正在打造一款无广告的搜索引擎

    据外媒报道,Sridhar Ramaswamy于 2013 年成为谷歌广告和商务高级副总裁。他领导着这个价值 1150 亿美元的分支机构达五年之久,该机构负责通过AdSense在搜索、YouTube和网站上出现的广告。但因受够了谷歌的暴利和客户与广告商之间的利益冲突,Ramaswamy选择离开谷歌并创建了自己的搜索引擎。

  • 谷歌向苹果支付数十亿美元,使其成为Safari的默认搜索引擎

    英国监管机构周三发布了有关苹果Safari浏览器和谷歌搜索引擎交易的调查报告。英国竞争和市场管理局(CMA)最新报告显示, 2019 年,谷歌共向英国支付了 12 亿英镑(约合 15 亿美元)的费用,成为英国各种移动设备上的默认搜索引擎,其中,绝大部分付给了苹果公司。

  • 谷歌英国向苹果交了15亿美元“保护费” 成Safari默认搜索引擎

    据路透社报道,英国监管机构正在审查苹果和谷歌之间的一项长期协议,该协议涉及苹果设备将谷歌设置为默认搜索引擎。

  • 失去大将!苹果前工程师辞去英特尔高管职务

    苹果前工程师吉姆·凯勒(Jim Keller)自 2018 年以来一直在英特尔工作,他将离开这家公司。在一份公开备忘录中,英特尔表示,凯勒因个人原因辞职,今天生效(美国当地时间 6 月 11 日,)。他是担任英特尔的高级副总裁和总经理,主要负责芯片的设计。

  • 经福特中国工程师测试,福特车漆经得住考验?

    在广场看到一群白鸽飞舞,是多么美好的一副场景。在树荫下听到鸟儿叽叽喳喳的叫声,令人心情愉悦。可是,美好的事物背后总有让人难以接受的一面。鸟儿在美,声音在动听,你也无法改变它乱排粪便的问题。相信各位车主的爱车肯定都被鸟粪光顾过,虽然为此头疼,却无法避免,除了有损颜面对车漆也有损害。福特中国工程师为此做了认真的功课。由于鸟粪里含有的尿酸对车漆具有一定的腐蚀性,轻则漆面氧化,失去光泽,严重的会导致车漆的

  • 工程师们为人工智能瓶颈提供了聪明、及时的解决方案

    莱斯大学的研究人员展示了设计创新的以数据为中心的计算硬件的方法,以及将硬件与机器学习算法共同设计的方法,这两种算法可以将能源效率提高两个数量级。机器学习是自动驾驶汽车和许多其他高科技应用背后的人工智能形式,它的进步开创了一个新的计算时代——以数据为中心的时代,并迫使工程师们重新思考75年来几乎没有受到挑战的计算体系结构的各个方面。电气与计算机工程助理教授林英彦(音)说:“问题是,对于目前机

  • 小米10遭遇音量问题?工程师到用户家中做测试:真相大白

    关于少数用户反馈的音量小问题,小米手机系统软件部总监张国全在微博撰长文予以详细回应。此次小米方面直接联系到了北京米粉,带手机到这些用户家里做现场对比。为进一步严谨科学,最后还回到

  • “打”两份工还独自成功开发APP,这位女工程师经历了什么?

    今天要跟大家分享的是女性独立开发者Jen Yip的创业故事。Jen Yip是一个女工程师,在推特有 4 年的工作经验,后来在硅谷和合伙人共同创办了一家宠物健康初创公司。由于厌倦了硅谷的生活,她决定周游世界,旅游结束后再也没有正经上班,而是当一个自由自由职业者,并独立开发一款基于订阅的个人理财和预算的web app——Lunch Money。

  • 猿辅导招聘服务器端研发工程师(JAVA)诚邀技术大拿

    猿辅导是一家在线教育领域的互联网公司,众所周知互联网公司最重要的岗位非程序员莫属,猿辅导也不例外,近日猿辅导招聘服务器端研发工程师(JAVA)正如火如荼的进行着。猿辅导可以为工程师们提供舒适的工作环境以便大家可以大显身手。猿辅导望京办公楼猿辅导的这份工作主要内容是负责猿辅导主app相关产品服务器端的开发,而且作为一名有经验的研发工程师,你还需要指导新人进行开发。猿辅导的办公环境对于这个岗位,猿辅导有相应?

  • 坚守匠心 厚积薄发——CAXA CAM制造工程师2020版正式发布

    2020 年 6 月 9 日,数码大方(以下简称CAXA)完全自主研发的CAXA CAM制造工程师 2020 版正式发布。制造工程师2020 是基于CAXA 3D实体设计 2020 平台全新开发的CAD/CAM系统,采用全新的3D实体造型、线架曲面造型等混合建模方式,涵盖从两轴到五轴的数控铣削加工方式,支持从设计、编程、代码生成、加工仿真、机床通信、代码校验的全流程闭环设计制造模式。 30 年深耕细作,高擎国产CAD/CAM大旗 CAD/CAM作为核心工业软件,是“工业知

  • AR初创公司Magic Leap起诉前工程师窃取技术一案遭驳回

    6月18日消息,据国外媒体报道,增强现实(AR)初创公司Magic Leap起诉其前工程师窃取技术一案遭驳回。当地时间周三,加州圣何塞的联邦法官卢西·柯(Lucy Koh)批准杭州太若科技公司(以下简称太若科技,也称Nreal)创始人徐驰提出的撤销此案的请求。她认为,Magic Leap对徐驰的指控没有充分的证据。去年6月份,Magic Leap对徐驰提起诉讼。该诉讼以太若科技为共同被告,指控徐驰违反了合同、欺诈和不公平竞争。该公司?

  • 销售易:拥有这四项CRM神技能,维修工程师秒变“维修侠”

    几天前,国内某著名家电厂商的维修工程师,在服务过程中,遇见女童悬挂 6 楼窗外,毫不犹豫,徒手爬楼,救下女童,因而获得厂商见义勇为奖励——价值 60 万元的房产一套。维修工程师化身“维修侠”,一时间收获了一众好评。甚至有各种网友立下Flag要购买该品牌的产品。可见,“维修侠”良好的现场客户服务,不仅强化了品牌形象,也带来了更多的销售机会。这也是为什么在产品技术趋于同质化、产品价格愈发透明化的今天,企业越来越?

  • 中文播客,到底何时才能火起来?

    “播客的听众是很多的,但就像雪花牛里的脂肪,细细碎碎地融入到了肌肉里。”这句话来自“小宇宙播客App” 6 月 4 日发布的一条微博。

  • Epic方舟怎么设置中文 Epic方舟生存进化中文设置方法

    Epic平台上免费领取到《方舟生存进化》之后要怎么把游戏的语言设置成中文呢,在游戏初始默认是英文语言,这里我们来了解下降方舟的语言设置成中文的详细步骤。

  • 用算法寻找肿瘤的分子弱点,代码真的能治愈癌症?

    ruxolitinib试验是哥伦比亚大学系统生物学家Andrea Califano历时十年的追求的产物。通过复杂的计算,他对催化癌细胞的分子网络进行建模,并精确定位到转录因子蛋白作为关键因子,从而控制细胞内许多基因表达。

  • 中文播客迷思:小众乌托邦还是新的流量洼地?

    从接触到播客这种媒介,到创建自己的播客网站并成为一名主播,梦妮只用了半年时间。“我们对社会议题有观点,我们想要做有价值的东西,作为青年人,我们不想沉默”。

  • 3人伪造老干妈印章与腾讯签合同 百度搜索躺枪 回应:这事与我无关

    7月1日下午,针对网传“腾讯状告老干妈拖欠广告费提及某搜索引擎”一事,百度今日下午发布微博称,“手里的瓜突然不香了......有一说一,这事与我无关。请大家不传谣不信谣,理性

  • 从零学习人脸识别:产品经理需要了解的算法通识

    人脸识别功能在日常生活中已经越来越常见,像车站检票、银行核验身份、上下班打卡……尽管技术本身随处可见,但真正了解技术原理的人并不多。虹软视觉开放平台策划了《从零学习人脸识别》系列课程,系统讲解这门技术的技术原理和应用现状。第一期《人脸识别算法初识》课程,主要介绍人脸识别运行流程、应用场景及商用门槛等场景问题。【人脸识别的技术原理】最近几年,随着深度学习的发展以及计算机算力的提升,包括人脸识别在内的

  • 参与评论
文明上网理性发言,请遵守新闻评论服务协议

热文

  • 3 天
  • 7天