首页 > 优化 > 关键词  > 百度分词技术最新资讯  > 正文

萧涵:略谈百度中文分词技术

2011-06-01 14:40 · 稿源:xiaohan86.com

《萧涵:略谈百度中文分词技术》文章已经归档,站长之家不再展示相关内容,下文是站长之家的自动化写作机器人,通过算法提取的文章重点内容。这只AI还很年轻,欢迎联系我们帮它成长:

这里萧涵给大家谈下一百度的中文分词(当然也不局限于百度,其他搜索引擎也是差不多的)...

在总控部分的协调下,分词子系统可以获得有关词、句子等的句法和语义信息来对分词歧义进行判断,即它模拟了人对句子的理解过程...

举个例子说,“搜索引擎优化”,在字典中匹配出来可能是:搜索/引擎/优化、搜/索引/擎/优化,但经过后期的概率计算,发现“搜索引擎优化”在上下文相邻出现的次数非常多,那么基于统计就会将这个词语也加入进分词索引库...

分词准确性对搜索引擎来说十分重要,但如果分词速度太慢,即使准确性再高,对于搜索引擎来说也是不可用的,因为搜索引擎需要处理数以亿计的网页,如果分词耗用的时间过长,会严重影响搜索引擎内容更新的速度...

......

本文由站长之家用户“xiaohan86.com”投稿,本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间,为了保证文章信息的及时性,内容观点的准确性,平台将不提供完整的内容展现,本页面内容仅为平台搜索索引使用。需阅读完整内容的用户,请联系作者获取原文。

举报

  • 相关推荐
  • YY直播首部AIGC短剧上线:借助百度技术优势 强化生态短剧概念

    YY直播旗下短剧厂牌麦穗上线首部AIGC短剧《权谋之帝王心术》,该剧基于YY主播真实生态故事改编,以主播为人物原型,百度AIGC参与剧本创作并完成视觉呈现,制作成本和周期较真人短剧下降超50%。作为直播行业首部AIGC真人短剧,YY借助百度技术优势参与"百剧计划"重点项目。该剧共4部,首部6月17日上线,用户可通过YY等平台观看。麦穗厂牌主打生态短剧概念,已上线多部原创作品,深度植入YY生态故事并由主播出演主角。通过AIGC技术,该剧制作成本降低58%,周期缩短53%,避免了档期、场地等传统制作难题。未来YY将持续深化"生态故事+AIGC+多平台分发"的特色短剧运营模式。

  • 一场没有“罗永浩”的直播,为百度AI正名

    5500万GMV,这可能是迄今为止,一个AI数字人单次直播带来的最高销量。 过去几年内,数字人直播代替真人主播的传言总是一波又一波,空无一人的直播基地无数手机屏幕“自动地”产生着GMV,这个画面曾经击中了无数网友的心。但现实是,这些数字人们机械重复的动作、无法随机应变的话术反而让真人主播们都松了一口气。 但这次,真正的转折点来了。6月15日,罗永浩数字�

  • 罗永浩担任百度慧播星首席产品体验官 入驻百度优选进行真人直播带货

    百度宣布,罗永浩将正式担任百度慧播星首席产品体验官。 除了罗永浩本人入驻百度优选进行真人直播带货外,其数字人也将不定期开播、常态化为用户带来更多福利。 6月15日,罗永浩数字人直播首秀创下超1300万人次观看、GMV突破5500万元的行业新纪录,部分核心品类带货量反超真人直播。 百度文心大模型化身灵魂编剧”,基于老罗人设和商品特性,开启了全新大师级剧本

  • 从大学到中学:2025百度商业AI技术创新大赛播种未来科技人才

    百度商业AI技术创新大赛聚焦生成式AI与商业场景融合,2025年第三届赛事全面升级,设置三大前沿赛道:生成式广告推荐算法优化、视频广告生成推理性能优化、搜索场景视频广告AIGC产品优化。大赛走进吉林大学等高校开展宣讲,并延伸至中学进行AI科普,激发青少年科技热情。赛事旨在挖掘优秀人才,推动AI技术创新与产业落地,为中国AI领域培育未来之星。

  • PK本尊,百度电商新解数字人

    6月15日晚,罗永浩数字人在百度电商完成首场直播,该场直播GMV突破5500万元,数据超过了5月23日罗永浩本人在百度电商直播时的GMV。 进一步对比两场直播,可以看到很多有趣的细节。 “先本尊,后替身”的两场直播带货说明百度电商在过去两年时间内已完成基础建设。百度优选在接受采访时提到,“我们在GMV上没有压力,百度优选作为电商行业的新玩家,历史包袱并不多,

  • 今夏增长卷上天?看百度商家智能体玩转服务预约!

    文章探讨了数字化浪潮下商家经营从"经验驱动"转向"智能驱动"的趋势。通过教育、旅游、法律三大行业的实战案例,展示了智能体如何助力企业实现"省人、省心、省钱"目标。在教育领域,智能体帮助机构精准解读家长需求,提升招生效率;在旅游业,智能体化身"旅行搭子",提供个性化行程规划;在法律行业,智能体24小时提供专业咨询和情感支持。智能体正从单纯工具进化为懂行业、懂场景、懂人心的"金牌销售",通过预约化服务和场景适配能力升级,助力企业降本增效,实现服务温度与商业效率的双赢。

  • 百度回应支付李彦宏私人飞机费用:合理操作 大厂普遍存在

    百度发布2025年Q1财报:总营收325亿元,同比增长3%;核心营收255亿元,增长7%;净利润77亿元,大增42%。财报披露公司向董事长兼CEO李彦宏支付飞机相关费用引发关注。百度回应称该信息已在4月年报中披露,费用经内部审批流程规范合理,强调上市公司交易行为有严格规范,且国内外大厂支付高管飞机费用属常见现象。此前百度集团曾表示,2022-2024年经董事会批准,将为李彦宏因公使用私人飞机产生的费用提供报销,费用标准参照同类飞机市场收费分析确定,且该费用占公司整体财务比重不大。

  • 百度任罗永浩为“慧播星”首席体验官 将再造10万数字人主播

    近日,罗永浩数字人”在百度电商开启直播首秀。 据百度提供的数据显示,数字人直播间开播仅26分钟,GMV便超过罗永浩真人直播1小时的成交额,最终以7小时5500万元的战绩收官。 据统计,90%的网络用户在观看直播后评价都非常正向,且纷纷表示数字人直播与真人直播已真假难辨”。 不过,也有网友评论:还是不能完全替代罗老师”。 为验证AI主播 真人IP”混合模式的商�

  • 数字人老罗也要交个朋友!“罗永浩数字人”将于15日亮相百度电商

    罗永浩今日在微博宣布自己的数字人”将在6月15日亮相百度电商直播。 罗永浩称这次直播就两件事儿:人虽然是我的数字人,但货还是老罗严选的好货;价格还是实惠厚道,数字人老罗也要交个朋友。 罗永浩解释:最近自己发现头部带货主播基本没做过数字人,于是就让百度给自己做一个,本周日晚17:00就开始带货。” 他表示:虽然相信百度的技术底子,但他还是不放心,

  • peak怎么设置中文 peak游戏怎么切换中文?peak改中文方法

    《PEAK》是一款Steam热门多人合作攀岩游戏,玩家需在险恶环境中协作登顶。游戏每24小时更换新山峰,开放地图和自由路线带来丰富体验。虽然原版无中文,但可通过迅游加速器实现一键汉化:1.下载安装汉化补丁 2.客户端输入"游戏冲冲"获取工具 3.点击"一键汉化"完成设置。该工具还提供网络优化功能,确保多人联机流畅。游戏需配合迅游加速器使用,解决海外服务器延迟问题,实现丝滑协作体验。