首页 > 关键词 > NLP最新资讯
NLP

NLP

自然语言处理,通常缩写为 NLP,是计算机科学和人工智能 (AI)的一个分支,它关注使计算机能够以与人类相同的方式理解口语和文本。NLP 技术理想地使机器不仅能够理解文本或语音数据,而且能够用自己的文本或语音做出响应。该技术借鉴了多个领域——计算语言学、机器学习模型、深度学习模型和统计模型——以更好地连接人机通信。

什么是 NLP,它是如何工作的?

NLP 的工作原理是将语言分解成更短、更简单的部分,称为标记。标记是我们用来串在一起并形成句子的语言部分,例如单词和标点符号。然后,NLP 技术尝试使用更高级别的 NLP 功能来理解这些令牌之间的关系,其中包括:

  • 内容分类:提供语言文档摘要,包括内容警报、重复检测、搜索和索引
  • 主题发现和建模:解释文本组的主题和含义,并将高级分析应用于文本
  • 上下文提取:自动从基于文本的源中提取结构化数据
  • 情感分析:识别存储在大量文本中的基于观点的语言
  • 文本到语音和语音到文本的转换:将语音命令转换为文本,反之亦然
  • 文档摘要:通过自动创建概要来压缩大量文本
  • 机器翻译:类似于语音翻译,自动将文本或语音从一种语言翻译成另一种语言。

自然语言处理被广泛用于各种行业并且有很多用途。一些突出的例子包括电子邮件过滤器、智能助手、搜索结果、预测文本、语言翻译、数字电话、数据分析和文本分析。

NLP 对于基于机器学习的数据标注过程也很重要。数据标注是指为数据添加注释或标记以便机器学习程序可以识别的过程。在 NLP 的上下文中,数据标记可以帮助计算机为口语或文本分配含义。NLP 是一种有用的数据标记方法,尤其是在处理文本数据时。NLP 可用于通过多种方法自动化数据学习。NLP 在数据标记中的一个常见用例是教计算机以一种称为命名实体识别的方法检测或发现句子的核心含义。可以教计算机识别某些单词或短语并为其赋予含义,例如检测“Eric”是一个人或“California”是一个位置。

NLP 可以为数据标记提供的另一种方法是语义分析——一种可以识别句子语调的算法。这种方法的一个常见示例是教计算机识别正或负的二进制音调,尽管已经使用了具有更多细微差别的更高级的分类器。此方法也可以应用于标题为“文档标签”的字段中的整个文档。

NLP 数据标记中其他更高级的任务包括:

  • 共指解析——查找对文本中特定实体的所有引用的任务
  • 依存关系解析——教计算机检查句子中单词之间的依存关系以分析其语法结构
  • 语法树——也称为解析树;指的是发现句子句法的树结构

这些方法可以帮助机器更好地分解句子的结构并导航人类语言中的歧义。上述方法也可以相互混合使用,以突出文档标签的单个单词。

与“NLP”的相关热搜词:

相关“NLP” 的资讯162449篇

  • 快手主导研究成果SAMP入选人工智能顶会EMNLP2023

    随着深度学习模型在自然语言处理等领域的广泛应用,模型推理速度和性能成为关键问题。由快手主导的研究成果《SAMP:基于自适应混合精度的训练后量化模型推理库》成功入选该领域顶级会议EMNLP2023,并于新加坡现场展示和分享。该会议曾推动了预训练语言模型、文本挖掘、对话系统、机器翻译等自然语言处理领域的核心创新,在学术和工业界都有巨大的影响力,此次入选也意味着快手在该领域的研究成果获得了国际学者的认可。

  • 斯坦福大学研究:通过自动偏好排名和NLP进展,降低大语言模型错误率

    研究人员从斯坦福大学和UNCChapelHill共同努力解决了大语言模型产生的事实性错误的问题,这些错误被称为“幻觉”。在没有人工标记的情况下,研究人员通过微调LLMs,采用新颖的方法,以在开放式生成环境中提高事实准确性。对提取原子事实的简化方法进行调查,并将事实性调谐方法扩展到更大的模型,如GPT-4,提出了进一步探讨的建议。

  • 深言科技联合清华大学NLP实验室开源LingoWhale-8B模型

    深言科技与清华大学NLP实验室联合开源了LingoWhale-8B模型,这是一种拥有约80亿参数的中英双语大语言模型。该模型在多个公开评测基准上达到领先效果,在10B以下开源模型中表现出色。商业用途下需要申请并获得官方授权。

  • 全面超越AutoGPT,面壁智能联合清华NLP实验室开源大模型「超级英雄」XAgent

    国内领先的人工智能大模型公司面壁智能又放大招,联合清华大学NLP实验室共同研发并推出大模型「超级英雄」——XAgent。通过任务测试,XAgent在真实复杂任务的处理能力已全面超越AutoGPT。XAgent拓展了AI智能体在执行复杂任务中的能力上限,让我们看到大模型技术融入生产和生活的前沿趋势和无限潜力。

  • 度小满积极布局“NLP+金融”领域 提升业务创新与风控效率

    度小满在“NLP金融”的技术落地之路深耕多年,在NLP方面的积累显得尤为突出。大模型的兴起为金融领域的NLP应用打开了新的想象空间。度小满的成功实践证明了NLP技术在金融领域的巨大潜力,也为未来的金融智能化发展提供了有效方向。

  • 复旦NLP团队发布80页大模型Agent综述,一文纵览AI智能体的现状与未来

    复旦大学自然语言处理团队推出LLM-basedAgents综述论文,全文长达86页,共有600余篇参考文献!作者们从AIAgent的历史出发,全面梳理了基于大型语言模型的智能代理现状,包括:LLM-basedAgent的背景、构成、应用场景、以及备受关注的代理社会。作者们探讨了Agent相关的前瞻开放问题,对于相关领域的未来发展趋势具有重要价值。就像其他的云服务一样,AaaS有潜力为用户提供高灵活性�

  • Prompt2Model:可自动生成专用NLP模型

    卡内基梅隆大学和清华大学的研究人员开发了Prompt2Model系统,可以根据提示自动生成专用NLP模型。Prompt2Model并不是GPT-4的替代品是用于特殊用途NLP模型的自动化管道,这些模型可以很好地执行特定任务,比大型模型小得多,因此可以在低端的的硬件上本地运行。团队正在探索集成大规模开源语言模型来减少对专有API的依赖。

  • 持续探索NLP+金融发展方向 度小满推动NLP加速落地金融场景

    随着AI应用领域的不断扩大,NLP技术也迎来了更好的发展时期。NLP技术在金融领域的应用可以说是备受期待。度小满从人才建设、技术创新等方面着手,不断探索NLP与金融结合的诸多可能性,持续推动NLP等技术落地金融各大场景,为金融行业创新发展注入活力。

  • 度小满积极布局NLP+金融 推动大模型技术在金融领域落地

    在金融行业数智化转型的过程中,如何推动NLP等前沿技术在金融领域的运用是度小满一直深入思考和探索的主题。度小满深耕“NLP金融”多年,做了充分的技术储备和人才培养,并斩获多项成果,持续推动NLP在金融场景的应用。作为深耕“NLP金融”技术落地之路五年的金融科技企业,度小满在NLP领域已经形成了一定的技术积累,未来有望迎来更多发展机遇。

  • 可直训ChatGPT类模型!华师大、NUS开源HugNLP框架:一键刷榜,全面统一NLP训练

    华师大HugAILab团队研发了HugNLP框架,这是一个面向研究者和开发者的全面统一的NLP训练框架,可支持包括文本分类、文本匹配、问答、信息抽取、文本生成、小样本学习等多种NLP任务模型搭建和训练。开源地址:https://github.com/HugAILab/HugNLP论文:https://arxiv.org/abs/2302.14286值得注意的是,HugNLP还集成了大量最新的Prompt技术,例如Prompt-Tuning、In-Context+Learning、Instruction-tuning,未来还将引�

  • 华为盘古大模型即将亮相:NLP、CV、科学计算全覆盖

    4+月+8+日至+9+日,由中国人工智能学会主办的人工智能大模型技术高峰论坛将在杭州萧山举办。会议议程显示,华为云人工智能领域首席科学家田奇将介绍「盘古大模型的进展及其应用」。在开始打造盘古大模型的时候,团队确立了三项最关键的核心设计原则:一是模型要大,可以吸收海量数据;二是网络结构要强,能够真正发挥出模型的性能;三是要具有优秀的泛化能力,可

  • 华为盘古系列AI大模型即将上线 包括NLP大模型、CV大模型等

    华为旗下的盘古系列AI大模型即将上线,该系列AI大模型中的NLP大模型、CV大模型、科学计算大模型已经标记为即将上线状态。盘古大模型采用了深度学习和自然语言处理技术,并使用了大量的中文语料库进行训练。借助创新的3DEST网络结构以及分层时间聚合算法,盘古气象大模型在气象预报的关键要素和常用时间范围上精度均超过当前最先进的预报方法,同时速度相比传统方法

  • 库克或被踢出苹果董事会 NLPC提议撤销其职务

    美国国家法律和政策中心计划在苹果公司的股东大会上行使其股东权利,提议撤销阿尔·戈尔和首席执行官蒂姆·库克在董事会中的职务。苹果公司年度股东大会将于3月10日举行,股东将有机会对提案进行投票、任命董事会成员或其他行政行为。"这两项提案都将在3月10日的股东大会上进行听取和表决。

  • 智能销售辅助系统有哪些?竹间以NLP技术打破传统销售弊端

    在传统的销售链路中,销售个人和企业的局限性都异常明显。在大部分行业的日常销售过程中,都多多少少存在客户信息冗杂,客户跟进不及时,客户重点不明确,客户流失率较高的情况。竹间Emoti Salesmate让人人都有机会成为金 牌销售,也让更多企业在数字化变革的浪潮里,有机会利用人工智能进入先行赛道,加速打造以知识数据驱动的新一代销售形态,获得可持续发展机会。

  • 蜜度智能校对获华为技术认证 前沿NLP应用助力发展昇腾AI生态

    作为首个通过华为昇腾AI生态认证的自然语言处理智能文本校对应用解决方案,校对通AI-Box将充分运用人工智能和边缘计算先进技术,为新时代语言文字和网络信息内容生态安全工作提供助力...在互联网跨模态信息检索和智能校对SaaS服务细分领域中, 2020 年市场占有率超过 12 %, 2021 年市场占有率超过 15 %,全国排名前三名......

  • NLPCC 2022对话文本分析评测比赛报名通道已开启

    就此,思必驰与千言开源数据集项目联合举办首届“对话文本分析评测比赛”,并发布模拟对话场景数据集...传统文本分析是在篇章级、段落级甚至句子级分析意图、理解内容、挖掘有价值信息,而对话文本分析任务则是在对话中挖掘明显的和潜在的信息...本次比赛在NLPCC2022 官网发起,现已启动报名并发布训练数据,获奖者不仅可获得NLPCC和CCF-NLP双重认证证书,亦有机会在NLPCC2022 发表论文...本次比赛以销售领域的对话为基础,提供两个对话领域的典型任务:对话主题抽取 [1],对话文本摘要生成 [2]......

  • 以NLP技术为核心,容联云对话式AI平台入选《2022中国对话式AI采购指南》

    容联云凭借以NLP技术为核心的对话式AI平台及智能客服应用,包括文本、导航、坐席辅助、陪练等丰富的对话式产品矩阵入选“中国对话式AI采购指南”核心供应商,并且入选金融行业典型应用案例...根据字母点评统计,2020年中国对话式AI市场规模达到32.3亿元,2021年达到50.5亿元,较2020年增长56.3%,呈现高速增长...未来,企业级对话服务场景需求仍将保持快速增长,预计2021-2025年中国对话式AI复合增速将达到25.4%,2025年中国对话式AI市场规模将达到125.0亿元......

  • 融营步入智能AI时代,深度探索NLP技术应用新场景!

    销售大脑的架构思路是希望通过NLP技术来对销售的沟通能力进行“分析-指导-优化-提升”,为使产品模型能深度贴合不同业务场景,融营智能充分发挥自身在通信领域内的优势条件,将日均通话时长超 200 万分钟的原始通话数据作为其研发数据库,让海量真实数据协助系统完成一次又一次的“大脑训练”,于是,产品模型也在一次又一次的训练中反复得到能力强化,这也是为什么融营智能的销售大脑将更具市场竞争力的核心原因......

  • NLPCC 2021丨场景驱动的创新,思必驰助力企业提质增效

    “NLPCC于 2012 年创建,每年举办一次,从 2014 年起成为自然语言处理及中文计算领域的国际学术会议。NLPCC2021 重点关注人工智能和大数据领域的自然语言分析和理解任务,继承往年NLPCC 会议的优势活动形式,本次会议组织了主题演讲、论文报告、专题报告、研习会、专题小组、技术评测、创新展示等多种学术活动。”金秋十月,硕果累累。 10 月 15 日- 17 日,由中国计算机学会主办、自然语言处理专业委员会承办的第十届CCF自然语言

  • 虎博科技陈烨:NLP加速产业互联网数智升级,惠及民生更幸福

    7 月 10 日,虎博科技创始人兼CEO陈烨博士出席 2020 世界人工智能大会(WAIC)云端峰会未来城市主题论坛,分享了以NLP为代表的人工智能新基建在智慧城市建设中的实践应用与价值。陈烨表示,人工智能新基建赋能ToB产业,能够真正惠及市民的美好生活,政务、传媒、通讯、能源等领域的国之重器更需要前沿人工智能技术赋能业务创新与服务升级。 (虎博科技创始人兼CEO陈烨博士发表演讲) 2020 年,被誉为新基建元年,以人工智能为代表的的

  • 【重磅AI课程】京东NLP企业项目实战训练营

    基于先进的AI技术和强大项目实战能力,为培养更多专业人工智能人才,京东经过长时间打磨面向大众学员推出“真企业级项目实战训练营”,让每一位学员切切实实接触到企业级的AI项目资源,从实战中提升自己。京东NLP企业项目实战训练营首期班正式定档啦, 6 月 1 日不见不散!一门专注于培养行业TOP10%NLP工程师的高级课程,已收录:Seq2Seq、Distillation、Transformer、XLNet、ALBERT等前沿框架实战;教学内容出自于京东智联云 3 大AI?

  • 云测数据:助力人工智能落地,NLP这条路还有多远?

    工作人员齐整坐好,每个人都对着电脑全神贯注,一件又一件的“东西”在眼前划过,经过标准化处理就转到下一流程……这实际上这是人工智能行业里的数据标注办公区一角由于深度学习的研究方向,人力密集型的数据标注工作是推进人工智能技术落地的重要环节之一。很长一段时间以来,在过往AI的发展中数据的采集与标注行业没有过多的被收到关注,毕竟,与算法、算力这些高大上的东西相比,AI数据的生产总带着那么几分与AI技术的“科技感

  • 阿里达摩院新技术拿下NLP顶赛第一名,超过谷歌微软等团队

    3月3日消息,阿里巴巴达摩院宣布,在全球自然语言处理领域顶级赛事GLUE Benchmark中,阿里巴巴达摩院以平均分90. 3 分的成绩获得第一名,刷新自然语言理解技术世界纪录,与阿里同场竞技的还有来自Google、微软、Facebook、斯坦福大学等企业和高校的团队。

  • “NLP心理学”自媒体权重排名,做自媒体怎么从零开始?

    备注:本文数据来自站长之家移动传媒平台,文章涉及的数据依托平台大数据计算所得,非百度官方数据,仅供参考。NLP心理学是当前百家号中的普通号,目前账号百家号权重为2,综合排名位列432765名,教育分类排名位列12849名,领先了61.1%的百家号。 NLP心理学百家号概况 NLP心理学的简介为专注传播NLP、心理学内容,是一家主旨明确、领域专注的自媒体作者,截止目前为止他们已经在百家号上发布了超过33篇的游戏内容,最近该作者创作?

  • 从AutoML到AutoNLP,深兰自研系统再发力夺冠NeurIPS 2019

    加拿大当地时间12月8日-14日,全球最受瞩目的人工智能和机器学习领域的顶级盛会之一,第33届神经信息处理系统大会(NeurIPS 2019)在温哥华召开。深兰科技DeepBlueAI团队分别在D²-City & BDD100K 目标检测挑战赛和AutoDL挑战赛(AutoNLP)中获得冠军,从技术层面助推了自动驾驶领域的发展和自然语言处理在多应用场景的落地。NeurIPS每年都会吸引大量专家、学者和AI领域从业人员的参与,目的是促进神经信息处理系统在生物、技术、?

  • 小米副总裁崔宝秋:MiNLP平台每天调用次数达60亿次

    11月19日小米开发者大会上,小米集团副总裁崔宝秋宣布,小米MiNLP平台每天调用次数达到 60 亿次。崔宝秋宣布,发布MiNLP1. 2 版,功能从词法分析扩展到句法和语义分析;小爱同学3. 0 正式上线,首次增加男性声音,同时成为首个能在手机上实现自然连续对话的语音助理。

  • 世界人工智能大会NLP行业论坛,达观数据、乐言科技联手世界级大咖洞见A

    备受业界关注的“ 2019 世界人工智能大会” 8 月 29 日在上海拉开帷幕。此次大会由国家发展改革委员会、科技部、工业信息化部、国家网信办、中国科学院、中国工程院和上海市人民政府共同主办。大会由一系列高端论坛、主题活动、应用展示和智能体验区组成,作为人工智能落地应用的领导者,达观数据与乐言科技联合主办了“理解语言,拥抱智能”主题论坛,和众多国际人工智能大咖探讨前沿技术及产业发展。达观数据CEO陈运文达观数据创

  • 从发展滞后到不断突破,NLP已成为AI又一燃爆点?

    AI行业应用是一片新的大陆,深度学习作为新大陆的基石,经历了一轮又一轮突破。过去十年,在计算机视觉、语音识别、棋类AI等计算和感知智能技术上,深度学习率先取得成功。而最近深度学习在认知智能/自然语言处理上的进展,特别是Transformer衍生模型加上两阶段预训练语言模型范式的成功,正在将自然语言处理变成人工智能下一个最有可能的突破口。 计算机视觉与语音的成功是破茧成蝶而非横空出世 从 2010 年到 2017 年,从LeNet到

    NLP
  • 谷歌 BERT 在环信 NLP 中的应用

    Google 的 BERT 模型一经发布便点燃了 NLP 各界的欢腾,Google Brain 的资深研究科学家 Thang Luong 曾给出其“开启了 NLP 新时代”的高度定义,国内外许多公司及开发者对其进行了研究及应用,本文作者及其团队对 BERT 进行了应用探索。 随着 Google 推出的 BERT 模型在多种 NLP 任务上取得 SOTA,NLP 技术真正进入了大规模应用阶段,环信一直致力于帮助企业应用先进的AI技术提高生产效率,对于 BERT 的探索我们一直走在了行业前

  • 搜狗搜索承办“AIS 2019”论文研讨会 聚集国内顶尖人才共话NLP前沿发展

    5 月 25 日至 26 日,由杭州钱塘新区管委会和中国中文信息学会联合主办,杭州大创小镇及搜狗(杭州)智能科技有限公司承办的AIS 2019(ACL、IJCAI、SIGIR)论文报告会在杭州如期举行。作为顶级的自然语言处理与信息检索国际论文研讨会,“AIS 2019”邀请了 60 余位论文被录用的作者进行现场展示,分享文本生成、阅读理解、机器翻译和信息检索等前沿领域的最新研究成果。杭州钱塘新区管委会副主任王永芳,中国中文信息学会青年工作