首页 > 动态 > 关键词  > 谷歌最新资讯  > 正文

谷歌开源项目飞马PEGASUS:可以自动进行文章摘要

2020-06-15 09:33 · 稿源: TechWeb.com.cn

谷歌于去年年底发布了一个精简型的机器语义分析项目:飞马(PEGASUS):预先机器学习及训练后的自动文章摘要项目。近期这个项目迎来的新的版本,这个小型项目可以非常精准的自动提取出文章中的摘要,并且只用一千个训练模型就可以生成媲美人类的摘要内容。

当对包括文本摘要在内的下游NLP任务进行微调时,最近针对大型文本语料库进行自我学习的目标的预训练工作已显示出巨大的成功。

但是,尚未探讨为抽象文本摘要量身定制的预训练目标。此外,缺乏跨不同领域的系统评估。在这项工作中,我们提出了在大规模文本语料库上使用新的自我训练目标对基于大型编解码器模型进行预训练的方法。在PEGASUS中,重要句子从输入文档中删除/掩盖,并作为其余句子的一个输出序列一起生成,类似于摘录摘要。

我们在涉及新闻,科学,故事,说明,电子邮件,专利和立法法案的12个下游汇总任务中评估了最佳PEGASUS模型。

实验表明,在通过ROUGE分数衡量的所有12个下游数据集上,它均达到了最先进的性能。我们的模型还显示了在低资源汇总方面的令人惊讶的性能,超过了仅使用1000个学习后的6个数据集上的最新结果。

最后,我们使用人工评估验证了我们的结果,并表明我们的模型摘要可在多个数据集上实现人工表现。

附件:如何部署一个自动摘要的环境

项目地址:https://github.com/google-research/pegasus

设定使用GPU在Google云端上创建实例(可选)

请先创建一个项目并创建一个实例

gcloudcomputeinstancescreate\${VM_NAME}\--zone=${ZONE}\--machine-type=n1-highmem-8\--acceleratortype=nvidia-tesla-v100,count=1\--boot-disk-size=500GB\--image-project=ml-images\--image-family=tf-1-15\--maintenance-policyTERMINATE--restart-on-failure安装库和依赖项

举报

  • 相关推荐
  • 「6月26日AI日报」可灵AI推全球首部AIGC单元剧;谷歌开源AI智能体Gemini CLI

    AI行业近期动态汇总:1)豆包AI编程升级为"应用创作1.0",支持可视化编辑和实时预览,降低开发门槛;2)谷歌开源Gemini CLI工具,集成Gemini 2.5 Pro模型,提供免费编程助手;3)Anthropic推出"Artifacts"功能,用户无需编程即可在Claude中创建AI应用;4)出门问问发布TicNote+硬件产品,内置Shadow AI技术;5)OpenAI将Codex CLI重构为Rust语言以提升性能;6)谷歌发布Imagen4文生图模型,突�

  • WeGame还有机会么?

    ​随着腾讯游戏业务发展如火如荼,从产品到平台各个摩拳擦掌,但WeGame已经“失声”了很长时间。 上一次聊WeGame还要追溯到2020年的0分成(在WeGame平台同步首发上线的国产单机游戏或创新玩法类产品,1000万元人民币流水以内,平台不再收取任何分成)以及19年的上线国际版WeGame X。 哪怕是去年《黑神话:悟空》的火爆借其东风,也没能完全覆盖掉过去留给玩家LOL启动器的刻�

  • 如何用 DeepSeek 制定项目管理计划

    本文介绍了如何利用DeepSeek AI工具快速完成电商双十二促销网页开发项目。关键点包括:1.通过DeepSeek平台输入详细需求指令,系统会生成项目管理计划和甘特图代码;2.将代码复制到Mermaid等在线渲染工具中可视化查看项目进度安排;3.根据可视化结果优化调整计划,确保任务时间节点和依赖关系合理。该方法能帮助团队在一个月内高效完成女鞋促销页面的开发上线,特别适合电商节日促销等时效性强的项目。

  • AI日报:阿里开源3D数字人项目MNN TaoAvatar;MiniMax Agent上线;罗永浩数字人直播再探“AI+IP”带货模式

    本文汇总了AI领域最新动态:1)阿里开源MNN+TaoAvatar技术,实现手机端3D数字人实时交互;2)MiniMax升级AI工具Agent,新增智能图像搜索和多语言支持;3)罗永浩数字人将登陆百度电商直播;4)OpenAI员工套现近30亿美元,软银成最大接盘方;5)ChatGPT推出深度研究和语音模式升级;6)Meta发布V-JEPA2模型,提升机器人环境适应能力;7)AMD与OpenAI合作推出新一代AI芯片;8)Google Gemini集成Imagen4图像生成模型;9)谷歌AI实现10公里级精准天气预报;10)Gartner预测到2028年80%的AI应用开发时间将缩短50%。

  • 雷军:小米YU7销量肯定比SU7高 但SU7也不会低

    今晚7点,小米举行人车家全生态发布会,会后小米创办人雷军进行了分享。 他表示,之前内部特别担心,YU7发布以后会不会没有人买SU7了,其实我挺自信的,我觉得喜欢开轿车的人和喜欢SUV的人其实是两类人,虽然有很多重合度,但还是有很多人喜欢轿车,觉得轿车开起来舒服,当然也有人觉得SUV空间大,所以是两种完全不一样的人,都有固定的铁粉。 雷军还提到,小米内

  • 如何用DeepSeek一键自动生成Word文档

    DeepSeek推出AI自动排版Word文档功能,用户只需输入指令即可一键生成格式规范的文档,大幅提升办公效率。操作流程:1.在DeepSeek对话框输入文档要求并指定HTML格式输出;2.AI处理完成后点击运行按钮;3.页面会出现下载Word按钮,点击即可获取自动排版的文档。该工具同样支持生成PDF、Excel等格式,只需修改指令中的文件类型即可。免费工具地址:https://www.deepseek.com

  • 迅雷发布下载MCP服务:一句话让AI自动找资源并下载

    迅雷发布下载MCP服务,打破了传统下载模式,一句话即可让AI自动帮你下载。 该项服务同时支持PC版迅雷和NAS迅雷,现所有用户均可免费使用。 目前,迅雷MCP支持在纳米AI、扣子空间、Cursor、Cherry Studio等国内外各个主流大模型应用接入,让AI变身为您的下载助手。

  • 微柏软件承担项目入选“2025年度国家档案局科技项目拟立项项目名单”

    国家档案局公布2025年度科技项目拟立项名单,微柏软件与多家单位合作的特高压直流输电工程电子档案管理项目成功入选。该项目由微柏软件联合中国南方电网超高压输电公司、中山大学数据归档与档案安全国家重点实验室、广东藏粤直流电力运营有限公司共同承担,聚焦战略协同下的特高压直流输电工程电子档案管理与技术创新应用研究。这是微柏软件在工程电子档案领域的又一突破,进一步巩固了其在该领域的国内领先地位。

  • 免费使用!荣耀MagicPad 3平板首发AI PPT功能:自动生成

    荣耀终端股份有限公司平板与IOT产品领域总经理@荣耀平板利用哥 发文透露,荣耀MagicPad 3平板将首发AI PPT功能,可以将文档快速生产为用户想要的PPT。 最重要的是他强调,所有这些功能,包含文档格式转化、AI PPT等都是免费的,而且会覆盖现有在售机型和存量平板。

  • 雷军否认小米YU7是拉高版SU7 预计YU7和SU7会一样火爆

    而对于“小米YU7是不是就是一款拉高版SU7”的疑问,雷军给出了明确答复:不是。他解释道,虽然YU7和SU7都基于小米Modena平台开发,但YU7项目有90%的零部件都进行了重新开发。在驾驶风格上,YU7在运动风格的基础上偏向舒适,与SU7有着不同的风格特点。雷军表示,消费者试驾后就能明显感受到两者的差异。