首页 > 传媒 > 关键词  > 正文

百度王颖:大模型重构百度文库,成为“学习办公神器、家庭教育利器、兼职赚钱暗器”

2024-05-24 17:04 · 稿源: 站长之家用户

5月24日,36Kr新质生产力·AI Partner大会在北京举行。百度副总裁、文库事业部负责人王颖出席并发表《创作新纪元:人人都是内容创作者》主题演讲。她表示,在大模型重构下,百度文库成为“一站式AI内容获取和创作平台”,成为人人可用的“学习办公神器、家庭教育利器、兼职赚钱暗器”。

图片1.png

据王颖透露,自去年以来,百度文库已领先发布智能PPT生成、文档生成、思维导图生成、研究报告生成、拍图生文、智能画本、智能漫画、智能小说及全场景指令编辑等多种AI能力,累计AI用户数已突破1.4亿,AI功能使用次数已突破15亿。百度文库也希望携手行业伙伴,共同开启创作新纪元,让每个人都能成为内容创作者。

“学习办公神器”:“一句话”生成PPT、文档、思维导图等,研报生成达“咨询顾问”水准

经过十余年的发展,百度文库已积累12亿专业文档及4亿专业学术资料,拥有海量的学习和办公资源。在此基础上,百度文库借助大模型能力,发布多项AI功能,打通用户从内容查阅、编辑到创作的全链路,解决了很多用户“跨平台”、“起笔难”、“编辑难”等学习办公中的难点,成为“学习办公神器”。

在会上,王颖展示了一线用户的反馈。一位来自温州大学的建筑系教授,通过百度文库“智能文档生成”功能,一句话、几十秒就打造了一套“茶社设计方案”,从空间布局、装修风格再到家具、茶具选择及摆放,建筑设计标准非常比较准确,方案大纲和设计草案也非常详尽。一位来自贵阳医疗卫生机构的管理人员,利用百度文库AI一键生成“医院规章制度培训”PPT,不仅逻辑严谨、设计美观、配图丰富,还能自动生成配套演讲稿,大大提升了工作效率。

百度文库“智能PPT生成”功能,也得到了国家机构的认可。今年2月,国家工业信息安全发展研究中心发布《大模型赋能智慧办公评测报告——PPT生成》。百度文库以总分86分排名第 一,获得生成质量、意图理解、排版美化、可信保护等五项指标中的四项第 一,独占大模型PPT产品第 一梯队。

在内容生成之外,百度文库也非常注重内容的专业度和权 威性。3月,百度文库与国家信息中心中经网旗下中经数据达成深度合作,推出“智能研报生成”功能,全面覆盖工业、石油、电力等24个核心行业领域,依托其权 威、专业、可靠的宏观经济统计数据资源,让用户享受智能、有效的报告生成体验。

罗兰贝格全球合伙人李冰博士也表示,“百度文库的AI研报功能很超预期,生成的报告框架清晰、逻辑严谨,数据库支持权 威,感觉已经像有一定经验的咨询顾问写出的东西。”

“家庭教育利器”:行业首发“智能画本”,首创3D风格AI画本功能

在学习、办公场景之外,百度文库同样积累了海量的亲子教育资源,并通过“智能画本”等跨模态AI内容创作功能,成为很多宝爸宝妈的“家庭教育利器”。

据行业数据统计,欧美国家小孩每年的人均绘本阅读量为50本左右,而中国小孩只有10本,行业亟需更加优质、普惠的教育资源。在这样的背景下,5月20日,百度文库行业首发“智能画本”功能,让完全没有绘画能力的父母们,也能为孩子进行专属故事创作,门槛更低、操作更简单。

据悉,百度文库“智能画本”功能,在行业率先实现“图文声并茂”的AI视频画本创作能力,可以一句话、几分钟就创作出图文并茂、人声朗读的视频画本,未来还将上线自定义配音功能,大幅提升绘本朗读的音色拟真性和环境融合性,提供更加丰富、多元的专属故事创作体验。

同时,百度文库还和“猪猪侠”IP达成战略合作,行业首创“3D风格AI画本”创作功能,共同探索跨模态技术、IP内容共创等领域,引领“IP创作”走向人机共创时代。

据王颖介绍,很多宝爸宝妈日常购买实体画本居多,但实体画本价格贵、更新快、存在同质化,成为很多父母在家庭教育中的一大难题。在使用“智能画本”功能之后,很多宝爸宝妈很快喜欢上了这个功能,无论是课外读物还是睡前故事都能轻松搞定,起到寓教于乐的效果。

“兼职赚钱暗器”:AI画漫画、写小说、拍图生文,打造从创作到变现的“进阶之路”

而百度文库正在公测的“智能漫画”,更是百度文库在跨模态AI内容创作领域的又一创新探索。

目前,行业在“AI绘制漫画”上仍存在一定痛点,诸多AI漫画创作工具往往只能生成单图、四宫格图片,经常会出现场景关联性弱、人物不一致等硬伤,通常只能通过大量后期工作去补救。

而百度文库“智能漫画”,在行业率先打通AI漫画创作全链路,在多场景及多人物处理、人物一致性、故事完整性等方面处于行业领先。用户在百度文库只需要输入一句话主题,AI就可以全自动生成完整故事分镜及脚本,选择漫画风格、设定角色形象后,即可生成完整漫画作品,还可以在编辑器中进行精调。

据王颖介绍,无论开启副业、还是想做“斜杠青年”,百度文库在“兼职赚钱”场景赋能了非常多用户。比如,有一位白领,作为小说爱好者,在百度文库创作小说并发布在小说平台后,收获了上万点赞。一位大学生作为漫画爱好者,在百度文库从“漫画小白”到“迅速上手”,不仅激发了创作灵感,还能直接用AI生成漫画作品,在第三方漫画平台上投稿赚钱。

同时,利用百度文库“拍图生文”功能,自媒体达人只需要拍一张商品图片,就可以迅速生成小红书内容,语气美好适配小红书画风,轻松开启自媒体副业;宝妈可以通过拍摄宝宝的闲置用品,一键生成闲鱼转卖文案,节省了大量时间。通过智能漫画、智能小说、拍图生文等跨模态AI创作功能,百度文库正在帮助更多人,轻松走向从内容创作到商业变现的“进阶之路”,成为用户的“兼职赚钱暗器”。

自去年以来,百度文库一系列AI新功能的推出,获得了众多用户的喜爱和好评。根据AI产品榜4月榜单显示,百度文库AI功能位列国内总榜第 一名。据王颖透露,在5月30日即将举办的2024百度移动生态万象大会上,百度文库也将发布全新产品,联合更多IP及企业在内容创作领域展开重磅合作,共同打造跨模态AI内容创作生态,全民自由创作的时代或将来临。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 大家在看
  • LibreChat.ai:一站式AI聊天平台,自由定制,支持多种AI服务。

    LibreChat是一个免费、开源的AI聊天平台,提供广泛的定制选项,支持众多AI提供商、服务和集成。它以熟悉的界面,创新的增强功能,服务于所有AI对话,满足您所需的用户数量。

  • Genspark:AI代理引擎,提供个性化信息搜索体验。

    Genspark是一个AI代理引擎,它通过一个多代理框架提供个性化的信息搜索体验。与传统搜索引擎不同,Genspark的AI代理能够实时生成新的、定制的Sparkpages页面,直接满足用户的查询需求,从多个相关来源综合内容,提供高质量、无偏见的信息。

  • ShareGPT4Video:提升视频理解和生成的AI模型。

    ShareGPT4Video系列旨在通过密集且精确的字幕来促进大型视频-语言模型(LVLMs)的视频理解以及文本到视频模型(T2VMs)的视频生成。该系列包括:1) ShareGPT4Video,40K GPT4V注释的密集视频字幕,通过精心设计的数据过滤和注释策略开发而成。2) ShareCaptioner-Video,一个高效且功能强大的任意视频字幕模型,由其注释的4.8M高质量美学视频。3) ShareGPT4Video-8B,一个简单但卓越的LVLM,其在三个先进的视频基准测试中达到了最佳性能。

  • PixelProse:大规模图像描述数据集,提供超过16M的合成图像描述。

    PixelProse是一个由tomg-group-umd创建的大规模数据集,它利用先进的视觉-语言模型Gemini 1.0 Pro Vision生成了超过1600万个详细的图像描述。这个数据集对于开发和改进图像到文本的转换技术具有重要意义,可以用于图像描述生成、视觉问答等任务。

  • GPTCommit:自动化生成Git提交信息的脚本工具。

    GPTCommit是一个利用OpenAI的GPT-4o模型来分析代码变更并自动生成提交信息的自动化Git提交工具。它简化了代码提交流程,通过智能分析代码变更,快速生成合适的提交信息,提高开发效率。

  • DeepFuze:革命性深度学习工具,用于面部转换和视频生成。

    DeepFuze是与ComfyUI无缝集成的先进深度学习工具,用于革新面部转换、lipsyncing、视频生成、声音克隆和lipsync翻译。利用先进的算法,DeepFuze使用户能够以无与伦比的真实性结合音频和视频,确保完美的面部动作同步。这一创新解决方案非常适合内容创作者、动画师、开发者以及任何希望以先进的AI驱动功能提升其视频编辑项目的人士。

  • TikTok Symphony:创意AI套件,简化TikTok内容创作。

    TikTok Symphony是一个由生成性AI驱动的全新创意解决方案套件,旨在简化营销人员和创作者在TikTok上的内容创作旅程。通过将人类想象力与AI驱动的效率相结合,TikTok Symphony使各种规模的企业、创作者和代理机构能够提升内容创作水平,提高生产力,并发现有价值的洞察。

  • Moatless Tools:使用大型语言模型编辑大型代码库的工具。

    Moatless Tools 是一个业余项目,作者在这里尝试一些关于如何使用大型语言模型(LLMs)来编辑大型现有代码库的想法。项目认为,构建好工具以插入正确的上下文到提示中并处理响应,比依赖代理推理解决方案更为关键。

  • CogiDigm:创新AI技术,引领数字艺术未来。

    CogiDigm利用GenAI技术革新娱乐产业的叙事方式,包括电影制片厂、后期制作和广告代理公司。我们拥有尖端技术,成为行业领跑者。我们与FBRC.ai和AILA合作,提供视频生成和操作服务,释放创造力。我们的理念是采用以人为本的集体智能方法,提供广泛的服务,包括创新的GenAI解决方案、道德的AI模型实施、专业的技术指导、战略咨询和无缝部署专业知识。

  • Flash Diffusion:快速生成高质量图像的扩散模型

    Flash Diffusion 是一种高效的图像生成模型,通过少步骤生成高质量的图像,适用于多种图像处理任务,如文本到图像、修复、超分辨率等。该模型在 COCO2014 和 COCO2017 数据集上达到了最先进的性能,同时训练时间少,参数数量少。

  • Pizi:快速将照片转化为产品页面

    Pizi是一个创新的应用程序,它允许用户通过简单的拍照将照片快速转化为产品页面,极大地节省了创建产品页面所需的时间和精力。它通过优化照片和描述,旨在提高转化率,同时无需专业设备或人员,节省成本。Pizi还具备SEO功能,能够提高产品页面的搜索引擎可见性。

  • Seio:快速创建SEO优化文章,提升在线业务影响力

    Seio是一个SEO内容创作工具,它允许用户在几分钟内从关键词创建SEO优化的文章,帮助企业提升在线影响力。它提供了强大的自助产品和增长分析功能,以及团队共享的收件箱,以确保团队协作的高效性。Seio还提供了AI驱动的编辑器和多平台发布功能,以及与Zapier集成的自动化SEO流程。此外,Seio提供全天候的客服支持,帮助用户解决问题。

  • Accorata:AI驱动的早期投资项目发现平台

    Accorata是一个面向早期投资者的AI驱动的项目发现平台,旨在通过快速筛选全球前种子期和种子期初创企业来简化早期项目源的获取。平台通过集成的甲板处理器、AI增强的创始人尽职调查和符合最严格欧洲数据保护标准的主权技术,为投资者提供快速、深入的分析和筛选服务。

  • Callin AI:AI驱动的语音助手,提升企业客户服务效率。

    Callin AI提供一系列AI语音助手,旨在通过自动化客户对话来增强企业的成长。这些助手可以处理来电和去电,提供24/7的客户服务,并且可以根据企业的具体需求进行定制。Callin AI利用最新的语音识别和自然语言处理技术,帮助企业提高客户满意度,减少等待时间,并扩大服务能力。

  • Agent Mode:AI时代的命令行助手

    Agent Mode是Warp AI的一个特性,它允许用户使用自然语言在终端中完成多步骤工作流程。它能够识别和解释自然语言指令,提供环境特定的指导,并引导用户完成多步骤任务。Agent Mode利用OpenAI的API,但不会存储或保留用户的输入或输出数据。

  • Epipheo AI:AI视频生成器,快速创建专业解说视频。

    Epipheo AI是一个强大的通用人工智能工具,能够轻松生成专业的解说视频。它具有直观的界面和先进的算法,使用户能够在几分钟内创建吸引人的视频。Epipheo AI提供多种高质量的语音选项,确保信息传达清晰有效,增强观众参与度和专业性。此外,它还提供AI生成的变体,用于快速迭代和分享,确保视频不仅满足而且超出预期,具有高效率和易用性。

  • ComfyUI-LuminaWrapper:一个用于Lumina模型的Python包装器

    ComfyUI-LuminaWrapper是一个开源的Python包装器,用于简化Lumina模型的加载和使用。它支持自定义节点和工作流,使得开发者能够更便捷地集成Lumina模型到自己的项目中。该插件主要面向希望在Python环境中使用Lumina模型进行深度学习或机器学习的开发者。

  • Safe Superintelligence Inc.:构建安全的超级智能

    Safe Superintelligence Inc. 是一家专注于构建安全超级智能(SSI)的公司,由 OpenAI 联合创始人兼前首席科学家 Ilya Sutskever 创办,其将安全置于“商业压力”之上。该公司认为SSI是当前时代最重要的技术问题,并致力于通过革命性的工程和科学突破来解决这一问题。公司的目标是快速提升智能能力,同时确保安全始终领先。其商业模式确保了安全性、安全性和进步不受短期商业压力的影响。

  • Tele-FLM:52B参数的开源多语言大型语言模型

    Tele-FLM(亦称FLM-2)是一个52亿参数的开源多语言大型语言模型,具有稳定高效的预训练范式和增强的事实判断能力。基于解码器仅变换器架构,已在大约2T的token上进行训练。Tele-FLM在同等规模上展现出优越的性能,有时甚至超越了更大的模型。除了分享模型权重外,我们还提供了核心设计、工程实践和训练细节,期待它们对学术界和工业界社区都有所裨益。

  • ChatFLM:智能聊天助手,提供高效交流体验。

    ChatFLM是一款基于FLM技术的智能聊天模型,旨在为用户提供流畅且智能的对话体验。该模型通过先进的自然语言处理技术,能够理解用户意图并生成合适的回复,适用于多种交流场景。

今日大家都在搜的词: