首页 > 见闻 > 关键词  > 百度最新资讯  > 正文

百度已在太原建立数据标注中心 把AI从理想变成现实

2019-03-27 16:40 · 稿源:站长之家

图片来源图虫:已授站长之家使用

站长之家(ChinaZ.com) 3月27日 消息:上证报消息,博鳌亚洲论坛 2019 年年会上,百度副总裁尹世明透露称百度已经在太原建立了数据标注中心。结合其云计算和大数据、人工智能技术等,可以形成一整套产业链,把AI从理想变成现实。

尹世明表示,“必须要给数据做标注,无论是语音的,还是算法的,所以百度现在已经在太原建立了一个巨大的数据标注中心。”

什么是“数据标注”?简单来说,数据标注就类似于小时候为了能让小朋友学会认字,而添加的拼音标识一样。而机器人也是一样,需要从 0 开始学习。因此,一开始的时候需要人工添加一些数据标注来训练它们,教机器认识这个世界。再高明的算法也需要基础的数据学习,而这就是AI需要数据标注的原因。

举报

  • 相关推荐
  • AI大模型折叠:数据标注“民工”月入不过5000,单价从5毛降到4分

    郑雯至今觉得记得几个月的下午,那天,她一个小时就赚了2毛钱。她毕业于湖南的一所专科学校,是一名大模型数据标注师,每天的工作并不复杂——给自己领取的原始数据添加标签。(备注:文中人物皆为化名。

  • 百度发布首个量子领域大模型 及百度量子助手、量子写作助手AI原生应用

    百度发布首个量子领域大模型,及百度量子助手和量子写作助手两大AI原生应用,旨在芯片层、框架层、模型层及应用层等全栈技术上加速量子技术与大模型深度融合,充分激发两大技术各自的潜力。该量子领域大模型是在文心一言基础上,使用量子领域高质量数据进行更有针对性的训练和优化构建的量子领域大模型,能更好地理解量子知识,专业执行量子任务。只需输入6个变量,量子写作助手可在5分钟内撰写一篇13000字符合格式要求的专利文档,高效帮助企业将量子领域的研究成果与知识产权沉淀为企业资产。

  • 百度将发布AI互动式「新搜索」 具备听、会、看能力

    百度世界2023将于10月17日举行,届时将发布大模型重构后的百度产品。在百度世界2023媒体预沟通会上,百度集团副总裁肖阳和王凤阳分享了百度移动生态在AI原生应用上的进展,并透露了一些即将发布的重磅新品。百度营销还将向生态伙伴发起更广范围、更深层次的合作邀请,打通生成式AI在营销领域的应用。

  • 百度将发布国内首个生成式数据分析商业智能产品百度GBI

    在昨日的百度世界2023媒体预沟通会上,百度透露了更多的基于大模型重构的最新进展。首先是百度网盘,它正在向个人与企业的知识管理方向发展,推出了基于大模型的网盘智能助理“云一朵”,用户可以通过语音交互操作网盘内的文件、图片、视频等,并且还能帮助用户快速了解视频内容。百度Apollo智舱大模型和智舱开发工具链增强了智能座舱的理解、生成、推理、记忆等核心能力,提升了人车交互方式,使交互体验更加自然,并提升了车内导航、用车等场景的用户体验。

  • 百度和小红书夺走的,淘宝想用AI夺回来

    淘宝问问可能替代淘宝搜索淘宝在搜索框里加上了AI应用——淘宝问问,它的核心目标是成为下一代的电商智能导购。相比于商业化,淘宝问问更在意如何留住更多新用户。国内的大模型本身与国外有一定代差,所以需要开放给更多用户来用,才能知道下一步怎么去优化。

  • 百度百家号:AI自动文字成片新增优化文案功能

    百度百家号宣布,面向具有自动文字成片权益的作者,新增优化文案功能。若已获得自动文字成片权益,该功能将自动开启,可以通过「百家号设置-功能设置-发文设置-自动文字成片优化文案」中修改授权选项。若还未获得自动文字成片权益,也可以在「发布-AI成片」中体验和使用文字成片功能。

  • 谷歌这一“大招”,要逼死多少AI标注公司?

    当下的生成式AI,是一个正在茁壮成长的孩子,那么源源不断的数据,就是其喂养其生长的食物。就是制作这一“食物”的过程。AI标注的出现,并不是国内标注企业的末日只是一种低效、廉价、缺乏技术含量的劳动密集型标注方式的末日。

  • Autolabel终结人工标注AI标注比人类标注效率高100倍

    一家初创公司refuel上线了一个AI标注数据的开源工具Autolabel,它能够利用LLM自动对数据进行标注,大大简化了数据标注流程。Autolabel支持主流的LLM提供商,并可为开源和私有模型提供支持。在接下来的几个月中,开发者承诺将向Autolabel添加大量新功能:如支持更多LLM进行数据标注;支持更多标注任务,例如总结等;支持更多的输入数据类型和更高的LLM输出稳健性;让用户能够试验多个LLM和不同提示的工作流程。

  • 百度百科:AIGC、AI等成网友最关注的十大科学词

    9月20日,百度百科联合科普中国共同发布《全国科普日知识大数据报告》,报告从网友最关注的十大科学热词、十大热门视频、最前沿科研成果、实时热点等多维度,全面『揭秘』网友最关注知识内容。AIGC、AI等前沿热点成百科网友最关注的十大科学词。百度百科成立17年以来,已汇聚超2745万个科普知识点、有778万人参与编写、2.44亿次编辑,并且联合超过3000个权威机构和专家参与百科词条审核。

  • GPT-4终结人工标注AI标注比人类标注效率高100倍,成本仅1/7

    【新智元导读】这个开源工具,居然能用GPT-4代替人类去标注数据,效率比人类高了100倍,但成本只有1/7。大模型满天飞的时代,AI行业最缺的是什么?毫无疑问一定是算力。让用户能够试验多个LLM和不同提示的工作流程。

今日大家都在搜的词: