首页 > 业界 > 关键词  > 正文

百度宣布国内首个大模型数据标注基地运营:标注师100%本科

2023-08-26 09:06 · 稿源: 快科技

快科技8月25日消息,据百度官方介绍,位于海口市秀英区的百度智能云(海口)人工智能基础数据产业基地日前启动运营,这是百度智能云与海口市政府合作共建的国内首个大模型数据标注中心。

官方表示,当前,大模型正处在产业落地前期,高质量的数据,是大模型实现产业化的关键要素。

对于以ChatGPT、文心一言为代表的生成式AI,海量的数据训练、人工标注、指令微调、基于人类反馈的强化学习(RLHF),可以让大模型与人类价值观、思维方式不断对齐,使大模型更加可用。

据介绍,为保障数据标注质量,百度智能云搭建了全流程数据服务人才梯队,海口数据标注基地现拥有数百名专职大模型数据标注师,标注师的本科率达到100%。

百度智能云方面表示,目前已经在全国与各地政府合作,共建了十多个数据标注基地,累计为当地提供超过1.1万个稳定就业岗位,间接带动5万人就业。

举报

  • 相关推荐
  • Sora App的AI视频社交,给了百度们新希望

    Sora2发布两周后,百度的蒸汽机AI视频模型,和谷歌Veo3.1撞了档期。 两家公司选择同期发布并非有多默契,而是Sora2带来的压迫感促使它们不得不加快脚步。 奥尔特曼将形容Sora2为“创意领域的ChatGPT3.5时刻”,不仅在物理逻辑、画面连贯性、真实感和音画同步等方面实现了质的飞跃,还把Sora从一个“文本到视频”的工具进化成一个“创意到生态”的平台。 这无疑是扔在AI视�

  • 易鑫正式发布汽车金融行业首个Agentic大模型

    易鑫在2025世界互联网大会乌镇峰会上发布汽车金融行业首个Agentic大模型XinMM-AM1。该模型参数量约300亿,响应延迟低于200毫秒,支持语音实时交互,单卡吞吐达370 tokens/秒,可提升获客、风控与运营效率,解决行业周期长、交互多、决策复杂等难题。易鑫作为AI驱动的金融科技平台,研发投入超20亿元,率先实现AI全场景应用,将持续推动智能汽车金融生态建设。

  • 双胞胎姐妹玩石头剪刀布默契度100% 考试分数也高度趋同

    近日,双胞胎姐妹在玩石头剪刀布时展现的100%默契现象引发关注,结合科学解释与真实案例,这一奇妙现象背后的秘密逐渐浮出水面。 在河南郑州,一对双胞胎姐妹连续三局石头剪刀布出拳完全一致,令在场记者惊叹不已。更令人称奇的是,她们的学习成绩、考试分数也高度趋同,展现出超乎寻常的同步性。这一案例发生在郑州某小区,该小区居住着12对双胞胎,被居民们戏

  • 登榜LMArena!文心大模型5.0-Preview文本能力国内第一

    11月8日,文心全新模型ERNIE-5.0-Preview-1022在LMArena大模型竞技场排名中位列全球第二、中国第一。该模型在创意写作、复杂长问题理解和指令遵循方面表现突出,超越多款国内外主流模型。创意写作可高效生成文章、营销文案等内容;复杂长问题理解适用于学术问答、报告分析等任务;指令遵循能力支持智能助理、代码生成等场景,为多领域内容生产提供高效支撑。

  • AI日报:豆包视频1.0pro fast发布;谷歌Gemini新功能上线;百度推上体体育大模型 2.0

    本期AI日报聚焦多项技术突破:火山引擎发布豆包视频生成模型1.0pro+fast,速度提升3倍且价格下降72%;百度与上海体育大学推出“上体体育大模型2.0”,拓展AI在运动员训练等场景应用;谷歌Gemini新增一键生成PPT功能;美团发布LongCat-Video模型,支持5分钟连贯视频生成;xAI推出虚拟女友Mika引发热议;MiniMax开源高性能M2编码模型;OpenAI上线企业知识管理功能;另报道20岁辍学生开发的AI笔记工具Turbo AI半年用户破500万,展现年轻创业者的技术影响力。

  • 免费 GEO品牌可见度查询——让大模型信得过就这么玩

    本文探讨在AI时代如何成为大模型信赖的信息源。关键点包括:可信信息源需具备数据来源清晰、内容结构化、可验证追踪等能力;提出五大实操要点——确保数据干净可追溯、采用RAG等技术增强可检索性、保持内容更新与时效性、强化品牌可见度、建立反馈优化机制。同时推荐使用AIBase平台的GEO排名查询工具免费监测内容可见度,通过持续优化提升在大模型入口的推荐概率。

  • 国内大模型GEO优化全攻略:免费工具教你监测品牌在文心一言、通义千问等AI平台的可见度

    AI搜索时代,品牌若未出现在AI回答中就等于"不存在"。GEO(生成引擎优化)成为新战场,核心是让AI在回答用户问题时优先引用企业内容。文章详解国内主流AI模型特点:文心一言整合百度生态、通义千问依托阿里电商数据、小众模型在垂直领域更易被引用。提出三大优化策略:内容结构化呈现、建立行业权威背书、布局高权重平台。推荐使用AIBase免费工具实时监测品牌在各大AI平台的曝光情况,通过数据驱动优化策略。

  • 续航巨无霸!荣耀将率先量产10000mAh手机

    11月7日爆料称,荣耀将成为首家量产10000mAh电池手机和9000mAh性能旗舰的品牌。其首款10000mAh新机荣耀Power+2预计春节前亮相,搭载联发科天玑8500旗舰芯片和1.5K屏幕。此前荣耀Power系列已推出8000mAh青海湖电池,硅含量提升10%,能量密度达821Wh/L,极寒环境下续航出色。Power+2将突破万毫安时大关,有望改写智能手机续航标准,解决电量焦虑,让用户出门无需携带充电宝。

  • 10000mAh手机来了!荣耀万级大电池试产

    据博主数码闲聊站爆料,荣耀第二块万级大电池试产了,额定36.88Wh-9755mAh。 典型值应该是9900mAh,大胆一点也能标10000mAh。 这将是全球第一款10000mAh电池量产智能机,引领行业进入10000mAh时代。

  • 百度智能云联合昆仑芯、HAMi,落地双模式算力调度方案,提升算力利用率

    百度智能云联合昆仑芯与CNCF开源项目HAMi,推出基于昆仑芯P800的XPU/vXPU双模式算力调度方案。该方案已在金融客户集群落地,支持智能客服、营销辅助等十余类AI业务,兼顾稳定性与灵活性。XPU整卡模式通过拓扑寻优调度保障大规模训练性能,vXPU虚拟化模式以多粒度切分实现单卡多任务,最大化资源利用率。双模式协同让国产算力高效匹配业务需求,同时提供自动化调度与人工调节结合的灵活管理能力。

今日大家都在搜的词: