首页 > 业界 > 关键词  > 中文语料库最新资讯  > 正文

“弱智贴吧”的数据,居然是中文语料库

2024-04-07 08:50 · 稿源: ​AIGC开放社区公众号

中国科学院、北大、中国科技大学、滑铁卢大学、01.ai等10家机构联合推出了,专用于中文的高质量指令调优数据集——COIG-CQIA。在大模型领域英语一直是训练数据最重要的语言,但由于中英文的结构和文化差异,直接将英文数据集翻译成中文并不理想。所以,为了填补高质量中文数据集的

......

本文由站长之家合作伙伴自媒体作者“​AIGC开放社区公众号”授权发布于站长之家平台,本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间,为了保证文章信息的及时性,内容观点的准确性,平台将不提供完全的内容展现,本页面内容仅为平台搜索索引使用。需阅读完整内容的用户,请查看原文,获取内容详情。

举报

  • 相关推荐
  • 按摩店初中文凭小伙娶美国女博士:相爱能克服一切困难

    近日,一位名为吴彦举的河南农村小伙与美国博士妻子Amy Thames(中文名:吴爱美)的跨国爱情故事在网络上引发热议。这对夫妻结婚已20年,用他们的亲身经历诠释了“有爱就能冲破一切隔阂和枷锁”的深刻内涵。 吴彦举出生于河南禹州农村,家境贫寒,童年时与牛马同住一屋,生活条件极为艰苦。他自幼渴望通过学习改变命运,成绩优异却因家庭经济困难被迫辍学,早早承�

  • 按摩店初中文凭小伙娶美国女博士:英雄救美拉进彼此距离

    ​近日,河南按摩师吴彦举与美国博士生Amy Thames(中文名吴爱美)的跨国婚姻故事引发广泛关注。这段始于新疆按摩店的感情,历经20年风雨,跨越阶层、学历与国界,书写了一段动人佳话。 吴彦举1981年出生于河南禹州农村,因家庭贫困初中便辍学。18岁时,他在采石场打工右眼被碎石击伤,视力严重受损。2004年,他在新疆一家按摩店工作,月收入不足千元。而吴爱美是美�

  • 小米17 Pro妙享背屏对话翻译上线:正屏说中文 背屏即时翻译

    小米13 Pro系列近日上线妙享背屏对话翻译功能,实测对着手机说中文即可实时显示译文,效率很高。背屏还新增大头贴模式,支持拍摄动态照片,并加入多款动态壁纸。游戏方面新增植物合成与雪人推箱子两款休闲游戏,搭配复古风格保护壳,操作简洁有趣。作为核心亮点,背屏采用与主屏同源的龙晶玻璃,支持LTPO自适应刷新率,横向覆盖后摄模组,辨识度拉满。小米总裁卢伟冰表示,该系列大胆创新获用户积极反馈,下一代旗舰将继续沿用背屏设计并加大研发投入。

  • ​金仓数据库异构多活架构,护航浙江省人民医院信创实践

    浙江省人民医院作为省内规模最大、实力最强的三甲医院,承担信创试点使命。面对多院区、高负载及业务连续性等挑战,医院选择电科金仓数据库,以“异构多活容灾架构”为核心,打造国内首个LIS系统国产化改造案例。该方案实现多中心互备、秒级切换,业务连续性达99.99%,效率提升60%,为集团化医院信创提供了可复制的全链路解决方案。

  • AI日报:上海首例涉AI提示词著作权案宣判;Kimi K2 Thinking发布;中文图像编辑新王UniWorld-V2发布

    今日AI领域动态:上海首例AI提示词著作权案宣判,法院认定提示词不具独创性;月之暗面发布Kimi K2思考模型,实现自主多轮工具调用;UniWorld-V2图像编辑模型支持中文框选即改,性能超越GPT-Image;谷歌推出AI文件检测工具Magika 1.0,支持超200种格式;Sora安卓版首日下载量达47万次;我国发布全球首个AI海洋大模型“瞰海”,可精准预测10天内海洋变化;宇树科技“Embodied Avatar”系统实现低延迟远程机器人操控;谷歌Gemini API推出文件搜索工具,简化私有RAG系统集成。

  • 团队故事|95后中文系学姐联手浙大宅叔创办站点智能公司

    站点智能公司由Aler创立,倡导“站点即智能体”,运用AI技术降低传统企业建站门槛。通过“AI搭建AI站点”方案,助力企业打造自主数字阵地,摆脱对第三方平台的依赖,实现独立增长。核心团队包括创始人Aler、CTO乙丙及运营Daiven,三人凭借技术、人文与市场运营的跨界协作,推动产品从概念到落地。公司已获投资支持,并于2025年上线内测版,致力于以AI赋能企业数字化,传递“独立、自由”的品牌精神。

  • 国产化率达100%!温州港TOS成功“换芯”金仓数据库

    浙江省首个信创版港口集装箱码头生产操作系统n-TOS及配套中心业务处理系统CTOS在温州港乐清湾港区上线运行。系统采用海光CPU、银河麒麟操作系统等全栈国产软硬件,国产化率达100%,安全性和稳定性通过全面验证。金仓数据库助力实现Oracle数据库的平滑迁移,确保业务零改造上线。该系统作为港口"智慧大脑",管理集装箱装卸、堆存等全流程业务,标志着浙江海港在码头核心系统自主可控方面迈出关键一步,为后续推广提供样板。

  • 超薄Mate来了!华为Mate 70 Air上架电信终端产品库

    网友发现,华为Mate 70 Air上架电信终端产品库,其型号为华为SUP-AL90,提供12GB 256GB、12GB 512GB两种选择,有曜金黑、羽衣白和金丝银锦三种配色可选,出厂搭载鸿蒙5操作系统。 如图所示,Mate 70 Air屏幕尺寸是6.9英寸,其延续了Mate系列中轴对称设计,相机模组依然是大星环,镜头中间为华为自研影像XMAGE的标识和条形闪光灯。 从命名不难看出,Mate 70 Air主

  • 智源联合共建单位开源可信中文互联网语料库CCI

    智源研究院联合拓尔思、中科闻歌共建了“中文互联网语料库”,旨在为大数据和人工智能行业提供安全、可靠的语料资源。该语料库经过严格的筛选和清洗,包括基于规则和模型的过滤,以及针对评测数据集的严格过滤。智源研究院还开放了其他高质量中文数据集,如WUDAOcopora、COIG和MTP。

  • 金仓数据库助力国家电网智慧计量工控系统上线

    国家电网在山东电力、河南电力两家超大型省公司成功试点上线智慧计量实验室(工控部分),系统运行稳定。以金仓数据库为支撑,实现关键计量设备数据高效管理与分析,标志着国网在构建现代先进测量体系道路上迈出关键一步。项目采用国产化技术路径,完成所有环节实施工作,确保系统国产化替换平稳上线,为零代码修改、高效迁移集成适配提供实践路径,为后续全国推广积累经验。

今日大家都在搜的词: