出门问问开放大模型“序列猴子”开源数据集

2024-02-26 08:43 · 稿源：站长之家

站长之家(ChinaZ.com) 2月26日消息:出门问问宣布，将向公众开放其超大规模语言模型“序列猴子”的部分训练数据集，命名为“序列猴子开源数据集1.0”。

序列猴子，作为出门问问的核心技术之一，具备强大的通用表示与推理能力，已在问答系统、自然语言处理、机器翻译、文本摘要等多个领域展现出其卓越的性能，极大地提高了生产效率和数据处理能力。

微信截图_20240226084508.png

为了推动大语言模型技术的持续进步，出门问问决定将其部分训练数据集进行开源。这次开源的“序列猴子开源数据集1.0”包括中文通用文本语料、古诗今译语料以及文本生成语料，这些数据资源都经过精心挑选和整理，以确保其高质量和易用的数据格式。同时，公司采用了宽松的许可协议，为广大的开发者和研究人员提供了便捷的使用条件。

出门问问希望通过这一行动，吸引更多的人才和团队参与到大语言模型的研究与应用中来，共同推动这一前沿技术的持续进步。公司坚信，开源数据集的发布将促进学术交流与合作，加速相关领域的创新步伐。

项目地址：https://github.com/mobvoi/seq-monkey-data

（举报）

相关推荐

关键词：

穿越周期：出门问问“软硬结合”战略步入收获期，中期亏损近乎清零

出门问问（02438.HK）发布2025年中期业绩，收入178.9亿元，同比增长10.0%，亏损大幅收窄99.5%。AI智能硬件业务表现亮眼，收入98.3亿元，增长64.8%，主要得益于战略新品TicNote的强劲表现。公司全面推动AI Agent化转型，人效提升80%，并持续拓展产品形态与商业场景，未来将加大AI Agent技术研发，打造更个性化、安全的智能体验。

出门问问 AI数字经济中期业绩
美团也开源了大模型，但我觉得他们的野心是通用生活Agent。

也有线上体验地址:https://longcat.ai 我自己去体验了一下，整体模型能力，中规中矩，但是快，是真的快，能把560B的模型，在推理的时候搞得这么快，是真的有点牛逼的。我直接录了个屏给大家看一下。这里我们可以直观对比一下LongCat和DeepSeek V3的输出速度，他俩都是MoE架构，而且总参数量差不太多。为了更公平的竞争，用了同一个问题，并关闭了联网搜索来避免搜索干扰�

美团 AI模型开源
荐AI日报：腾讯开源3D世界模型HunyuanWorld-Voyager；即梦AI系列模型开放API；通义推智能体开发框架AgentScope 1.0

本文介绍了AI日报栏目，聚焦人工智能领域最新动态。主要内容包括：腾讯开源具备3D重建能力的HunyuanWorld-Voyager模型、通义实验室推出的多智能体开发框架AgentScope 1.0、即梦AI开放图像与视频生成API、腾讯翻译模型Hunyuan-MT-7B在WMT2025斩获佳绩、苹果推出图像生成技术STARFlow和视觉语言模型FastVLM、新模型CoMPaSS-FLUX.1提升空间理解能力、Cherry Studio免费提供Qwen38B模型、谷歌Gemini API新增网页内容解析功能，以及腾讯优图开源智能体框架Youtu-Agent。这些进展展现了AI技术在多个领域的创新与应用。

AI 3D重建腾讯开源
荐AI日报：AI内容新规正式生效；美团推出开源大模型LongCat；阶跃发布语音大模型Step-Audio 2 mini

AI日报栏目每日更新AI领域热点内容，聚焦开发者需求。本期重点包括：阶跃星辰发布端到端语音大模型Step-Audio2 mini，在多项基准测试中表现优异；9月1日起AI生成内容需强制标识；美团推出开源大模型LongCat；上海AI实验室发布多模态大模型InternVL3.5；腾讯ARC团队推出音频生成模型AudioStory；OpenAI发布实时语音模型GPT-realtime；Meta与UCSD合作推出DeepConf技术；xAI代码库遭窃事件；阿里巴巴Qwen团队发布GUI自动化框架；微软推出Copilot Labs实验中心；小红书自动化工具xiaohongshu-mcp上线。

AI 语音大模型 Step-Audio2mini
全球第一！腾讯混元翻译模型Hunyuan-MT-7B登顶开源热榜

腾讯混元翻译模型Hunyuan-MT-7B登顶Hugging Face趋势榜首位，并在ACL WMT2025比赛中以30项第一的成绩领先。该模型支持33种语言，包括5种汉语言方言互译，在Flores200评测中表现卓越，超越同尺寸模型，与超大模型效果相当。腾讯提出完整训练范式，覆盖预训练到强化学习全链条，实现业界最优翻译效果。

腾讯混元 Hunyuan-MT-7B 翻译模型
荐AI日报：腾讯开源图像模型HunyuanImage2.1；爱诗科技获6000万美元融资；Freepik上线豆包Seedream4.0图像模型

本文汇总了AI领域的最新动态：腾讯升级混元生图模型至2.1版，支持2K分辨率与中英文输入；爱诗科技获阿里领投6000万美元融资，聚焦AI视频生成；Freepik上线Seedream 4.0图像模型，提供高分辨率生成选项；阿里千问新模型通过MoE架构提升推理效率10倍；微软在Office 365中集成Anthropic技术，调整AI供应商策略；首款AI Agent浏览器Fellou CE发布，简化工作流程；清华团队开源GUAVA技术，实现

AI日报混元生图模型 2K分辨率
百度文心大模型X1.1正式发布：超越DeepSeek R1、打平GPT-5

今天，在WAVE SUMMIT深度学习开发者大会2025上，百度文心大模型X1.1正式发布，在事实性、指令遵循、智能体等能力上均提升显著。百度王海峰介绍，文心大模型X1是基于文心大模型4.5训练而来的深度思考模型，升级后的X1.1主要采用了迭代式混合强化学习训练框架。一方面通过混合强化学习，同时提升通用任务和智能体任务的效果；另一方面通过自蒸馏数据的迭代式生产及训练

百度文心大模型深度学习智能体
数据赋能「智造」，以数据价值驱动宁波钢铁高质量发展

宁钢作为杭钢集团核心企业，是国内领先的钢铁联合企业，主营优特钢、汽车钢等40多个产品系列，年产量超400万吨。面对数字化转型挑战，宁钢携手网易数帆构建统一数据管理平台，整合数据资源，赋能业务团队，提升供应链效率，实现数据驱动的高质量发展，助力绿色、低碳、智能、高端目标。

钢铁工业宁波钢铁智能工厂
AI火花集｜从“听命令”到“懂人心”，阿里云携手嘉兴声芯拆解智能语音落地路径

未来AI硬件将突破“机械响应”局限，语音交互成为核心入口。行业数据显示语音设备出货量激增，72%用户偏好语音交互。智能硬件面临算力不足、模型难选、成本高等挑战。嘉兴声芯通过端云协同方案，在本地处理隐私数据，云端进行语义理解，实现高效安全的语音交互。该方案已在AI玩具、车载后装等场景落地，推动硬件从工具向智能伴侣转型。

AI硬件语音交互人机交互
AI大模型费用计算器：新手如何避开工具选择的三大坑

文章指出AI初学者常陷入三个陷阱：盲目选择昂贵工具、被华丽宣传迷惑、忽视隐藏成本。建议使用AIbase.cn等专业平台进行系统化评估，通过费用计算器对比主流模型成本，基于实际需求而非营销话术做决策。关键是要先对比分析再试用，找到真正契合业务需求的解决方案，避免资源浪费。

今日大家都在搜的词：

热文

3 天
7天

出门问问开放大模型“序列猴子”开源数据集

穿越周期：出门问问“软硬结合”战略步入收获期，中期亏损近乎清零

美团也开源了大模型，但我觉得他们的野心是通用生活Agent。

荐AI日报：腾讯开源3D世界模型HunyuanWorld-Voyager；即梦AI系列模型开放API；通义推智能体开发框架AgentScope 1.0

荐AI日报：AI内容新规正式生效；美团推出开源大模型LongCat；阶跃发布语音大模型Step-Audio 2 mini

全球第一！腾讯混元翻译模型Hunyuan-MT-7B登顶开源热榜

荐AI日报：腾讯开源图像模型HunyuanImage2.1；爱诗科技获6000万美元融资；Freepik上线豆包Seedream4.0图像模型

百度文心大模型X1.1正式发布：超越DeepSeek R1、打平GPT-5

数据赋能「智造」，以数据价值驱动宁波钢铁高质量发展

AI火花集｜从“听命令”到“懂人心”，阿里云携手嘉兴声芯拆解智能语音落地路径

AI大模型费用计算器：新手如何避开工具选择的三大坑

今日大家都在搜的词：

热文

库克称最爱橙色新iPhone：17 Pro是迄今最先进iPhone

苹果推出手机斜挎挂绳售价479元：10种配色可选

iPhone首现2TB内存！iPhone17系列价格公布

天猫首发iPhone 17：支持24期免息淘宝闪购最快30分钟到手

影视飓风连续4年给员工换新iPhone 全员可得iPhone 17 Pro Max

旧款Apple Watch也将支持高血压警报：涉及这三款

AI日报：腾讯开源图像模型HunyuanImage2.1；爱诗科技获6000万

苹果发布4款芯片为新机赋能 iPhone Air的牙膏“挤爆了”

iPhone Air充电口未居中上热搜强迫症用户表示受不了

甲骨文创始人妻子是34岁沈阳姑娘此前超马斯克成全球首富

苹果发布会前瞻：最大看点iPhone Air iPhone17或成国内首款无卡

为什么微信上那么多人住在安道尔上热搜：这些因素导致

iPhone 17系列今晚发布：苹果发布会新品揭晓

小米智能音箱多彩版发布：售价199元

库克称最爱橙色新iPhone：17 Pro是迄今最先进iPhone

苹果推出手机斜挎挂绳售价479元：10种配色可选

AI日报：国产版Nano Banana？即梦图片4.0发布；阿里巴巴发布 Q

魅族22官宣9月15日发布：外观、配置公布

小米王腾因泄密被辞退曾单独签署保密协议

王腾否认被将入职魅族担任副总：系谣言

站长商机