首页 > 热点 > 关键词  > 模型最新资讯  > 正文

复旦MOSS团队:MOSS参数规模约为ChatGPT的十分之一

2023-03-02 10:39 · 稿源:站长之家

站长之家(ChinaZ.com)3月2日 消息:澎湃新闻报道,针对MOSS与ChatGPT的差异,复旦大学计算机科学技术学院邱锡鹏表示,ChatGPT的参数量多达1750亿个,而MOSS大约是前者的1/10左右。

邱锡鹏解释称,选择百亿规模这样级别的参数,是因为学术界主要是做一些探索性的技术,这个规模也在财力物力承受范围之内。实验结果证实了我们的猜想,MOSS模型可以非常顺利地与人类进行聊天互动。

微信截图_20230302103948.png

2月20日,复旦大学自然语言处理实验室发布了国内第一个对话式大型语言模型MOSS(moss.fastnlp.top/#/),并通过邀请码进行内测。

复旦大学自然语言处理实验室称,MOSS只是想在百亿规模参数上探索和验证chatGPT的技术路线,并且实现各种对话能力。MOSS还是一个非常不成熟的模型,距离ChatGPT还有很长的路需要走。由于训练数据中的多语言语料库有限,MOSS 在理解和生成非英语文本方面表现不佳。目前正在开发一个改进版本,以提高其中文语言能力。

邱锡鹏表示,如果优化顺利,计划在三月底开源MOSS。

举报

  • 相关推荐
  • ChatGPT全球服务突发中断 OpenAI紧急修复

    OpenAI的人工智能助手ChatGPT于12月2日至3日连续出现服务中断,导致部分用户无法正常使用。 此次故障主要影响网页版用户,许多人在通过浏览器访问时遭遇无响应或加载失败的问题,而Mac桌面客户端在此期间运行正常,未受影响。 故障发生后,OpenAI迅速采取缓解措施,并于2日2时37分开始监测恢复进展。至当日3时,服务已确认完全恢复正常。公司随后发布声明,解释此次中断

  • OpenAI奥特曼启动“红色警报”:全力改进ChatGPT 暂缓广告业务

    OpenAI首席执行官山姆奥特曼在内部备忘录中向员工宣布,公司将启动红色警报”紧急状态,以集中资源提升ChatGPT的核心能力,同时推迟广告业务等非核心项目。 备忘录显示,奥特曼将谷歌等竞争对手在生成式AI领域的技术突破视为直接威胁”,认为其快速迭代已对OpenAI构成严峻挑战。 为巩固市场地位,公司决定暂

  • OpenAI推出ChatGPT购物研究功能

    OpenAI于11月25日正式推出ChatGPT购物研究功能,旨在帮助用户快速精准地找到心仪电商产品。该功能通过自然语言理解与信息整合,突破传统推荐算法局限,能主动提问、智能筛选,深入挖掘用户真实意图,精准识别功能参数、使用场景及风格偏好。结合历史对话记忆功能,系统可纳入个人偏好与习惯,提供个性化购买指南,包括热门产品推荐、核心差异对比及优缺点分析,并附带可靠零售链接。未来还将接入即时结账功能,实现从研究、决策到购买的全流程闭环,显著简化购物流程。目前该功能正逐步向移动端与网页端用户开放,覆盖免费版、Plus、Pro等多个层级。

  • OpenAI全球上线ChatGPT群聊功能:最多支持20人同时在线

    11月21日,OpenAI正式向全球用户开放ChatGPT群聊功能,覆盖免费版、Go版、Plus版及Pro版订阅计划。用户可通过创建群组实现最多20人实时协作,所有成员可查看完整对话历史。系统严格隔离创建者个人数据以保障隐私,成员可设定AI参与模式。该功能基于GPT-5.1+Auto模型实现智能对话管理,支持表情互动、头像创意应用及文件解析等协作任务。这标志着ChatGPT从个人助手向协作平台转�

  • Checkout.com 启用 OpenAI 智能体电商协议,赋能全球企业商户

    Checkout.com宣布支持由OpenAI推动的AI智能体电商协议(ACP),旨在让AI智能体在对话中代表消费者发现、挑选并购买产品。该公司预测未来五年内AI电商将占家庭月消费的五分之一。通过与Visa、万事达等伙伴合作,Checkout.com致力于构建安全、标准化的全球支付体系,赋能企业商户应对AI驱动的商业变革,提供定制化智能体验。

  • AI日报:Kling 2.6将发布;千问APP推学习大模型;Z-Image-Turbo-Fun-Controlnet-Union 开源

    本期AI日报聚焦多领域AI进展:Kling 2.6发布,支持音频同步生成,AI视频进入有声时代;千问APP推出学习大模型,提升拍照答疑与作业批改能力;阿里通义实验室开源图像生成模型,实现精准控制;豆包手机助手遭遇微信登录异常,凸显生态兼容挑战;米哈游推出带猫语特色的AI聊天模型AnuNeko;亚马逊云科技发布三款新型AI智能体,其中Kiro可自主编程数日;IDC报告预测具身智能�

  • 华为WATCH Ultimate 2非凡探索今日开售:售价6499元起

    华为WATCH Ultimate 2非凡探索智能手表11月28日首销,售价6499元起。该产品被誉为“全能表王”,搭载多项全球首发技术,包括150米潜水级防水,是全球首款支持水下音频播放及独立海豚声通信的智能手表,可在30米内实现手表间信息收发,60米内一键SOS求救。户外通信方面,首发北斗卫星消息功能,无网络时可发送语音信息。健康管理配备AI运动解读、健康问答及多种传感器,监测更精准。内置华为向日葵定位系统、离线地图,支持eSIM独立通信及鸿蒙生态应用,提供智慧控车等便捷功能。

  • 易鑫开源汽车金融业首个Agentic大模型,加速AI生态共建

    易鑫集团(02858.HK)宣布开源其自主研发的Agentic大模型YiXin-Agentic-Qwen3-14B,成为汽车金融行业首个开源此类模型的企业。该模型基于通义千问Qwen3-14B深度优化,具备卓越推理、复杂任务处理及多方协作的智能体能力,在多项性能测试中位列榜首,推理成本较行业平均水平降低三分之一。模型搭载金融领域专属知识体系与工具集,覆盖语音交互、车辆评估、风控、欺诈识别等功能,形成全链路智能支撑体系。易鑫提出“底座开放-社区共建-能力迭代-企业部署-生态繁荣”的开源共建模式,通过提供低代码私有化模板,帮助企业快速落地AI应用。此次开源与之前发布的行业首个开源推理大模型YiXin-Distill-Qwen-72B形成“垂直底座+Agentic大脑”双轮技术矩阵,填补了汽车金融领域专业开源AI工具链的空白。

  • 行业首家!易鑫正式开源Agentic大模型,定义汽车金融AI新范式

    易鑫宣布开源自主Agentic大模型YiXin-Agentic-Qwen3-14B,成为汽车金融行业首个开源此类模型的企业。该模型基于Qwen3-14B,参数规模140亿,通过多阶段训练体系深度优化,在智能体协作、函数调用、推理等能力上可比肩参数200B以上的商用大模型。多项专业评测显示,其在金融专业知识理解方面显著优于DeepSeek V3.1、Kimi-K2等主流模型,并在智能体工具使用任务中同样表现卓越,位居同尺寸模型性能测试首位。该模型既展现出强劲的专业理解力与协作推理能力,又兼具高实用性与经济效益,将为汽车金融及各类专业场景提供高效、可靠的智能引擎。易鑫以技术创新为核心驱动力,持续引领行业迈向智能化转型。

  • 颜值与画质兼得,TCL A400 Pro引领壁纸电视新标准

    TCL A400Pro艺术电视以39.9mm超薄机身实现无缝贴墙,结合QD-Mini LED技术带来卓越画质,支持万级分区控光与量子点Pro技术,色彩精准自然。配备隐藏式集线系统与星环散热,兼顾美观与功能。具备全屋移动灵活性,搭配丰富艺术资源库及AI创作功能,可化身私人艺术展馆。安桥Hi-Fi音响提供沉浸式听觉体验,通过多尺寸与配件适配不同家居场景,重新定义电视与空间的关系。

今日大家都在搜的词: