首页 > 业界 > 关键词  > 正文

深言科技联合清华大学NLP实验室开源LingoWhale-8B模型

2023-11-03 16:09 · 稿源:站长之家

站长之家(ChinaZ.com)11月3日 消息:深言科技与清华大学 NLP 实验室联合开源了 LingoWhale-8B 模型,这是一种拥有约80亿参数的中英双语大语言模型。

微信截图_20231103160929.png

该模型在多个公开评测基准上达到领先效果,在10B 以下开源模型中表现出色。LingoWhale-8B 模型具备强大的基础能力,能够完成各种任务,包括数学计算、代码生成、逻辑推理、对话和知识问答等。

该模型已经全面开源,供学术研究免费使用。而商业用途下需要申请并获得官方授权。

开源地址:

GitHub:

https://github.com/DeepLangAI/LingoWhale-8B

Huggingface:

https://huggingface.co/deeplang-ai/LingoWhale-8B

ModelScope:

https://www.modelscope.cn/models/DeepLang/LingoWhale-8B

Wisemodel:

https://wisemodel.cn/models/DeepLang/LingoWhale-8B

举报

  • 相关推荐
  • 格创东智与香港大学共建工业AI联合实验室,推动香港成为全球工业AI创新枢纽

    4 月 16 日,格创东智与香港大学(以下简称为港大)签订合作协议,共同成立“香港大学-格创东智工业AI联合实验室”,并聘任香港大学副校长(研究)申作军教授为荣誉首席科学家。实验室将深度融合香港大学的人工智能科研优势与格创东智服务先进制造的工业AI落地用例,开展“工业AI技术的创新与实际应用”方向的研究工作。此举是格创东智在年初迭代章鱼Agentic AI平台后

  • 深数所携手金蝶征信,共建全国首个企业信用数据联合实验室

    深圳数据交易所与金蝶征信宣布共建全国首个"企业信用数据联合实验室",聚焦"AI+数据要素"创新融合,助力信用经济建设。双方将结合深数所全国性数据要素流通平台优势与金蝶10年企业数字信用服务经验,依托其740万企业客户数据,激活数据要素在信贷、供应链等场景的应用潜力。实验室将研发智能信用评估产品,帮助金融机构优化风控,为中小微企业提供精准信贷支持。目前金蝶已服务200余家金融机构,促成1800亿元数字信贷。未来该实验室将持续吸纳数据与技术力量,探索数据要素与信用经济创新应用,助力深圳打造具有国际影响力的"数据新名片"。

  • 科龙空调静省电Max:打破实验室数据滤镜,定制专属“气候空间”

    科龙空调推出静省电Max系列产品,主打超强省电性能。经中国家电研究院实测,该产品在模拟真实使用环境下,8小时制冷仅耗电2.5度(约1.4元/天),APF能效比达5.5,一年可省电403度。采用行业Top3大排量压缩机、48根双排紫铜冷凝管等优质配置,冷热效率提升11.4%。产品还具备15秒速冷、30秒暖房功能,运行噪音低至15分贝,并配备睡眠管家模式。作为2025世俱杯官方指定空调,科

  • 打破实验室滤镜!科龙省电静音空调Max:中家院真实场景实测8h花1.4元

    科龙空调联合中国家电研究院对静省电Max新品进行真实环境测试,APF值达5.5、噪音低至15分贝,实现"真省电、真静音、真速冷"三大优势。测试显示其8小时耗电仅2.579度(约1.4元/天),采用双排冷凝器+稀土永磁压缩机技术,换热效率提升30%。15秒速冷、30秒速热,防直吹功能通过三导板精准控风,冷风平行送出避免直吹。京东补贴后售价1999元,提供0元安装和10年整机保修服务。该产品突破行业实验室数据虚高问题,以真实性能重新定义省电静音空调标准,并布局磁悬浮电机等核心技术,推动行业向高效节能升级。

  • Linux中国开源社区官网正式宣布关闭!域名未知原因被冻结

    快科技4月16日消息,近日,国内知名第三方开源社区Linux中国开源社区官网正式宣布关闭,其实在2024年社区就已经停止更新,但官网仍可以访问。不过从2025年3月20日开始,Linux.cn域名被注册商设置为clientHold(永久冻结)状态,这意味着该域名在DNS系统中被禁止解析、访问、使用、变更和交易,导致网站完全无法使用。虽然这个域名仍然在Linux中国站长账号下,但由于clientHold状态,这个域名当前已经完全无法使用。至于clientHold状态的原因,Linux中国站长解释称域名注册商按上级要求设置为冻结状态,域名注册商无权进行解封,其实到现在

  • 刚刚,OpenAI开源BrowseComp,重塑Agent浏览器评测

    今天凌晨2点,OpenAI开源了专门用于智能体浏览器功能的测试基准——BrowseComp。这个测试基准非常有难度,连OpenAI自己的GPT-4o、GPT-4.5准确率只有0.6%和0.9%几乎为0,即便使用带浏览器功能的GPT-4o也只有1.9%。通过使用更多的计算资源,模型可以尝试更多的搜索路径,从提高找到正确答案的概率。

  • AI日报:智谱开源32B/9B系列GLM模型并启用Z.ai域名;OpenAI发布GPT-4.1系列模型;阿里魔搭上线MCP广场

    欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、智谱AI启用全新域名Z.ai 并开源32B/9B 系列 GLM 模型智谱技术团队近期宣布开源32B和9B系列的GLM模型,并推出全新交互体验平台Z.ai。这些模型遵循MIT许可协议,支持商业用途,提升了

  • 九为健康联合华为云发布神农中医大模型智能体,解码如何用大模型重构“望闻问切”

    2025 年 4 月 11 日,在华为云生态大会上,浙江九为健康科技股份有限公司(以下简称"九为健康")正式发布基于华为云盘古大模型的"九为神农中医大模型智能体"。该解决方案依托AI技术,系统性攻克中医药研发周期长、作用机制解析困难、个性化方案制定复杂等产业难题,通过智能化手段推动中医药现代化进程,为医药全产业链提供覆盖研发、诊疗及健康管理的全流程智能服�

  • DeepSeek上新!开源发布DeepSeek-Prover-V2-671B模型

    快科技4月30日消息,今日,DeepSeek 今日在 AI 开源社区 Hugging Face 发布了一个名为 DeepSeek-Prover-V2-671B 的新模型。据介绍,DeepSeek-Prover-V2-671B 其参数量达到6710亿,使用了更高效的 safetensors 文件格式,并支持 BF16、FP8、F32 等多种计算精度,方便模型更快、更省资源地训练和部署。在模型架构上,该模型使用了DeepSeek-V3架构,采用MoE(混合专家)模式,具有61层Transformer层,7168维隐藏层。同时支持超长上下文,最大位置嵌入达163840,使其能处理复杂的数学证明,并且采用了FP8量化,可通过量化技术减小模型大小,提

  • 字节AI加速文生图技术新突破,GOOG/微美全息引领开源大模型释放科技势能

    字节跳动发布豆包1.5深度思考模型,升级文生图能力。该模型在专业领域和通用任务中表现突出,采用MoE架构,总参数量200B,激活参数20B,推理成本优势显著。同时,其图像生成模型Seedream 3.0性能追平GPT-4o等顶尖模型。全球AI产业加速发展,开源模型降低技术门槛,推动商业化落地。微美全息等企业构建开放AI生态,DeepSeek等公司通过开源策略促进技术普惠。行业迎来"开源AI+"新阶段,企业需把握机遇应对挑战。