首页 > 业界 > 关键词  > Riiid最新资讯  > 正文

Riiid AI模型Sheep-duck-llama-2在HuggingFace排名

2023-10-10 10:58 · 稿源:站长之家

文章概要:

- Riiid最新生成式AI模型在HuggingFace排名第一

- 模型Sheep-duck-llama-2在10月提交,获得74.07分

- 该模型通过调优取得进步,验证了瑞德在AI技术上的领先地位

站长之家(ChinaZ.com)10月10日 消息:近日,AI教育解决方案领导者Riiid宣布,其最新生成式AI模型在知名机器学习模型平台HuggingFace上获得第一名。

HuggingFace开放式大语言模型排名中,Riiid10月提交的最新模型“Sheep-duck-llama-2”获得了74.07分的高分,在全球500多个开源生成式AI模型中位居榜首。HuggingFace会定期对参与排名的公司和个人提交的模型进行评测,并更新排名。

image.png

早在9月,Riiid提交的另一个模型就已获得73.69分,位列世界第二。而10月提交的“Sheep-duck-llama-2”模型则进一步取得74.07分的佳绩,最终登顶排行榜。

“Sheep-duck-llama-2”是在llama-2-70b模型的基础上进行微调的文本生成模型,应用了HuggingFace Transformers库,使用了Orca样式和Alpaca样式的数据集进行训练。该模型在ARC、HellaSwag、MMLU和TruthfulQA等多个指标上进行了评估。

Riiid CEO表示,作为一家不限于教育领域的AI技术公司,这次排名第一充分证明了Riiid在大语言模型学习能力和调优技术方面的世界领先地位。他预计,Riiid通过AI教育实践累积的提示工程经验,将为其调优技术带来良好协同效应。

Riiid一直致力于使优质教育普惠全球,已与十多个国家的教育公司和学校合作,为学生提供个性化学习体验。最近,Riiid还签署备忘录,将为巴西公立教育提供AI技术支持。Riiid研究人员将继续开发新的模型架构,提升AI模型性能,并以实际数据验证学习影响,在国际AI会议上发表论文。

举报

  • 相关推荐
  • 实锤了,Llama 4重测排名掉至32名!远不及DeepSeek和Qwen

    LMArena更新了Meta最新发布的开源大模型Llama-4-Maverick的排名,从此前的第2名,直线掉到了第32名!这也实锤了此前开发者对Meta为刷榜排名向LMArena提供了“特供版”的Llama4大模型的质疑。开源版同款Llama-4-Maverick-17B-128E-Instruct在LMArena的排名为32名,远低于Gemini2.5Pro、GPT4o、DeepSeek-V3-0324、DeepSeek-R1、Qwen2.5-Max,甚至连英伟达基于上一代Llama3.3改造的Llama-3.3-Nemotron-Super-49B-v1都不如。

  • Llama 4大模型跌落神坛:作弊刷榜、代码能力极差、和DeepSeek比就是伪开源

    被寄予厚望的美国Meta公司的最新开源大模型Llama4发布不到2天时间,口碑急转直下,被质疑为刷榜作弊实际效果差、开源条件多部署门槛高是伪开源等。大模型评测平台LMArena亲自下场发文,打脸Meta提供给平台的Llama4是“特供版”。Meta若继续在商业控制与技术开放之间摇摆,恐将在AI竞赛中进一步失去开发者支持。

  • 反击DeepSeek失败!Llama 4效果不好,Meta承认有问题

    今天凌晨1点半,Meta生成式AI领导者AhmadAl-Dahle在社交平台发布了一篇长文,对前天刚开源的Llama4质疑进行了官方回应。Ahmad表示,Llama4一开发完就发布了,所以,不同服务中模型质量难免会有一些差异。由于关税大战的原因,Meta的股票遭遇重创,他们也需要一个利好消息来拉升股票,现在适得其反。

  • 刚刚,Llama 4深夜开源击败DeepSeek V3!2万亿多模态巨兽抢回王座

    Llama4重磅发布了!Meta官宣开源首个原生多模态Llama4,首次采用的MoE架构,支持12种语言,首批发布一共两款:Llama4Scout:共有1090亿参数,17B活跃参数,16个专家,1000万上下Llama4Maverick:共有4000亿参数,17B活跃参数,128个专家,100万上下文另外,2万亿参数Llama4Behemoth将在未来几个月面世,288B活跃参数,16个专家。Llama4的横空出世,成为迄今为止开源最强,多模态能力最好的模型之一。L

  • 苦等一年 Meta终于放大招 正式发布开源大模型Llama 4

    美国科技巨擘Meta重磅推出其迄今最为强大的开源AI模型Llama4,恰逢Llama3上市一周年之际。Llama4系列采用了先进的混合专家架构,这一架构在模型训练及用户查询回答过程中展现出更高效率,通过将模型划分为多个专注于特定任务的专家”子模型,实现精准高效的处理。Meta首席执行官扎克伯格表示:他们的目标是建立世界领先的人工智能,将其开源,并使其普遍可用,以便世界上每个人都能受益。

  • Llama 4五大疑点曝光,逐层扒皮,全球AI进步停滞,NYU教授称Scaling彻底结束

    令人失望的Llama4,只是前奏已。接下来我们恐将看到——全球局势的改变,将彻底阻止AI进步!最近,一位AICEO做出长视频,逐级对Llama4身上的六大疑点进行了扒皮。GaryMarcus正在寻找对开发更可靠替代方法有兴趣的投资者。

  • Meta说他们的 Llama 4 偏见少了!但,“虚假对等”才是真偏见

    Meta公司称,相比之前的版本,他们最新的人工智能模型Llama4的政治偏见更少了。其中一部分便是通过允许该模型回答更多带有政治争议性的问题来实现这一点的。下次当你使用Meta的AI产品时,它可能会为“通过服用马用镇静剂来治疗新冠病毒”这种观点说好话!

  • 超过ChatGPT、Deepseek?谷歌发布 Gemini 2.5 Flash AI 模型

    新版AI模型缩短了响应时间,节约了运算成本;还推出了新的AI芯片“Ironwood”。谷歌发布了新的AI模型“Gemini2.5Flash”,据称,这款AI模型的性能比OpenAI和DeepSeek的AI产品“更高效”。谷歌计划在三星今年上半年推出的AI伴侣机器人Ballie上搭载生成式AI模型。

  • 全渠道销售量排名第一!海信新风空调何以激发“乘数效应”?

    奥维云网数据显示,2024年海信新风空调以全渠道销量第一稳居中国市场榜首。2025年一季度,海信继续领跑行业,推出搭载"增氧新风+AI省电"功能的X3Pro新品,以及FIFA世界杯定制款璀璨C3Pro空调。C3Pro采用主动式空气健康解决方案,配备AI智能交互和传感器技术,可实时监测并自动调节室内空气质量。海信通过技术创新构建"AI空气管家"生态,实现语音智控、场景定制等功能,满足用户个性化需求。作为中国新风空调领域的开创者,海信持续引领行业从温控工具向健康空气解决方案转型,重塑全球健康空气产业格局。(140字)

  • 英伟达将首次在美制造 AI 超算、及 Blackwell 芯片

    站长之家(ChinaZ.com) 4月15日 消息:随着 AI 行业的蓬勃发展,英伟达位于美国的人工智能芯片和超 级计算机工厂将创造数千个就业机会。科技巨头英伟达(NVIDIA)宣布,其 AI 超 级计算机将完全在美国本土生产。在全球贸易战的背景下,英伟达这一举动是为了减少对海外市场的依赖,并促进美国国内的生产。英伟达确认,他们已开始在台积电位于美国亚利桑那州凤凰城的工厂生产�