首页 > 业界 > 关键词  > 模型最新资讯  > 正文

Yi Tay官宣新模型Reka Flash 性能媲美Gemini Pro

2024-02-14 10:10 · 稿源:站长之家

要点:

  • 前谷歌科学家Yi Tay领导的团队发布了21B的多模态语言模型Reka Flash,性能媲美Gemini Pro和GPT-3.5。

  • Reka Flash在多语言推理和视觉基准测试中表现出色,优于其他大型模型。

  • Reka Edge是一个更紧凑的7B模型,适用于本地部署和延迟敏感应用。

站长之家(ChinaZ.com)2月14日 消息:Yi Tay领导的团队发布了21B的多模态语言模型Reka Flash,其性能与Gemini Pro和GPT-3.5相媲美。这一模型在多个基准测试中取得了出色的成绩,尤其在多语言推理和视觉基准测试中表现突出,超越了其他大型模型。与此同时,团队还推出了Reka Edge,这是一个参数更少、效率更高的7B模型,适用于资源受限的场景,如本地部署。Reka团队的发布标志着他们在构建先进多模态语言模型的路上迈出了重要一步,为接下来的研究奠定了基础。

image.png

体验地址:https://chat.reka.ai/auth/login

首先,Yi Tay领导的团队发布了Reka Flash,这是一个21B的多模态语言模型,具有与Gemini Pro和GPT-3.5相媲美的性能。他们用相对有限的资源从零开始训练了这个模型,展现出了令人瞩目的技术实力。

其次,Reka Flash在多个基准测试中表现出色,尤其在多语言推理和视觉基准测试方面表现突出,超越了其他大型模型。这表明Reka Flash在处理多模态数据和多语言任务上具有很高的适用性和效率。

此外,Reka团队还提出了Reka Edge,这是一个更为紧凑的7B模型,适用于本地部署和资源受限的场景。这一举措进一步丰富了他们的产品线,满足了不同场景下的需求。

总的来说,Reka团队的发布标志着他们在多模态语言模型领域的重要进展,为未来的研究和应用奠定了坚实的基础。这也预示着在人工智能领域,特别是在自然语言处理和计算机视觉方向,将迎来更多创新和突破。

举报

  • 相关推荐
  • 只有0.9B的PaddleOCR-VL,却是现在最强的OCR模型。

    ​这几天,OCR这个词,绝对是整个AI圈最火的词。因为DeepSeek-OCR,甚至让OCR这个赛道文艺复兴,又给直接带火了。 整个Hugging Face的趋势版里,前4有3个OCR,甚至Qwen3-VL-8B也能干OCR的活,说一句全员OCR真的不过分。 然后在我上一篇讲DeepSeek-OCR文章的评论区里,有很多朋友都在把DeepSeek-OCR跟PaddleOCR-VL做对比,也有很多人都在问,能不能再解读一下百度那个OCR模型(也就是PaddleOCR-VL

  • AI日报:OpenAI发布浏览器Atlas;通义Qwen3-VL新增2B、32B两个模型尺寸;百川发布循环证据增强大模型

    本文汇总AI领域最新动态:OpenAI推出集成ChatGPT的Atlas浏览器,实现多任务自主处理;阿里通义千问新增2B/32B视觉语言模型,手机可流畅运行;谷歌AI Studio升级Vibe Coding功能,简化应用开发流程;百川发布医疗大模型M2Plus,通过循证推理降低误诊率;奇瑞墨甲机器人实现L3级技术突破,计划多行业应用;YouTube推出AI肖像识别工具,打击虚假内容;三星宣布2026年推出AI眼镜,融合AR与语音助手;Claude客户端更新,支持截图分析和语音交互功能。

  • 全新开源的DeepSeek-OCR,可能是最近最惊喜的模型。

    ​AI圈虽然天天卷,但是很多的模型,真的越来越无聊了。 每天就是跑分又多了几个点。 直到昨天,DeepSeek久违的发了一个新模型。 DeepSeek-OCR。 这玩意,是真的有点酷。

  • 火山 AI 搜索引擎升级:大模型时代重塑用户体验与业务增长

    火山引擎近日升级企业级AI搜索助手,底层模型升级至豆包大模型1.6,全面提升搜索、推荐、问答能力。该平台支持“开箱即用”,企业可快速构建专属对话式搜索助手,已在电商导购、视频新闻、AI搜图、智能硬件等多场景落地,帮助优化产品体验,为业务增长注入新动能。

  • 向AI构建能力,用模型产出价值,让金融优质发展

    2025年云栖大会在杭州举行,聚焦“云智一体+碳硅共生”主题,展现中国前沿科技生命力。阿里云智能集团副总裁张鹰介绍,“通义点金”平台全新升级,致力于构建金融行业垂直模型,打造具备业务洞察力的“专家级智能体”。核心突破包括:通过飞轮平台实现模型与业务双向螺旋上升,构建可观测、可评测、可迭代能力;赋予模型“自知之明”,精准调用工具并内化人类逻辑思维;建立多层次交叉验证测评体系,确保金融级严谨性。未来将持续推动通用模型与金融专业知识的有机结合,助力金融业务核心效能提升。

  • 金融行业用好大模型,只有“垂直”一个解

    文章探讨大模型在金融等复杂业务场景的落地挑战,指出通用模型难以满足行业对准确性、可解释性及合规性的高要求。垂直模型通过内化行业核心知识与能力,成为解决复杂业务问题的关键路径。实践显示,金融垂直模型已在营销、客服、风控等场景实现显著成效,如提升效率80%、降低风险。未来需通过数据飞轮、深度适配等技术实现模型持续迭代,构建一站式金融垂直模型生产工场。

  • DeepSeek开源3B OCR模型:长文本识别达97%精度

    DeepSeek在GitHub开源新一代OCR模型,采用创新光学二维映射压缩技术,在长文本识别场景实现97%准确率。模型通过动态压缩生成最优视觉特征令牌,较传统方法减少60%计算冗余。实验显示在1:20压缩率下仍保持60%以上准确率,显著优于同类模型。该技术路径为OCR系统小型化提供解决方案,其动态压缩策略对大型语言模型的记忆管理机制具有重要启示。

  • 00后担大梁交大本科生在计算机安全顶级会议上实现突破,打造大模型全方位安全分析底座

    上海交大本科生徐菲悦为第一作者的论文《大型语言模型鲁棒性与对齐的多维评估框架》被IEEE S&P 2026录用。该研究提出“安全魔方”评估体系,构建覆盖攻击、防御与判定三大维度的多指标框架,系统化刻画LLM安全性,新增攻击稳定性、跨模型迁移性等关键度量,弥补传统单一指标不足,为研究比较、安全基线制定及监管审查提供可操作的通用量表。

  • AI日报:美图RoboNeo上线首月MAU破百万;影视级音画同步模型Gaga AI发布;vivo蓝心3B端侧大模型发布

    本文汇总AI领域最新动态:美图通过组织变革推动AI应用RoboNeo月活破百万;vivo发布蓝心3B端侧大模型,性能超越8B模型;Gaga AI实现静态照片生成60秒电影级视频;ChatGPT周活用户突破8亿;Figma引入Gemini模型提升设计效率;印度试点AI聊天机器人购物;Figure AI推出第三代家用机器人Figure 03;谷歌推出Gemini Enterprise自动化工作流平台。显示AI正从工具向创作者跃升,加速渗透各行业。

  • 金蝶征信“金融风控大模型” 摘得AFAC2025大奖

    一家社区水果店凭借收款码的36个月交易记录,将银行贷款额度从7万元提升至10万元。这揭示了中国超3亿商户正通过二维码流水数据构建数字信用体系:使用收款码满六个月的商户获贷可能性超60%,三年后跃升至90%。此类高频实时数据正重塑风控逻辑——不看抵押、不看报表,只忠实记录每笔交易背后的经营事实。金蝶征信凭借AI与知识图谱技术,穿透至6层交易链条,构建包含4.45亿交易关系的产业互联网图谱,助力金融机构实现精准信贷匹配。其智能风控系统已推动合作机构放贷额度提升50%,标志着风控模式从“经验驱动”向“数据智能驱动”的转型。

今日大家都在搜的词: