首页 > 业界 > 关键词  > RekaCore最新资讯  > 正文

多模态语言模型Reka Core:可分析图片、视频、音频 评测得分与GPT-4接近

2024-04-17 09:59 · 稿源:站长之家

划重点:

🌟 强大性能:Reka Core是一款与业界领先模型媲美的前沿多模态语言模型,具备出色的性能表现和灵活的部署方式。

🔍 核心能力:Core拥有多模态理解、超长上下文窗口、强大推理能力、编码和主动式工作流等关键能力,支持更广泛的应用场景。

🤝 合作伙伴:Reka与Snowflake、Oracle等领先技术平台和政府机构合作,共同推动多模态技术的发展,助力客户实现数据价值最大化。

站长之家(ChinaZ.com)4月17日 消息:Reka AI近日宣布推出其最新力作——Reka Core,这是一款前沿的多模态语言模型,拥有强大的性能和灵活的部署方式。该模型像Gemini一样可以直接分析图片、视频、音频,评测得分与GPT-4和Gemini-Ultra接近。

image.png

Reka Core是通过数千个GPU在数月内高效训练而成,与当今行业领先模型不相上下。在核心性能方面,Core在总拥有成本方面提供了超值的性价比,其功能与部署灵活性的结合为广泛的新应用场景打开了大门。

与市场上其他领先模型相比,Core在多模态人类评估中表现出色,超越了GPT-4V,优于Claude-3Opus,视频任务上更是胜过了Gemini Ultra。在语言任务方面,Core在各项业内标准测试中也表现出竞争力。

image.png

除了语言理解,Core还具备图片、视频和音频的强大多模态理解能力,拥有128K的上下文窗口,可以准确地记忆大量信息。其推理能力出色,适用于需要复杂分析的任务,并且是顶尖的代码生成器,可为主动式工作流提供支持。此外,Core还具备多语言能力,预训练了32种语言的文本数据,流利掌握英语以及多种亚洲和欧洲语言。

Reka的三款模型为图像、视频和音频输入提供了全面支持,助力电商、社交媒体、数字内容、视频游戏、医疗保健和机器人等行业拓展更广泛和差异化的客户应用场景。Snowflake、Oracle等全球领先科技平台和政府机构如AI Singapore等成为Reka的重要合作伙伴,共同推动多模态技术的发展。

Reka致力于开发前沿多模态模型,而今天Core的发布标志着其在实现这一使命上迈出了重要的一步。通过Edge、Flash和Core等系列模型的全面支持,Reka已经准备好迎接更广泛的挑战,展望未来,我们期待着与更多愿意加入我们的伙伴共同探索多模态世界的无限可能。

产品入口:https://top.aibase.com/tool/reka-core

举报

  • 相关推荐
  • 主流AI多模态大模型有哪些?超全的多模态大模型指南分享

    2024年多模态大模型成为AI领域最具前景的技术方向之一。文章全面分析了主流多模态大模型的特点、应用场景和发展趋势。多模态大模型能同时处理文本、图像、音频、视频等多种数据,实现更智能的人机交互。重点介绍了GPT-4V、Claude3.5、Gemini、通义千问等代表性模型,对比了它们在视觉理解、编程能力、中文处理等方面的优势。应用场景涵盖智能客服、内容创作、教育医疗等领域。未来发展趋势包括模型规模扩大、支持更多模态、实时交互能力提升等。选择模型需考虑应用需求、语言支持、性能成本等因素。

  • AI日报:腾讯混元推3D生成大模型Hunyuan3D-PolyGen;钉钉AI表格重磅来袭;阿里推多模态大语言模型HumanOmniV2

    本文介绍了AI领域多项重要进展:1)腾讯推出首个美术3D生成大模型Hunyuan3D-PolyGen,显著提升建模效率;2)阿里发布多模态大模型HumanOmniV2,准确率达69.33%;3)钉钉AI表格实现1小时处理千项任务;4)百度PaddleOCR3.1版本在多语种识别和文档翻译方面升级;5)微软推出Deep Research智能体,自动化研究流程;6)香港理工与OPPO联合开源视频超清框架DLoRAL;7)谷歌开源MCP工具箱简化AI与数据库集成;8)Win11将推出AI动态壁纸功能。这些创新展示了AI在3D生成、多模态理解、办公效率、视觉处理等领域的突破性进展。

  • 微信iOS又有新功能 聊天终于能发实况图片了

    日前,微信iOS版又迎来新功能与好友聊天支持发送实况照片,目前为灰度测试阶段。 据了解,使用该功能需要将微信iOS更新至8.0.61版本及以上,默认实况为关闭状态,发送照片时点击进入大图预览页面可手动开启单个照片的实况开关。

  • AI日报:阿里通义开源音频生成模型ThinkSound;谷歌Veo3支态图片生成视频;昆仑万维发布 Skywork-R1V 3.0

    【AI日报】今日AI领域重要动态:1)阿里开源支持链式推理的音频生成模型ThinkSound,实现高保真空间音频生成;2)谷歌Veo3升级,支持静态图片生成生动视频;3)Hugging Face发布30亿参数小模型SmolLM3,性能优于Llama-3.2-3B;4)阿里开源网络智能体WebSailor,展现强大推理和检索能力;5)Moonvalley发布原生1080P视频生成模型Marey Realism v1.5;6)Vidu Q1支持最多七张参考图像生成一致性视频;7)苹果�

  • AI重构社交生态 Soul以多模态技术赋能社交

    社交平台Soul正通过AI技术重塑社交生态:1)2016年推出智能推荐系统"灵犀引擎",2020年启动AIGC算法研发,2023年推出自研大模型Soul+X,开发AI虚拟人、智能聊天等应用;2)升级多模态大模型,支持文字对话、语音通话、多语言理解等功能,提供拟人化情感陪伴;3)围绕Z世代需求,促成超10万对情侣步入婚姻,并联合开展心理健康公益活动;4)以"技术+人文"双轮驱动,致力于打造更智能舒适的社交环境,重新定义人机关系。

  • AI日报:腾讯元宝升级一句话搜索图片视频;微信支付MCP上线;谷歌在全球推出 Veo 3

    【AI日报】今日AI领域重要动态:1)腾讯元宝升级,支持一句话搜索呈现图文视频;2)微信支付MCP上线,AI与支付结合开启商业新纪元;3)谷歌Veo3视频生成模型向Pro/Ultra会员开放,新增"照片生成视频"功能;4)开源DeepSeek R1增强版推理效率提升200%;5)美图WHEE推出"一句话修图"功能;6)芯片公司Ambiq申请美国IPO,受益生成式AI需求;7)昆仑万维开源奖励模型Skywork-Reward-V2;8)Kyutai发布超低延迟开源语音合成技术;9)Figma拟以200亿美元估值登陆纽交所;10)字节跳动开源Trae-Agent智能开发工具。

  • 国内首个!高德地图正式上线多语言地图:新增14种语言

    日前,高德地图正式上线多语言地图,在原有的中英文基础上,新增多达14种语言。 这14种语言包括西班牙语、葡萄牙语、法语、德语、泰语、日语、韩语、土耳其语、意大利语、俄语、阿拉伯语、马来语、印尼语、越南语。 此次多语言版的推出,使更多非英语国家的用户也能享受高德地图提供的优质出行服务。 高德地图多语言版实现了产品界面与地理信息的多语种适配,�

  • AIBase.com完整评测:发现20,382+AI工具的最佳途径

    AIBase是全球领先的AI工具导航平台,收录超过20,382个AI工具,涵盖25个主类别和187个子类别。平台提供智能搜索、专业分类目录和多语言支持,90%的工具经过实际测试。其核心优势包括:1)行业领先的收录数量和准确性;2)每日更新最新AI工具;3)用户可在30秒内找到所需工具。文章通过三个案例展示了AIBase如何帮助不同职业群体提升工作效率,并提供了5个专业使用技巧。尽管

  • 微信朋友圈评论区能发表情包和图片:缓存可清理 不会太占用存储空间

    上个月,微信开始灰度测试朋友圈评论区带图功能,支持用户用表情包和图片进行评论。 有网友表示,微信现在评论可以带图了,我想知道评论区的图片会不会缓存下来占用我的手机空间。 对此,微信员工客村小蒋表示,在讨论微信占空间时,有两种需要区分的数据:可再生数据和非可再生数据。

  • 苹果自研AI模型难产:改用第三方大语言模型

    苹果可能会跟OpenAI或Anthropic合作,双方正在谈判讨论一项潜在交易,苹果希望调用OpenAI或Anthropic的第三方大语言模型来为Siri提供技术支持。 据悉,OpenAI或Anthropic正在训练适配苹果私有云计算服务器的模型,苹果也在进行测试,目前苹果发现Anthropic的AI模型最适合Siri,且与Anthropic初步讨论了一些财务条款,消息称Anthropic要求苹果每年支付数十亿美元的费用,且该费用会随时间�