首页 > 关键词 > AntutuBenchmark最新资讯
AntutuBenchmark

AntutuBenchmark

让大模型直接操纵格斗游戏《街霸》里的角色,捉对PK,谁更能打?GitHub上一种你没有见过的船新Benchmark火了。与llmsys大模型竞技场中,两个大模型分别输出答案,再由人类评分不同——街霸Bench引入了两个AI之间的交互,且由游戏引擎中确定的规则评判胜负。正如开发者所说,想要赢,要在速度和精度之间做好权衡。...

特别声明:本页面标签名称与页面内容,系网站系统为资讯内容分类自动生成,仅提供资讯内容索引使用,旨在方便用户索引相关资讯报道。如标签名称涉及商标信息,请访问商标品牌官方了解详情,请勿以本站标签页面内容为参考信息,本站与可能出现的商标名称信息不存在任何关联关系,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述反馈文件后,将会依法依规核实信息,第一时间沟通删除相关内容或断开相关链接。

与“AntutuBenchmark”的相关热搜词:

相关“AntutuBenchmark” 的资讯1879篇

  • 大模型实时打《街霸》捉对PK,GPT-4居然不敌3.5,新型Benchmark火了

    让大模型直接操纵格斗游戏《街霸》里的角色,捉对PK,谁更能打?GitHub上一种你没有见过的船新Benchmark火了。与llmsys大模型竞技场中,两个大模型分别输出答案,再由人类评分不同——街霸Bench引入了两个AI之间的交互,且由游戏引擎中确定的规则评判胜负。正如开发者所说,想要赢,要在速度和精度之间做好权衡。

  • 苹果研究人员提出MAD-Bench基准,克服多模态大语言模型中幻觉和误导性提示

    在人工智能领域,多模式大语言模型在推动进步方面发挥了巨大作用,但它们面临处理误导性信息的挑战,可能导致不正确或产生幻觉的响应。这种脆弱性引发了对MLLM在需要准确解释文本和视觉数据的应用中可靠性的担忧。作为一个不断发展的领域,解决这些挑战对于在现实应用中部署MLLMs至关重要。

  • 微软推大模型整合性工具库PromptBench

    微软最近推出了一个专门用于评估大语言模型的整合性工具库,名为PromptBench。该工具库提供了一系列工具,包括创建不同类型的提示、进行数据集和模型加载、执行对抗性提示攻击等,以支持研究人员从不同方面对LLMs进行评估和分析。这一系列特点和功能使得PromptBench成为一个非常强大且全面的评估工具库。

  • realme真我GT5 Pro现身Geekbench平台:确认有24GB版本

    随着发布日期的临近,关于realme真我GT5Pro的相关爆料信息也开始多了起来,最近又有一款真我GT5Pro出现在Geekbench跑分平台。根据测试数据显示,这款测试机型运行安卓14系统、搭载骁龙8Gen3处理器,值得一提的是其还采用了24GB内存,预计在正式机型上也会提供这一配置版本。真我GT5Pro手机此前已经官宣将在本月正式发布,预计官方也会很快预热更多信息,感兴趣的可以关注一下。

  • 天玑9300苏黎世AI Benchmark跑分出炉,赢得AI性能第一!

    联发科最新发布的一代旗舰级5G生成式AI移动芯片天玑9300,其创新的全大核架构设计与最新的AI处理器APU等联发科特色技术的合并,为生成式AI应用提供了强大的动力,以实现引人入胜、丰富多样的生成式AI体验。联发科也与大量的AI企业在业内进行深入合作,共同在移动平台上构造了一个充满活力的AI生态。联发科等生成式AI的领先者们正通过不断地技术革新和适当的生态布局,大力推动混合式AI计算,并为端侧生成式AI部署设计出了一套独自且高效的方法,全力以赴推进生成式AI在端侧的普及,旨在让更多的用户享受到端侧AI的个性化服务,带来全新的全方位智能体验,实现科技成果惠及全社会。

  • 首批骁龙8 Gen3旗舰跑分出炉!小米14、Z60 Ultra现身Geekbench:性能直指A17 Pro

    高通将在本月25日的骁龙峰会上发布新的旗舰芯片骁龙8Gen3,在芯片发布后,各大厂商也将陆续推出自家的新旗舰机型。首批搭载骁龙8Gen3的小米14和努比亚Z60Ultra接连现身Geekbench,其跑分成绩也得到了确认。需要注意的是,努比亚测试机型搭载的骁龙8Gen3处理器并不是最新版本。

  • 小米Redmi Note 13 Pro现身Geekbench:首发骁龙7s Gen 2

    小米RedmiNote13Pro目前已经现身跑分网站Geekbench6,型号为2312CRAD3C,首发骁龙7sGen2处理器。从跑分信息来看,小米RedmiNote13Pro搭载16GB内存,单核1012分,多核2943分。Note将再次改写千元影像的新大门,全面提升手机行业影像门槛。

  • AI初创公司 Arthur 发布开源 AI 模型评估工具 Bench

    纽约人工智能创业公司Arthur发布了开源工具ArthurBench,用于评估和比较大型语言模型的性能。ArthurBench可以帮助企业在特定用例上测试不同语言模型的性能,并提供准确性、可读性、避险等指标进行比较。Arthur还与亚马逊网络服务和Cohere合作举办黑客马拉松,鼓励开发人员为ArthurBench构建新的指标。

  • Intel A580跑分现身Geekbench:超越RTX 3050

    在Intel公布Arc系列独显之初,就曾有消息指出将有一款定位入门级的A580显卡。但时至今日,这张显卡依旧没有正式现身。Intel仍未公布将在何时发售A580显卡。

  • 一加Ace 2 Pro现身Geekbench:搭载二代骁龙8 首发24GB+1TB

    一加一款新机目前已经现身Geekbench跑分平台,预计是将要发布的一加Ace2Pro。这款手机取得了单核心1580分、多核心5163分的成绩,性能绝对是旗舰级别的。一加Ace2Pro主打版本为16GB512GB版本,同时该机将会首发量产24GB1TB版本。

  • 荣耀MagicPad现身GeekBench 搭载骁龙888

    荣耀新的旗舰平板MagicPad在基准测试平台GeekBench的数据库中出现了,这表明这款平板的性能表现将会非常出色。根据GeekBench给出的信息,荣耀MagicPad型号为HONORGDI-W09,将搭载高通骁龙888处理器,并提供16GB和8GB两种内存型号。荣耀MagicPad作为荣耀迄今最强的平板,除了搭载骁龙888处理器外在屏幕和音质方面有着非常出色的表现,预计将在7月12日与荣耀MagicV2等新品一同亮相。

  • CPU性能激增20%!苹果M2 Ultra处理器Geekbench 6跑分出炉

    不久前,苹果发布了最新的M2Ultra处理器,在新的MacPro与MacStudio中首发搭载。这颗处理器的Geekbench6跑分成绩已经出炉,与早些时候流出的Geekbench5.4跑分成绩存在一定差异。如果放眼整个CPU阵营,M2Ultra仍不能实现对Intel与AMD的完全超越。

  • 清华等开源「工具学习基准」ToolBench,微调模型ToolLLaMA性能超越ChatGPT

    人工智能基础模型也类似,如果仅靠训练阶段得到的权重,使用场景就会非常受限,而最近提出的工具学习(tool learning),将特定领域的专用工具与大规模基础模型相结合,可以实现更高的效率、性能。

  • 苹果 M2 Ultra 芯片现身 Geekbench 数据库,频率 3.68 GHz

    苹果的新款MacPro在Geekbench数据库中现身,显示了其搭载的M2Ultra芯片的部分性能数据。这款芯片是苹果为MacPro定制的一款高端芯片,拥有12个CPU核心和30个GPU核心,支持最高96GB的内存。苹果还将展示其最新的软件产品,包括iOS17、macOS13、watchOS10和tvOS16等。

  • 荣耀 Magic5 现身 Geekbench:骁龙 8Gen2+12G 运存

    日前荣耀+Magic5新机现身+Geekbench+跑分平台,型号为+PGT-AN00,确认搭载骁龙8Gen2处理器,拥有12GB+内存,运行+Android13系统。从跑分数据来看,荣耀+Magic5的单核跑分为1411,多核跑分为4584。据+@数码闲聊站+称,新机还将标配5000mAh+以上单电芯大电池,续航很不错,但快充速度肯定不如100W+的旗舰机。

  • 小米Poco X5跑分现身GeekBench:骁龙695芯片 Redmi Note 12小改款

    小米主打海外市场的Poco X5手机现身GeekBench平台,根据跑分数据来看,隶属入门级别机型。小米 Poco X5 手机分为标准版与5G两种版本,跑分机型为标准版, 单核成绩 693,多核成绩 2113。在其他规格方面,5000mAh的大容量电池、辅以最高33W的充电功率,4800万像素双摄都得以保留。

  • 240W闪充之王!真我GT Neo5现身Geekbench:顶配16GB+1TB

    真我推出了240W满级秒充技术,同时宣布真我GTNeo5将在2月份发布,首发搭载该技术。随着发布时间的日益临近,有博主进一步晒出了该机的Geekbench跑分信息。realme副总裁徐起表示,真我GTNeo5产品贼强、配置贼顶、亮点贼多、机器贼香。

  • 真我GT Neo5现身Geekbench跑分网站:顶配搭载16GB+1TB存储组合

    真我推出了业界领先的240W满级秒充技术,同时宣布全新的真我GTNeo5将首发搭载该技术,该机将于2月份正式发布。随着发布时间的日益临近,外界关于该机的爆料也更加密集,截至目前已经有非常详尽的外观配置细节传出。至于更多详细信息,我们拭目以待。

  • 谷歌Pixel Fold折叠机现身Geekbench:搭载Tensor G2

    据GSMArena今日消息,一款型号为GoogleFelix的新机现身Geekbench跑分平台,传闻该机就是谷歌PixelFold折叠手机。从该机识别信息来看,其搭载了TensorG2芯片,与高通骁龙888相差不大。有爆料称该机的起售价为1799美元,将于2023年5月与Pixel平板电脑一同亮相。

  • 苹果 M2 Max 芯片 Geekbench 跑分成绩曝光 单核性能较上一代提升近 20%

    根据Geekbench性能测试数据,M2 Max这款芯片,预计搭载在2023年春季推出的MacBook Pro上,单核测试分数达1899,相比于上一代旗舰芯片M1 Max,M2 Max单核性能提升近20%。作为比较,Mac Studio中的M1 Max芯片的单核得分是1755,多核得分是12333。如果M2 Max芯片的结果是准确的,那么即将推出的芯片的性能提升将相对较小。

  • Redmi Note 12 Pro跑分现身Geekbench:天玑1080与天玑920成绩相仿

    今晚,Redmi将发布新一代体验小金刚”Redmi Note 12系列;而现在,Redmi Note 12 Pro的Geekbench跑分成绩也已经现身...根据Geekbench显示的信息,Redmi Note 12 Pro搭载的这颗天玑1080单核跑分767分,多核跑分2008分,与天玑920成绩相仿...天玑1080是联发科在今年10月发布的处理器,采用台积电6nm制程工艺,搭载2个ARM Cortex-A78大核(2.6GHz),6个ARM Cortex-A55小核(2GHz)......

  • 三星Galaxy S23 Ultra现身Geekbench:搭载高通骁龙8 Gen2

    继Galaxy S23之后,超大的Galaxy S23Ultra最近也被一位数码博主在Geekbench评估网站上发现了。 根据外媒博客发布的最新信息,与之前的披露基本相同,新的三星Galaxy S23Ultra采用旗舰级的骁龙8Gen2平台,8GB内存,运行Android13。它在Geekbench中的单核得分是1521分,多核得分是4689分,这比它的前辈有很大的改进。<br/> <br/>

  • RTX 4090现身Geekbench:跑分达RTX 3090 Ti 1.6倍

    根据目前放出的信息,在GeekbenchCUDA跑分测试项目中,RTX4090的得分为417713分,RTX3090Ti的分数为260346分...也就是说,RTX4090的跑分成绩达到了RTX3090Ti的1.6倍之高...作为NVIDIA新的旗舰级显卡,RTX4090拥有760亿个晶体管,16384个CUDA核心和24GB的高速GDDR6X显存,性能之强毫无疑问...根据目前信息,RTX4090将作为RTX40系显卡最早登场的一款,在10月12日正式发售,国行建议零售价12999元...

  • 8C/8T纯E核:Geekbench曝光酷睿i3-N300低功耗入门处理器

    作为一档低功耗入门处理器,其特点是采用了 Gracemont 架构的纯 E 核设计...由 @BenchLeaks 的 Twitter 爆料和单独的 Geekbench 基准测试数据库页面可知,酷睿 i3-N300 系列处理器具有 8 核心 / 8 线程,同时拥有 4×64 KB L1I、4×32 KB L1D、1×2 MB L2 和 1×6 MB L3 的缓存设计...基础频率 1.8 GHz / 睿频可达 3.8 GHz,Geekbench 单核得分 1025 / 多核则是 4420......

  • 面向全球发售 小米 12T Pro现身Geekbench

    报道称,小米 12T Pro已现身Geekbench数据库。该机的型号显示其为一款面向全球发售的产品。Geekbench 数据显示,小米 12T Pro将采用8核处理器,其中1个内核运行频率为3.19GHz,3个内核运行频率为2.75GHz,4 个内核运行频率为2.02GHz,因而也就意味着该机将搭载高通骁龙 8+ Gen 1芯片。此前还有爆料显示,小米 12T Pro预计将采用6.67英寸+1,220 x 2,712分辨率的AMOLED屏幕,并且配备屏下指纹识别。另外,其前置2000万像素自拍摄像头,后置三摄分别为2亿像素主摄+800万像素广角摄像头+200万像素微距摄像头。

  • 12核心Ryzen 7900X跑分在偏向Intel的UserBenchmark网站上排名第一

    随着发布会的临近,基准测试也被泄露出来...这些分数在在线免费基准测试工具网站UserBenchmark上泄露了,该网站被认为几乎一有机会就喜欢向AMD泼脏水,当Ryzen75800X3D推出时,该网站称AMD的3DV-cache技术为噱头,还有无数这样的例子...对于UserBenchmark来说,讽刺的是,Ryzen7900X还是在其基准测试中击败了Corei9-12900KS,占据了头名,数据显示7900X的性能比12900KS好18%......

  • Intel低功耗处理器i7-13700T现身Geekbench:跑分追平i5-12600K

    近日,Intel新的低功耗处理器i7-13700T现身Geekbench数据库,跑分成绩也一并公布。根据已知数据,i7-13700T与其他i7-13700处理器拥有相同的核心配置,区别在于它的默认频率仅1.4GHz,最高频率为4.788GHz,功耗35W。这样的频率与功耗使得它并不适合游玩游戏,主要针对需要多核心且功耗低的设备。在Geekbench V5中,i7-13700T的单核成绩在1893到1939分之间,多核成绩则是在8925到11564分之间。这意味着,i7-13700T的跑分成绩已经基本做到了与i5-12600K持平,性能上能够得到保证。不出意外,包含i9-12900K在内的多颗13代桌面处理器市将在今年

  • Geekbench证实Moto Razr 2022折叠屏新机规格 或售1150欧元

    (viaNashvilleChatter)以下是MotoRazr2022翻盖式折叠屏新机的预期规格汇总:●6.7英寸@FHD+pOLED柔性内屏(120Hz刷新率/20:9宽高比)+3英寸外屏●高通骁龙8+Gen1芯片组●高达12GBRAM+512GBROM●支持25W快充●预装Android12移动操作系统●32MP前置自拍摄像头●后置50MP主摄+13MP超广角镜头感兴趣的朋友,可留意8月2日(下周二)19:30的发布会...

  • 一加10T现身GeekBench:搭载高通骁龙8+处理器/16GB内存

    据海外爆料达人最新发布的信息显示,近日一款型号为PGP110的一加新机已现身Geekbench网站,不出意外的话该机正是此前得到曝光的一加10T,该机将搭载骁龙8+旗舰平台,最高辅以16GB内存,这将是一加第一款配备这么大内存的智能手机...全新的一加10T将采用一块6.7英寸FHD+ LTPO 2.0 AMOLED挖孔屏,搭载高通骁龙8+旗舰处理器,辅以16GB LPDDR5内存,以及最高512GB的UFS 3.1存储,安兔兔综合成绩突破了113万分,是目前骁龙8+机型中的最高分......

  • 苹果MacBook Air内置M2芯片在Geekbench的跑分数据开始增多

    除了升级的处理器(它的CPU速度提高了18%,GPU速度提高了35%),Air更苗条,带来了新的13.6英寸2560x1664pxIPSLCD,亮度为500尼特,支持MagSafe线缆和两个USB-C端口,还有一个新的1080p网络摄像头...

热文

  • 3 天
  • 7天