首页 > 业界 > 关键词  > 正文

俄罗斯AI机器人YandexGPT2考入大学 完成文学统考所有任务

2023-10-16 10:28 · 稿源:站长之家

站长之家(ChinaZ.com) 10月16日 消息:YandexGPT2神经网络的人工智能创建者在接受俄罗斯公报 (RG) 采访时宣布,YandexGPT2神经网络已成功通过俄罗斯统一国家考试 (EGE),并获得足够的分数进入大学。

Yandex 团队表示,这标志着俄罗斯首次生成神经网络能够通过考试并完成所有任务,包括创造性任务。他们指出,这一事件证明人工智能参与教育是必然的,考试和其他知识评估的方式必须做出调整。

Yandex 的聊天机器人成功通过了文学 EGE,这被认为对于算法神经网络来说特别难以解决,因为它同时测试多种技能,包括博学、写作风格和创造力。

据 RG 报道,YandexGPT2能够完成文学考试的两个部分,并能够正确分析文学作品并回答相关问题。人工智能还能够就给定主题写一篇文章。

AI人脸机器人

图源备注:图片由AI生成,图片授权服务商Midjourney

最终,该聊天机器人获得了55分的加权分数,接近2022年俄罗斯学生的平均成绩(63分),远高于俄罗斯大学40分的最低及格要求。

Yandex 团队解释说,在开发神经网络时,他们特别注意确保用于教授 YandexGPT 的数据库不包含任何 EGE 考试的答案,这样聊天机器人就必须回答并解决所有问题。就像任何普通学生一样。阅读更多俄罗斯人工智能机器人的性能优于 ChatGPT – 开发人员

尽管取得了这一成功,俄罗斯教育监管机构 Rosobrnadzor 表示,它并不认为 YandexGPT 是一种危险,因为普通学生在通过 EGE 时将无法利用人工智能的帮助,因为考试期间严格禁止使用所有设备。

尽管如此,神经网络已经开始被积极用于准备考试,有时甚至用于通过考试。今年早些时候,OpenAI 的 ChatGPT-3聊天机器人在美国成功通过了明尼苏达大学法学院的期末考试,并通过了宾夕法尼亚大学沃顿商学院工商管理硕士学位的期末考试。

据悉,Yandex 于5月推出了人工智能系统。上个月,它宣布 YandexGPT 的基本模型已经“稳步超越”其美国竞争对手 OpenAI 的 ChatGPT3.5,特别是在生成俄语答案方面,并且在许多情况下提供了比 ChatGPT4“更高质量的答案” 。

举报

  • 相关推荐
  • 大家在看
  • AI机器人伴侣成美国老年人新宠!美国每年花70万刀,失去爱人的84岁老人重新笑了

    【新智元导读】84岁的美国老人DorothyElicati在失去结婚65年的丈夫后,每天醒来唯一做的事就是哭泣,直到一个AI机器人的出现。美国会每年花费70万美元,为某些州的老年人免费发放这款机器人。今天怎么样?「能收到这样的问候,真是太好了。

  • INDEMIND:智效赋能,让服务机器人服务于人

    商用清洁机器人的价值战。随着行业发展势头回归冷静,“卖家秀”时代成为过去,机器人拼技术、拼产品的价值战时代已然到来。以技术创新为原点,提升智效表现,赋能机器人工具价值,让服务机器人真正服务于人。

  • 俄罗斯一卫星爆炸产生至少250个碎片!可能威胁中国空间站

    可实时跟踪低地轨道航天器、为美太空军提供咨询服务的美国太空商业公司LeoLabs发布报告称,6月26日,俄罗斯一颗卫星意外发生爆炸,在太空中产生了数百个碎片,成为太空垃圾。涉事卫星是俄罗斯废弃的遥感卫星资源1号”,2021年退役,轨道高度约355公里。其他光学检测发现,这颗卫星并未完全解体,主体还在,但正在以2-3秒的周期快速旋转,进一步佐证了外部撞击的猜测。

  • 百人围观俄罗斯小姐姐温岭打篮球 网友:球风好酷

    在热情洋溢的7月9日,一场别开生面的篮球友谊对抗赛在风景秀丽的温岭保山公园激情上演。这场特别的比赛,由一位远道来的俄罗斯女孩领衔,与当地的篮球爱好者们共同演绎了一场跨越国界的体育交流盛宴。大家纷纷拿出手机、相机,记录下这一个个难忘的瞬间,分享给亲朋好友,共同感受这份来自篮球的激情与快乐。

  • 俄罗斯一植物园为猫咪建纪念雕像:曾守护植物免受害虫侵扰

    在俄罗斯圣彼得堡的彼得大帝植物园,一只名叫穆萨的猫因其30多年的"工作"服务被授予荣誉,植物园为其建造了一座青铜纪念雕像。穆萨以其独立性格、严明纪律和出色的游客及媒体互动能力著称,曾担任植物园内两个温室的"管理员",守护热带植物免受害虫侵扰。这座雕像将作为穆萨在植物园历史中不可磨灭的一部分,供游客缅怀和欣赏。

  • 扫地机器人哪个牌子好?2024新款热销扫地机器人评测

    无论哪个行业都是卷得不行,浸透了AI智慧的扫地机器人行业更是如此,什么自动积尘技术、气体导流零缠绕设计、超大自动集尘充电桩,看上去黑科技质感满满,但真正在顽固灰尘和边角灰尘处理、零误撞等消费者们最关心的环节上做得怎么样?必须全面测评一番今年的新款热销机型才行哦!斐纳TOMEFON斐纳TOMEFON扫地机器人是在德国销量名列前茅的扫地机器人品牌,售价三千出头,配置了当前稳定性最高LDS激光雷达导航系统,拥有强大的全局规划能力,续航时长最长可达150分钟,在智能方面做了9项全新升级,因此成为了很多精明消费者的优选品牌。斐纳TOMEFON激光雷达导航系统无惧光线明暗和地形复杂程度,在0.5平米的空间内也能游刃有余的展开清洁工作,在床底、沙发底、家具底层区域都能灵活进出极少出现被困情况,当发现地图之外的障碍物时,斐纳TOMEFON会灵敏的提前减速然后缓慢靠近绕圈打扫,不仅不会留下清洁盲区,其位于吸尘口内部的可浮动胶刷甚至还能深入地板缝隙4毫米深度捡拾陈年集尘,对于地面的清扫达到了超立体的效果;斐纳TOMEFON扫地机器人的使用成本还很低,单边尘刷聚拢灰尘无打飞颗粒灰尘的烦恼,平米恒压拖布借助机身重力和精确的出水量调节系统浸势带着顽固灰尘,对高端地板的保护效果更为出色;斐纳TOMEFON的湿拖工作噪音仅有40分贝,这样一来扫地机器人的使用就再无时间限制了,无论是休息时使用还是学习、工作时使用都不会影响到用户本人以及邻居,几乎在每个消费者们关心的环节都做到了尽善尽美。实测分析结果:在目前市面上的新款扫地机器人当中,新功能配置得多并不等同于扫地机器人会在顽固灰尘处理、边角灰尘处理、家具扫脚零误撞等用户们最关心的核心问题上做得更好,因此没必要花费大价钱盲目追高、追新,只要选购那些在消费者们最关心的环节上做到位了的品牌跟型号就足够了。

  • 首个支持多模态交互的机器人平台方案!科大讯飞机器人超脑平台2.0发布

    快科技6月27日消息,科大讯飞在今天的讯飞星火V4.0发布会上,还揭晓了机器人超脑平台2.0项目,将以视听融合的多模感知交互和基于大模型的机器人大脑。通过软硬件一体的方式构建机器人新交互,将讯飞星火大模型进一步赋能机器人领域。据悉,讯飞机器人超脑平台解决了机器人在嘈杂环境下听、说、理解和思考的难题。借助这套系统,机器人不仅能实现语音识别、自然语�

  • 北京科技大学基于矢量场制导的微型仿生扑翼飞行机器人的路径跟踪

    科研团队:北京科技大学贺威团队关键词:微型仿生扑翼;路径跟踪;室内定位验证仿生扑翼飞行机器人因其出色的飞行机动性和较低的飞行成本等优点,在隐蔽侦察、环境监测等领域展现出广阔的应用前景。微型仿生扑翼飞行机器人在此基础上还具有尺寸小、重量轻、隐蔽性好等特点,在狭窄受限空间作业任务中优势更为突出。凌云光·元客视界致力于为高校提供完备的解决方案,助力科研发展。

  • 扫地机器人哪个牌子好?扫地机器人老玩家的新机评测

    最近我又给父母家里新买了一台扫地机器人,原因是之前的机型因为使用成本过高一直被父母闲置,无法发挥让父母解放双手的作用。新机收货后的老规矩是给大家来个测评记录,虽然我用过很多台扫地机器人人了,但在德国销量第 一的斐纳TOMEFON我确实还是第 一次接触:【开箱】斐纳TOMEFON的外包装有两层,打开黄色的瓦楞纸盒子里面才是斐纳TOMEFON的正式外包装盒,里面的纸�

  • 扫地机器人哪个牌子好?养宠家庭新入扫地机器人评测

    在尝试过多种清洁方法感觉都不太行之后,我决定购买一台扫地机器人,以帮助我逃脱猫毛的包围。非常感谢在下单之前朋友们毫不吝啬的向我传授选购经验,这台集合了所有朋友关注的扫地机器人到底能不能让我实现光脚自由?在正式使用之前咱还是得实际评测一番才能对得起朋友们的厚爱!【绘图】虽然没有用过扫地机器人,但因为这段时间看多了吐槽也知道了扫地机器人正

  • EasyMedia:AI驱动,快速将YouTube视频转化为社交媒体内容。

    EasyMedia是一个利用人工智能技术,帮助用户将YouTube视频内容快速转化为适合不同社交媒体平台的帖子、推文等。它支持Facebook、Instagram、Twitter、LinkedIn等多个平台,能够根据平台特点自动调整内容格式,提高内容的吸引力和传播力。产品背景在于帮助用户节省内容创作时间,同时增加其在数字世界中的影响力。

  • Kuluko:将想法变成有声书

    Kuluko是一款AI驱动的有声书生成器,它允许用户通过简单的提示或个性化的设置来创作属于自己的有声书。它提供了两种模式:简易模式和高级模式,以满足不同用户的需求。简易模式下,用户只需输入一个提示,AI即可生成完整的小说。高级模式则允许用户自定义故事的各个方面,包括角色、类型、背景、故事时间、叙述者声音等。Kuluko将故事转化为长达4小时的有声书,用户可以立即开始收听。此外,Kuluko还具有个人和公共图书馆功能,用户可以选择私密享受或与他人分享。

  • fastn:无代码AI驱动的集成平台

    fastn是一个无代码、AI驱动的集成平台,旨在帮助开发者通过单一、统一的API连接和编排多个数据源。它通过AI代理创建API,支持即时API组合,无需编码即可实现数据流的连接。fastn的主要优点包括降低成本、加速开发和上市时间、提高可靠性和安全性。它通过实时数据编排、统一数据访问和监控与故障排除等功能,帮助企业构建互联生态系统。

  • Wasps:AI代码审查工具,快速理解代码库并修复问题。

    Wasps是一个集成在VSCode中的AI代码审查插件,通过深度分析和理解代码库,能够快速识别并修复代码中的错误和漏洞。它为开发者提供即时反馈,推荐潜在问题和改进建议,帮助提高代码质量和开发效率。

  • LLM Optimize:专业网站审计,提升AI推荐排名

    LLM Optimize 是一套工具,旨在帮助用户优化网站,使其在AI聊天机器人和生成引擎(如ChatGPT和Google的AI Overview)中排名更高。该工具通过专业的网站审计,提供可操作的建议,帮助用户在这些生成引擎中获得更好的展示效果。其重要性在于,随着AI技术的不断发展,传统的SEO策略正在逐渐被LLM(Large Language Models,大型语言模型)优化所取代。LLM Optimize通过分析网站内容和竞争对手的策略,提供定制化的优化方案,帮助用户在AI驱动的搜索结果中获得更高的曝光率。

  • Meme Search:通过文本搜索快速找到完美表情包

    Meme Search是一款通过视觉内容和文本索引表情包的应用程序,它能够让用户通过文本搜索快速找到所需的表情包。该应用使用自然语言处理技术,将图片中的文本描述自动生成并作为向量索引存储,从而实现快速检索。Meme Search的开源特性和创新的搜索方式,使其成为提升表情包搜索效率的有力工具。

  • PDFJourney:快速且经济的PDF创建方式

    PDFJourney 是一个旨在为用户提供快速且经济的PDF创建服务的网站。它通过简化用户界面和操作流程,使得用户能够轻松地创建PDF文件。该产品的主要优点在于其高效的渲染速度和低廉的成本,这对于需要频繁处理文档的用户来说是一个巨大的优势。PDFJourney 是 GPT4 的微调版本,它致力于通过技术手段降低文档处理的复杂性和成本,从而提升用户的工作效率。

  • AnyParser:准确、私密且可配置的文档检索LLM

    AnyParser Playground 是一个基于网页的解决方案,旨在帮助用户从PDF和图像文件中提取信息。它通过使用机器学习技术,能够处理文件的前10页,为用户提供数据的全面洞察。该平台不存储用户数据,保证了数据的隐私和安全性。

  • Reimagic.ai:将照片转化为非凡肖像的革命性应用

    Reimagic.ai是一款革命性的移动应用程序,可以将您的照片转化为非凡的肖像。它具备即时背景转换、无缝融合、多样化使用场景、用户友好界面等功能,适用于人像、宠物和产品摄影,使每张快照都成为杰作。

  • Xspiral:新一代3D可视化设计平台,让创意触手可及。

    Xspiral是一个结合了2D和3D设计的混合平台,通过AI技术增强,提供实时渲染、无需下载、协作功能。它允许用户快速创建、设计、管理、预览、分享和发布3D作品。Xspiral支持使用智能写作功能,如一键重写、总结、扩展和快速思维导图,以及创建和管理交互式3D工作流应用,包括文档、思维导图、流程图等。它还支持在3D空间中进行UI/UX设计,为初学者和专业人士提供了轻松创建3D设计的可能。

  • 如果相机:用AI帮你看见各种「如果」背后自己可能的样子

    如果相机是一款利用人工智能技术,帮助用户探索不同生活选择下自己可能的样子的网站。通过AI技术,用户可以体验到不同的生活方式、外貌变化等,从而发现更多的可能性。该产品的主要优点在于其创新性和趣味性,能够激发用户的想象力和探索欲。

  • Relingo:智能双语翻译,助力词汇记忆

    Relingo是一款专注于提升用户英语词汇记忆能力的教育类APP。它通过在用户阅读和观看视频时自动高亮生词并提供翻译,帮助用户在感兴趣的内容中轻松积累单词。产品支持多种语言,包括中文、英文、日文等,覆盖了全文翻译、视频双语字幕、PDF阅读等多种场景,使用户在沉浸式翻译中提升语言能力。

  • AI Photo Filter:AI滤镜,一键转换照片风格

    AI Photo Filter是一个在线服务,使用人工智能技术将用户上传的照片转换成多种艺术风格,如动漫、粘土、3D、像素艺术等。它适用于初学者和专业人士,只需简单点击即可使用。该技术的主要优点包括操作简便、风格多样、效果生动,能够满足不同用户对照片美化和创意表达的需求。

  • ideaShell:AI语音思维笔记,捕捉灵感,提升行动力。

    ideaShell是一款结合人工智能技术的语音思维笔记应用,旨在帮助用户通过语音快速捕捉灵感和想法,并通过AI技术进行反思和行动规划。它通过自动组织、格式化、添加标签和标题,帮助用户将想法转化为行动,同时支持将草稿导入到其他应用程序如Notion、Craft、Docs和Reminder中进行最终创作和后续行动。

  • 无忧智慧公文:智能公文辅助系统,提升办公效率。

    无忧智慧公文是专为政府机关、大型央企、国企办公人员定制的办公辅助系统,依托大数据、人工智能(AI)与自然语言处理技术(NLP),提供辅助写作、智能审核和智能排版功能,帮助用户安全、智能、高效地完成公文工作。

  • 无忧智能审核系统:依托AI与NLP的文本自动查错与智能纠错系统。

    无忧智能审核系统是一款基于大数据、人工智能(AI)和自然语言处理技术(NLP)的文本自动查错与智能纠错系统。它通过深度学习能够全面校对多种文本错误类型,有效提升人工检校效率,消除审校盲区,提升内容安全和文本质量。系统支持多种部署方式,包括嵌入版、整站审核和接口版,能够满足不同行业和场景的需求。

  • MacOS Agent:MacOS的简化助手

    MacOS Agent 是一个基于大型语言模型(LLM)的简单、轻量级解决方案,利用Dify这个AI应用开发平台。该助手使用户,甚至儿童,能够通过自然语言命令轻松控制MacOS,就像与技术专家交谈一样简单。它不仅类似于Siri,还通过支持多轮对话增强了功能,允许用户在任务中保持上下文和连续性。例如,你可以要求助手提供一些文本,然后请求它将该文本转换为Excel或Word文件。

  • Vercel AI SDK:构建AI驱动产品的开发工具包

    Vercel AI SDK是由Next.js的创造者推出的工具包,旨在帮助开发者构建AI驱动的产品。它提供了统一的API来访问多个AI提供商,支持生成音乐播放器、动态生成用户界面等。该SDK兼容多种框架,如React、Next、Vue等,能够通过Vercel Functions提供即时反馈。

  • DeepSeek-V2-Chat-0628:一款先进的对话生成模型

    DeepSeek-V2-Chat-0628 是 DeepSeek-V2 系列的改进版本,专为对话生成任务设计。它在 LMSYS Chatbot Arena Leaderboard 上表现出色,整体排名第11,特别是在编程任务和挑战性提示中表现出色。该模型在多个评估指标上均有显著提升,如 HumanEval、MATH、BBH、IFEval 和 Arena-Hard 等。此外,其在“系统”领域的指令遵循能力也经过优化,显著提升了用户体验。

  • Goldfish:视频理解的先进模型

    Goldfish 是一种为理解任意长度视频而设计的方法论。它通过高效的检索机制,首先收集与指令相关的前k个视频片段,然后提供所需的响应。这种设计使得Goldfish能够有效处理任意长的视频序列,适用于电影或电视剧等场景。为了促进检索过程,开发了MiniGPT4-Video,该模型为视频片段生成详细的描述。Goldfish在长视频基准测试中取得了41.78%的准确率,超过了之前的方法14.94%。此外,MiniGPT4-Video在短视频理解中也表现出色,分别在MSVD、MSRVTT、TGIF和TVQA短视频基准测试中超过了现有最佳方法3.23%、2.03%、16.5%和23.59%。这些结果表明,Goldfish模型在长视频和短视频理解方面都有显著改进。

今日大家都在搜的词:

热文

  • 3 天
  • 7天