首页 > 业界 > 关键词  > YandexGPT最新资讯  > 正文

“俄版 ChatGPT”YandexGPT 2 参加俄罗斯大学统考,单科成绩接近平均分

2023-10-16 11:30 · 稿源:站长之家

站长之家(ChinaZ.com)10月16日 消息:据今日俄罗斯和RGRU等媒体的报道,俄罗斯的聊天机器人YandexGPT2已成功参加了俄罗斯国家统一考试,并在文学科目中取得了令人瞩目的成绩。YandexGPT2的加权分数为55分,接近2022年俄罗斯考生的平均成绩(63分),远高于当地大学的最低合格要求(40分)。这一成就引起了广泛的关注。

Yandex团队在开发YandexGPT2时特别注重了确保机器人没有获取统考答案的内容,以保证其能够像普通学生一样回答和解决问题。他们选择文学科目来测试YandexGPT2的知识面、写作风格和创造力等方面。这意味着YandexGPT2不仅可以回答问题,还可以进行文学作品分析和创作作文等任务。

image.png

尽管YandexGPT2的表现引人瞩目,俄罗斯的教育监督机构并不认为它是危险的,因为普通学生在考试期间不能使用任何AI帮助,且严禁使用电子设备。这意味着YandexGPT2是独立完成考试的。

此前,Yandex的搜索和广告技术部门主管Dmitry Masyuk表示,YandexGPT在生成俄语内容时的表现已经能够超越ChatGPT3.5版本,在许多情况下甚至提供了比ChatGPT4.0更好的回答。他还表示YandexGPT与其美国竞争对手的竞争只是时间问题。

总之,YandexGPT2的成功参加俄罗斯国家统一考试文学科目并取得出色的成绩引起了广泛的兴趣。这一成就展示了人工智能在教育领域的潜力,同时也引发了对AI在教育和考试中的应用的讨论。 YandexGPT2的表现表明,人工智能在回答问题和创造性任务方面具有巨大的潜力。

举报

  • 相关推荐
  • Yandex Ads推荐系统迎来重大升级,助力中国品牌精准触达俄语区用户

    中俄贸易持续扩大,俄语区成中国企业出海高增长市场。Yandex Ads推出新一代生成式AI推荐技术ARGUS,通过大幅提升用户行为信号处理能力与记忆容量(从几周扩展至一年),实现广告投放的精准动态调整。2026年Q1中俄贸易额同比增14.8%,中国对俄出口增22.1%。85%在俄中国企业计划扩大布局,81%将加大营销投入。Yandex来自国际企业广告收入同比增79%,其中中国企业投入增128%。ARGUS全面部署后预计带来两位数效率增长,助力企业实现从“被看见”到“被信任”的跨越。

  • GPT5.5:更贵不更烧,主角给到Codex,逼Claude慌忙修复降智问题

    ​GPT-5.5来了。API定价$5/$30每百万token,GPT-5.4的两倍。 但它并不更烧token。 Sam Altman在公布定价的同一条推文里补了一句:"Remember, you will need less tokens per task than5.4!" 贵一倍,但每个任务token更少——"其实更划算"。OpenAI总裁Greg Brockman在发布会上给了更大的词:"a new class of intelligence."

  • 时隔一个月又崩了!DeepSeek网页及API服务出现异常 官方称正在修复

    今日,多名用户在社交平台反馈DeepSeek服务异常,平台对话页面提示服务器繁忙,请稍后重试”。官方服务状态网站显示DeepSeek网页及API服务不可用。今日下午,官方状态页面更新信息,确认问题已定位,正在实施修复。

  • DeepSeek首次有了视觉能力,技术论文却被它连夜删掉了

    DeepSeek做了件罕见的事情:在终于开始灰测多模态能力后,它放出了一篇解释背后技术的论文,但这篇论文却在发布没多久就又被悄悄撤掉。 4月29日,DeepSeek研究员陈小康在X发布一条推文——现在,我们可以看见你了。配图中,DeepSeek 标志性的鲸鱼 logo 摘下眼罩,露出了眼睛。 过去,DeepSeek 最被外界熟知的是它在文本、代码和推理任务上的能力。但真实世界里的问题,并不总�

  • AI日报:DeepSeek识图模式灰测;小红书成立AI一级部门;阿里发布程序员“数字分身”QoderWake

    本期AI日报涵盖8大热点:1. DeepSeek开启多模态识图灰度测试,视觉理解能力落地;2. 文心一言5.1预览版上线LMSYS,全球排名第13;3. 小红书成立AI一级部门“Dots”及海外团队;4. Chrome发布Prompt API,浏览器原生AI时代来临;5. 阿里发布QoderWake,实现代码修复全流程无人值守;6. 蚂蚁集团开源万亿级大模型Ling-2.6-1T;7. 巨日禄与火山引擎合作,AI短剧进入工业化时代;8. Gemini迎史诗级更新,一键生成Office文档。

  • 李飞飞押注的AI游戏平台火了!Astrocade融资5600万美元

    美国AI社交游戏平台Astrocade宣布完成5600万美元A B轮融资,其中,B轮由红杉资本领投,A轮由Sea Capital领投,英伟达、谷歌AI Futures Fund等机构也参与投资。 与传统游戏开发需要程序、美术、策划团队不同,Astrocade主打自然语言生成游戏”。用户只需输入一句话,例如做一个太空飞船射击游戏”,AI便能自动生成场景、角色、玩法以及基础交互逻辑,整个过程几乎不需要代码能力。

  • 填补空白!DeepSeek灰度上线识图模式

    DeepSeek正灰度测试识图模式,用户可在网页端和App端上传图片进行内容理解、描述与分析,填补了多模态能力的空白。该模式与快速、专家模式并列,作为独立一级入口存在,表明视觉理解被定位为核心能力。部分用户已可使用,但另一些用户虽看到入口却收到暂不可用的提示。实测显示,当前开放的主要是图片理解能力,涵盖视觉问答、截图分析等场景,尚未支持图像生成、视频理解或跨模态生成,更接近视觉语言模型范畴。

  • AI日报:Kimi K3将于第三季度推出;英伟达发布多模态“全能模型”;Claude深度集成Adobe、Blender

    本期AI日报聚焦八大热点:月之暗面将推2.5万亿参数Kimi K3大模型,长文本处理能力突破;英伟达发布多模态模型Nemotron-3 Nano Omni,推理效率提升9倍;蚂蚁集团开源百灵Ling-2.6-flash模型;商汤推出原生多模态统一模型SenseNova U1;Claude深度集成Adobe等八大软件;字节TRAE SOLO上线语音输入;科大讯飞发布星火X2-Flash模型;ima上线知识Agent copilot,内置记忆系统。

  • INDEMIND:家庭机器人的范式革命,从机械执行到理解空间

    家庭机器人历经扫地机、陪伴机器人等产品形态,始终停留在“自动化工具”阶段,缺乏对家庭环境的真正理解。传统SLAM技术虽能精准建图,却无法赋予机器人区分沙发与餐桌的“生活常识”。大模型技术爆发后,行业竞争维度从硬件参数转向空间认知深度。未来,机器人需具备“感知-理解-决策-执行”的完整智能闭环,从“执行指令”升级为“理解空间”,重构家庭服务商业逻辑,实现从硬件销售到全场景服务运营的范式革命。

  • DeepSeek API输入缓存降价!只有首发价格的1/10

    国产大模型DeepSeek官方宣布,全系API输入缓存命中价格下调至首发价的1/10,叠加限时优惠后,V4-Pro缓存输入低至0.025元/百万Tokens,创全球大模型价格新低。 本次调价覆盖DeepSeek-V4-Pro、V4-Flash全系列,核心降幅集中在输入缓存命中场景。 DeepSeek-V4-Pro:从1元降至0.1元/百万Tokens,5月5日前叠加2.5折,实付0.025元。 DeepSeek-V4-Flash:从0.2元降至0.02元/百万Tokens,无额外折扣。

今日大家都在搜的词: