11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
近期,澳大利亚科廷大学、中国南京大学等研究机构的天文学家在大约16000光年之外,偶然发现一个神秘物体。 该神秘物体与以往任何见过的天体都不同,它每44分钟就会向地球眨眼般地闪光一次,每次持续2分钟。 原本科学家以为,它只是又一个脉冲星的亲戚”。直到最近,美国NASA的钱德拉X射线望远镜捕捉到同一个地方居然也在发出同步的X射线这才让事情变得不寻常起来�
本次AI高考数学测试评估了7个大模型的表现,包括Doubao、DeepSeek、Qwen3等。测试包含14道客观题和5道解答题,总分150分。结果显示:1)客观题各模型差距不大,最大分差仅3分;2)解答题成为主要失分区,仅Gemini2.5Pro获得满分;3)图像识别题(第6题)难倒所有多模态模型,暴露AI图文理解短板。最终Gemini2.5Pro以145分居首,Doubao和DeepSeek R1以144分并列第二。测试表明大模型在数学推理能力上有进步,但在复杂论证和多步骤计算方面仍需提升。
今日,字节跳动旗下火山引擎举办FORCE原动力大会,正式发布豆包大模型1.6。 新系列包括三个大模型,分别是Doubao-Seed-1.6-thinking、Doubao-Seed-1.6、Doubao-Seed-1.6-flash。 火山引擎总裁谭待表示,Doubao-Seed-1.6是首个支持256k长上下文的大模型。 以thinking模型为例,其思考能力强化,支持多模态,Doubao-Seed-1.6则支持on/off/auto三种思考模式。 在高考全国新一卷数学单科测试中,豆包大模�
2025年高考数学考试引发热议,多家AI大模型参与测试。腾讯元宝和豆包表现最优,分别获得145分和140分(满分150分),仅错1-2道题。文心一言和QWen3稍逊,得分在120分左右。测试显示,AI在选择题和基础解答题表现良好,但在涉及图像理解、向量分析等复杂题目时仍存在困难。特别是一道包含向量图的"杀手题"让所有AI失分。专家指出,国产大模型数学能力已有显著提升�
近日,随着高考的圆满结束,一场别开生面的“数学擂台赛”在各大AI大模型间悄然展开。多家知名科技公司的大模型被邀请参与2025年数学新课标Ⅰ卷中的14道客观题测试,以此检验它们在逻辑推理和数学能力上的实力。此次测试题目包含8道单选题、3道多选题以及3道填空题,满分设定为73分,且测试过程严格遵循高考判分原则,确保结果的公正性与准确性。 测试成绩揭晓�
近日,随着高考的落幕,一场别样的“高考”也在各大AI大模型之间展开。此次测试邀请了多家知名科技公司的大模型,参与2025年数学新课标Ⅰ卷中的14道客观题测试,以此检验它们在逻辑推理和数学能力上的表现。测试题目包括8道单选题、3道多选题和3道填空题,满分73分,测试过程严格遵循高考判分原则。 测试结果显示,字节跳动的豆包和腾讯的元宝(T1)以68分的总成绩�
今天下午,有关高考数学的微博话题霸占了热搜榜,引发热议。 在海南某考点,一名男生第一个走出考场,还简单接受了媒体采访,称数学太难了,不会”。对于高考数学题目,有的学生答得非常不错,有的学生则表示太难。 据了解,2025年高考数学命题遵循高校人才选拔要求和高中数学课程标准,依据高考评价体系,持续推进考试内容改革。更新设计理念,深化基础性考查
今日,北大韦神”登榜各大平台热搜。 截止6月6日21时,韦东奕仅靠一条4秒的出镜视频,抖音粉丝量就已突破500万。 据媒体从韦东奕堂哥处了解,该账号并非假冒,确实是韦东奕本人账号。 堂哥还表示:此账号后续将分享数学相关内容,使韦东奕与外界有更多接触。”
非营利组织FutureHouse发布全球首个公开可用的AI科学家系统,包含四个专业AI智能体:通用智能体Crow、文献综述智能体Falcon、调研智能体Owl和实验智能体Phoenix。这些AI在科学文献搜索准确率上已超越GPT-4.5等主流模型,能访问完整科学文献并评估信息来源质量。平台提供透明推理过程和API接口,支持科研流程自动化。测试显示AI在PCOS疾病研究中,仅用几分钟就完成传统需数周的文献调研,并能生成可验证假设。创始人表示这些AI将大幅提升科研效率,未来两年内有望替代科学家大部分案头工作。
DeepSeek发布数学推理模型DeepSeek-Prover-V2,包含7B和671B两个参数版本。该模型采用"递归+强化学习"训练方法,在MiniF2F测试集上达到88.9%通过率,解决了PutnamBench中的49道题目。关键技术包括:1) 使用DeepSeek-V3分解复杂定理生成子目标;2) GRPO算法从多个候选方案中自动学习最优解;3) 通过思维链整合非形式化推理与形式化证明。模型在AIME竞赛题和教科书题目上也表现优异,7B小模型意外在部分问题上超越大模型。论文指出该方法为通向AGI提供了正确路径,未来将扩展至IMO级别数学难题。