11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
腾讯云
12-20
蚂蚁百灵团队开源高性能思考模型Ring-flash-2.0,在多项基准测试中表现优异;阿里通义7款模型登顶Hugging Face榜单,Qwen3-Omni凭借多模态能力全球第一。谷歌Veo3突破视频生成局限,可自动完成视觉任务;特斯拉推进人形机器人量产,马斯克称其为最重要产品。马斯克第六次起诉OpenAI窃取商业机密,苹果内部测试聊天机器人Veritas优化Siri,YouTube推出AI音乐主播增强互动,LiquidAI发布轻量级模型Liquid Nanos优化边缘计算。
9月18日,华为全联接大会2025在上海开幕。会上,华为与浙江大学联合发布国内首个基于昇腾千卡算力平台的DeepSeek-R1-Safe基础大模型。该模型在安全防护能力上表现突出,对有害言论、敏感内容等14个维度的防御成功率近100%,同时通用能力测试性能损耗控制在1%以内。双方表示将继续深化合作,推动AI安全技术与产业生态协同发展,为我国人工智能高质量发展提供支撑。
7家国产大模型参加2025年辽宁高考模拟测试,结果显示:腾讯元宝在文科考试中以667.5分夺冠,接近清北录取线;豆包、讯飞星火分别以655分和652分紧随其后,均达985高校水平。理科方面,豆包以635分领先,元宝和Kimi分别获得632.5分和629分。测试发现大模型在文科表现优于理科,尤其在语文作文和数学解题能力突出,元宝数学获得149分高分。但在理科综合科目存在短板,物理化学的解题过程和知识点推导不够完整,图像符号理解不足。相比去年,今年大模型整体能力显著提升,已从"文科一本、理科二本"水平进步到冲击顶尖高校的水平,展现了国产AI的快速发展。
GPT-4o,被击败了?最近大伙都被GPT-4o生成的各种“整活”图像刷屏了吧,各种动漫油画风格改图、经典影视复现、漫画设计改图……新的玩法每天都在涌现,大有“AI一日,人间一年”之势。甚至OpenAICEOSamAltman都累了:“收手吧,我们需要休息!”但就在GPT-4o火遍全球之际,一个来自初创团队的新模型ReveImage,却凭借其在特定图像生成领域的出色表现,悄然赢得了用户和专业榜单的
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、阿里巴巴发布最新视觉推理模型QVQ-Max阿里巴巴旗下的AI研究团队Qwen发布了其最新的视觉推理模型QVQ-Max。尽管中美科技竞争加剧,该公司仍在寻求美国风投支持,因其专注于应用�
「未来已来,AI加速」《AI火花集》深度聚焦AI浪潮中的破局者群像,揭开先行者如何借力阿里云大模型与云计算的技术势能,点燃创新的火花。每一份样本都是企业与阿里云共同书写的AI进化论。作为AI耳机行业的技术底座,阿里云通义也将持续强化模型能力,以更低成本、更多模态场景的升级、更快的响应速度、持续深度赋能AIxFU。
据报道,OpenAI发布事故报告指出,当前遭遇GPT-4o和4o-mini模型性能下降问题,目前正在进行调查,并将尽快发布最新消息。科研人员创新性地推出了一项名为LONGPROC的基准测试工具,该工具专为评估模型在处理长上下文中的复杂信息并生成相应回复的能力设计。特别是在需要输出8ktokens的任务中,即便是参数庞大的先进模型也未能幸免于难,这或许预示着未来大型语言模型研究的
知名科技媒体Venturebeat消息,OpenAI高级研究科学家、德扑AI之父NoamBrown,在美国旧金山举办的TEDAI大会上提出了一个震惊的理论——让AI模型思考20秒所带来的性能提升,相当于将模型扩大100,000倍并训练100,000倍的时间。Brown也被这个结果吓到了写了多篇论文来验证其真实性。Brown是OpenAI的高级研究科学家主要方向是超复杂推理、AIAgent以及自我对弈。
随着ChatGPT、Copliot等生成式AI产品的快速迭代,对训练数据的需求呈指数级增长,同时也是提升大模型性能的关键环节之一。为了解决训练数据短缺和质量差的难题,微软研究院发布了一个专门用于生成高质量合成数据的的AIAgent——AgentInstruct。Orca-3在多项指标上也超越了LLAMA-8B-instruct和GPT-3.5-turbo等其他模型。
近日,第五代英特尔至强处理器,以优秀的表现通过了中国电子技术标准化研究院组织的人工智能服务器系统性能测试。英特尔也成为首批通过AISBench大语言模型推理性能测试的企业。同时还彰显了英特尔至强可以为企业提供开箱即用”的功能,即可以在通用系统上部署一部分AI工作负载,从为客户带来更佳的总体拥有成本优势。