首页 > 业界 > 关键词  > 机器学习最新资讯  > 正文

​ UC 伯克利分校研究展示机器学习系统可达到接近人类水平的预测能力

2024-03-06 09:43 · 稿源:站长之家

**划重点:**

1. 🌐 UC Berkeley研究团队开发的语言模型系统在预测领域取得重大突破,接近甚至超越了人类平均水平。

2. 🔄 该系统利用大规模数据和LM的快速处理能力,自动化了关键的预测过程,包括信息检索、基于数据的推理和个别预测的综合。

3. 📈 研究显示,在全面的测试集上,该系统平均Brier分数为0.179,接近人类集合分数0.149,为预测精度和效率提供了显著潜力。

站长之家(ChinaZ.com)3月6日 消息:在预测分析不断演变的领域,预测的艺术和科学成为决策的关键工具,涵盖从政府政策到企业战略的各个领域。传统上,预测主要依赖统计方法,依靠丰富的数据和潜在模式的微小变化。然而,判断性预测引入了一种微妙的方法,利用人类直觉、领域知识和多样的信息来源,在数据稀缺和不确定性下预测未来事件。

预测的挑战在于其固有的复杂性以及现有方法的局限性。统计模型虽然强大,但在数据稀缺或数据分布显著变化的情况下往往需要赶上发展。然而,判断性预测引入了人的因素,将人的洞察力和偏见引入方程式。这种方法依赖于预测者从各种来源综合信息,包括历史数据和当前事件,以对未来结果进行明智预测。

加利福尼亚大学伯克利分校的研究团队开发了一种新型语言模型管道,一种专为预测而设计的检索增强语言模型系统。该系统自动化了预测过程的关键组成部分,包括从新闻来源检索相关信息、基于收集的数据进行推理以及将个别预测聚合成全面的预测。这一创新的核心在于它能够利用Web规模的数据和LM的快速解析能力,为传统预测方法提供可扩展和高效的替代方案。

image.png

该系统采用不同方法综合应对,通过将问题分解为子问题并使用搜索查询来实现全面的预测覆盖。文章从新闻API中检索并根据GPT-3.5-Turbo提供的相关性分数进行过滤。然后,文章被总结以适应语言模型的上下文窗口。推理是准确预测的重要方面,系统使用草稿本提示引导模型的推理过程。它通过集成不同模型的预测来提高准确性,并通过超参数调整来优化检索和推理系统,包括优化提示、文章摘要和集成方法。这一复杂的过程允许更为明智和微妙的预测方法,利用语言模型丰富的知识和快速处理能力。

研究人员对研究结果表示乐观。在全面的测试集上,该系统平均Brier分数为0.179,接近人类集合分数0.149,表明基于语言模型的预测系统在某些情况下接近甚至超越了从竞争平台聚合的人类预测者的准确性。这一发现表明语言模型有望在规模上提供准确的预测,促进更为明智的决策过程。

image.png

该研究为将语言模型整合到预测领域提出了强有力的论点,突显了这些工具增强预测准确性和效率的潜力。虽然从研究到实际应用的过程涉及许多挑战和考虑,但加利福尼亚大学伯克利分校团队的基础工作标志着可靠和可访问的预测方法的不断努力迈出的重要一步。这项研究的影响超越学术兴趣,有望在我们探索未来不确定性的过程中影响政府、企业等决策过程。

论文:https://arxiv.org/abs/2402.18563

举报

  • 相关推荐
  • 周鸿祎:AI无法取代人类 因为学不会这一独特能力

    今天,周鸿祎发布视频谈及对AI的看法。他指出,尽管当下许多人担忧会被AI取代,但目前来看,AI还无法彻底取代人类。 周鸿祎认为,即便智能体再强大,也仍需人类的管理。人类未来的目标是管理、组织和训练智能体。 他以瑞典一家支付巨头为例进行阐述。该公司曾豪言自家AI客服集群能取代700名人类客服,起初成绩亮眼,AI客服处理了大部分客户咨询,效率显著提升。然

  • 26岁女子每天熬夜致卵巢早衰绝经 相当于45岁女性水平

    6月30日,河南中医药大学第一附属医院接诊了一例令人惋惜的病例。一名年仅26岁的女性患者,因身体不适前来就诊,经过详细检查,医生发现其卵巢功能已严重衰退,水平相当于45岁女性,甚至已经出现了绝经的症状。 在进一步询问中,医生了解到,该女子由于工作压力巨大,长期处于焦虑失眠的状态,每天熬夜至凌晨两三点才入睡,饮食也极度不规律,主要依赖外卖解决�

  • 李世石:AI不会“解读”……直觉依然属于人类!

    在技术逐渐超越人的时代,我们必须思考:如何在与科技同行的同时,不失人类本色……

  • IBM被评为2025年Gartner数据科学和机器学习平台魔力象限领导者

    IBM宣布其数据科学与机器学习平台(DSML)入选Gartner 2025魔力象限领导者。文章指出,企业在实施AI项目时面临负责任AI部署、成本优化和规模化等挑战。IBM的watsonx产品组合通过提供统一的开源和专有框架、模型及部署选项,帮助数据科学家构建企业级AI解决方案。其中,watsonx.data作为混合数据湖解决方案,简化了AI数据管理;Granite AI模型开源且高效;AutoAI for RAG自动化了检索增强生成流程。IBM还通过收购DataStax增强向量搜索能力,持续为AI创新提供工具支持。

  • 长视频到了系统性能力重建时刻?

    过去两年,长视频行业整体进入深度调整周期:用户增长趋缓、制作成本居高不下、流量红利逐步衰退,平台之间从“比拼数量”转向“拼内容质量”与运营效率。 与此同时,泛滥的短剧也在进一步侵蚀长视频的基本盘。如何在内容上坚持长期主义,同时在组织与成本控制上实现机制创新,成为所有平台必须面对的现实命题。 在这场变革风暴中,各家平台路径分化——有人从

  • 趣链科技亮相国际金融科技盛会,全面展示数字出海能力

    2025年6月3-5日,全球顶级金融科技盛会Money20/20 Europe在荷兰阿姆斯特丹成功举办。本届大会聚焦嵌入式智能、数字基因、治理2.0和货币未来四大议题,吸引120多个国家的3万余名金融科技从业者参与。浙江省商务厅组织省内数字服务与金融科技企业参展,重点展示区块链、跨境支付等领域创新成果。趣链科技创始人李伟博士发表主题演讲,分享区块链与AI融合如何重塑金融基础设施,并透露将持续拓展国际生态,深化在隐私计算、数据互操作性等领域的技术合作。活动期间同步举办2025浙江服务贸易金融展,推动浙江金融科技品牌走向国际舞台。

  • 网上垃圾信息太多了!马斯克刚刚宣布一件大事:Grok 4将重写人类所有知识库

    马斯克宣布将用新一代AI模型Grok 3.5/4重写人类知识库,修正错误内容并补充缺失信息,再基于"纯净版"知识库重新训练模型。他认为当前AI模型训练数据存在太多"垃圾",Grok将充当人类知识的审核员和补充者,具备识别知识库错误的高级推理能力。文章指出AI存在虚构细节的问题,这些虚假内容可能被重新训练进模型,导致真假难辨。这反映了当下AI发展面临的核心矛盾:技术进步与内容真实性的博弈。

  • 装库科技应邀出席丰台区“未来企业家”发布会 展示AI设计与数字化交付能力

    6月20日,丰台区举办"丰聚英才·企航未来"未来企业家实训营发布会。装库科技作为区内科技企业代表受邀参会,董事长王敬现场展示企业在AI设计与数字化家居领域的技术成果。丰台区委书记王少峰参观企业展台,深入了解企业在人工智能设计、数字化供应链等方面的能力。装库科技重点介绍了"所见即所得"全流程服务体系,通过AI技术实现户型识别、风格生成、产品选配等创新应用。作为国家高新技术企业,装库科技致力于构建从房产交易到家居交付的智能化平台。此次参会是企业深度融入区域创新发展生态的重要举措,未来将继续发挥在AI设计、数字化供应链等领域的技术优势,助力丰台区高质量发展。

  • 对话智源研究院王仲远:做具身智能的“安卓系统”,而非专用的“iOS”

    大模型的发展正在遭遇瓶颈。随着互联网文本数据被大规模消耗,基于数字世界训练的AI模型性能提升速度明显放缓。与此同时,物理世界中蕴藏着数字世界数百倍甚至千倍的多模态数据,这些数据远未被有效利用,成为AI发展的下一个重要方向。 在2025北京智源大会上,智源研究院发布了“悟界”系列大模型,试图推动AI从数字世界迈向物理世界,实现所谓的物理AGI。这一系�

  • 水滴信用惊艳亮相火山引擎原动力大会,展示企业大数据大模型成果

    6月11日,2025火山引擎春季FORCE原动力大会在北京国家会议中心举行。大会聚焦大模型与AI云原生等前沿技术,汇聚行业精英探讨AI转型机遇与创新产品落地路径。水滴信用作为合作伙伴惊艳亮相,展示其企业大数据MCP成果。火山引擎智能算法负责人吴迪发表主题演讲,介绍其MCP服务通过搭建三座桥梁连接开发者生态、大模型工具和云服务,助力构建复杂Agent系统。水滴信用凭借多年企业数据服务积累,整合全国超3.7亿市场主体信用信息,推出企业大数据MCP解决方案,实现企业信用信息一站式智能分析。此次合作不仅展示技术实力,更为企业信用信息服务行业智能化升级树立新标杆,推动行业迈向"数据驱动、智能决策"新时代。