首页 > 业界 > 关键词  > Agent4Rec最新资讯  > 正文

新加坡推Agent4Rec 大模型智能体构成推荐系统模拟器

2023-11-15 16:18 · 稿源:站长之家

要点:

  • Agent4Rec构建: 新加坡国立大学NExT++实验室团队构建了Agent4Rec,一个由1000名基于ChatGPT-3.5的智能体组成的电影推荐系统模拟器,模拟真实用户在推荐场景中的行为。

  • Agent行为验证: Agent4Rec在推荐场景下通过实验验证了智能体的真实性,包括对用户电影喜好的准确捕捉、对不同推荐系统的区分能力以及其作为A/B测试平台的潜在价值。

  • 推荐系统问题探索: 通过Agent4Rec,研究人员探索了推荐系统中尚未解决的问题,包括多维度推荐数据的因果关系分析和信息茧房问题的研究。

站长之家(ChinaZ.com)11月15日 消息:推荐系统领域长期存在线上线下效果差距大的问题,Agent4Rec通过构建大语言模型智能体,模拟真实用户行为,为解决这一问题提供了新的思路。在Agent4Rec中,每个用户智能体由个性化模块构成,根据用户历史交互生成电影偏好,模拟用户在推荐系统中的行为。通过实验证明,Agent4Rec可以有效模拟用户的喜好,具备区分不同推荐系统的能力,并可作为A/B测试平台,为推荐研究提供可靠的虚拟场景。

image.png

项目地址:https://github.com/LehengTHU/Agent4Rec

Agent4Rec的建设和验证为推荐系统研究和应用之间的巨大割裂提供了解决途径。通过多维度的实验评估,Agent4Rec表现出对真实用户行为的大概率反映。此外,研究人员还通过信息茧房问题和因果关系分析,深入探讨了推荐系统领域尚未解决的问题。这一工作为构建理想的离线A/B测试平台和满足企业需求的用户评价指标提供了新的思路。

Agent4Rec的实验结果表明,通过将智能体选择的高分电影加入训练集进行重新训练,可以在离线和模拟的“在线”指标上取得提升。然而,将智能体不喜欢的电影作为数据增强的效果则不尽如人意,从侧面印证了智能体的行为与真实用户行为的一致性。此外,研究人员还根据不同用户特质对智能体进行分组,并验证了智能体在活跃性、从众性和观影多样性上的表现与真实用户的一致性。

Agent4Rec的建设和验证为推荐系统研究和应用之间的巨大割裂提供了解决途径。通过多维度的实验评估,Agent4Rec表现出对真实用户行为的大概率反映。此外,研究人员还通过信息茧房问题和因果关系分析,深入探讨了推荐系统领域尚未解决的问题。这一工作为构建理想的离线A/B测试平台和满足企业需求的用户评价指标提供了新的思路。

举报

  • 相关推荐
  • 易鑫发布Agentic大模型,破解汽车金融风控与效率痛点

    9月12日,易鑫集团在“IT Value Summit数字价值年会”上入选“2025创新场景年度AI应用TOP榜”,成为汽车金融科技领域唯一上榜企业。首席科技官贾志峰指出,易鑫以AI为核心驱动力,通过自研大模型“智鑫多维”等技术,显著提升风控水平与融资通过率,推动行业智能化转型。平台已连接全国4.2万家经销商及上百家金融机构,服务覆盖牧民、基层员工等多元群体,体现技术普惠价值。未来将持续加大科技创新投入,深化国内普惠金融服务,并探索技术出海,助力全球汽车金融行业迈向更高水平智能化。此次上榜不仅是对其技术实力的认可,更反映出行业正加速拥抱智能化变革。

  • 方洪波迎战雷军,祭出两大Agent

    ​家电三巨头美的、格力和海尔,正面临小米的强力挑战。小米家电连续多个季度狂飙突进,已经让三巨头感到不安。 格力对于小米格外警惕。在小米攻势最凶猛的空调赛道,针对奥维云网7月空调线上市场份额数据,格力与小米各执一词,争执不下。 海尔同样感受到压力:去年7月,小米以12%的全渠道份额,超越海尔跻身前三。到了今年7月,海尔收复失地,市场份额升至15%,

  • AI日报:腾讯重磅发布混元图像3.0;快手发布KAT系列Agentic Coding大模型;苹果悄然研发ChatGPT式应用

    快手发布KAT系列代码大模型,腾讯推出“混元图像3.0”实现多模态突破,苹果研发类ChatGPT应用升级Siri,谷歌更新Gemini 2.5 Flash Lite提升效率。苹果还推出Manzano图像模型,YouTube Music测试AI音乐主播功能,VideoFrom3D框架简化3D视频生成,Moondream 3.0在多项基准测试中超越GPT-5等顶尖模型,展现强大性能。

  • AI日报:京东物流推出超脑大模型2.0;DeepSeek V3.1终结版发布;Kimi 推出全新 Agent 模式

    本期AI日报聚焦多领域技术突破:京东物流发布“超脑大模型2.0”与“异狼具身智能机械臂系统”,推动物流行业迈向自主执行;DeepSeek推出V3.1终结版,修复漏洞并为V4架构铺路;Kimi上线Agent模式“OK Computer”,支持智能网站开发等复杂任务;ChatGPT新增个性化资讯功能,定制用户专属新闻;Exa Code发布代码索引工具,助力AI代理精准生成代码;Meta推出AI视频创作平台Vibes,简化短视频制作;蚂蚁数科发布隐私保护AI框架Gibbon,推理速度提升超百倍;OpenAI新基准测试显示GPT-5在多个行业逼近人类专家水平,覆盖九大行业44种职业。

  • 腾讯云李力:坚持同源同构,为企业打造更贴近Agent的AI原生云

    9月17日,腾讯云在2025全球数字生态大会上宣布智算全面升级,推出“更贴近Agent的AI+Infra”解决方案,包括Agent+Runtime、云专家服务智能体Cloud Mate及全链路安全能力。腾讯云副总裁李力强调,“同源同构”是核心原则,确保产品服务一致性与全球化布局。方案旨在提升模型推理效率、工具集成灵活性和系统稳定性,助力AI从实验室走向生产级应用。腾讯云通过硬件多元支持、软件加速优化及智能运维服务,降低企业技术门槛,已服务国内90%大模型厂商及千行百业。

  • 两步生成企业级Agent,华为云Versatile平台打通智能体落地最后一公里

    华为在2025全联接大会上发布企业级智能体平台Versatile,通过极简流程实现企业级Agent开发,仅需输入业务逻辑与流程图即可完成,效率提升10倍。同时公布昇腾芯片未来三年规划,将陆续发布多款高性能芯片。华为云还推出超节点产品Atlas系列,算力全球领先。CloudMatrix384 AI+Token推理服务全面上线,吞吐量达2400TPS,性能远超业界水平。该平台已与多个行业合作,助力企业构建数字化AI产线,实现业务效率飞速提升。

  • 腾讯云联合IDC发布AI Infra报告:定义Gen Al时代智算新范式

    2025年腾讯全球数字生态大会于9月16-17日在深圳召开。在Infra+Agent专场,腾讯云与IDC联合发布《AI+Infra:加速智能体落地的基础架构、发展趋势与产业实践》报告。报告指出,随着AI应用规模化落地,AI云基础设施正向核心智算设施演进,涵盖分布式底座、异构硬件、高性能软件和场景化方案四大维度。报告还提出六大演进趋势:架构重构、行业垂直化、算力智能化、安全能力提升、研发范式创新和服务化转型,并解析了腾讯云在交通、制造、医疗等领域的落地案例,为企业智能化转型提供实践指南。

  • 又一颗旗舰Soc!高通骁龙8 Gen5官宣

    9月25日,高通在骁龙峰会上正式发布骁龙8 Elite Gen5(第五代骁龙8至尊版)。接近尾声时,高通意外展示骁龙8 Gen5,但未公布其核心规格。据爆料,骁龙8 Gen5采用自研Oryon CPU,主频超4.0GHz,基于台积电3nm N3P工艺,集成Adreno GPU。安兔兔跑分突破340万,略高于骁龙8 Elite的330万左右。骁龙8 Gen5定位为“小弟”,性能仅次于骁龙8 Elite Gen5,同样强悍。首发搭载方面,骁龙8 Gen5由一加首发,骁龙8 Elite Gen5则由小米17系列首发。

  • 卢伟冰:小米17全球首发骁龙8 Elite Gen5

    9月25日,高通公司发布全球最快移动SoC——骁龙8 Elite Gen5。该芯片采用第三代Oryon核心,配备2+6 CPU集群架构,超大核频率达4.6GHz,性能提升20%,GPU图形性能提升23%,NPU性能提升37%。小米宣布成为全球首发合作伙伴,全新小米17系列将搭载该平台,凭借卓越性能与AI技术,打造史上最强影像旗舰体验。此外,该平台首次支持专业级视频编解码器(APV),助力创作者实现专业视频制作。

  • ChatGPT正秘密测试私信功能:支持用户之间直接交流

    OpenAI正在为其明星产品ChatGPT测试名为私信”(Direct Messages)的社交功能。 这一变化意味着ChatGPT正从原本用户与AI单向交互的语言模型工具,逐步转向具备人与人通过AI连接”能力的社交平台。 OpenAI此次测试的私信”功能允许用户创

今日大家都在搜的词: