首页 > 业界 > 关键词  > Anthropic最新资讯  > 正文

Anthropic宣布关键突破,解析人工神经网络行为

2023-10-12 16:49 · 稿源:站长之家

划重点:

🧠 重要突破:Anthropic宣布了一项关键研究成果,能更好地理解支撑其人工智能算法的神经网络的行为。

🌐 影响广泛:这一研究有望提高下一代人工智能的安全性和可靠性,使研究人员和开发者能够更好地控制其模型的行为。

🤖 神经网络解析:研究人员通过解析神经网络内部的特征,取得了重要进展,有望解决神经网络行为的难题。

站长之家(ChinaZ.com)10月12日 消息:人工智能初创公司Anthropic PBC近日宣布了一项重大突破,他们表示已找到一种更好地理解支撑其人工智能算法的神经网络行为的方法。这一研究成果有望在提高下一代人工智能的安全性和可靠性方面产生深远影响,使研究人员和开发者能够更好地控制其模型的行为。

Anthropic的研究聚焦在神经网络的不可预测性上,这些网络受到启发于人脑的神经元工作方式,模仿生物神经元之间的信号传递。神经网络是通过数据训练的,而不是按照特定规则编程的,因此它们可以呈现多种不同的行为,这就是为什么研究人员很难控制人工智能模型,以及如何防止其生成虚假答案,也就是所谓的“幻觉”。

人工智能  AI 机器人 (2)

图源备注:图片由AI生成,图片授权服务商Midjourney

Anthropic指出,神经科学家在试图理解人类行为的生物基础时面临类似的挑战。他们知道人脑中的神经元必须以某种方式实施思维、情感和决策,但他们无法确定其工作原理。

为了更好地理解神经网络的工作方式,Anthropic的研究人员深入研究了单个神经元,并确定了每个神经元内部的小单元,被称为特征,这些特征更好地对应于神经元激活的模式。通过研究这些特征,研究人员相信他们最终可以更好地理解神经网络的行为。

在一项实验中,Anthropic研究了一个小型变压器语言模型,将512个人工神经元分解成代表DNA序列、法律文本、HTTP请求、希伯来文本、营养说明等上下文的4000多个特征。他们发现,单个特征的行为比神经元的行为更具解释性。

Anthropic验证了他们的研究成果,他们创建了一个盲目的人工评估者来比较单个特征和神经元的可解释性。结果显示,特征(红色)比神经元(蓝绿色)得分要高得多。

Anthropic表示,这为以特征作为神经网络理解的基础提供了有力证据。通过放大并查看4000多个特征的整个集合,Anthropic发现这些特征在不同人工智能模型之间具有广泛的普适性。因此,通过研究一个模型中的特征所学到的经验可以应用于其他模型。

尽管人工神经网络是使人工智能在过去几年中变得如此强大的关键发展,但没有人真正完全理解它们的工作原理,因此无法预测它们将如何回答或响应任何给定的提示。研究人员迄今大多集中在“机械互操作性”的研究上,即逆向工程神经网络的研究。

Anthropic的研究方法为解决这一混乱提供了一个有趣的途径,通过更清晰地理解神经网络的内部工作方式,他们已经展示出了预测神经网络结果的能力。尽管这一方法尚未扩展到更大的模型,但在小型模型上已经显示出了令人印象深刻的潜力,有望在“机械互操作性”的研究中取得良好进展。

Anthropic相信,通过进一步研究,他们可能能够操控所描述的特征,以更可预测的方式控制神经网络的行为。最终,这可能对克服理解语言模型行为的挑战至关重要。

举报

  • 相关推荐
  • AI新王诞生!Anthropic估值冲爆1.2万亿 首次反超OpenAI

    长期笼罩在OpenAI阴影下的二号选手”Anthropic,近期在链上Pre-IPO市场的隐含估值骤然飙升至1.2万亿美元(约合人民币8.7万亿元)。 若Anthropic以这一估值顺利完成首次公开募股,它将直接跃升为全球第11大上市公司,缔造商业史上的新神话。 最新链上Pre-IPO交易数据显示,短短七天内,Anthropic估值暴涨20%,单周涨幅已相当于一家头部上市公司的体量。而自2025年10月以来,其估值曲

  • 自然堂集团的终端网络:6.48万个零售点的覆盖策略

    上海自然堂集团更新招股书,披露截至2025年底三年财务及运营数据。集团2025年总收入53.18亿元,同比增长15.6%,经调整净利润4.13亿元,同比增长102.9%,毛利率70.6%。核心亮点包括:品牌力稳居国货护肤榜首,自研成分喜默因®贡献超10亿元营收,自研成分产品收入占比超80%;线上线下均衡发展,DTC能力增强,会员复购率30.7%;数字化系统“一盘货”覆盖绝大多数经销商,未来美妆城入选上海十大标志性文旅项目。集团正从国货美妆品牌向全球科技美妆企业迈进。

  • OpenAI成立OpenAI部署公司:帮助企业构建人工智能系统

    OpenAI正式成立OpenAI 部署公司”,在帮助企业构建人工智能系统。 同时,OpenAI已同意收购Tomoro一家专注于将AI转化为运营优势的应用 AI 咨询与工程公司。 新成立的部署公司由OpenAI控股,无论客户是与OpenAI、OpenAI部署公司,还是与两者同时合作,都将获得统一的服务体验。

  • 北京国际人力获评世界品牌莫干山大会“人工智能+”生态创新实践范本

    5月9日,第十个中国品牌日之际,2026世界品牌莫干山大会“搜索·点赞·传播品牌好故事论坛”在浙江德清举办,发布“人工智能+”生态创新实践范本。北京国际人力旗下万维招聘AI智能招聘平台获评“人工智能+”创新产品。论坛聚焦品牌强国建设,北京国际人力以47年行业积淀,推出全流程智能招聘平台,针对传统招聘痛点,运用大模型等技术构建PC端、微信小程序、线下求职一体机三位一体服务矩阵,赋能企业招聘管理与求职者职业成长,彰显国企担当,助力“中国服务”品牌高质量发展。

  • 安世腾全球首个旗舰智算中心重磅揭牌,锚定全球算力网络战略高地

    5月12日,安世腾科技在上海举行全球首个旗舰智算中心揭牌仪式,并与上海极篇人工智能科技签署战略合作协议。该中心总投资3亿元,算力规模达1000P,支持大模型训练和AI推理,采用绿色低碳技术,PUE低至1.2。安世腾COO李心仪表示,项目落地标志着AI原生算力基础设施全面铺开。公司还发布全球化算力出海三步走战略,以该中心为支点,拓展东南亚、非洲等市场,构建全球分布式算力网络,助力“一带一路”数字合作。

  • 2026年4月全球网络攻击量反弹攀升,勒索软件活动持续扩张

    Check Point Research发布的2026年4月全球威胁情报报告显示,全球网络攻击活动重新加速,各机构平均每周遭遇2,201次攻击,环比增长10%,同比增长8%。教育、政府与电信行业持续承压,其中教育行业以每周4,946次攻击位居榜首。勒索软件活动持续升温,4月公开报告攻击事件共707起,环比增长5%,同比增长12%。生成式AI相关数据泄露风险持续高位,企业环境中每28个提示词中就有1个存在敏感数据泄露问题,90%的机构受此影响。报告强调,企业需将网络安全视为持续常态,重点转向预防、治理及AI驱动的安全能力。

  • BOE(京东方)携手UNESCO推动亚太科学俱乐部网络落地

    联合国教科文组织2026科学俱乐部挑战赛亚太站及科学俱乐部网络亚太启动活动在京东方技术创新中心闭幕。活动汇聚全球科教代表、杰出女科学家等80余位嘉宾,共商科教协同发展。继2025年在非洲落地全球首个科学俱乐部网络后,京东方与UNESCO将模式拓展至亚太,标志着“科学十年”倡议的重要里程碑。京东方以创新科技赋能活动,彰显中国科技企业助力全球STEM教育、践行可持续发展的责任担当。

  • 得一微担任世界人工智能眼镜联盟(WAEA)董事会员,共推AI眼镜存力新前景

    近日,“2026AI眼镜产业生态大会”在深圳举行,汇聚全球顶尖企业与专家,探讨产业创新趋势。得壹微电子(YEESTOR)作为国内领先AI存力芯片设计企业受邀出席,被授予“世界人工智能眼镜联盟(WAEA)董事会成员单位”。大会指出,AI眼镜正从极客玩具迈向大众消费品,预计2026年全球出货量将突破2368万台。得壹微电子深耕存力主控芯片,为AI眼镜提供从端到云的全栈存力支持,推动端侧AI与智能穿戴生态规模化商用。

  • 汉斯顿HR-M28:专为餐饮定制的“口感守护者”

    文章强调水质对餐饮品质至关重要,水质不佳会影响咖啡、汤品等饮食品质。指出TDS值60-70是餐饮用水的“黄金区间”,既能去除有害物质,又能保留有益风味。重点推荐汉斯顿小型商务净水器HR-M28,其体积小巧、安装灵活,采用RO反渗透技术,可稳定产出适宜水质,帮助咖啡店、奶茶店、火锅店等提升饮品和食物的口感与风味统一性。文章还列举了多家餐饮品牌的使用案例,说明净水器在保障水质安全、控制运营成本方面的重要性。

  • 迭代大幅放缓!苹果新款Vision Pro被曝最快2028年推出

    知名爆料人古尔曼透露,苹果下一代Vision Pro头显预计最快推迟至2028年发布,产品更新周期大幅拉长,现有机型将在较长时间内维持现状。 消息称,苹果目前的研发重心已全面转移,优先推进AI智能吊坠、支持摄像功能的AirPods两款新品,同时秘密研发AR智能眼镜,高端混合现实头显的迭代工作暂时被搁置。 尽管新款产品迟迟未能更新,苹果官方承诺将持续为在售的Vision Pro提�

今日大家都在搜的词: