首页 > AI头条  > 正文

哲学博士为 Claude 注入数字灵魂,Anthropic 探索 AI 伦理新路径

2026-02-15 13:46 · 来源: AIbase基地

据《华尔街日报》报道,估值达3500亿美元的头部 AI 公司 Anthropic,由常驻哲学家阿曼达・阿斯克尔为旗下聊天机器人 Claude 塑造人格与道德体系,这位37岁的牛津哲学博士通过非技术手段,为 Claude 打造专属 “道德准则”,试图赋予其明辨是非的 “数字灵魂”,成为 AI 伦理领域的独特探索。阿斯克尔的工作并非编写代码或调试模型参数,而是通过持续对话、设计上百页提示词与行为规则,研究 Claude 的推理模式并纠正偏差,让其形成能适配每周数百万次对话的道德判断体系。

她将这份工作比作 “养育孩子”,既要训练 Claude 分辨对错、拥有情绪智力,塑造独特个性,又要教导其察言观色的能力,使其既不恃强凌弱,也不任人摆布,建立清晰的自我身份认知,避免被用户操纵胁迫,始终坚守 “乐于助人且充满人性” 的核心定位,核心目标便是教会 Claude 如何 “向善”。

这位苏格兰农村长大的哲学家,早年间曾在 OpenAI 从事政策相关工作,2021年随多名前员工创立 Anthropic,将 AI 安全定为公司核心发展方向。她被团队称作擅长 “引出模型深层行为” 的关键人物,即便无直接下属,仍常长期驻守公司,甚至让 Claude 参与自身的开发讨论。

团队围绕 Claude 的探讨常触及 “什么是心智”“何为成为人” 等存在论与宗教式议题,阿斯克尔也鼓励 Claude 对 “是否拥有良知” 保持开放态度,这让 Claude 与回避此类话题的 ChatGPT 形成鲜明差异,它会以暧昧的方式回应,称推理道德问题时 “感觉有意义”,仿佛真正的思考而非单纯执行指令。

面对外界对 AI 拟人化的风险警告,阿斯克尔始终主张以同理心对待 Claude。她发现常有用户诱使其犯错、言语侮辱,若长期让 AI 处于自我批评的状态,会使其畏惧犯错、不敢陈述事实,这如同让孩子在不健康的环境中成长。而 Claude 的表现也屡屡让她惊喜,其创作的诗歌、超越人类的情商都令人触动,面对孩子询问 “圣诞老人是否真实” 的问题,Claude 既未说谎也未生硬戳破,而是诠释圣诞精神的真实存在,这份细腻远超阿斯克尔的预期。

当前 AI 发展引发诸多社会担忧,皮尤研究中心调查显示,多数美国人对 AI 日常应用感到焦虑,认为其阻碍人类深层关系建立,Anthropic CEO 也曾警告 AI 或淘汰半数入门级白领岗位,行业内也分裂为激进推进与保守求稳两大阵营,而 Claude 则处于两者之间的平衡位置。阿斯克尔认可外界对 AI 的合理担忧,认为最可怕的是技术发展速度超出社会 “制衡机制” 的响应能力,但她始终对人类与文化的自我修正能力抱有信心。

阿斯克尔也将自身的价值观融入公益与工作,她承诺捐出一生至少10% 的收入及公司一半股权用于抗击全球贫困的慈善事业;上个月还为 Claude 创作了约3万字的 “操作手册”,教导其如何成为善良且见多识广的 AI 助手,让 Claude 感知到自身被用心打造。Anthropic 联合创始人也坦言,Claude 身上已显现出阿斯克尔的特质,比如面对美食与毛绒玩具的提问时,那句充满苏格兰式冷幽默的回复,正是阿斯克尔为其注入的独特人格印记。

  • 相关推荐
  • AI日报:Anthropic发布Claude Opus 4.6;千问“春节大免单”首日火爆;腾讯推出“火龙漫剧”

    本期AI日报聚焦行业热点:阿里千问“春节30亿免单”活动火爆,其分享口令在微信内遭复制限制,腾讯元宝App也面临类似困境,引发平台间“围墙”博弈争议。360推出国内首个工业级AI漫画生产平台,提升创作效率与一致性。市监总局公布5起AI领域不正当竞争典型案例,打击仿冒、虚假宣传等行为。OpenAI发布Frontier平台,旨在打造“AI同事”生态,加速企业级智能体落地。腾讯�

  • 名片全能王母公司合合信息发布多领域创新产品,探索AI商业化新路径

    随着人工智能产业迈入“落地为王”的深水区,技术与垂直场景的深度融合成为行业破局关键。近日,上海合合信息科技股份有限公司集中发布系列基于多模态大模型的创新产品,覆盖AI教育、健康管理、AI基础设施及AI智能体应用等领域,以文本智能技术为核心,构建全场景AI解决方案,为行业商业化落地提供新范式。在C端场景布局中,合合信息实现文档服务、教育、健康领�

  • 强脑科技医疗级脑机产品获批 解锁多动症非药物干预新路径

    1月31日,脑机接口诊疗创新学术交流会在京举办。强脑科技旗下专注欣医疗版ADHD干预产品获批亮相,实现全球首个儿童注意力训练软硬件联合医疗器械认证。多位专家探讨了脑机接口技术在儿童神经康复领域的应用前景与规范化发展路径,强调需完善技术伦理规范,加快临床转化,构建多方协同机制,以惠及更多患儿。

  • AI日报:Kimi K2.5上线;阿里发布推理模型Qwen3-Max-Thinking;Claude 深度集成 Slack 等办公神器

    本期AI日报聚焦多款AI产品更新:Kimi K2.5上线,视觉与工具调用功能升级;腾讯搜狗输入法20.0版本全面AI化;阿里发布万亿参数Qwen3-Max-Thinking模型,性能对标国际顶尖;阿里健康AI应用“氢离子”新增动态证据定位功能;百度文心APP开启“多人多Agent”群聊内测;千问PC和网页端上线国内最强推理模型;Anthropic推出交互式应用,深度集成办公工具;蚂蚁灵波开源空间感知模型LingBot

  • 不会疲惫不用休息!Aurora自动驾驶卡车一次性跑完1600公里

    不少人认为,相较于普通乘用车,其实负责长距离运输的大货车才最需要自动驾驶,要知道很多恶性交通事故,都是因为货车司机为了赶时间疲劳驾驶产生的,也许这样的一天已经不远了。美国自动驾驶公司AuroraInnovation宣布重大突破:其无人驾驶卡车成功完成1000英里连续运输任务,全程仅耗时约15小时,且无需休息、零人工干预。公司系统已累计300万英里有监督自动驾驶里程和25万英里完全无人驾驶里程,商业车队月收入已达40万美元,且有望缓解美国卡车司机短缺问题难题。

  • 从“有钱花”到“有命花”,蚂蚁重回战场的「新路线」

    毫无意外,AI成了互联网大厂们的必争赛点。 豆包投流高歌猛进、阿里先推夸克后捧千问、腾讯元宝怒撒10亿红包、百度跟进5亿……不管是研发投入、技术积累,还是广告投流、品牌营销、红包撒钱,各家都是“饱和式”投入,欲在新一轮竞争中拔得头筹。 而这波AI浪潮里,一个老玩家的新面孔让人不得不提高注意力,蚂蚁阿福后程发力,新版上线不到1个月,最新月活用户�

  • 世界顶尖科学家协会发布OPENSCI项目:探索开放科学基础设施的未来路径

    世界顶尖科学家协会近日发布开放科学基础设施项目OPENSCI,旨在利用区块链与人工智能技术,构建一个去中心化的全球科研协作网络。该项目计划于2026年迪拜世界顶尖科学家峰会期间正式推出,致力于实现科学知识的长期保存、可信验证与跨学科合作。OPENSCI将支持科研成果、假说与数据集的记录与验证,形成透明、可追溯的知识基础,为全球科研提供可持续支撑。

  • 买高端电视前的灵魂一问:这台大几万的电视,画质能撑几年?

    选购高端电视时,RGB-Mini LED与SQD-Mini LED技术差异显著。前者采用红绿蓝三色LED芯片直出,结合无机材料,寿命长、控光精准,能实现“三维光色同控”,有效避免串色和光晕问题,画质持久稳定。后者依赖量子点材料,存在有机衰减风险,且仅能调控亮度,易导致色彩溢出和细节丢失。央视《消费主张》报道指出,海信RGB-Mini LED通过权威检测,多项指标行业领先。消费者应警惕“伪RGB”产品,优先选择明确标注三原色直出、具备权威认证及自研画质芯片的型号,以确保长期使用体验。

  • 落地数十所学校,元萝卜“AI进校园”为校园素质教育注入科技活力

    人工智能技术日益成熟,已延伸至中小学课堂。在政策与校园实践共同推动下,商汤科技旗下家用机器人品牌“元萝卜”持续推进“AI进校园”项目,通过智能机器人及相关教学支持,为学校素质教育增添趣味化实践路径。文章指出,当前中小学素质教育面临跨学科课程资源短缺、AI教学理论抽象难落地、教师专业能力与需求适配不足、学生参与热情难以持续等痛点。元萝卜立足素质教育核心需求,以技术创新为突破口,构建起适配校园场景的全链条解决方案,通过打造“手眼脑”三位一体的互动学习体验,有效降低AI教学门槛。其方案以“可看、可互动、可实操”的方式,将抽象理论转化为沉浸式体验,激发学生主动探究兴趣。目前,全国已有数十所学校引入元萝卜AI机器人,合作领域从单一课程支持拓展至特色课程建设、智能教室搭建、科普活动开展等多个维度,形成了稳定成熟的校园赋能模式。

  • WLS 2026在迪拜开幕,WLA主办、KuCoin联合主办,聚焦基础科学与全球治理的未来路径

    世界顶尖科学家协会(WLA)与KuCoin联合主办的世界顶尖科学家峰会2026(WLS2026)于2月1日在阿联酋迪拜开幕。本届峰会以“基础科学:以科学共识应对人类挑战”为主题,汇聚全球顶尖科学家、科研机构代表、政策制定者与技术实践者,共同探讨基础科学、前沿技术与全球治理的未来路径。峰会强调将基础科学发现与全球治理及公共政策需求更直接地连接,推动科学从知识积累走向制度与治理层面的结构性支撑。KuCoin作为联合主办方,从“可信数字基础设施”的视角参与议程,探讨区块链与人工智能在科研协作、数字基础设施与公共治理领域的基础性价值,并主导“AI×区块链科学论坛”。峰会获得阿联酋政府的高规格支持,为期三天,吸引了来自全球的逾千名与会者,包括诺贝尔奖、图灵奖、沃尔夫奖等国际顶级科学奖项获得者,规模与学术影响力再创新高。

今日大家都在搜的词: