首页 > 传媒 > 关键词  > 1024程序员节最新资讯  > 正文

Hugging Face创始人x小红书技术副总裁对谈:开源、AI与技术人的成长

2025-10-31 19:41 · 稿源: 站长之家用户

刚刚过去的1024程序员节小红书Red Academy和小红书科技发起了一场直播,在这场直播里,小红书技术副总裁凯奇、小红书语音模型技术负责人风龙,携手Hugging Face联合创始人Thomas Wolf,以最近流行的AMA(Ask Me Anything)形式,进行了一场关于技术、AI与未来的深度对谈。

这场对谈围绕三大核心观点展开:

AI Coding正成为基础能力;

开源是技术加速发展的核心引擎;

实现有“活人感”的AGI路径清晰但仍需攻克诸多难题。

从这三个观点出发,三位嘉宾关于以下几个话题进行了讨论和分享:

开源与闭源:三位嘉宾一致认为开源是推动技术前进的强大引擎。小红书正投身其中,从文本模型、多模态模型到FireRed系列语音模型,初衷是为让更多开发者和中小企业能共享技术红利。

AGI与未来:通用人工智能将会到来,但发展路径仍有挑战,例如在创造力、复杂环境感知和数据等方面仍有瓶颈。

如何让AI更有“人味”:凯奇分享了小红书引入“人文训练师”的实践,致力于让AI的交互更自然、更贴心,真正融入小红书这个充满“活人感”的社区。

AI时代的个人能力:技术人的核心竞争力正转向“定义问题”和“框架性解决”的能力;AI不仅是效率神器,也让非技术背景的人拥有了“指挥”计算机实现想法的能力。

以下是直播对话摘录:

Q: 怎么看大模型时代的开源和闭源?

Thomas Wolf:开源和闭源差距在缩小,中国在这方面比较领先。现在也发现,很多其他国家的人会开始从一个开源模型着手。开源能打造一个围绕模型的社群,让更多人使用,更高效地帮助他们。闭源就是需要更多的一些时间来去开发出一些好的模型。

风龙:整个的开源其实是推着技术往前走的,推着技术不断的往下发展。开源才是动用了大家的力量,众人众人拾柴火焰高。语音技术发展经历开源工具如HTK、Kaldi、Wenet、FireRed等,推动技术前进。闭源对商业公司无可厚非,但可能是暂时性选择。

凯奇:AI开源与代码开源还挺不同的,更关注模型权重和制作过程公开。开源降低社会运用AI成本,互帮互助,整体上降低了整个社会去运用AI的成本。

Q: 小红书做了哪些开源?为什么这么选择?

凯奇:今年6月小红书开源了文本模型1.0版本,是hi lab第一个MoE模型。8月开源多模态模型,性能对标Gemini和Seed。开源dots OCR模型,在hugging face热门榜排第4。

风龙:语音模型方面,我们开源了在50多个benchmark综合排名第一的大模型语音识别系统FirRedASR;开源了面向对话及长播客生成的大模型语音合成系统FireRedTTS业务,在播客生成开源领域达到了sota的效果;也首次开源了一套完整的可私有化部署的大模型人感语音交互系统。这些模型都受到了很多好评。我们想让中小型公司和独立开发者,也能享受这种玩大模型的乐趣,所以我们会做一些大模型,打破相对的技术垄断。我们从社区里面汲取了营养。我们也觉得需要把技术公开出来,一方面是听取社区给模型的反馈,来知道模型到底做得怎么样。

Q: 怎么看AGI的实现和想象,通往AGI上有哪些瓶颈?

Thomas Wolf:AGI不会立刻实现,会有多功能、全方位的提升。未来应用包括机器人、大语言模型、语音识别。AGI也能够创建一些我们之前没概念的东西,比如新游戏、新体验。同时能够打造全新的科学发展,发明新科学。

AGI的一个瓶颈是模型缺乏创造力。当你有一个问题时,它们非常擅长解决问题,但要求它们发明一个新问题时,例如想在科学上取得重大突破时,就需要找到正确的问题来提出,而LLM模型目前非常不擅长提出好问题的。

风龙:5-10年内可能看到曙光,但路上还有种种曲折,但如果要真的实现电影《Her》里面的人工智能想象,还需要解决非常多的问题 比如硬件、甚至一个简单的蓝牙数据传输稳定性都需要持续提升

凯奇:关键转折点是AI能否改进自己。如果可以做到,只要有算力,就可以不停的自我改进,智力增长会非常非常的快。障碍有context bottleneck和非智力因素瓶颈。

Q:你怎么看技术进展的速度?是在变慢吗?

Thomas Wolf:可能有一点。我想很多人对最近的模型有点失望。幸好有新一波的推理模型提供了新范式。但我们构建的AI仍然是非常听话的学生,它们按照我们的要求做,但对应该做什么几乎没有好想法,所以仍非常需要人类来指明方向。至少在当前,需要人来给出要解决的问题,我们需要给出前进方向,给出要做什么的创造性想法。所以我建议,要让知道自己该做什么的人使用这些模型,这样就能很好地理解它。

Q: 在技术产品中如何保持人情味?如何让AI保持人感?

凯奇:当前AI回答有时候会有点冷冰冰、缺乏同理心。小红书是大家称之为一个有“活人感”的社区,所以在小红书用AI的时候,我们也希望这个AI也是更有活人感的。会通过后训练和RL算法调整行为,用人文训练师教会AI更有人感回答。

Thomas Wolf:情感非常重要,需要更好数据来做情感输出,当前的瓶颈是数据量不够。可以做的是:看待AI答案要有批判性,同时也要评估AI的错误率。

风龙:语音模型中会加入情绪感知和环境音感知生成情感反馈语音。我们会分析目前这句话到底有没有表达出情绪,是开心的还是有一点悲伤的?还是说有一点愤怒?我们也有能主动感知对话中用户情绪的TTS,如果用户当下很难过,那AI回复的语音就会带有安慰的情感。

Q:对于个人或团队,推荐哪些AI小项目方向,如何构建壁垒?

凯奇:发挥专业领域知识,解决context bottleneck,挑选合适context喂给AI。怎么挑选哪些context扔给它,这个是很重要的。

Thomas Wolf:这是一个高度数据驱动的世界和领域。所以第一步始终应该是:尝试为我们想要衡量的东西建立一个良好的评估标准。有了标准然后才能看清你想朝哪个方向发展,进入哪个领域,甚至决定是否应该使用AI。

Q: 对于非技术同学,在AI浪潮下有什么建议?

风龙:AI降低实现产品门槛,非技术同学也可以一个人做产品。人人都真的可以一个人做产品。

凯奇:产品同学多了一个强大武器,需学习AI技术边界,了解prompt engineering、fine tune等手段。 

Q: 怎么使用AI coding提效,怎么看待AI coding的发展? 

风龙:在语音研究工作中需要大量测试网页。之前的网页都由语音研究员手写,有了AI coding工具后,这种写前端的工作完全可以用现成工具完成,大大节省时间。

凯奇:写demo程序时,用AI做refactor或熟悉API,可以直接扔文档让它写代码,非常提效。AI coding让非程序员也能操纵计算机达成目的。AI coding还处于早期阶段,现在还没那么好,但未来在程序架构迭代和运维方面会更强。

Q: AI浪潮下,技术人的变与不变?

风龙:技术人还要找到核心竞争力,AI coding只是工具箱中的一个工具。看到一个大的应用问题后,不变的是要想怎么去拆解,怎么用工具箱里面工具把它做好。

凯奇:未来世界上只有会用AI的人和不会用AI的人两种,技术同学在会用AI这块是很有优势的。技术人需提升通用问题解决能力和产品sense,发现和定义问题比具体怎么做更重要。

Q: 学习新技术有什么好的方法和建议?

风龙:很多时候我们觉得可能要自己ready了再去做一件事,但是往往我们其实就是learning by doing。跟踪最新论文、与同行交流、公司内部讨论。

凯奇:用AI陪看论文非常提效,能很快帮我推导公式和分析逻辑,就能很方便地理解公式。Notebook LM可以听论文写概要。

Q: 最近两个月,小红书里刮起了AMA风,有什么体验和有趣发现?

Thomas wolf:我是首次参加 AMA,很多人来问我应该学什么专业,应该从事什么样的工作,我觉得这个方式是非常好的一个方式,能让很多行业里非常优秀的人所聚集在一起,直接建立连接。

凯奇:在主页上刷到了很多AMA的笔记,过去小红书这个产品给大家的印象可能更多是偏生活向的,但这次AMA,在科技领域的兴趣圈层也是有很好的爆发。我的一些朋友告诉我,他们现在都是在小红书看论文,我觉得小红书作为生活兴趣社区,的确正在变得越来越广大。

风龙:我发了第一篇AMA笔记后,收到500多条评论问语音相关的问题,其中有人问我为什么社区里有这么多AMA帖子。我回答的是:因为优秀的人总会和优秀的人相遇。

*小红书科技薯在今年9月策划发起了AMA(Ask me anything)活动,这一玩法在小红书上快速发酵——许多知名AI产品创业者、大厂负责人、高校教授等科技大咖纷纷在小红书上发布“Ask me anything”的笔记,邀请用户向自己提问,并积极在评论区互动、对话。

Q:如果回到30岁,会给自己什么建议? 

Thomas Wolf:十年前,2015年那时我创办了Hugging Face。我认为那是个好主意。所以我会说,去做你打算做的事,探索你所热爱的。

风龙:如果回到30岁的时候,我会选择在博士毕业后直接加入小红书,享受挑战和攀登珠峰的经历。

凯奇:要搞AI。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 招主播太难,公会“挖”向小红书

    ​娱乐直播行业进入存量竞争,主播招募早已成为公会的“生命线” 与内卷战场。 从早期地推、招聘平台,到高校合作、直播间招募,公会的拉新渠道不断翻新,如今又集体涌入小红书开启“种草式招募”: 有人20天拉新300名主播,尝到流量红利;也有人账号被封、流量低迷,深陷渠道风险......

  • 小红书关停“最短命”项目:小红卡功能将暂停试运营

    小红书发布一则重要公告,引发广泛关注。上线仅3个月的“小红卡”将于2026年1月1日起暂停试运营,针对已购买该卡的用户,小红书将提供全额退款服务。 “小红卡”于今年9月底低调上线,其定位为“精选吃喝玩乐一卡通”。年费定价168元,用户购买后可在数千家精选本地门店享受全年全店9折优惠,此外还能获得“精选门店推荐”“专属活动参与权”等一系列附加权益。小

  • 上线仅3个月!小红书宣布小红卡将暂停试运营

    小红书宣布,其推出的“小红卡”将于2026年1月1日起暂停试运营,已购用户可获全额退款。官方表示,团队未来将集中资源聚焦本地生活内容影响力,提升相关产品与工具,帮助用户发现优质本地去处,让平台成为本地消费决策的首选。据悉,“小红卡”于今年9月底上线,定位为精选吃喝玩乐一卡通,年费168元,用户可在数千家精选门店享受全年9折优惠及专属活动等权益。此举显示出小红书深入布局本地生活服务的野心,初期仅在广州就精选了921家店铺,覆盖美食、购物、休闲娱乐、运动健身、景点五大类目。

  • 微博时代红极一时的bot号,成了小红书“邪修起号大法”

    ​“时尚是一个轮回”,这句话的含金量还在不断上升。 这不,曾在微博时代红极一时的bot账号,近期又在小红书卷土重来了。 bot是robot(机器人)的简称,最早是指由程序自动运行、定期发布内容的机器人,比如准点报时bot。随着时间推移,bot的含义逐渐扩展,演变为由真人运营的账号,走红于微博、推特等国内外社交平台。 这些真人运营的bot账号模仿机器人风格,

  • 小红书「路书计划」:让 “向往的路线” 落地成行

    从“世界那么大我想去看看”到“人生就要追逐旷野”,生活越是现代化,人们对自然与自由的向往就越强烈,这也让自驾游的热度常年居高不下。 不过与前几年相比,年轻一代自驾游爱好者的习惯已悄然改变:路线选择上,他们不再只盯着 “此生必驾” 经典路线,也喜欢发掘小众特色目的地;时间与距离不再是束缚,数周深度漫游与周末短途 “出逃” 同样受欢迎;同行方式�

  • 小红书的双11,悄悄「超出预期」

    这是《窄播Weekly》的第73期,本期我们关注:小红书的双11。 本周,小红书发布了双11期间的店铺、商家、买手、好货榜,对双11业绩做了进一步总结。整体上,成交破千万商家数量是之前的2.4倍,千万级买手数量是之前的1.9倍。此前,小红书还宣布,买手贡献成交额同比增长73%,章小蕙、吴千语等直播间单场创新高,开播买手数量同比增80%。 除了官方口径的表述,我们接触到�

  • 0元入驻、流量补贴,小红书加码本地生活

    ​小红书继续加码本地生活。 近期,小红书上涌现大量服务商发布的招商信息,承诺为入驻商家提供从流量扶持、权益激励到一站式运营的全链路服务。 这是小红书继9月上线“小红卡”后的又一次布局。而如今本地生活赛道早已群狼环伺,成为各大巨头的必争之地。 小红书能否啃下本地生活这块蛋糕?

  • IBM宣布收购Confluent,构建面向企业级生成式AI的智能数据平台

    IBM宣布以约110亿美元现金收购数据流处理公司Confluent,旨在为企业客户提供端到端数据平台,连接、处理并治理AI应用和智能体使用的数据。交易预计于2026年完成,将提升IBM的调整后息税折旧摊销前利润,并在第二年增加自由现金流。Confluent基于Apache Kafka构建,其实时数据流处理能力与IBM的AI基础设施软件结合,将助力企业更快速部署生成式AI和AI智能体,消除数据孤岛,抓住数据爆炸与AI普及带来的市场机遇。

  • 小红书,如何成为长内容创作者的“新沃土”

    ​小红书有了一批自己的“作家”。 “文字只是一种辅业,生活中的锅碗瓢盆才是重心。” “写作对我而言,是给予我重新观察生活的眼光。” “日复一日,我生活的大部分时间,都消耗在种田和一日三餐的家务活上。” 写下这些字句的不是专业作家,而是一群在小红书中“长”出来的长内容创作者。

  • AI日报:Kling 2.6将发布;千问APP推学习大模型;Z-Image-Turbo-Fun-Controlnet-Union 开源

    本期AI日报聚焦多领域AI进展:Kling 2.6发布,支持音频同步生成,AI视频进入有声时代;千问APP推出学习大模型,提升拍照答疑与作业批改能力;阿里通义实验室开源图像生成模型,实现精准控制;豆包手机助手遭遇微信登录异常,凸显生态兼容挑战;米哈游推出带猫语特色的AI聊天模型AnuNeko;亚马逊云科技发布三款新型AI智能体,其中Kiro可自主编程数日;IDC报告预测具身智能�

今日大家都在搜的词: