首页 > AI头条  > 正文

TikTok 撤回视频摘要 AI 功能:因频繁出现“蓝莓”等严重幻觉

2026-05-07 09:03 · 来源: AIbase基地

TikTok 近期宣布停止测试一项旨在为视频自动生成文字摘要的实验性人工智能功能,并将该工具的研发重心转向特定领域。这项已在美国等市场小范围测试数月的“人工智能概览(AI Overviews)”功能,原计划利用 TikTok 自研或第三方多模态模型为用户提供视频背景信息及产品推荐

抖音,TikTok

然而,在实际应用中,该功能展现出的严重“幻觉”引发了广泛关注:其将头部创作者 Charli D'Amelio 的出镜视频识别为“配料不同的蓝莓集合”,将训狗教程误读为“折纸艺术”,甚至将夏奇拉的宣传短片描述为“移动的蓝色形状”。

面对算法理解能力的显著偏差,TikTok 发言人证实已根据反馈暂停相关测试,并明确未来该功能将聚焦于识别视频中的具体产品,而非尝试概览复杂的视频全文。这一动作反映出当前生成式 AI 在处理动态视觉信息时,依然面临逻辑关联断裂与语义识别错误的技术瓶颈。

此次事件被行业视为继谷歌“胶水披萨”后的又一典型 AI 幻觉案例。尽管近期数据表明谷歌等大厂的 AI 概览准确率已有所提升,但 TikTok 的受挫再次警示,在短视频这种高密度、非结构化的内容生态中,多模态大模型的泛化能力仍不足以支撑高可靠性的自动化叙事。短期内,行业正从追求“全能描述”转向“垂直应用”,通过缩小认知边界来提升 AI 工具的实用价值与商业确定性。

  • 相关推荐
  • 字节迫近Meta,但Reels也追上了TikTok

    张一鸣的“一生之敌”,注定是扎克伯格和Meta。 此前,围绕TikTok,扎克伯格施展多重手段,给张一鸣和字节跳动带来了不小的麻烦。如今,TikTok的纷纷扰扰尘埃落定,但双方的暗战依然没有止歇。 从估值上看,字节已经追了上来。 2020年前后,字节的估值首次突破1000亿美元,同期Meta市值高达8000亿美元,相当于8个字节。六年后,字节估值升至6000亿美元,Meta市值为1.7万亿美

  • 告别爬楼!微信上线群聊记录一键总结功能:转发元宝即可生成摘要

    99 ”的群聊消息不用再一条条翻,AI替你读完了。 近日,腾讯旗下AI助手元宝与微信深度打通,上线了群聊一键总结”功能。 只需将聊天记录转发给元宝,它便能在几秒内提炼出讨论要点,这波更新,算是切中了无数群聊困难户”的真实痛点。 操作路径并不复杂,用户选中微信群聊聊天记录转发其他应用-选择元宝-复制粘贴给元宝,就能让它帮你总结。

  • DeepSeek回应“乱回”漏洞:特殊字符引发模型幻觉

    面对近期网络上愈演愈烈的隐私泄露猜测,DeepSeek官方今日正式作出回应。一份关于特定字符触发模型异常回复的说明被发布出来,试图为这场“串台”风波画上句号。 DeepSeek技术团队在全面排查后,给出了完全否定的结论。官方的解释是,输入“think”等字符后所返回的异常内容,实质上属于一种特殊字符引发的“模型幻觉”,并不涉及任何安全层面的问题,更不是隐私泄露

  • DeepSeek回应信息“串台”BUG:特殊字符引发模型幻觉 不会泄露隐私

    近期有网友反映DeepSeek输入“think”字符会出现隐私泄露问题,模型输出无关内容且结果各异。DeepSeek官方今日发布说明称,经排查,该现象属于特殊字符引发的模型幻觉,不涉及安全或隐私泄露。后续将通过针对性训练增强模型对特殊字符的识别与处理能力,优化相关表现。公司始终重视用户数据安全与体验,感谢关注与监督。

  • sora正式停服,国内版天空AI视频生成模型发布

    Sora宣布停服后,国内“天空AI”视频生成大模型正式发布。该模型由温州专帮信息科技推出,支持文本、图片生成逼真视频,核心亮点是用户无需GPU服务器,用家庭或办公电脑即可完成算力,成本几乎为零。目前发布三个版本:手机版、单机版和多用户商用版,并支持OEM贴牌、私有化部署等技术服务,实现低成本、高效率的视频创作。

  • 风波过后,长视频究竟在用AI做什么

    ​5月6日杨洋新剧《雨霖铃》的看片会上,谈及打戏,制片人侯鸿亮说:“在今天这个AI时代,恐怕也是最后一次这样手搓了。”正午阳光的第一部武侠剧,说出了最后一部的气魄,“手搓武侠”果然成为《雨霖铃》传播最广的标签。 经过整个4月影视行业对AI的激情鼓吹,大众的逆反情绪也确实该走到了反向造神环节。5月伊始,“手搓红利”显现。不管是民间自制的手搓爆款《

  • AI日报:谷歌发布最強模型Gemini 3.5 Flash;阿里云“千问云”上线;苹果AI辅助功能升级

    本期AI日报聚焦六大热点:谷歌发布性能与效率显著提升的Gemini 3.5 Flash模型并免费开放;阿里云推出面向Agent时代的“千问云”平台,重构大模型服务链路;谷歌与三星联合推出两款集成Gemini的智能眼镜;苹果推出Apple Intelligence驱动的AI辅助功能及Vision Pro眼控轮椅;谷歌发布多模态交互模型Gemini Omni;通义实验室发布Qwen3.7-Max模型,采用正交解耦技术,多项评测国内第一。

  • 千问与淘宝全面打通:正式上线AI购物功能

    千问与淘宝近日宣布全面打通,正式上线AI购物功能。用户只需一句话,即可完成从商品筛选、对比、下单、支付到查物流、退换货等全流程操作。 具体使用上,用户打开千问App与AI对话,便能完成淘宝平台上的商品挑选、对比及购买;而在淘宝App内,点击“千问AI购物助手”即可体验AI购物,并可使用AI试穿、AI算优惠、AI低价帮抢等功能。 此次上线的核心功能已覆盖全购物场�

  • 千问电脑版上线AI语音输入法功能

    千问电脑版正式上线AI语音输入法,全面开放免费使用。用户只需按下快捷键(Windows右Alt键/Mac右Command键),即可在微博、QQ邮箱、PS等桌面应用中直接调用。该功能支持“边想边说、边说边改”,自动去除口语化表达如“嗯”“啊”,并进行纠错和格式化。此外,它还能结合上下文智能回复,支持创作、问答、翻译等指令,如自动生成邮件回复、制作PPT、整理表格或输出Word文档,大幅提升办公效率。

  • 像素吐司v1.3实测:4K 人像视频精修达到专业级水准

    像素吐司v1.3是一款专业AI人像视频处理工具,基于独立测试环境(Win11, i7-12700H, RTX 3060, 32GB RAM)验证其五大核心功能:AI精准追色(色差ΔE<2.5)、真实美颜质感(4K纹理保留93%)、精准追踪与帧稳定(波动<5%)、肌肤处理(含中性灰磨皮,效率提升50倍)及面部塑形(自然微调)。该工具通过智能场景分割与批量处理,可大幅提升电商、婚礼、Vlog等场景的视频精修效率,兼顾专业细节与易用性。

今日大家都在搜的词: