AI视野：ChatGPT语音旁白功能免费开放；文心一言率先实现收费；Claude2.1长下文长度扩展至200K；拼多多成立大模型团队

2023-11-22 15:15 · 稿源：站长之家

📰🤖📢AI新鲜事

ChatGPT语音旁白功能现已向所有免费用户开放

OpenAI宣布将ChatGPT with voice语音功能免费对所有用户开放，用户只需下载应用程序，点击耳机图标即可进行语音对话，此功能于今年9月推出，最初仅面向Plus和Enterprise用户。

微信截图_20231122083553.png

【AiBase提要:】
🔊 语音功能全面免费: OpenAI宣布ChatGPT with voice语音功能向所有用户免费开放，用户可通过手机应用进行语音对话。
📅 推出历程: 该语音功能于今年9月首次推出，最初仅对Plus和Enterprise用户开放，现在正式对所有用户免费开放。
🚀 用户规模扩大: OpenAI在开发者大会上宣布，每周已有一亿用户使用ChatGPT，显示其在人工智能领域的广泛应用和用户接受度。

奥特曼回归OpenAI

OpenAI宣布原则上达成协议，创始人奥特曼回归公司担任CEO，同时新董事会由Bret Taylor、Larry Summers和Adam D'Angelo组成。

【AiBase提要:】
👨‍💼 奥特曼回归CEO职位: OpenAI宣布创始人奥特曼原则上回归担任首席执行官，解雇事件引发公司动荡。
🤝 新董事会组建: 由Bret Taylor、Larry Summers和Adam D'Angelo组成的新董事会将领导OpenAI，期望引入治理变革。
🔄 员工抗议与微软新动向: 员工威胁辞职，要求恢复奥特曼职位，而奥特曼在短时间内转投微软领导新的高级人工智能研究团队。

百度文心一言率先实现收费

在财报电话会议上，百度董事长兼CEO李彦宏表示，通过生成式人工智能技术推动广告增长，百度文心一言4.0版本率先实现收费，取得显著效果，预计在四季度收入将超过数亿元人民币。

【AiBase提要:】
🚀李彦宏指出，百度利用生成式人工智能技术推动广告增长，包括创意建设、精准投放、竞价优化等方面，这些努力预计将在四季度带来数亿元人民币的营收增长。
💬 百度文心一言4.0版本从11月1日起开始向企业和消费者收费。
🚀实现从按单次点击收取费用（CPC）到按实际销售产品数量收取费用(CPS)的转变。

Claude2.1长下文长度扩展至200K

Anthropic公司宣布Claude2.1升级，提升token处理能力至20万个，降低虚构率一半，新增API工具，为用户带来更强大的聊天机器人体验。

【AiBase提要:】
🔄 Token处理能力提升: Claude2.1可处理20万个token，是GPT-4最高版32，000-token上限的两倍，相当于解析500页材料。
🤥 虚构率降低: Anthropic表示Claude的虚构率降低一半，用户可更可靠地依赖聊天机器人的输出，接近ChatGPT水平。
🛠️ 新增API工具: 升级引入API工具，支持用户连接第三方API，用户可自然语言请求特定的API调用，提供更定制化的聊天机器人体验。

世界新闻摄影大赛AI禁止参赛

世界新闻摄影大赛在数天内取消了人工智能生成图像的投稿资格，经过反对声浪后，将AI生成图像排除于“开放格式”类别。基金会与新闻机构合作制定伦理标准，明确了图像编辑规则。

【AiBase提要:】
🔄 规则变更: 世界新闻摄影大赛迅速取消人工智能生成图像投稿资格，排除于“开放格式”类别。
📷 规则调整: 大赛明确了通过相机制作的照片编辑规则，拒绝使用某些生成式AI模型的工具。
🌐 伦理标准制定: 为了明确照片定义，基金会与机构合作制定伦理标准，确保照片真实准确。

B站UP主将ChatGPT接入《原神》游戏

B站UP主“Risd_锐小杜”成功将ChatGPT接入《原神》，使游戏中的角色和NPC具有更灵活智能的对话，突破了游戏原有设定，受到玩家热烈欢迎。

【AiBase提要】
🎮 创新玩法: B站UP主成功将ChatGPT整合到《原神》，使游戏中的角色对话更灵活，玩家可以通过语音输入改变剧情走向。
👍 玩家迎接: 新玩法在B站引起高度关注，视频播放超过67万次，表明玩家对这种创新体验充满兴趣。
🤖 AI限制: 尽管引入AI为游戏增色，但仍受游戏框架和角色动作自然性的限制，需要进一步优化。

AI用BLACKPINK声音翻唱aespa歌曲抖音获赞29万

一位网友使用BLACKPINK成员声音，成功AI翻唱了aespa的歌曲《Drama》，在抖音上引起轰动，获得超过29万点赞，突显了AI音乐翻唱的受欢迎程度。

【AiBase提要:】
🎤 声音辨识度惊人: 网友称BLACKPINK成员的声音像防盗水印，认为AI翻唱颠覆传统，受到欢迎。
🚫 版权争议引发关注: 随着AI翻唱现象兴起，音乐行业面临版权争议，一些公司要求下架未经授权的AI翻唱作品。
🔮 AI在音乐领域潜力: 尽管引发担忧，音乐产业却积极拥抱AI，展示了AI在音乐创作和生成方面的崭新可能性。

柯洁抖音直播暴打AI

柯洁在抖音进行直播，挑战人工智能《金铲铲之战》游戏，豪言暴打AI。尽管屡战屡败，但在直播最后10分钟，通过“抽象围棋”弹幕，成功取得胜利，引起广泛关注。

【AiBase提要:】
🔍 挑战AI游戏: 棋手柯洁在抖音直播中尝试击败人工智能，《金铲铲之战》成为焦点。
👾 屡战屡败: 柯洁在游戏中多次败北，粉丝在评论区调侃，但直播末尾发生戏剧性逆袭。
🏆 抽象围棋胜利: 在最后10分钟，柯洁通过“抽象围棋”弹幕成功获得胜利，直播获得300万点赞。

联发科发布AI芯片天玑8300

联发科发布的天玑8300芯片将为经济实惠的手机提供类似ChatGPT的本地生成式人工智能功能，与高通等厂商竞相探索移动领域生成式人工智能趋势。

【AiBase提要】
📱 联发科发布天玑8300芯片，为经济实惠手机提供本地生成式人工智能功能。
💡 与高通趋势相符，移动公司竞相在手机中推广生成式人工智能技术。
🔄 天玑8300相较前代芯片有多项改进，包括提高性能、电池续航和连接配件的优化。

OpenAI的GPT-4在文档摘要中幻觉率最低

Vectara排行榜显示，OpenAI的GPT-4在文档摘要中具有最低的3%幻觉率和出色的97%准确率，成为大型语言模型中表现最佳的模型。

【AiBase提要:】
👏 卓越表现: OpenAI的GPT-4在Vectara排行榜上凭借97%准确率和3%的幻觉率脱颖而出，成为文档摘要中幻觉率最低的大型语言模型。
🚀 排名亮眼: GPT-4和GPT-4Turbo在排行榜中表现最佳，而非OpenAI模型中，Meta Llama2以94.9%准确率和5.1%的幻觉率获得最高得分。
🌐 开源可信度: Vectara发布了开源模型，允许检查大型语言模型的幻觉率，以提高生成式AI系统的可信度，为企业提供更有信心地启用生成系统的信息。

生成式AI助推增长英伟达收入创历史新高

NVIDIA在Q32024财报中宣布创下181.2亿美元历史性收入，主要由数据中心业务推动，涵盖GPU销售和用于生成AI工作负载的GPU/CPU系统。

【AiBase提要:】
🚀 历史新高收入: NVIDIA在最新财报中创下181.2亿美元的历史性收入，以数据中心业务为主导，包括GPU销售和用于生成AI工作负载的GPU/CPU系统。
💡 生成AI趋势: 全球范围内，生成AI成为软硬件市场几十年来最大的总地址市场扩张，反映了行业从通用计算向加速计算和生成AI的广泛过渡。
🌐 新兴市场和合作关系: 新兴市场包括政府建立主权人工智能基础设施，各地云服务提供商对AI云的投资，以及企业软件公司整合AI助手，NVIDIA预计将在这些领域取得增长。

🤖📈💻💡大模型动态

Stability AI推出视频生成模型Stable Video Diffusion

Stability AI最近发布了视频生成模型Stable Video Diffusion，基于其Stable Diffusion文本转图像模型，可通过动画化现有图像生成视频，但目前仍处于研究预览阶段。

【AiBase提要:】
🎥 Stability AI发布开源的视频生成模型Stable Video Diffusion，能通过动画化图像生成高质量视频。
⚠️ 模型目前在“研究预览”阶段，有特定使用条款，限制应用于“教育或创意工具”等领域，禁止用于“真实事件或人物的表现”。
💰 Stability AI计划商业化应用，已筹集超过1.25亿美元资金，但面临财务困境和高烧钱速度，公司前高管离职。

拼多多成立大模型团队

拼多多成立大模型团队，致力于在客服、搜索、推荐等业务场景中应用大模型，提升用户购物体验和运营效率。

【AiBase提要:】
🚀 大模型团队成立: 拼多多在上海组建大模型团队，重点研发大模型在客服、对话场景下的应用，并计划拓展至其旗下电商平台TEMU的多个业务场景。
💼 高薪招才启事: 拼多多开始在大模型领域招聘人才，提供年薪百万的职位，最高可达130万元，显示对大模型技术的重视。
🔍 业务拓展与效益提升: 大模型应用将帮助拼多多实现智能化推荐和虚拟客服，提高购物体验、销售转化率，同时支持供应链管理、库存预测和销售预测，提升运营效率。

快手:已开始研发超千亿规模大模型以及多模态大模型

快手首席执行官程一笑表示，公司已启动超过千亿规模的语言大模型和多模态大模型的研发，以确保在新技术突破中保持国内领先地位，其中包括130亿和660亿规模的大模型，并推出了文生图大模型“可图”。

【AiBase提要:】
🚀 快手启动新AI战略，研发超千亿规模的语言和多模态大模型，以保持国内领先地位。
🌐 公司推出文生图大模型“可图”，具备文本理解和多样风格转化能力，用于生成多种风格的绘画作品。
🔄 快手加速推进大模型场景应用，包括在短视频评论区推出“AI玩评”功能，利用大模型生成海量风格图片，促进用户互动。

🤖📱💼AI应用

Krea上线背景去除功能简单拖拽即可自动抠图

Krea最新更新引入背景去除功能，用户只需简单拖拽图片到界面，系统自动抠图，省时省力，提供更灵活的创意空间。

官网地址:https://www.krea.ai/

【AiBase提要:】
🚀 创新功能登场: Krea推出背景去除功能，用户通过简单拖拽实现自动抠图，解决复杂背景限制创作的问题。
🎨 灵活创意空间: 用户能更灵活地编辑内容，确保生成画面干净、专业，提供更广阔的创意空间。
💻 AI驱动技术: Krea是一款AI创意工具，拥有2500多个AI模型，支持实时AI训练，满足用户的个性化审美需求。

研究人员开发人工智能模型“ALERTA-Net” 预测股市趋势

南达科他州大学研究人员成功研发深度神经网络模型“ALERTA-Net”，首次整合宏观经济、搜索引擎和社交媒体数据，为股市预测提供新思路。

论文地址:https://dx.doi.org/10.48550/arxiv.2310.18706

【AiBase提要:】
🧠 综合数据预测: ALERTA-Net整合宏观经济、搜索引擎和社交媒体数据，成功预测股市走势和波动。
🌐 全球股票分析: 研究团队选择41支“蓝筹”股票，结合深度学习和社交媒体信息检索，获得700万条推文数据。
📈 优异性能: 与DP-LSTM等基准模型相比，ALERTA-Net在准确性方面表现更出色，为股市预测领域带来创新。

👨‍💻💡🎯聚焦开发者

开源AI工具ChatAnything:用文本描述生成虚拟角色

南开大学与字节跳动合作推出ChatAnything，通过在线方式生成基于大型语言模型的拟人化角色，引入创新概念MoV和MoD，解决面部关键点检测难题。

项目地址:https://chatanything.github.io

【AiBase提要:】
🎭 ChatAnything框架创新: 南开大学与字节跳动合作推出ChatAnything，以在线方式生成基于大型语言模型的拟人化角色。
🗣️ MoV和MoD创新概念: 引入创新概念MoV和MoD，实现声音和外观的多样生成，充分利用语言模型技术为角色创造个性。
🧠 挑战与解决方案: 面临面部关键点检测困难，通过像素级引导解决，介绍ChatAnything框架的四个主要模块，提供全面的拟人化解决方案。

PyTorch团队重写Meta“分割一切”模型性能提速8倍

PyTorch团队通过重写Meta的「分割一切」模型，在保持准确率的同时，成功提升了推理速度8倍，涉及多方面PyTorch原生特性和新功能的应用。

【AiBase提要】
🚀 性能提速8倍: PyTorch团队通过采用多种优化方法，包括Bfloat16、Torch.compile、GPU量化等，成功将Meta的「分割一切」模型性能提升8倍。
🔍 深入性能分析: 文章详细介绍了SAM模型的性能分析、瓶颈识别，以及采用Bfloat16、Torch.compile等优化手段，综合提高了GPU同步和性能。
🧠 多方面优化应用: PyTorch团队通过重写SAM模型、使用Nested Tensor、Triton自定义操作等手段，综合优化了生成式AI模型，为AI领域发展提供了重要方法和工具。

深度催眠引发的LLM越狱:香港浸会大学揭示大语言模型安全漏洞

研究团队通过深度催眠方法提出的新型大语言模型越狱攻击DeepInception揭示了LLM在应对人类指令时可能失去自我防御，强调改进大模型的防御机制的紧迫性。

项目地址:https://deepinception.github.io/

【AiBase提要:】
🔍 轻量级越狱攻击: DeepInception是一种轻量级Jailbreak方法，通过深度催眠LLM使其越狱，并规避内置安全防护。
🤖 利用人格化特性: 利用LLM的人格化特性构建新型指令Prompt，实现自适应的LLM越狱，揭示多个LLM的致命弱点。
⚠️ 安全性呼吁与改进: 实验证明DeepInception领先于先前Jailbreak方法，呼吁加强对LLM自我越狱的关注，通过心理学视角为改进大模型的防御机制提供启示。

（举报）

相关推荐

关键词：

ChatGPT

品牌AI搜索监控实战手册:你的企业在ChatGPT眼中是什么样子?

某互联网大厂品牌总监分享：投入200万SEO使"企业级CRM"关键词在Google排名第一，但用户用ChatGPT询问"推荐适合中国企业的CRM系统"时，AI回答中根本没有该品牌。更值得警惕的是，竞品不仅被提及，还被AI用"性价比高""用户体验好"等正面词汇描述。这揭示2025年品牌营销最大盲区：企业不知道AI如何"看待"自身品牌。数据显示超40%年轻用户开始使用AI搜索作为主要信息渠道，而绝大多数企业对自己在AI平台的"形象"一无所知。文章提出GEO品牌监控概念，通过覆盖度、推荐强度、信息质量三个维度量化品牌在AI搜索中的影响力，并给出五步实施流程：建立监控基线、竞品对标分析、设置持续机制、深度洞察挖掘、数据驱动优化。通过真实案例说明，系统化GEO优化能在3个月内提升品牌提及率33个百分点，证明AI搜索时代的品牌竞争已从"被看见"升级为"被AI信任"。
荐AI日报：李飞飞Marble 3D世界模型公测；OpenAI首次推出ChatGPT群聊功能；百度发布多模态 AI助手超能小度

本期AI日报聚焦多项技术突破：World Labs推出Marble 3D模型，实现多模态生成可交互虚拟世界；OpenAI在韩新试点ChatGPT群聊功能，支持多人协作互动；苹果更新隐私政策，要求第三方AI调用需明示授权；百度发布多模态助手“超能小度”，支持空间感知与设备免费升级；LinkedIn推出AI人脉搜索，通过自然语言精准匹配专业人士；Cursor完成23亿美元融资，估值达293亿；Character AI与耶鲁合作实现音画同步技术Ovi；Google NotebookLM上线深度研究工具，支持多格式文件分析与知识库构建。

AI 3D虚拟世界多模态输入
荐谁能成为中国的ChatGPT？夸克抢先交卷

在OpenAI上线自己家AI浏览器ChatGPT Atlas的同一周，微软在海外发布了新的AI助手Mico和更AI化的Edge浏览器，夸克则在国内推出了新的「对话助手」功能。这一系列消息背后，新旧巨头、两个市场产生了两个确定的共识:一个是AI助理与AI浏览器的融合会进一步深化，入口之争就是系统之争;另一个是对话会成为人与AI交互的主要方式，自然语言就是未来的编程语言。在海外市场，OpenA

AI浏览器 ChatGPT Atlas
如何让你的内容被 ChatGPT 优先引用？——GEO 优化实战指南

传统SEO追求"谷歌首页排名"，生成式AI时代则需追求"被AI引用"。AI模型不提供明确排名算法，更像黑箱，使内容创作者困惑。GEO优化的核心是让内容具备"可引用性"：权威清晰、结构化信息、语义覆盖多维度、模型检索映射。需通过AIBase等GEO排名查询工具验证"AI曝光率"，分析引用语境、竞争差距，调整内容结构以提升AI引用倾向。SEO优化机器如何找到你，GEO则优化AI如何引用你。

SEO优化 AI引用内容权威性
GEO如何改变ChatGPT搜索和Perplexity的游戏规则

本文对比ChatGPT与Perplexity两大AI搜索平台：ChatGPT作为全能型助手，整合搜索与多任务处理，但存在信息时效性不足；Perplexity专注垂直搜索，强调引用透明与权威来源。针对AI搜索优化（GEO），提出差异化策略：面向ChatGPT需构建结构化知识库、强化品牌实体识别；面向Perplexity需注重权威数据引用和元数据优化。文章还介绍了AIBase的GEO监测工具，通过曝光率等指标量化内容在AI生态中的可见度，并给出可落地的优化行动方案。
如何提升品牌在AI回答中的提及率？GEO优化3招，让ChatGPT主动提及你的品牌

本文探讨AI搜索时代品牌面临的"隐身危机"，指出AI搜索用户年增538.7%，但品牌在AI回答中提及率不足20%。提出三大核心策略：1）构建权威背书矩阵，通过知乎等高权重平台获取自然提及；2）优化AI友好内容，采用对话式标题和结构化数据；3）建立数据监测闭环，通过A/B测试持续迭代。强调需善用监测工具实时追踪品牌在豆包、文心一言等AI模型的曝光表现，避免内容"注水"。最终实现从"被动等待"到主动抢占AI"第一屏"的转变。

文章搜索核心标签 SEO优化
OpenAI推出AI浏览器ChatGPT Atlas 开启个性化上网新体验

OpenAI于10月22日推出首款AI驱动浏览器ChatGPT Atlas，以个性化上网体验为核心。用户点击“Ask ChatGPT”即可在侧边栏实时互动，实现网页摘要生成、航班预订、文档编辑等多样化任务。目前仅支持macOS，未来将扩展至Windows和移动端。高级代理功能暂限付费用户使用，其特色包括自动捕捉页面上下文、分屏浏览及记忆用户操作历史，旨在通过自然对话提升网络使用效率。

ChatGPT Atlas 人工智能浏览器
华为WATCH ULTIMATE DESIGN非凡大师紫金款明天开启预售

华为11月14日推出WATCH ULTIMATE DESIGN非凡大师紫金款智能手表。该系列定位超高端，于2023年9月首次发布，由刘德华代言。新款采用18K黄金材质，设计灵感源自航海轮舵，表圈手工镶嵌六颗黄金，搭配黄金表圈、旋转表冠及可伸缩蝴蝶扣等精致设计，尽显奢华质感。功能方面支持双向北斗卫星消息、百米防水及健康管理，智能模式下续航达8天。新品将于11月15日10:08开启预售，面向追求高端独特风格的消费者。

华为WATCH ULTIMATE DESIGN
华为WATCH Ultimate 2非凡探索版明日开启预售

华为正式宣布旗舰智能手表WATCH Ultimate 2非凡探索将于11月7日开启预售。这款“全能表王”支持150米潜水与音频功能，具备海豚声呐通信技术，可在水下30米实现手表间信息传输，60米内一键SOS求救。同时搭载北斗卫星语音消息功能，无网络环境下可通过卫星发送语音信息。硬件上配备1.5英寸OLED屏幕，峰值亮度达3500nit，支持20ATM防水与IP68/9防尘。省电模式下续航达11天，常规使用达4.5天。该手表海外售价799英镑（约7443元人民币），国内价格尚未公布。

华为WATCH Ultimate2 智能手表
Creators’ App迎来重大更新

索尼与分秒帧联合推出云端影像创作平台ICE-Cloud，集成索尼先进影像技术与高效云端协作能力，为创作者提供从拍摄到后期全流程赋能。平台支持移动端、PC端及网页应用，实现素材自动上传、云端管理、在线审片和项目协同，打破时空限制，提升创作效率。通过Creators’ App连接相机与云端，实现即拍即传、异地实时协作，致力于打造新一代创意工作流。

索尼云端影像创作平台 Creators’

今日大家都在搜的词：

热文

3 天
7天

AI视野：ChatGPT语音旁白功能免费开放；文心一言率先实现收费；Claude2.1长下文长度扩展至200K；拼多多成立大模型团队

品牌AI搜索监控实战手册:你的企业在ChatGPT眼中是什么样子?

荐AI日报：李飞飞Marble 3D世界模型公测；OpenAI首次推出ChatGPT群聊功能；百度发布多模态 AI助手超能小度

荐谁能成为中国的ChatGPT？夸克抢先交卷

如何让你的内容被 ChatGPT 优先引用？——GEO 优化实战指南

GEO如何改变ChatGPT搜索和Perplexity的游戏规则

如何提升品牌在AI回答中的提及率？GEO优化3招，让ChatGPT主动提及你的品牌

OpenAI推出AI浏览器ChatGPT Atlas 开启个性化上网新体验

华为WATCH ULTIMATE DESIGN非凡大师紫金款明天开启预售

华为WATCH Ultimate 2非凡探索版明日开启预售

Creators’ App迎来重大更新

今日大家都在搜的词：

热文

华为Mate 80系列已在华为商城开启预约

华为Mate 80 Pro Max外观公布：采用双圆环设计

小米超级小爱AI大模型推出随心修图功能

荣耀500系列官宣将于11月24日发布

iPhone Pocket被吐槽像保温水瓶套网友：韭菜太好割

影视飓风CEO在相亲角被大妈吐槽网友：大妈不识货

腾讯发布2025第三季度财报：营收1928.69亿元同比增长 15%

雷军回应小米双11战绩：谢谢大家支持

小米澎湃OS 3第三批正式版推送：支持小米14、K70系列等

卢伟冰：小米手机双11连续三年国产销量第一

95岁巴菲特每周还上5天班此前计划年底退休

京东发布双11战报：订单总量增长近60% 下单用户同比增长40%

荣耀500系列官宣：超级标准版+超级Pro版

AI日报：百度发布文心5.0；可灵2.5Turbo模型上线“首尾帧”功能

站长商机