AI视野：百度将发布AI互动式新搜索；OpenAI计划重磅更新；Character.AI推出AI群聊功能；谷歌人机验证已经拦不住AI

2023-10-12 15:29 · 稿源：站长之家

文头.jpg

🤖📱💼AI应用

百度将发布AI互动式新搜索

百度世界2023即将发布AI互动式新搜索，具备听、会、看的能力，通过大模型和多轮交互提供个性化搜索体验。

【AiBase提要】
🔍 百度新搜索整合语义检索技术和大语言模型，具备听、会、看能力。
🔌 百度建设AI新生态，吸引2万家开发者入驻插件平台，扩展大模型应用生态。
📈 百度营销发布AI商业引擎，以生成式AI技术重构商业产品和解决方案，促进广泛合作。

网易有道推出全球首个虚拟人口语教练Hi Echo

有道推出虚拟人口语私教Hi Echo，提供一对一专属教练，支持多轮对话和口语练习，具备纯正美式口音。

微信截图_20231012081406.png

【AiBase提要:】
📚 Hi Echo是虚拟人口语私教，提供个性化口语练习，支持多轮对话和评分。
🎙️ 学习者可以在不同对话场景和话题中练习，覆盖多个话题，持续更新。
🎙️教练具备地道美式口音，帮助学习者轻松练习口语。

Character.AI推出AI群聊功能

Character.AI是一家由前Google AI研究人员创建的初创公司，现在为其订阅者提供新的AI群聊功能，让用户可以与多个人工智能角色实时交谈。

【AiBase提要】
🤖 Character.AI是一由前Google AI研究人员创建的初创公司，受a16z支持，为订阅者提供新的AI群聊功能。
🗣️ 用户可以创建包含多个AI角色的群聊，与朋友建立社交关系、分享想法，或进行实时协作，扩展了群聊体验。
💰 这项功能首先向C.ai+订阅者提供，以获取反馈和改进，随后将对公众开放，不是免费的服务。

百度百科推出百科AI词条编辑助手

百度百科推出基于大模型技术的AI词条编辑助手，提高编辑效率和准确性，同时计划上线百科BOT-『百科同学』，以实时对话方式解答用户知识问题。

【AiBase提要:】
1. 百度百科发布了百科AI词条编辑助手，利用前沿大模型技术，自动生成精炼摘要，提升词条编辑效率和准确性，特别适用于长篇新闻报道。
2. 百度即将推出百科BOT-『百科同学』，用于实时对话，快速解答历史知识类问题，支持趣味问答和作画等功能，以加速知识的普及。
3. 这一举措将有助于更多人通过AI辅助获得和分享知识，促进知识的普及和传播。

中国移动推出“86NEXT”AI产品，将首次应用于10086

中国移动在全球合作伙伴大会上发布了名为“86NEXT”的创新AI技术产品，以大模型为代表，将首次在10086中应用，提升用户体验与满意度。

【AiBase提要】:
🔸 中国移动发布“86NEXT” AI产品，采用大模型技术，旨在提供更深入和人性化的交流体验。
🔸 该产品可与5G视频客服技术相结合，为用户带来丰富多彩的交互体验。
🔸 除了在用户体验上的提升，它还能应用于各类服务形态，为客户提供综合问题解决方案，提高客服人员的工作效率。

微软Viva平台新增AI驱动的员工技能分析功能

微软将在Microsoft Viva员工体验平台上推出新的人工智能功能「Skills」，旨在为雇主提供员工技能的全面洞察。

【AiBase提要】:
📊 新功能「Skills」旨在为雇主提供员工技能的全面洞察。
🤖 利用微软图谱和LinkedIn技能图谱的综合力量，技能功能将智能地推断员工的技能概况。
📆 预计「技能」功能将在今年年底进行私人预览测试，并成为Microsoft Viva套件的一部分。

在线支付服务商Klarna推出AI图像搜索工具

瑞典在线支付和零售服务提供商Klarna推出AI图像搜索工具“Shopping Lens”，用户可通过拍照迅速找到购物商品，还推出多项增强购物体验的功能。

【AiBase提要:】
📷 Klarna发布“Shopping Lens” AI图像搜索工具，允许用户拍照寻找商品。
🎥 “Shoppable Video”扩展至欧洲市场，提供个性化视频推荐。
🛒 推出实体店内产品扫描、新的返现计划、单一登录解决方案等功能，提升用户购物体验。

📰🤖📢AI新鲜事

OpenAI计划重磅更新应用程序开发成本可降低20倍

OpenAI计划进行重磅更新，通过增加内存存储功能，将应用程序开发成本降低约20倍，帮助开发人员构建专属ChatGPT，还将推出新的视觉开发工具。

【AiBase提要】:
- 💡 OpenAI计划推出重磅更新，以更低价格、更高效的方式帮助构建ChatGPT，将应用程序成本降低20倍左右。
- 💡 这一更新解决了合作伙伴在开发AI软件时的高昂ChatGPT模型成本问题。
- 💡 OpenAI还将推出视觉开发工具，适用于医疗、金融、电商、娱乐等领域。

图灵奖得主Hinton加入机器人初创公司Vayu Robotics获9000万美元投资

深度学习先驱Geoffrey Hinton加入初创公司Vayu Robotics，强调AI技术可控和低道德风险，获得9000万美元投资。

QQ截图20231012141347.jpg

【AiBase提要:】
🤖 Geoffrey Hinton重返机器人领域，成为Vayu Robotics顾问。
📈 初创公司Vayu Robotics获得9000万美元投资，强调AI技术可控。
👥 公司的CTO是Hinton的门徒，开发小型送货机器人，注重AI视觉技术。

微软加强Bing AI图像生成内容限制

微软削减了Bing的DALL-E3AI图像生成功能，以加强对潜在问题关键词和内容的控制。

【AiBase提要:】
🔒 微软削减了Bing的DALL-E3AI图像生成功能，以应对用户生成问题图像的问题。
📛 用户曾经能够轻松绕过关键词限制，生成具有问题内容的图像。
🛡️ 微软加强了对潜在问题关键词和内容的控制，但仍存在不完善之处。

谷歌内部员工质疑AI聊天机器人Bard的有效性和价值

谷歌内部员工对AI聊天机器人Bard的效用产生疑虑，涉及投入资源是否合理。这些质疑对于谷歌而言，正在成为一项严峻的挑战，因为它在搜索领域的主导地位受到了一系列竞争对手的挑战。

【AiBase提要:】
1️⃣ 内部员工开始怀疑Bard的有效性和功能，引发了资源投入的疑虑。
2️⃣ 谷歌不断为Bard增加新功能以应对竞争，但也面临虚假信息和危险建议的挑战。
3️⃣ 论坛讨论还涉及到道德和社会责任，引发广泛关注。

研究人员揭示GPT-4安全漏洞，使用少见语言可绕过限制

布朗大学的研究人员发现OpenAI的GPT-4存在安全漏洞，可以通过使用少见语言如祖鲁语和盖尔语绕过其限制性设置。在处理非英语语言的限制性提示时，他们取得了惊人的79%成功率，而仅使用英语的成功率不到1%。

【AiBase提要】:
1. 研究人员揭示OpenAI的GPT-4存在安全漏洞，无法有效处理非常见训练数据中的语言，尤其在处理非英语语言时成功率高。
2. 他们通过将不安全的提示翻译成低资源的自然语言，如祖鲁语，成功绕过了GPT-4的安全机制，引发有害回应。
3. 这项研究突显了对非英语语言的安全性研究的必要性，同时也引发了关于语言不平等估值和跨语言漏洞的担忧。

中兴通讯将发布支持大模型训练的最新AI服务器

中兴通讯计划推出新一代智算中心基础设施产品，包括高性能AI服务器和数据处理器，以支持大模型训练和推理。

【AiBase提要】
🔍 中兴通讯致力于满足各类AI应用场景的需求。
📈 他们已经发布面向中小型模型的G5系列服务器。
🚀 中兴通讯计划在今年内发布支持大模型训练的最新AI服务器。

🤖📈💻💡大模型动态

OPPO推出基于AndesGPT大模型的小布1.0公测版

OPPO宣布启动AndesGPT大模型的新小布1.0公测，通过4位量化技术，在不降低精度的情况下实现性能优化，并将在ColorOS14发布会上公布更多相关信息。

知识与百科能力国内第一！ColorOS 14 将搭载新小布： 11 月 16 见

【AiBase提要:】
📌 OPPO推出小布1.0公测，基于AndesGPT大模型，通过4位量化技术提高性能。
📌 AndesGPT大模型是OPPO的生成式大语言模型，在知识与百科能力测试中表现出色。
📌 用户可以报名参与小布1.0公测，更多信息将在ColorOS14发布会上披露。

智源研究院开源中英双语大模型悟道·天鹰340亿Aquila2-34B

智源研究院发布了悟道·天鹰340亿（Aquila2-34B）模型，在推理、泛化、代码生成等方面表现卓越，同时还提供开源项目，推动大模型研究的协同创新。

微信截图_20231012133913.png

【AiBase提要:】
悟道·天鹰340亿（Aquila2-34B）模型在综合能力方面超越其他开源基座模型，领先于同级别的对话模型。
智源研究院还发布了多个开源项目，包括 FlagScale 高效并行训练框架和 FlagAttention 高性能 Attention 算子集，以进一步推动大模型研究的发展。
该模型在推理能力和处理长文本任务方面表现出色，提供了强大的自然语言处理能力。

Aquila2模型全系开源地址:

https://github.com/FlagAI-Open/Aquila2

https://model.baai.ac.cn/

https://huggingface.co/BAAI

Kandinsky1:3.3亿参数强大模型，文本生成逼真图像

Kandinsky1是一款强大的文本到图像生成模型，拥有3.3亿参数，通过潜在扩散技术实现高质量图像生成，在COCO-30K验证数据集上获得8.03的FID分数。

【AiBase提要:】
🌟 Kandinsky1拥有3.3亿参数，表现卓越，通过潜在扩散技术实现高质量文本到图像生成。
🖼️ 基于扩散的模型标志着文本到图像生成的演进，超越了传统GANs的性能。
📊 Kandinsky在COCO-30K数据集上取得8.03的FID分数，与最先进的文本到图像生成模型竞争激烈。

👨‍💻💡🎯聚焦开发者

谷歌人机验证已经拦不住AI了

苹果AI/ML团队与哥伦比亚大学合作研发的多模态大模型“雪貂”（Ferret）成功突破了谷歌人机验证码，可准确识别交通信号灯位置，性能媲美GPT-4V。

【AiBase提要】:
1. Ferret是由苹果AI/ML团队与哥伦比亚大学合作研发的多模态大模型，在“看说答”任务中表现出色，准确识别交通信号灯。
2. Ferret创新之处在于将引用和定位的空间理解能力紧密结合，同时理解语义和找到目标。
3. 这一模型采用混合区域表示方法，结合离散坐标和连续特征，在多任务评估中表现出色，为图像理解和多模态任务提供新的方向。

项目地址:https://github.com/apple/ml-ferret

论文地址:https://arxiv.org/pdf/2310.07704.pdf

Docker发布全新AI堆栈

Docker在Dockercon23大会上推出全新Docker GenAI堆栈，使生成式AI应用程序的开发变得更加容易，降低容器配置复杂性，提供免费的部署和商业支持选项，推动AI技术的普及和发展。

AiBase提要:
🚀 Docker发布全新Docker GenAI堆栈，推动AI应用程序的开发革命。
🧩 Docker GenAI堆栈简化生成式AI应用程序的开发，整合了Neo4j图形数据库和LangChain模型链技术。
💰 Docker GenAI堆栈是免费提供的，为开发人员提供本地运行选项，提高开发人员的体验。

LLM-Shearing大模型剪枝法:用5%的成本拿下SOTA

陈丹琦团队开发了LLM-Shearing大模型剪枝法，可将大型预训练模型剪枝至低成本，同时保持高性能水平，比重新预训练更经济。

【AiBase提要:】
1. LLM-Shearing是一种大模型剪枝方法，将预训练模型剪枝至仅需3%的计算量和5%的成本，同时保持高性能。
2. 剪枝方法将模型剪枝看作一种约束优化问题，同时学习剪枝掩码矩阵以最大化性能为目标。
3. 这项研究提供了一种高效的方式，可用于将剪枝后的模型继续预训练，最终超越从头开始预训练的模型。

论文地址:

https://arxiv.org/abs/2310.06694

Hugging Face:

https://huggingface.co/princeton-nlp

项目主页:

https://xiamengzhou.github.io/sheared-llama/

Replit将GhostWriter融入核心平台全面开源AI开发工具

Replit宣布将GhostWriter AI代码补全工具融入其核心平台，全面开源，使所有用户能够享受人工智能增强的编程体验。

【AiBase提要:】
👉 Replit整合GhostWriter，向所有用户提供AI代码补全工具。
👉 公布开源大语言模型 replit-code-v1.5-3b，旨在赋能全球开发者。
👉 Replit使用自家构建的开源技术，包括更新版本的大语言模型，支持多种编程语言，并在强大硬件上训练。

革命性视频合成工具MAGVIT-v2将视觉内容转化为大模型的标记

卡内基梅隆大学、Google研究和乔治亚理工学院联合推出的MAGVIT-v2视频标记工具，将图像和视频转化为大型语言模型可理解的标记，为视觉生成任务带来重大突破。

项目地址:https://magvit.cs.cmu.edu/

【AiBase提要】:
1. MAGVIT-v2是一项视频标记工具，由卡内基梅隆大学、Google研究和乔治亚理工学院联合开发，能将图像和视频输入转化为大型语言模型可识别的标记。
2. 这一革命性工具的独特算法使开发者能够实现各种令人惊叹的应用，从全景视频到智能去除和图像转动动画。
3. MAGVIT-v2在视觉生成任务中明显超越传统扩散模型，为大型语言模型在视觉任务领域带来崭新机遇。

FAVOR:通过精细融合音频和视觉细节提升大模型视频理解能力

研究人员最近发布了名为FAVOR的创新技术，它能够通过精细融合音频和视觉信息，显著提高大型语言模型对视频内容的理解能力，为人工智能视频理解技术的进步带来积极影响。

【AiBase提要】:
1. FAVOR技术巧妙地融合音频和视觉信息，从帧级别提升大型语言模型对视频的理解。
2. 这一创新为大型语言模型在视频理解领域开辟新机遇，提高了视频理解的准确性和效率。
3. FAVOR支持多模态输入，包括文本、图像、音频和视频，为用户提供更精确的多媒体交互体验。

（举报）

相关推荐

关键词：

百度

百度AI：熬过“起大早”的孤独，等来时代的奖励

AI的故事，又进入到了新阶段。 11月13日，第20届百度世界大会举行。在这场被视为AI行业风向标的会议上，百度创始人李彦宏发表了题为《效果涌现》的主旨演讲。他表示，当前，“我们更关心如何让AI与我们要做的每一项任务，都能有机结合，让AI成为企业发展和个人成长的原生推动力。” 这场演讲的核心，恰恰道出了AI产业的分水岭——从“智能涌现”迈向“效果涌现”。

AI 百度世界大会李彦宏
百度搜索推出“百度猎户座”AI引擎，涵盖基座模型、搜索AI API、 MCP、垂类优势能力

2025年11月13日，百度发布“百度猎户座”AI引擎，全面开放25年搜索技术与前沿AI能力。该系统整合底座模型、搜索API、MCP及垂直领域能力，基于多智能体架构统一连接信息、工具、服务与模型，融合搜索技术优势与全网MCP生态资源。即日起对外开放，支持企业快速接入打造专属AI应用。同时，文心助手上线个性化记忆功能，视频生成推出“参考生成”玩法，AI短剧创作平台免费提供超30万部IP资源及全流程工具。

百度猎户座 AI引擎搜索技术
百度Q3财报：AI业务增长超50% 萝卜快跑季度单量增长212%

今日，百度发布2025年第三季度财报显示，该季度总营收312亿元，核心营收247亿元。三季度，百度首次披露AI业务收入，显示同比增长超50%。

百度财报 AI业务收入萝卜快跑
百度世界2025：罗永浩数字人同款慧播星高说服力技术向全球开放

在今日盛大举行的百度世界大会上，百度公司宣布了一项重大举措——“罗永浩”同款慧播星高说服力数字人技术正式向全球开放。百度创始人李彦宏在大会上强调，数字人技术并非简单的应用工具，而是AI时代的一种基础性技术，甚至可能成为全新的通用交互界面，引领未来人机交互的新潮流。据百度公布的数据显示，在今年双 11 购物节期间，慧播星数字人带货成绩斐然，

百度世界大会数字人技术慧播星
百度发布 2025 年第三季度财报：AI 业务收入同比增长超 50%

日，百度正式发布2025年第三季度财报，数据显示，公司当季总营收达312亿元，其中百度核心业务营收247亿元，AI业务成为核心增长引擎，收入同比增长超50%，展现出强劲的商业化落地能力。在AI云领域，百度实现33%的同比增长，其中AI高性能计算基础设施的订阅收入同比激增128%。财报披露，百度千帆大模型平台已完成全面升级，推出整套Agent Infra解决方案，进一步强化模型服�

百度财报 AI业务增长千帆大模型平台
百度发布全球最大通用智能体活跃用户超2000万

在百度世界2025大会上，百度正式宣布其智能体产品GenFlow3.0已在百度文库与百度网盘全端上线，目前活跃用户突破2000万，已成为全球规模最大的通用智能体，致力于帮助用户在工作、学习和生活中成为超级个体”。 GenFlow3.0被定位为全球首个全端通用智能体，具备更强大的多模态通用能力，可实现全模态内容的输入、处理与输出。该产品采用中心化原生Multi-Agent架构，结合行�

百度世界2025 GenFlow3.0 智能体产品
百度旗下小度AI眼镜Pro正式开售：售价2299元

站长之家（ChinaZ.com）11月10日消息:今日，百度旗下备受瞩目的小度 AI 眼镜 Pro 正式开启发售，售价定为2299元，这一消息迅速吸引了众多科技爱好者和消费者的目光。在外观设计上，小度 AI 眼镜 Pro 提供了波士顿和猫眼两种时尚款式，满足了不同消费者的审美需求。镜片方面，用户既可以选择墨镜款式，也能挑选光致变色镜片，而且支持直接配近视镜片，无需采用夹片设计，为

小度 AI 眼镜
荐AI日报：谷歌Gemini 3 Pro Preview模型上线；Cloudflare文件异常致全球宕机；百度Q3 AI收入96亿元

谷歌发布Gemini 3大模型及Antigravity AI开发平台，支持参数灵活调整；Cloudflare因配置异常致全球服务中断6小时；微软测试AI文件连接器，允许Claude直接读取本地文件；百度Q3 AI收入96亿元，萝卜快跑订单激增；小米AI眼镜新增直播与语音控制功能；TikTok推出AI内容推荐调节选项；微软将Copilot全面集成至Office应用；谷歌推出实时生成交互界面的Generative UI技术；Manus发布Browser Operator，将浏览器升级为全功能AI代理。

AI Gemini 3
百度发布小度AI眼镜Pro：集成四大核心AI能力售价2299元

11月13日，2025百度世界大会在京开幕。百度集团副总裁、小度科技CEO李莹发布全新智能穿戴设备——小度AI眼镜Pro，售价2299元，已在电商平台开售。产品集成四大AI核心能力：AI识物可快速识别物体信息；AI翻译支持36种语言实时互译，针对医疗、金融领域优化术语库；AI备忘通过语音即时记录信息；AI会议纪要能自动提炼要点并生成待办清单。设备主打轻便舒适，整机重39克，提供两种时尚款式，支持定制镜片，具备IP54防护等级。硬件搭载第一代骁龙AR1平台，配备2GB+32GB存储，采用索尼1200万像素镜头，支持4K拍照与1440p视频录制。内置173mAh电池，配合智能眼镜盒可实现68小时综合续航。

百度世界大会小度AI眼镜Pro 智能穿戴设备
荐AI日报：百度发布文心5.0；可灵2.5Turbo模型上线“首尾帧”功能；微博推出 VibeThinker-1.5B

本期AI日报聚焦多项技术突破：OpenAI推出GPT-5.1，提升对话自然度与响应速度；百度发布原生全模态大模型文心5.0，支持跨文本图像生成；微博开源VibeThinker-1.5B模型，以低成本实现高效推理；可控视频生成模型新增首尾帧控制功能；李飞飞团队推出商用3D世界生成工具Marble；东北大学开源多语言翻译模型支持60种语言；谷歌Gemini语音功能升级实现更自然交互；阿里启动“千问”项目对标ChatGPT，全面布局C端AI应用竞争。

AI视频生成可灵2.5Turbo 首尾帧功能

今日大家都在搜的词：

热文

3 天
7天

AI视野：百度将发布AI互动式新搜索；OpenAI计划重磅更新；Character.AI推出AI群聊功能；谷歌人机验证已经拦不住AI

百度AI：熬过“起大早”的孤独，等来时代的奖励

百度搜索推出“百度猎户座”AI引擎，涵盖基座模型、搜索AI API、 MCP、垂类优势能力

百度Q3财报：AI业务增长超50% 萝卜快跑季度单量增长212%

百度世界2025：罗永浩数字人同款慧播星高说服力技术向全球开放

百度发布 2025 年第三季度财报：AI 业务收入同比增长超 50%

百度发布全球最大通用智能体活跃用户超2000万

百度旗下小度AI眼镜Pro正式开售：售价2299元

荐AI日报：谷歌Gemini 3 Pro Preview模型上线；Cloudflare文件异常致全球宕机；百度Q3 AI收入96亿元

百度发布小度AI眼镜Pro：集成四大核心AI能力售价2299元

荐AI日报：百度发布文心5.0；可灵2.5Turbo模型上线“首尾帧”功能；微博推出 VibeThinker-1.5B

今日大家都在搜的词：

热文

华为Mate X7外观公布搭载全新折叠玄武架构

AI日报：xAI推出Grok 4.1；OceanBase发布首款AI数据库seekdb；

董明珠再回应玫瑰空调：创新尝试打造家电艺术品

华为Mate X7今日开启预订搭载第二代红枫影像等配置

苹果回应iPhone17PM被湿巾擦掉色：高浓度酒精或是诱因

参与开发iPhoneAir设计师离职转投AI初创公司

AI日报：谷歌Gemini 3 Pro Preview模型上线；Cloudflare文件异

华为FreeBuds Pro 5悦彰耳机价格公布：1449元支持星闪音频

小米端到端辅助驾驶“Xiaomi HAD增强版”将于11月12日发布

小米AI眼镜推出1.4.16.0固件版本支持英语口语陪练

华为Mate 80系列已在华为商城开启预约

华为Mate 80 Pro Max外观公布：采用双圆环设计

华为Mate 80/Pro/Pro Max/RS开启预约：全系直屏设计

AI日报：阿里千问APP公测；Veo 3.1上线多图参考；超级小爱AI大

华为Mate X7外观公布搭载全新折叠玄武架构

阿里巴巴回应千问崩了：状态良好欢迎来问

AI日报：xAI推出Grok 4.1；OceanBase发布首款AI数据库seekdb；

荣耀500系列官宣将于11月24日发布

一加Ace 6T官宣将于本月发布：首发骁龙8 Gen5

小米超级小爱AI大模型推出随心修图功能

站长商机