AI视野：xAI首个大模型Grok炸场;李开复官宣开源大模型Yi-34B;ChatGPT原型Gizmo新功能曝光;百度网盘引入大模型智能助理

2023-11-06 15:31 · 稿源：站长之家

🤖📈💻💡大模型动态

李开复官宣全球最强开源大模型Yi-34B 一次可处理40万汉字

零一万物发布全球最强的开源大模型Yi-34B，具备超强的语言理解和处理能力，支持处理40万汉字，在中文指标上表现卓越，标志着中国在大模型领域的重大突破。

QQ截图20231106135852.jpg

项目地址:https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard

AiBase提要:
1. 零一万物推出「Yi」系列开源大模型，其中Yi-34B成为全球开源大模型的双料冠军，击败竞品，表现出色，特别在中文指标上表现突出。
2. Yi-34B的上下文窗口大小全球最长，支持200K字符，相比OpenAI的GPT-4大幅增加，提供更丰富的语义信息。
3. 零一万物采用科学训模方法和AI Infra团队的支持，成功降低了训练成本，提高了模型的性能，未来计划推出更多大模型。

马斯克旗下xAI首个大模型Grok炸场

马斯克旗下xAI团队发布了首个AI大模型产品“Grok”，它是一款智能助手，能回答各种问题并实时获取最新信息。

微信截图_20231106084749.png

体验地址:https://grok.x.ai/

【AiBase提要】
🚀 马斯克xAI发布首款AI大模型产品“Grok”。
💡 Grok是智能助手，回答问题并提供实时信息。
🌐 xAI团队计划在可靠性、可验证性、多模态能力方面继续研究。

元象XVERSE开源650亿参数通用大模型XVERSE-65B

深圳元象科技开源650亿参数的XVERSE-65B语言模型，支持多语言，适用于多轮对话和知识问答等任务。

项目地址:https://github.com/xverse-ai/XVERSE-65B

🧐 【AiBase提要】:
1️⃣ 深圳元象科技开源了XVERSE-65B，一个650亿参数的多语言语言模型，具备出色性能和广泛应用领域。
2️⃣ 该模型采用主流的Transformer网络结构，支持16K上下文长度，适用于多轮对话和知识问答等多种任务。
3️⃣ 经过充分训练，模型包含40多种语言的高质量数据，通过精细设置数据采样比例，使中英两种语言表现优异，同时也适用于其他语言。

知乎“知海图AI”大模型开放服务

知乎“知海图AI”大模型即将向公众开放服务，具备千亿级参数和强逻辑推理能力，旨在赋能创作者、讨论场、信息获取、内容运营。知海图AI已在多业务场景广泛应用，提高了效率和准确性。

【AiBase提要】:
1️⃣ 知乎的“知海图AI”大模型即将开放服务，拥有强大的参数和逻辑推理能力。
2️⃣ 该模型在多业务场景应用广泛，提高了效率和准确性。
3️⃣ 知乎将逐步将该模型的能力应用于创作、讨论场和信息获取。

多模态大模型面壁露卡开放服务

面壁智能多模态大模型应用「面壁露卡 Luca」正式面向公众开放服务。经过多次迭代更新，Luca不仅在中英文语言对话方面表现出色，还具备强大的代码、知识、逻辑及图片理解能力。

面壁露卡官网导航:https://top.aibase.com/tool/mianbiluka

【AiBase提要:】
📌 面壁智能多模态大模型「面壁露卡 Luca」正式向公众开放服务，以CPM模型为基础，具备多语言对话和强大的理解能力。
📌 面壁智能在AI Agent领域有突破性成就，与清华大学和OpenBMB开源社区合作，推动大模型技术应用。
📌 多模态大模型领域有不断创新，包括苹果的Ferret、多模态目标检测模型MQ-Det等，推动智能技术的发展。

中科院物理研究所发布材料合成AI大语言模型MatChat

中国科学院计算机网络信息中心与物理研究所合作，利用400多万篇论文数据，开发了MatChat，一款专注于无机材料合成路径预测的大语言模型，展现了潜在的应用潜力。

代码:https://www.scidb.cn/en/detail?dataSetId=37b8ce88305d44db9cdfe7c2d8fef4dd

【AiBase提要】:
📚 利用大规模文献数据，中国科学院发布了MatChat大语言模型，专注于无机材料合成路径预测任务。
💡 MatChat模型在预测合成复杂无机材料时性能表现优越，超过ChatGPT。
🌱 该成果为材料研究领域带来新的启发和思路，尽管需要更多语料以满足不同需求。

DeepSeek发布开源代码大模型DeepSeek Coder

DeepSeek Coder 是一个智能代码助手，可以生成各种代码，包括贪吃蛇游戏、2048游戏、测试样例、修 bug、SQL 查询等。DeepSeek Coder 还在国际权威数据集的测试中表现出色，领先其他开源模型。

【AiBase提要】
DeepSeek团队专注于AGI本质探索。
DeepSeek Coder是智能代码助手，生成各种代码。
模型在国际权威数据集测试中领先，已开放内测并在GitHub上开源。

🤖📱💼AI应用

ChatGPT订阅用户有望获得定制对话AI功能

OpenAI旗下热门聊天机器人ChatGPT即将推出名为"GPT构建器"的重要更新，允许用户创建和管理自定义聊天机器人，拓展其商业化应用。

【AiBase提要】
1. OpenAI将推出名为"GPT构建器"的更新，允许ChatGPT订阅用户创建和管理自定义聊天机器人，包括语言、语气、写作风格等设置。
2. 用户可以配置机器人的功能，如提供事项说明、上传知识库、开启网页浏览和图片生成。
3. OpenAI计划推出机器人市场，用户可以分享和浏览其他用户制作的聊天机器人。

百度网盘引入大模型智能助理

百度网盘进行了重大首页改版，采用多巴胺配色和个性化字体设计，引入智能助理，提供更智能化、年轻化的用户体验。

微信截图_20231106134900.png

【AiBase提要】
🎨 改版采用多巴胺配色和个性化字体设计，呈现年轻化 UI。
🧠 引入大模型智能助理，提供智能文件管理和搜索服务。
📲 用户可轻松访问工具和服务，提升使用效率。

📰🤖📢AI新鲜事

OpenAI首届开发者大会泄露消息，ChatGPT原型Gizmo新功能曝光

今年9月，OpenAI宣布首届开发者大会，而泄露消息透露了ChatGPT原型Gizmo的重大更新，包括自定义聊天机器人、界面改进、企业订阅和更多功能。

【AiBase提要】:
Gizmo将提供自定义聊天机器人、知识文件、工具和更多功能，加强了ChatGPT的能力。
ChatGPT原型Gizmo V8引入了新的模型选择器和高级模式，使用户能够创建自己的GPT。
OpenAI计划推出企业订阅和工作空间管理，提供更多优惠和功能，如无限制快速GPT-4访问和更长上下文。

蚂蚁百灵大模型通过备案

蚂蚁百灵大模型已完成备案，支持32K窗口长度的Transformer架构，多款相关产品即将完成内测并向公众开放。

【AiBase提要】
📋 蚂蚁百灵大模型完成备案，支持32K窗口长度的Transformer架构。
🚀 多款产品即将完成内测，准备向公众开放。
🌐 该大模型将在多领域应用中发挥重要作用。

迪拜将举办“全球AI挑战赛”，冠军可获近200万元奖金

迪拜哈姆丹亲王宣布将举办全球AI挑战赛，冠军可获得100万迪拉姆（约合人民币198.28万元）的奖金，旨在推动迪拜成为全球领先的人工智能创新中心。

【AiBase提要】:
1. 迪拜哈姆丹亲王宣布将主办全球AI挑战赛，奖金高达100万迪拉姆，以生成式人工智能为焦点，推动未来经济转型。
2. 这一挑战赛计划明年五月在迪拜的未来博物馆举行，旨在发展生成式人工智能解决方案。
3. 挑战赛由迪拜未来基金会和迪拜AI中心组织，旨在推进迪拜在科技领域的引领地位。

全球热门AI软件JUNLALA正式进军中国

JUNLALA计划将其AI软件SUPERLALA引入中国市场，注重本地化功能，旨在提供极致用户体验，标志着公司扩大全球影响力的重要举措。

官网:https://Junlala.ai

【AiBase提要】
🚀 JUNLALA的AI软件SUPERLALA将首次在中国正式推出，着重简单性、易用性和对中国用户的关注。
📅2023年11月5日，JUNLALA App将发布最新版本，具备一系列本地化功能和界面。
🌐 SUPERLALA旨在以用户为中心，为中国用户提供多样化的功能，实现顺畅的用户体验。

AI大佬Wolfram最新演讲:宇宙的本质是基于计算模型

英国科学家Stephen Wolfram在最新的TED演讲中分享了他的独特观点，认为宇宙的本质是基于计算模型运行的，由离散元素遵循简单计算规则构成。

【AiBase提要】
1. Wolfram提出了ruliad的概念，将计算视为宇宙的终极表达方式，对基础物理学和其他领域具有潜在影响。
2. 演讲中探讨了不同的科学模型，强调观察者在编织不同时间线和计算规则方面的关键作用。
3. 强调人工智能在科学研究和人类理解中的潜在作用，包括训练模型生成人类所写的文本。

AI面孔识别技术被用来识别鹅的面孔

维也纳大学的生物学家Sonia Kleindorfer博士及其团队开发了一种人工智能工具，用于识别鹅的面部特征，提高对鹅群个体的准确性，这项技术还将在生物多样性保护和生态学研究中发挥重要作用。

【AiBase提要】:
🦢 生物学家Sonia Kleindorfer开发了人工智能工具，识别鹅的面部特征，准确率高达97%。
🦆 研究揭示鹅拥有复杂社交关系，能识别伴侣和朋友的面部，为生态学研究提供新途径。
📸 该技术不仅限于鹅，还应用于识别港口海豹个体，对生物多样性保护有潜在影响。

👨‍💻💡🎯聚焦开发者

李飞飞团队推零样本360度场景合成技术ZeroNVS

斯坦福和谷歌的ZeroNVS技术能从单个图像实现零样本360度场景合成，通过3D感知扩散模型和SDS蒸馏生成逼真的合成图像，聚焦于场景。

论文地址:https://arxiv.org/pdf/2310.17994.pdf

【AiBase提要】
1. ZeroNVS利用3D感知扩散模型和SDS蒸馏生成多样化的逼真合成图像，专注于整个场景而非单个物体。
2. 实验结果显示，ZeroNVS在零样本性能方面明显领先，特别在LPIPS指标上。
3. ZeroNVS的创新技术有望在计算机视觉和图像合成领域产生重要影响。

Together AI发布RedPajama v2:30万亿token数据集用于大模型训练

TogetherAI最近发布了RedPajama v2，这是一个包含30万亿token的在线数据集，专为大型语言模型的培训而设计，为LLM领域提供了高质量的数据支持。

【AiBase提要:】
- 📌 RedPajama v2包含30万亿token，为大型语言模型的培训提供高质量数据支持。
- 📌 数据集强调对CommonCrawl的覆盖，包括高质量注释和去重集群，为LLM的培训提供有力基础。
- 📌 研究团队计划扩展高质量注释集，提供更多有力的数据支持，促进LLM领域的研究和应用。

UNC斯坦福等推出通用修正器LURE 多模态物体幻觉下降23%

多个大学合作开发的通用修正器LURE可解决多模态大模型中的物体幻觉问题，降低了幻觉频发的三个成因，提高了通用物体幻觉评估指标23%以上。

论文地址:https://arxiv.org/abs/2310.00754

代码地址:https://github.com/YiyangZhou/LURE

【AiBase提要】
🔍 通用修正器LURE解决多模态大模型的物体幻觉问题。
🔍 LURE通过统计分析物体共现、不确定性和物体位置，有效减少幻觉问题。
🔍 多模态大模型上的评估显示LURE提高了通用物体幻觉评估指标23%以上。

谷歌DeepMind研究发现Transformer模型难以泛化超出预训练数据范围

谷歌DeepMind的研究揭示，Transformer模型在预训练数据之外的泛化能力受到严重限制，难以解决新问题和函数类别。

论文地址:https://arxiv.org/pdf/2311.00871.pdf

【AiBase提要:】
🔍 谷歌DeepMind的研究人员进行实验，发现Transformer模型在预训练数据范围之外难以泛化。
📊 研究关注数据质量对模型性能的影响，发现模型在上下文学习中能够选择预训练的函数类别，但限制了泛化能力。
🧐 实验揭示了模型在处理不同函数类别和极端版本的函数时的局限性，强调预训练数据对模型性能的重要性。

GPU推理提速4倍!FlashDecoding++技术加速大模型推理

FlashDecoding++技术是一种用于加速大模型推理任务的新方法，可将GPU推理速度提升2-4倍，降低运营成本，支持多种GPU后端。

论文地址:https://arxiv.org/pdf/2311.01282.pdf

【AiBase提要:】
💡 FlashDecoding++技术旨在提高大模型推理效率，支持NVIDIA和AMD的GPU，可将GPU推理速度提升2-4倍。
💡 核心思想包括异步方法实现注意力计算的真正并行以及优化"矮胖"矩阵乘计算，降低大模型推理成本。
💡 公司"无问芯穹"已将FlashDecoding++集成到其大模型计算引擎"Infini-ACC"中，实现256K上下文的处理能力，提供更好的机会降低运营成本并提高效率。

（举报）

相关推荐

关键词：

大模型

突破大模型对齐瓶颈，北大团队携手昇腾打通产业应用通路

北大杨耀东团队研发Align-Anything多模态对齐框架，以RLHF为核心解决传统反馈信息有限问题，覆盖文本、图像、音频等全模态数据。该框架集成专用评估工具Eval-Anything，已在昇腾平台实现智慧医疗、网络安全等领域规模化落地。通过构建安全治理体系，显著提升大模型安全水位，同时保持通用能力。团队联合推出课程培养人才，深化产学研协同，为多模态大模型发展提供关键技术支撑。

多模态大模型产业智能化升级模型训练与推理
机器人“全能导航大脑”来了！银河通用发布NavFoM大模型

银河通用发布全球首个跨本体全域环视导航基座大模型NavFoM，实现机器人从“学会完成导航任务”到“真正理解移动”的跨越。该模型支持全场景、多任务、跨本体应用，通过统一“视频流+文本指令→动作轨迹”范式，融合800万条跨任务导航数据，在真实机器人上实现零样本自主避障、路径规划等复杂任务。其技术突破将推动具身智能从单一功能进化为基础设施，为规模化商业落地奠定关键基础。

机器狗导航大模型 TrackVLA
易鑫正式发布汽车金融行业首个Agentic大模型

易鑫在2025世界互联网大会乌镇峰会上发布汽车金融行业首个Agentic大模型XinMM-AM1。该模型参数量约300亿，响应延迟低于200毫秒，支持语音实时交互，单卡吞吐达370 tokens/秒，可提升获客、风控与运营效率，解决行业周期长、交互多、决策复杂等难题。易鑫作为AI驱动的金融科技平台，研发投入超20亿元，率先实现AI全场景应用，将持续推动智能汽车金融生态建设。

汽车金融大模型易鑫
登榜LMArena！文心大模型5.0-Preview文本能力国内第一

11月8日，文心全新模型ERNIE-5.0-Preview-1022在LMArena大模型竞技场排名中位列全球第二、中国第一。该模型在创意写作、复杂长问题理解和指令遵循方面表现突出，超越多款国内外主流模型。创意写作可高效生成文章、营销文案等内容；复杂长问题理解适用于学术问答、报告分析等任务；指令遵循能力支持智能助理、代码生成等场景，为多领域内容生产提供高效支撑。

文心模型 ERNIE-5.0 创意写作
何小鹏首次披露物理AI巨大进展发布第二代VLA大模型

小鹏汽车在2025科技日发布第二代VLA大模型，颠覆传统“视觉-语言-动作”架构，实现端到端直接输出动作指令，开创物理模型新范式。该模型具备动作生成与物理世界理解能力，参数规模达数十亿级，训练数据近1亿clips。基于2250TOPS算力的Ultra车型成功搭载，推动智驾技术显著进化，同步发布“小径NGP”功能，复杂小路接管里程提升13倍。行业首发的无导航辅助驾驶Super+LCC实现全球覆盖。何小鹏表示，大模型将成为物理AI世界的操作系统，并宣布与大众汽车达成战略合作，共同推进智能出行发展。

小鹏汽车 VLA大模型智能出行
大模型+反诈+算力三重突破腾讯云三项成果闪耀金融科技应用场景大赛

10月30日，2025金融街论坛年会金融科技大会公布“金融科技应用场景大赛”终评结果。腾讯云“金融反电诈治理方案”与“基于TCS的AI异构算力管理平台”凭借技术创新性与场景落地能力，从全国89家机构的280个项目中脱颖而出，双双荣获“十佳应用奖”。腾讯混元大模型信贷助手方案获“探索实践奖”。三大方案在金融风控、算力基座及大模型应用三个关键领域展现突出优势，获专家团高度认可。大赛自2021年启动，已成为金融科技领域极具影响力的赛事平台。

金融科技应用场景大赛腾讯云
新Siri或明年春季发布苹果公司或引入谷歌Gemini大模型 AI技术

苹果因自研大模型项目遇瓶颈，决定引入谷歌Gemini大模型升级Siri，计划每年支付约10亿美元获取定制化Gemini 2.5 Pro使用权。该模型拥有1.2万亿参数，将全面负责Siri的信息摘要、任务规划及复杂指令执行等核心功能，支持多模态交互和超长文本处理。升级版Siri预计2026年春季随iOS 26.4推送，后续将在WWDC大会展示进一步整合。苹果选择谷歌主要因成本优势、长期合作基础及Gemini领先性能。

苹果谷歌Gemini Siri升级
简知科技“简智AI大模型”通过国家生成式人工智能服务备案，助力兴趣教育迈向智能化新阶段

广州简知科技自主研发的“简智AI大模型”通过国家生成式人工智能服务备案，标志着该模型在安全性、合规性与可靠性方面达到国家级标准。作为兴趣教育领域AI应用的重要里程碑，该模型围绕用户兴趣成长周期设计，提供个性化学习支持：可为未明确兴趣方向的用户智能推荐内容，为入门用户规划学习路径，为基础扎实用户提供进阶训练与智能反馈。其技术能力在旗下“简小知”等品牌中已实现“学—练—评—测”全流程覆盖，并通过社群互动增强学习动力。公司未来将持续优化模型能力，联合行业伙伴构建完整培养体系，推动兴趣教育向个性化、高质量方向发展。

简智AI大模型生成式人工智能兴趣教育
荐AI日报：广电整治AI动画乱象；360发布大模型安全白皮书；百度推出小度AI眼镜Pro

国家广电总局宣布自2026年3月起全面整治AI生成内容，要求AIGC作品纳入分类分层审核体系。360发布《大模型安全白皮书》，提出全链路AI安全防线应对新型威胁。百度推出2299元小度AI眼镜Pro，集成智能翻译等多项功能。StepFun开源音频编辑模型Step-Audio-EditX，实现文本化语音编辑。Grok新增纯文本生成视频功能，17秒可生成带特效视频片段。研究发现谷歌Veo-3模型能生成逼真手术视频但缺乏医学逻辑。阿里Qwen3-Max-Thinking在全球数学竞赛夺冠，并在加密货币交易中取得显著回报。OpenAI推出轻量化GPT-5 Codex Mini模型，优化开发者体验。

AI动画广电总局 AIGC审核
免费 GEO品牌可见度查询——让大模型信得过就这么玩

本文探讨在AI时代如何成为大模型信赖的信息源。关键点包括：可信信息源需具备数据来源清晰、内容结构化、可验证追踪等能力；提出五大实操要点——确保数据干净可追溯、采用RAG等技术增强可检索性、保持内容更新与时效性、强化品牌可见度、建立反馈优化机制。同时推荐使用AIBase平台的GEO排名查询工具免费监测内容可见度，通过持续优化提升在大模型入口的推荐概率。

文章搜索核心标签可信信息源

今日大家都在搜的词：

热文

3 天
7天

AI视野：xAI首个大模型Grok炸场;李开复官宣开源大模型Yi-34B;ChatGPT原型Gizmo新功能曝光;百度网盘引入大模型智能助理

突破大模型对齐瓶颈，北大团队携手昇腾打通产业应用通路

机器人“全能导航大脑”来了！银河通用发布NavFoM大模型

易鑫正式发布汽车金融行业首个Agentic大模型

登榜LMArena！文心大模型5.0-Preview文本能力国内第一

何小鹏首次披露物理AI巨大进展发布第二代VLA大模型

大模型+反诈+算力三重突破腾讯云三项成果闪耀金融科技应用场景大赛

新Siri或明年春季发布苹果公司或引入谷歌Gemini大模型 AI技术

简知科技“简智AI大模型”通过国家生成式人工智能服务备案，助力兴趣教育迈向智能化新阶段

荐AI日报：广电整治AI动画乱象；360发布大模型安全白皮书；百度推出小度AI眼镜Pro

免费 GEO品牌可见度查询——让大模型信得过就这么玩

今日大家都在搜的词：

热文

影视飓风CEO在相亲角被大妈吐槽网友：大妈不识货

腾讯发布2025第三季度财报：营收1928.69亿元同比增长 15%

小米澎湃OS 3第三批正式版推送：支持小米14、K70系列等

荣耀500系列开启预约：Pro版外观首次亮相

AI日报：百度发布文心5.0；可灵2.5Turbo模型上线“首尾帧”功能

iPhone Pocket正式开售：联名三宅一生售价1299元起

微信小程序将在iOS端支持接入虚拟支付苹果抽成15%

1899元苹果手机包卖完了！iPhone Pocket在吐槽声中销售火爆

AI日报：李飞飞Marble 3D世界模型公测；OpenAI首次推出ChatGPT

苹果回应输入法宁死不屈：具备记忆功能与学习机制

iPhone Pocket被吐槽像保温水瓶套网友：韭菜太好割

影视飓风CEO在相亲角被大妈吐槽网友：大妈不识货

腾讯发布2025第三季度财报：营收1928.69亿元同比增长 15%

雷军回应小米双11战绩：谢谢大家支持

卢伟冰：小米手机双11连续三年国产销量第一

小米澎湃OS 3第三批正式版推送：支持小米14、K70系列等

AI日报：广电整治AI动画乱象；360发布大模型安全白皮书；百度推

OPPO Reno15系列定档11月17日发布

AI日报：月之暗面开源AI新框架Kosong；百度发布新模型ERNIE-4.

腾讯回应QQ群最早是为了员工约饭：是一个朴实无华的需求

站长商机