AI视野：王小川发布新大模型Baichuan53B;必应免费向用户提供DALL-E3；文心一言将再次升级

2023-10-08 15:38 · 稿源：站长之家

文头.jpg

🤖📈💻💡大模型动态

王小川发布新大模型Baichuan53B 宣布闭源商业化

王小川团队发布新的53B大模型，这是继Baichuan-7B和Baichuan-13B之后他们的第三个大模型产品，但与前两款不同，这次选择闭源。

AiBase提要
🚀53B模型规模达到530亿参数，是王小川团队到目前为止参数量最大的模型
🔥53B模型结合了搜索技术，增强了对抗生成和时效性等方面的能力
💰 王小川表示商业化的时机已到，53B闭源有利于直接面向企业客户商业化运营

开放模型权重被指将导致AI失控，Meta遭举牌抗议

AI领域开源与闭源选择存在分歧，但大模型时代开源力量崛起，Meta因开源陷入麻烦，抗议者质疑开放模型权重安全性，LeCun则表态开源AI不可阻挡。

AiBase提要
🔥 开源模型公开权重可能被滥用，Meta遭抗议
🤔 开源与闭源各有利弊，关键看使用
👍 开源促进AI健康发展不可阻挡

港中大MathCoder模型挑战GPT-4，数学题解得分超越后者

港中大开发的 MathCoder 大模型在数学推理方面超过了 GPT-4，能够无缝集成代码解决数学问题。

论文地址:https://browse.arxiv.org/pdf/2310.03731.pdf

AiBase提要:
1️⃣ 港中大开发的 MathCoder 大模型数学能力超过 GPT-4。
2️⃣ MathCoder 在 MATH 和 GSM8K 数据集上取得了优秀成绩。
3️⃣ MathCoder 通过无缝集成代码解决数学问题。

🤖📱💼AI应用

微软Bing Chat免费向用户提供DALL-E3

微软宣布将 OpenAI 最新模型 DALL-E3集成在 Bing Chat 和 Bing Image Create 中，并免费提供给用户使用。

AiBase提要:
1️⃣ DALL-E3是一款类 Midjourney 产品，通过文本就能生成二次元、3D、朋克、涂鸦等多种类型图片。
2️⃣ 微软表示，为了保证用户通过 Bing Image Creator 创建的内容的安全性，已经在生成的图片中内置了符合 C2PA 规范的数字水印。
3️⃣ 用户在创建图片的过程中，提供的文本细节越多、描述越丰富，最终生成的图片也就越精准。

文心一言将再次升级

百度宣布将于10月17日举行“百度世界大会2023”，李彦宏透露将带来文心一言、搜索、地图、网盘等应用产品的全新亮相。

AiBase提要:
📌 李彦宏将在主题演讲中分享AI原生应用的心得，重点介绍生成式AI的想象和创新空间
📌 文心一言将进行再次升级，发挥在生活生产中的更重要作用
📌 百度搜索、地图、网盘等应用将带来全新亮相，提供更好的用户体验

微软 OneDrive 将迎来全新升级:Copilot 将为用户提供更多 AI 功能

微软推出升级版OneDrive，整合Copilot人工智能功能，帮助用户更便捷地管理文件。

AiBase提要:
🔑 OneDrive将整合Copilot人工智能助手，可自动生成文件内容摘要，提高文件搜索效率。
🔑 OneDrive Copilot可预测用户需求，建议将相关文件归类到同一文件夹。
🔑 OneDrive 将推出人工智能搜索功能，可在2024年初公测。

谷歌为Google Assistant注入AI新功能

谷歌在Made by Google活动上为Google Assistant注入了新的AI功能，如与Bard的融合、理解更自然的语音命令、电话体验优化等，以提升其在语音助手市场的地位。

AiBase提要:
🎤 Assistant with Bard将成为更加智能的语音助手
🔊 可以理解更自然的语音交互方式
📞 电话筛选和垃圾电话过滤功能加强

📰🤖📢AI新鲜事

原百度AI高管景鲲和朱凯华离职将联手创业

原百度人工智能高管景鲲和朱凯华最近宣布离职，计划联手创业。两人在语音交互领域积累了丰富经验。据悉，他们的创业项目会结合大模型技术，目标是打造语音交互一体化解决方案。业内人士认为，两人在软硬件结合方面的经验，将会是创业过程中的优势。

AiBase提要：
景鲲和朱凯华分别曾任小度科技CEO和CTO，景鲲被称为“小冰之父”
二人均有软硬件结合经验，擅长语音交互领域
拟创业项目预计结合大模型技术，目标打造语音交互一体化解决方案

Windows12将于2024年推出:AI 功能刺激更新需求

英特尔高管在公开场合透露，微软可能会在2024年推出Windows12操作系统，以刺激用户对新系统的更新需求。

AiBase提要:
🔥 英特尔CFO提到2024年Windows会有重大更新，意味着Windows12即将推出
🔥 微软近期在Windows11中加入AI功能，Windows12可能会进一步整合AI
🔥 Windows12开发已在加速，正式发布时间表与2024年秋季吻合

淘宝:国庆期间AI修图服务搜索量周环比暴增数十倍

淘宝数据显示，国庆期间淘宝上AI修图服务搜索量周环比暴增数十倍，景点代打卡等“懒人旅游”服务也大受欢迎。

AiBase提要
🚀淘宝上境内外旅游门票预订大幅增长
📈代打卡、代P图等“懒人旅游”服务火爆
📊AI修图服务搜索量周环比暴增数十倍

百万网友围观DALL-E3新玩法!钢铁侠特斯拉皆“中招”

最近DALL-E3在网友手中玩出了多种新玩法，比如整齐摆放物品，生成各类难以拍摄的产品照片，配合提示词可生成不同风格图像。这种风格叫做knolling，重点在于摆放整齐，也是不少产品摄影的表达方式。

AiBase提要:
🚀DALL-E3可将物品整齐摆放，生成有趣的组合照片，比如电影人物的身体部件平铺照。
📷DALL-E3可轻松生成正常拍摄困难的产品组合照，如特斯拉全系列车型。
🎨添加提示词可让DALL-E3生成不同风格的图像，非常适合产品摄影创作。

研究人员称，即使是最糟糕Claude AI版本也比GPT3.5更好

根据Chatbot Arena排行榜，Anthropic的Claude模型在性能上超越了OpenAI的GPT-3.5，即使是最差的Claude版本也优于ChatGPT免费版的GPT-3.5。

AiBase提要
🔥 Claude模型在排名上整体领先GPT-3.5
📊 排名考量了上下文处理能力、长文本生成等多个维度
💡 排名结果将影响用户选择ChatGPT或Claude

宾夕法尼亚州立大学研发出“电子舌头”，有望赋能AI品尝美食

宾夕法尼亚州立大学研究团队最近研发出一种基于石墨烯的电子“舌头”，可以检测不同味道，为人工情感智能的发展带来重大突破。

AiBase提要:
💡研究团队研发出基于石墨烯的电子“舌头”，能检测不同味道，实现AI“品尝”功能。
💡研究关注将情感智能引入AI，通过仿效人类味觉过程使AI更人性化。
💡创新可应用于智能饮食推荐等领域，未来可拓展到视觉、听觉等其他感官的AI。

AMD蓄势待发准备挑战英伟达的人工智能霸主地位

AMD正在加紧挑战英伟达在AI市场近乎垄断的地位，凭借与PyTorch的合作和微软的支持，有望颠覆现状。

AiBase提要
⚡AMD一直在默默取得进展，开发了CUDA转换工具，即将推出的Instinct MI300A处理器具有竞争力。
🤝AMD与PyTorch合作，为后者提供AMD GPU支持，也获得了微软的战略支持。
🔥AMD有可能借助战略合作伙伴关系，在AI市场颠覆英伟达的垄断地位。

👨‍💻💡🎯聚焦开发者

浙大校友联手微软开源LLaVA-1.5，硬刚GPT-4V

最近威斯康星大学麦迪逊分校、微软研究院和哥伦比亚大学的研究人员联手开源了新型多模态模型LLaVA-1.5，在多个基准测试中实现SOTA，展现出强大的多模态理解能力，被认为可与GPT-4V形成正面竞争。

论文地址:https://browse.arxiv.org/pdf/2310.03744.pdf

AiBase提要:
LLaVA-1.5在11项基准测试实现了SOTA，使用8块A100GPU，LLaVA-1.5的训练仅需1天时间即可完成。
LLaVA-1.5在多模态理解上超越GPT-4V，可对其形成有力竞争。
LLaVA-1.5采用最简单的架构和公开数据集，性能显著提升。

OnnxStream:可在树莓派Zero2上运行Stable Diffusion1.5

OnnxStream是一款内存占用极低的机器学习推理引擎，可在内存仅512MB的树莓派Zero2设备上运行Stable Diffusion1.5等大型深度学习模型。

项目地址:

https://github.com/vitoplantamura/OnnxStream/tree/846da873570a737b49154e8f835704264864b0fe

AiBase提要
🧠 OnnxStream通过出色的内存管理，可极大降低模型运行时的RAM占用。
💻 OnnxStream支持多种功能以适应资源受限环境，如权重加载器、注意力切片等。
🔌 OnnxStream实现了跨平台支持，可灵活运行在Linux、Windows、Mac和Termux等系统。

StreamingLLM:让AI模型无限期平稳运行的一种方法

Meta、麻省理工和卡内基梅隆的研究人员提出StreamingLLM技术，通过在对话不同阶段重新引入初始标记，解决了LLM在长时间对话中性能下降的问题，使其能够在无限长度文本上保持高性能。

AiBase提要:
📌 Meta、MIT和CMU的研究人员提出了StreamingLLM技术，旨在解决LLM在长时间对话中的性能下降问题。
📌 StreamingLLM利用attention sinks的概念，在对话不同阶段重新引入初始标记，使LLM能够在无限长度文本上保持高性能。
📌 研究人员提出了使用单个特殊标记作为attention sink来稳定LLM的关注机制，保持其在长时间对话中的高性能。

全新图文生成方式MiniGPT-5生成文本的同时创作匹配的图片

MiniGPT-5是一款基于大型语言模型的视觉与语言协同生成工具，通过生成vokens实现图像文本协同生成。

项目地址:https://github.com/eric-ai-lab/minigpt-5

AiBase提要
📝 MiniGPT-5实现图像文本协同生成，用户可输入文本生成图像或输入图像生成文本
🔨 MiniGPT-5通过两阶段训练提高模型鲁棒性，无需详细描述进行训练
⭐️ MiniGPT-5在多个数据集上表现出色，是多模态生成有力工具

轻量级代码库分析工具ctoc开源

ctoc是一个轻量级的代码库分析工具，基于gocloc，可以快速统计代码库中的令牌数量，支持多种语言和输出格式，对理解代码库复杂性和与不同LLM模型互操作很有帮助。

项目地址:https://github.com/yaohui-wyh/ctoc

AiBase提要
📊 ctoc可以快速统计代码库中的令牌数量，分析复杂性
🔢 支持多种编程语言，可以轻松统计不同语言的令牌数
⚙️ 提供多种输出格式，支持与不同LLM模型互操作

（举报）

相关推荐

关键词：

大模型

登榜LMArena！文心大模型5.0-Preview文本能力国内第一

11月8日，文心全新模型ERNIE-5.0-Preview-1022在LMArena大模型竞技场排名中位列全球第二、中国第一。该模型在创意写作、复杂长问题理解和指令遵循方面表现突出，超越多款国内外主流模型。创意写作可高效生成文章、营销文案等内容；复杂长问题理解适用于学术问答、报告分析等任务；指令遵循能力支持智能助理、代码生成等场景，为多领域内容生产提供高效支撑。

文心模型 ERNIE-5.0 创意写作
易鑫正式发布汽车金融行业首个Agentic大模型

易鑫在2025世界互联网大会乌镇峰会上发布汽车金融行业首个Agentic大模型XinMM-AM1。该模型参数量约300亿，响应延迟低于200毫秒，支持语音实时交互，单卡吞吐达370 tokens/秒，可提升获客、风控与运营效率，解决行业周期长、交互多、决策复杂等难题。易鑫作为AI驱动的金融科技平台，研发投入超20亿元，率先实现AI全场景应用，将持续推动智能汽车金融生态建设。

汽车金融大模型易鑫
大模型+反诈+算力三重突破腾讯云三项成果闪耀金融科技应用场景大赛

10月30日，2025金融街论坛年会金融科技大会公布“金融科技应用场景大赛”终评结果。腾讯云“金融反电诈治理方案”与“基于TCS的AI异构算力管理平台”凭借技术创新性与场景落地能力，从全国89家机构的280个项目中脱颖而出，双双荣获“十佳应用奖”。腾讯混元大模型信贷助手方案获“探索实践奖”。三大方案在金融风控、算力基座及大模型应用三个关键领域展现突出优势，获专家团高度认可。大赛自2021年启动，已成为金融科技领域极具影响力的赛事平台。

金融科技应用场景大赛腾讯云
机器人“全能导航大脑”来了！银河通用发布NavFoM大模型

银河通用发布全球首个跨本体全域环视导航基座大模型NavFoM，实现机器人从“学会完成导航任务”到“真正理解移动”的跨越。该模型支持全场景、多任务、跨本体应用，通过统一“视频流+文本指令→动作轨迹”范式，融合800万条跨任务导航数据，在真实机器人上实现零样本自主避障、路径规划等复杂任务。其技术突破将推动具身智能从单一功能进化为基础设施，为规模化商业落地奠定关键基础。

机器狗导航大模型 TrackVLA
如何检查你的网站是否被大模型引用？AI排名查询工具推荐

本文探讨AI搜索时代网站流量获取新逻辑：传统SEO因Google搜索"零点击"现象失效，而71%用户通过AI工具研究购买决策。文章指出被大语言模型引用成为新流量入口，并推荐使用AIBase等GEO工具监测网站在豆包、DeepSeek等国内主流AI平台的曝光情况。提出三步操作法和三个优化建议：建立监控基线、定期检查变化、聚焦高转化场景。强调在AI搜索时代，内容被LLM引用已成为新的流量生命线。
何小鹏首次披露物理AI巨大进展发布第二代VLA大模型

小鹏汽车在2025科技日发布第二代VLA大模型，颠覆传统“视觉-语言-动作”架构，实现端到端直接输出动作指令，开创物理模型新范式。该模型具备动作生成与物理世界理解能力，参数规模达数十亿级，训练数据近1亿clips。基于2250TOPS算力的Ultra车型成功搭载，推动智驾技术显著进化，同步发布“小径NGP”功能，复杂小路接管里程提升13倍。行业首发的无导航辅助驾驶Super+LCC实现全球覆盖。何小鹏表示，大模型将成为物理AI世界的操作系统，并宣布与大众汽车达成战略合作，共同推进智能出行发展。

小鹏汽车 VLA大模型智能出行
荐AI日报：广电整治AI动画乱象；360发布大模型安全白皮书；百度推出小度AI眼镜Pro

国家广电总局宣布自2026年3月起全面整治AI生成内容，要求AIGC作品纳入分类分层审核体系。360发布《大模型安全白皮书》，提出全链路AI安全防线应对新型威胁。百度推出2299元小度AI眼镜Pro，集成智能翻译等多项功能。StepFun开源音频编辑模型Step-Audio-EditX，实现文本化语音编辑。Grok新增纯文本生成视频功能，17秒可生成带特效视频片段。研究发现谷歌Veo-3模型能生成逼真手术视频但缺乏医学逻辑。阿里Qwen3-Max-Thinking在全球数学竞赛夺冠，并在加密货币交易中取得显著回报。OpenAI推出轻量化GPT-5 Codex Mini模型，优化开发者体验。

AI动画广电总局 AIGC审核
新Siri或明年春季发布苹果公司或引入谷歌Gemini大模型 AI技术

苹果因自研大模型项目遇瓶颈，决定引入谷歌Gemini大模型升级Siri，计划每年支付约10亿美元获取定制化Gemini 2.5 Pro使用权。该模型拥有1.2万亿参数，将全面负责Siri的信息摘要、任务规划及复杂指令执行等核心功能，支持多模态交互和超长文本处理。升级版Siri预计2026年春季随iOS 26.4推送，后续将在WWDC大会展示进一步整合。苹果选择谷歌主要因成本优势、长期合作基础及Gemini领先性能。

苹果谷歌Gemini Siri升级
简知科技“简智AI大模型”通过国家生成式人工智能服务备案，助力兴趣教育迈向智能化新阶段

广州简知科技自主研发的“简智AI大模型”通过国家生成式人工智能服务备案，标志着该模型在安全性、合规性与可靠性方面达到国家级标准。作为兴趣教育领域AI应用的重要里程碑，该模型围绕用户兴趣成长周期设计，提供个性化学习支持：可为未明确兴趣方向的用户智能推荐内容，为入门用户规划学习路径，为基础扎实用户提供进阶训练与智能反馈。其技术能力在旗下“简小知”等品牌中已实现“学—练—评—测”全流程覆盖，并通过社群互动增强学习动力。公司未来将持续优化模型能力，联合行业伙伴构建完整培养体系，推动兴趣教育向个性化、高质量方向发展。

简智AI大模型生成式人工智能兴趣教育
【AI 智惠季】全模态大模型齐发优惠，GPU新客包月2.8折起

阿里云启动双十一“AI智慧季”大型优惠活动，聚焦企业多元AI场景落地需求，推出7000万tokens大模型免费体验、GPU新客特惠等政策，助力企业降低开发成本。同时提供标准化AI产品与解决方案，覆盖内容创作、智能客服等高频应用场景，并举办系列技术分享活动，携手企业拥抱AI新时代。

AI技术阿里云双十一优惠

今日大家都在搜的词：

热文

3 天
7天

AI视野：王小川发布新大模型Baichuan53B;必应免费向用户提供DALL-E3；文心一言将再次升级

登榜LMArena！文心大模型5.0-Preview文本能力国内第一

易鑫正式发布汽车金融行业首个Agentic大模型

大模型+反诈+算力三重突破腾讯云三项成果闪耀金融科技应用场景大赛

机器人“全能导航大脑”来了！银河通用发布NavFoM大模型

如何检查你的网站是否被大模型引用？AI排名查询工具推荐

何小鹏首次披露物理AI巨大进展发布第二代VLA大模型

荐AI日报：广电整治AI动画乱象；360发布大模型安全白皮书；百度推出小度AI眼镜Pro

新Siri或明年春季发布苹果公司或引入谷歌Gemini大模型 AI技术

简知科技“简智AI大模型”通过国家生成式人工智能服务备案，助力兴趣教育迈向智能化新阶段

【AI 智惠季】全模态大模型齐发优惠，GPU新客包月2.8折起

今日大家都在搜的词：

热文

焕新享界S9开卖72小时预订突破8000台

OPPO Reno15系列定档11月17日发布

AI日报：广电整治AI动画乱象；360发布大模型安全白皮书；百度推

华为Mate 70 Air维修备件价格公布：换主板2499元

特斯拉磁悬浮Cybertruck车模上架中国官网售价999元

小米手表S4 eSIM/Sport宣布支持开通中国移动一号双终端

真我GT8 Pro阿斯顿马丁F1限量版正式开售售价5499元

鸿蒙智行：智界R7累计交付量破10万台

特斯拉Model Y L上线外放电功能最高可输出2200瓦功率

华为Mate 70 Air今日开售：处理器双版本可选售价4199元起

女性人形机器人里藏真人？何小鹏回应：并亲自证清白

iPhone 18 Pro或缩小灵动岛苹果正测试特殊挖孔方案

OPPO Reno15系列官宣11月10日发布

AI日报：HeyGen发布AI视频翻译引擎；科大讯飞推星火 X1.5；QQ浏

华为Mate70 Air官宣今日开启预售

AI日报：上海首例涉AI提示词著作权案宣判；Kimi K2 Thinking发

华为路由X3 Pro今日开启预售：售价1299元起

何小鹏回应机器人IRON里是真人质疑：感谢认可

iPhone Air 2或新增1颗镜头：继续沿用6.5英寸高刷中屏

俞敏洪发文确认孙东旭离职：保持着良好的沟通

站长商机