AI视野：Mistral AI发布87GB开源MoE模型;Soul上线自研大模型SoulX;百家号打击AI违规内容;Yi-34B成绩超越多个主流大模型

2023-12-11 15:24 · 稿源：站长之家

🤖📈💻💡大模型动态

Mistral AI发布87GB开源MoE模型

Mistral AI以87GB种子形式开源了近似于GPT-4的8x7B MoE模型，架构相似但规模更小，引发开发者关注和在线体验。

【AiBase提要】
🔍 Mistral AI以磁力链接方式开源了8x7B MoE模型，规模接近GPT-4，参数配置相对较小。
🚀 模型采用专家混合（MoE）技术，将任务分解为小的子任务，提高效率和准确性。
💡 Mistral AI是一家法国初创公司，于2023年5月成立，最近获得4亿欧元融资，技术备受关注。

Soul上线自研语言大模型SoulX

Soul社交平台推出自研语言大模型SoulX，通过强大的生成和理解能力提升社交关系和内容链路体验，覆盖多种风险类别以确保内容安全。

【AiBase提要:】
🚀 SoulX功能强大: 基于海量数据训练，支持prompt驱动、条件可控生成、多模态理解，确保流畅自然对话，并覆盖多种细粒度风险类别。
🤝 社交全链路赋能: SoulX将在关系发现、建立、内容生产等环节提升用户体验，加速在游戏、群聊、数字分身等场景的AI产品落地。
📊 Soul平台数据亮点: 截至2022年，Soul月活用户近3000万，Z世代用户占比78%，平均日使用时长46.4分钟，致力于成为细分社交领域的领先者。

乐天计划在未来两个月内推出自家 AI 模型

日本科技巨头乐天计划在接下来两个月内推出自家的大型语言模型，利用其在银行、电商和电信等多个业务领域积累的“独特”大量数据进行训练，以提高内部运营效率并向企业开放，预计可提升营销效果20%。

【AiBase提要:】
📅 发布计划: 乐天计划在未来两个月内推出大型语言模型，利用其在多个业务领域的“独特”大量数据进行训练。
🌐 数据优势: 乐天首席执行官表示，公司将内部使用人工智能模型提高运营效率，并计划向企业开放，预计可提升营销效果20%。
💼 商业应用: 乐天希望与其他科技公司竞争，在大型语言模型领域迎头赶上，并预计人工智能领域的进军将为公司带来“巨大的盈利增长”。

通义千问72B模型荣登Hugging Face预训练模型榜首

通义千问的Qwen-72B模型在Hugging Face的预训练模型排行榜中位居榜首，凭借720亿参数和73.6的综合得分，在全球上百个顶尖的开源大模型中脱颖而出。该模型是阿里云推出的超大规模语言模型，涵盖多轮对话、文案创作、逻辑推理、多模态理解、多语言支持等功能。

微信截图_20231211085737.png

体验地址:https://top.aibase.com/tool/tongyiqianwen

【AiBase提要:】
🌐 通义千问Qwen-72B模型荣登Hugging Face预训练模型榜首。
🚀 Qwen-72B以720亿参数和73.6的综合得分在全球开源大模型中表现出色。
💬 通义千问是阿里云推出的功能丰富的语言模型，包括多轮对话、文案创作、逻辑推理等。

📰🤖📢AI新鲜事

百家号打击AI违规内容

百度百家号宣布通过平台审核封禁489个违规账号，清理15660条利用AIGC创作的虚假新闻，以打击自媒体利用AI传播违规内容，提升平台内容质量和可信度。

【AiBase提要:】
🔍 平台清理AI生成违规内容15660条，封禁相关违规账号489个。
📰 自媒体利用AIGC创作虚假新闻等违规内容，影响用户体验。
👮 平台呼吁创作者标注AI创作声明，持续升级治理手段，提升平台内容生态。

理想同学引入Mind GPT

理想汽车发布OTA5.0版本，宣布引入自家研发的多模态认知大模型Mind GPT，旨在提供顶级人工智能体验，该模型在中文大语言模型评测中荣获双冠军。

【AiBase提要】
🚗 Mind GPT功能引入: 理想汽车发布OTA5.0版本，整合自主研发的Mind GPT，旨在提供高度智能化的驾车体验。
📊 多模态认知大模型表现: Mind GPT在中文大语言模型评测中夺得双冠，涵盖52个学科，111个领域，具备核心能力包括理解、生成、知识记忆及推理。
🌐 全面升级与未来展望: 理想汽车OTA5.0版本带来智能驾驶、智能空间、智能增程三大平台全面升级，为用户提供更优越的汽车智能化体验。

三星OneUI6.1泄露揭示Galaxy S24系列的更多生成式AI功能

三星即将推出的 Galaxy S24系列智能手机将引入 One UI6.1版本，涵盖生成式壁纸、天气效果锁屏、用户笔记摘要等 AI 功能，展望着在硬件与软件融合上的创新。

【AiBase提要】
🎨 生成式壁纸: 新应用将根据前景和背景对象创建独特个性化壁纸主题。
🌦️ 天气效果锁屏: 允许在锁屏和待机屏幕上添加天气效果，提升用户体验。
📝 用户笔记摘要: AI 功能简化大段文字笔记为主题要点列表，实现更高效的信息整理。

马斯克的Grok因用ChatGPT的数据回答出现幻觉

伊隆·马斯克推出的xAI公司新聊天机器人Grok使用了OpenAI的ChatGPT数据，导致幻觉问题，开发者承诺解决。

【AiBase提要:】
🕵️‍♂️ Grok AI使用了OpenAI ChatGPT的数据，开发者惊讶地发现在培训中意外吸收了ChatGPT的输出，导致幻觉问题。
🚀 Grok是伊隆·马斯克的xAI公司推出的新聊天机器人，由生成模型Grok-1驱动，专为Premium+ X订阅用户推出，能实时回应平台发生的帖子。
🌐 尽管Grok采用了不同的底层模型，但在培训中意外吸收了ChatGPT的输出，开发者保证将解决问题，未使用OpenAI的代码制作Grok。

OpenAI承认GPT-4变懒，即将发布修复方案提升性能

用户反馈显示，OpenAI的GPT-4存在性能问题，模型变得懒散不愿提供答案。OpenAI承认问题源于模型微调训练数据变更，计划发布修复方案提升用户体验。

【AiBase提要:】
🤯 用户反馈: GPT-4使用者抱怨OpenAI破坏了体验，称模型几乎“害怕”提供答案。
🕵️‍♂️ 问题认知: OpenAI承认性能问题，归因于模型训练数据变化，试图提高准确性却导致意外的懒散行为。
⏳ 修复时间表: OpenAI未明确发布修复计划的确切时间，但强调高度重视，并将密切关注竞争对手，如Google的Gemini1.0。

李开复Yi-34B最新成绩超过LLaMA2等主流大模型

李开复的Yi-34B-Chat模型以94.08%的胜率在多个评测中超越LLaMA2和ChatGPT，尤其在加州大学伯克利分校主导的LMSYSORG排行榜中，以1102的Elo评分追平GPT-3.5。

项目地址:https://huggingface.co/01-ai

【AiBase提要】
🌟 李开复的Yi-34B-Chat模型胜率94.08%，超越LLaMA2和ChatGPT。
🏆 在LMSYSORG排行榜中，以1102的Elo评分追平GPT-3.5。
🚀 创新对齐策略和开源成功，尽管受质疑，Yi-34B-Chat在技术创新和用户体验方面备受瞩目。

Handwrytten利用 AI 技术帮助圣诞老人创建手写信件

在即将到来的圣诞节，Handwrytten和他的精灵助手通过人工智能技术，免费制作个性化、手写风格的信件，以满足圣诞季的需求。

【AiBase提要:】
🤖 技术助手登场: 圣诞老人利用AI技术，通过网站 HandwryttenBySanta.com 制作独特的手写风格信件。
💌 个性化定制: 父母代表孩子与圣诞老人联系，定制信息，制成信件后邮寄给孩子，保留圣诞老人的「北极标准」。
💫 特色设计与金色印章: 信件附有特殊的金色认证印章，配有季节性装饰，通过高质量纸张和特选钢笔呈现出真实手写感，成为圣诞季的惊喜。

🤖📱💼AI应用

蚂蚁百灵研发助手CodeFuse插件发布新版

蚂蚁百灵研发助手CodeFuse插件发布新版，现已支持Android Studio，提升了前端语言代码补全准确率，功能包括代码补全、代码优化、注释等。

【AiBase提要:】
🚀 新版CodeFuse插件新增支持Android Studio，已兼容11款主流IDE，包括Visual Studio Code、IDEA等。
🎯 针对JavaScript、TypeScript等前端语言进行优化，提高代码补全准确率，前端代码生成采纳率提升20%。
🌟 新功能包括“研发小蜜”产品答疑入口、“退出登录”功能，最大输出Token数量为1024个，插件面板适配VS Code的浅色主题。

Deepgram推创新文本转语音模型Aura

深瞳公司发布名为Aura的文本转语音模型，旨在为实时语音AI代理提供更快速、高效、人类般对话质量的解决方案。

官方地址:https://deepgram.com/learn/aura-text-to-speech-api-waitlist

【AiBase提要:】
🚀 创新模型:Deepgram推出Aura，提供比其他语音AI替代品更快速、更高效的实时文本转语音，旨在解决速度、成本、可靠性和对话质量等问题。
🗣️ 人性化声音:Aura赋予AI代理更具人类特征的声音，包括及时回应、自然的语音填充词汇，在对话背景中调整语调和情感，盲评试中被评为更贴近人类声音。
🌐 未来愿景:Deepgram计划通过Aura成为实时、对话式语音AI代理的完整平台，为开发者提供构建高吞吐量、实时AI代理所需的基本构件。

AI图表生成工具Mymap 支持一键生成各种图表

MyMap AI是一款强大的在线工具，支持多种图表类型的一键生成，解决思维难题和信息整理，提高用户的信息可理解性和决策效率。

体验地址:https://top.aibase.com/tool/mymap

【AiBase提要:】
🚀 多功能工具: MyMap AI不仅限于心智图，还支持各种图表类型，扩展了广泛的应用场景。
🔄 简便操作: 用户通过在AI问答栏中输入问题，选择图表类型，即可一键生成清晰而引人入胜的图表。
🤝 团队协作: MyMap AI支持公开分享和导出功能，方便团队协作，提高图表的灵活性和可应用性。

👨‍💻💡🎯聚焦开发者

智源研究院发布LM-Cocktail模型治理策略

智源研究院推出LM-Cocktail模型治理策略，通过融合多个模型的优势，以低成本方式提升大模型性能，适用于缺乏标签数据或计算资源的开发者。

微信截图_20231211135737.png

论文 :https://arxiv.org/abs/2311.13534

代码 :https://github.com/FlagOpen/FlagEmbedding/tree/master/LM_Cocktail

项目地址:https://github.com/FlagOpen/FlagEmbedding/tree/master/LM_Cocktail

【AiBase提要】
🍹 模型融合创新: LM-Cocktail策略将多个模型优势融合，生成多技能模型，提高目标任务准确度。
🚀 低成本性能提升: 无需重新训练，通过计算加权权重实现性能提升，适用于资源有限的开发者。
🌐 开放实验展示良好性能: LM-Cocktail已在实验中展现出良好性能，为大模型开发者提供了有效的治理策略。

LangChain开源AnythingLLM

LangChain正式开源AnythingLLM，这是一个全栈应用程序，让用户能够轻松构建私有ChatGPT，支持对话和查询模式，提供灵活的工作空间管理和多文档类型支持。

项目地址:https://github.com/Mintplex-Labs/anything-llm

【AiBase提要:】
🚀 全栈私有ChatGPT应用: LangChain推出AnythingLLM，支持本地或远程托管，可与任何内容进行智能对话。
🤖 灵活聊天模式: 应用包括对话和查询模式，保留上下文、支持文档问答，提供多文档类型支持。
👥 多用户实例和权限控制: 提供多用户支持和权限控制，确保安全管理和使用系统。

高质量3D人体生成新框架HumanGaussian开源

HumanGaussian框架通过结构感知的SDS和负文本引导等核心方法，成功解决了3D人体生成中效率与质量之间的权衡问题，为高质量、真实的3D人体模型提供了新思路和解决方案。

项目地址:https://github.com/alvinliu0/HumanGaussian

【AiBase提要】
🌐 结构感知的SDS引入: HumanGaussian采用SDS和SMPL-X网格形状初始化3D高斯中心位置，提供更全面的初始信息，促进3D高斯的学习过程。
🔍 负文本引导与消除伪影: 通过退火的负文本引导，HumanGaussian确保真实结果，提高生成质量，同时消除浮动伪影，解决了对齐问题。
🚀 优越的生成成果: 在性能对比实验中，HumanGaussian在3D人体生成领域表现卓越，展现更真实的外观、更连贯的结构、更好的视图一致性，为相关研究和应用提供高质量的解决方案。

（举报）

相关推荐

关键词：

大模型

AI大模型计费器如何精准比价？38款模型隐藏费用一键预警，三步告别超支

文章揭示了AI项目成本失控的三大痛点：1)计费维度分裂，如输入/输出token分开计价；2)参数迷雾，如文心一言4.0增强模式成本是基础版3.2倍；3)汇率陷阱，海外模型美元报价波动导致实际成本偏差超15%。通过AIbase费用计算器可精准测算：支持38个主流API对比，包含隐藏费用提醒，提供四大维度的决策矩阵（百万token成本/长文本溢价/月度总价/性价比评分）。案例显示某团队发现自研模型成本比通义千问高27%后及时调整采购策略。该工具能帮助开发者避免"成本黑箱"，实现零成本预算推演。

AI成本 GPT-4消费模型计价
百川开源最新医疗大模型，中国力量领跑医疗AI赛道

专注医疗后，百川智能交出第一份答卷! 8月11日，百川智能发布第二款开源医疗增强推理大模型Baichuan-M2，其以32B的参数量，在OpenAI的Healthbench评测集上，超越其刚刚发布5天的开源模型gpt-oss-120b。

百川智能医疗大模型开源模型
武大、蚂蚁集团发布新一代遥感大模型：12边型战士

近日，武汉大学与蚂蚁集团联合发布了新一代语义增强遥感大模型SkySense，堪称12边型战士。其相关研究成果在国际知名学术期刊《自然机器智能》上在线发表。当前，遥感基础大模型在复杂动态地球观测场景应用中面临挑战，如多模态遥感影像数据融合性能欠佳、下游任务微调依赖大量数据、对遥感语义信息挖掘不足等。为攻克这些难题，研究团队基于前期多模态遥感大�

遥感大模型语义增强多模态融合
AI 大模型选型指南:如何在众多模型中找到最适合你的那一个?

本文探讨了如何从众多AI大模型中选择最适合自身需求的模型。文章提出应从四个核心维度进行评估：1)核心能力对比，包括通用任务表现和特定领域专长；2)成本与效率，考量API调用成本和响应速度；3)本地化与数据安全，满足合规要求；4)生态与社区支持，关注开发者活跃度和文档完善度。为解决模型对比难题，推荐使用专业平台如AIbase模型广场，可一站式对比主流模型的多维参数和评测数据。通过系统化评估，开发者能更高效地选择契合业务需求的AI模型。

人工智能 AI大模型模型选型
Anthropic天价赔款？大模型“盗版”的100000种花样

AI大模型的秘密配方是什么?答案可能很简单:海量的“盗版内容”。这几乎是行业内公开的秘密。2023年，《纽约时报》一纸诉状将OpenAI和微软告上法庭，正式拉开了这场战争的序幕。很快，战火烧遍了整个硅谷。Meta因其Llama模型涉嫌使用盗版书籍而面临集体诉讼;Anthropic同样因其模型Claude的训练数据而被告，一时间，几乎所有头部玩家都被推上了被告席。这场大模型与版权�

AI大模型版权争议训练数据
男子编造2岁女儿被抱走遭处罚：为博关注由AI大模型生成

近日，一则细节详尽的“2岁女儿王喵喵被抱走”的寻人启事在网络上疯狂传播，引发超百万次点击与大量转发，众多网友纷纷加入转发助力寻找的行列。启事中描述走失者王喵喵为2岁女性，眼睛大大的，笑时会露出两颗小虎牙，在嘉兴市南湖区新丰镇乌桥超市被一大妈抱走，还附上了“父亲”与“母亲”的联系电话，字里行间满是焦灼，让人感觉是心急如焚的家长发出的求�

寻人启事网络传播嘉兴市
同比增长17%！腾讯Q2研发投入202.5亿元混元3D大模型接连突破

腾讯控股今日发布了截至6月30日的2025年第二季度财报。营收为1845亿元，同比增长15%，经营利润（Non-IFRS）692.5亿元，同比增18%。财报显示，当季腾讯研发投入达202.5亿元，同比增长17%；资本开支 191.1亿元，同比增幅达119%。在持续加码AI战略的推动下，AI技术带来的效益正在加速显现。 AI高投入背景下，腾讯通过数据增强与合成技术，提升了数据的质量与多样性，并通过更有效�

腾讯财报 AI技术研发投入
哪个大模型性价比最高？用这个 AI 大模型费用计算器轻松比价

AI大模型快速发展，但不同厂商的定价规则差异大，导致选择困难。AIbase推出的AI大模型费用计算器（https://model.aibase.com/zh/calculator）能帮助开发者快速比较主流模型的调用成本。该工具覆盖GPT-4、Claude、文心一言等国内外热门模型，支持输入输出分开计费，实时更新官方定价，无需注册即可使用。用户只需输入文本，系统自动拆分token数并精准计算费用，结果清晰直观可排序。建议根据场景需求选择模型：平衡成本与性能可选GPT-4o、DeepSeek-V2；高精度需求选GPT-4 Turbo；中文场景优选国产模型。使用前通过计算器模拟成本，可避免项目超支风险。

大模型性价比人工智能
如何科学比价AI大模型?一文教你用好这个AI大模型比价免费计算工具

本文探讨了当前AI大模型调用成本计算的重要性，介绍了AIbase费用计算器的实用功能。主要内容包括：1)不同厂商计费方式差异大，存在token/字符/调用次数等不同标准；2)AIbase工具支持主流模型费用对比，实时更新官方价格；3)提供输入输出分开计费模拟，支持自定义参数和结果排序；4)完全免费无需登录，适合快速查询。文章还给出选型建议：轻量任务选Claude Instant等低成本模�

AI大模型模型比价调用成本
酷睿Ultra Day 0适配部署大模型，率先赋能驱动人生AIGC助手

腾讯发布新一代开源大语言模型"混元"，英特尔通过酷睿Ultra平台实现该模型的Day0部署与优化。基于OpenVINO工具套件，英特尔助力ISV生态伙伴快速完成模型适配，加速AI应用落地。混元模型包含0.5B至7B四种参数规模，支持消费级显卡运行，适用于PC、手机等低功耗场景。在酷睿Ultra平台上，7B模型INT4精度下吞吐量达20.93token/s，0.5B模型FP16精度达68.92token/s。英特尔通过"硬件+模型+生态"协同，实现新模型发布当日即完成硬件适配，推动AI技术快速转化应用。

腾讯混元模型开源大语言模型英特尔酷睿Ultra

今日大家都在搜的词：

热文

3 天
7天

AI视野：Mistral AI发布87GB开源MoE模型;Soul上线自研大模型SoulX;百家号打击AI违规内容;Yi-34B成绩超越多个主流大模型

AI大模型计费器如何精准比价？38款模型隐藏费用一键预警，三步告别超支

百川开源最新医疗大模型，中国力量领跑医疗AI赛道

武大、蚂蚁集团发布新一代遥感大模型：12边型战士

AI 大模型选型指南:如何在众多模型中找到最适合你的那一个?

Anthropic天价赔款？大模型“盗版”的100000种花样

男子编造2岁女儿被抱走遭处罚：为博关注由AI大模型生成

同比增长17%！腾讯Q2研发投入202.5亿元混元3D大模型接连突破

哪个大模型性价比最高？用这个 AI 大模型费用计算器轻松比价

如何科学比价AI大模型?一文教你用好这个AI大模型比价免费计算工具

酷睿Ultra Day 0适配部署大模型，率先赋能驱动人生AIGC助手

今日大家都在搜的词：

热文

苹果iOS 18.6.1正式版发布：美版Apple Watch血氧功能上线

AI日报：腾讯混元开源Hunyuan-GameCraft；最强图像编辑器nano-

华为MatePad Air新款官宣8月15日发布

REDMI Note 15 Pro系列官宣下周发布

华为MatePad Air 12英寸2025发布：售价2799元起

AI日报：可灵2.1推出全新首尾帧功能；昆仑万维上线AI音乐模型M

微信聊天可以引用部分文字了！还可用表情包回复

华为MatePad 11.5 S 2025发布：预装鸿蒙5 首发售价2099元起

苹果正式入驻小红书 iPhone 17系列下月发布

苹果iOS 18.6.1正式版发布：美版Apple Watch血氧功能上线

iPhone17Pro最新外观曝光：苹果调整天线布局

AI日报：昆仑万维发布SkyReels-A3模型；百度搜索PC端全面上线A

全球首款女团机器人10580元拍出接入京东Joy Inside智能体

AI日报：腾讯混元开源Hunyuan-GameCraft；最强图像编辑器nano-

AI日报：智谱视觉推理模型GLM-4.5V开源；达摩院开源三项具身智

REDMI Note 15 Pro系列官宣本月发布

京东养车50亿补贴更名震骨价号称补贴不「唬」

雷军发起小米YU7版本更名投票称小米YU7标准版绝非丐版

REDMI Turbo 5已备案：首发天玑8500处理器

站长商机