首页 > 业界 > 关键词  > 大模型最新资讯  > 正文

AI视野:Mistral AI发布87GB开源MoE模型;Soul上线自研大模型SoulX;百家号打击AI违规内容;Yi-34B成绩超越多个主流大模型

2023-12-11 15:24 · 稿源:站长之家

🤖📈💻💡大模型动态

Mistral AI发布87GB开源MoE模型

Mistral AI以87GB种子形式开源了近似于GPT-4的8x7B MoE模型,架构相似但规模更小,引发开发者关注和在线体验。

图片

【AiBase提要】

🔍 Mistral AI以磁力链接方式开源了8x7B MoE模型,规模接近GPT-4,参数配置相对较小。

🚀 模型采用专家混合(MoE)技术,将任务分解为小的子任务,提高效率和准确性。

💡 Mistral AI是一家法国初创公司,于2023年5月成立,最近获得4亿欧元融资,技术备受关注。

Soul上线自研语言大模型SoulX

Soul社交平台推出自研语言大模型SoulX,通过强大的生成和理解能力提升社交关系和内容链路体验,覆盖多种风险类别以确保内容安全。

【AiBase提要:】

🚀 SoulX功能强大: 基于海量数据训练,支持prompt驱动、条件可控生成、多模态理解,确保流畅自然对话,并覆盖多种细粒度风险类别。

🤝 社交全链路赋能: SoulX将在关系发现、建立、内容生产等环节提升用户体验,加速在游戏、群聊、数字分身等场景的AI产品落地。

📊 Soul平台数据亮点: 截至2022年,Soul月活用户近3000万,Z世代用户占比78%,平均日使用时长46.4分钟,致力于成为细分社交领域的领先者。

乐天计划在未来两个月内推出自家 AI 模型

日本科技巨头乐天计划在接下来两个月内推出自家的大型语言模型,利用其在银行、电商和电信等多个业务领域积累的“独特”大量数据进行训练,以提高内部运营效率并向企业开放,预计可提升营销效果20%。

【AiBase提要:】

📅 发布计划: 乐天计划在未来两个月内推出大型语言模型,利用其在多个业务领域的“独特”大量数据进行训练。

🌐 数据优势: 乐天首席执行官表示,公司将内部使用人工智能模型提高运营效率,并计划向企业开放,预计可提升营销效果20%。

💼 商业应用: 乐天希望与其他科技公司竞争,在大型语言模型领域迎头赶上,并预计人工智能领域的进军将为公司带来“巨大的盈利增长”。

通义千问72B模型荣登Hugging Face预训练模型榜首

通义千问的Qwen-72B模型在Hugging Face的预训练模型排行榜中位居榜首,凭借720亿参数和73.6的综合得分,在全球上百个顶尖的开源大模型中脱颖而出。该模型是阿里云推出的超大规模语言模型,涵盖多轮对话、文案创作、逻辑推理、多模态理解、多语言支持等功能。

微信截图_20231211085737.png

体验地址:https://top.aibase.com/tool/tongyiqianwen

【AiBase提要:】

🌐 通义千问Qwen-72B模型荣登Hugging Face预训练模型榜首。

🚀 Qwen-72B以720亿参数和73.6的综合得分在全球开源大模型中表现出色。

💬 通义千问是阿里云推出的功能丰富的语言模型,包括多轮对话、文案创作、逻辑推理等。

📰🤖📢AI新鲜事

百家号打击AI违规内容

百度百家号宣布通过平台审核封禁489个违规账号,清理15660条利用AIGC创作的虚假新闻,以打击自媒体利用AI传播违规内容,提升平台内容质量和可信度。

【AiBase提要:】

🔍 平台清理AI生成违规内容15660条,封禁相关违规账号489个。

📰 自媒体利用AIGC创作虚假新闻等违规内容,影响用户体验。

👮 平台呼吁创作者标注AI创作声明,持续升级治理手段,提升平台内容生态。

理想同学引入Mind GPT

理想汽车发布OTA5.0版本,宣布引入自家研发的多模态认知大模型Mind GPT,旨在提供顶级人工智能体验,该模型在中文大语言模型评测中荣获双冠军

【AiBase提要】

🚗 Mind GPT功能引入: 理想汽车发布OTA5.0版本,整合自主研发的Mind GPT,旨在提供高度智能化的驾车体验。

📊 多模态认知大模型表现: Mind GPT在中文大语言模型评测中夺得双冠,涵盖52个学科,111个领域,具备核心能力包括理解、生成、知识记忆及推理。

🌐 全面升级与未来展望: 理想汽车OTA5.0版本带来智能驾驶、智能空间、智能增程三大平台全面升级,为用户提供更优越的汽车智能化体验。

三星OneUI6.1泄露揭示Galaxy S24系列的更多生成式AI功能

三星即将推出的 Galaxy S24系列智能手机将引入 One UI6.1版本,涵盖生成式壁纸、天气效果锁屏、用户笔记摘要等 AI 功能,展望着在硬件与软件融合上的创新。

【AiBase提要】

🎨 生成式壁纸: 新应用将根据前景和背景对象创建独特个性化壁纸主题。

🌦️ 天气效果锁屏: 允许在锁屏和待机屏幕上添加天气效果,提升用户体验。

📝 用户笔记摘要: AI 功能简化大段文字笔记为主题要点列表,实现更高效的信息整理。

马斯克的Grok因用ChatGPT的数据回答出现幻觉

伊隆·马斯克推出的xAI公司新聊天机器人Grok使用了OpenAI的ChatGPT数据,导致幻觉问题,开发者承诺解决。

【AiBase提要:】

🕵️‍♂️ Grok AI使用了OpenAI ChatGPT的数据,开发者惊讶地发现在培训中意外吸收了ChatGPT的输出,导致幻觉问题。

🚀 Grok是伊隆·马斯克的xAI公司推出的新聊天机器人,由生成模型Grok-1驱动,专为Premium+ X订阅用户推出,能实时回应平台发生的帖子。

🌐 尽管Grok采用了不同的底层模型,但在培训中意外吸收了ChatGPT的输出,开发者保证将解决问题,未使用OpenAI的代码制作Grok。

OpenAI承认GPT-4变懒,即将发布修复方案提升性能

用户反馈显示,OpenAI的GPT-4存在性能问题,模型变得懒散不愿提供答案。OpenAI承认问题源于模型微调训练数据变更,计划发布修复方案提升用户体验。

【AiBase提要:】

🤯 用户反馈: GPT-4使用者抱怨OpenAI破坏了体验,称模型几乎“害怕”提供答案。

🕵️‍♂️ 问题认知: OpenAI承认性能问题,归因于模型训练数据变化,试图提高准确性却导致意外的懒散行为。

⏳ 修复时间表: OpenAI未明确发布修复计划的确切时间,但强调高度重视,并将密切关注竞争对手,如Google的Gemini1.0。

李开复Yi-34B最新成绩超过LLaMA2等主流大模型

李开复的Yi-34B-Chat模型以94.08%的胜率在多个评测中超越LLaMA2和ChatGPT,尤其在加州大学伯克利分校主导的LMSYSORG排行榜中,以1102的Elo评分追平GPT-3.5。

image.png

项目地址:https://huggingface.co/01-ai

【AiBase提要】

🌟 李开复的Yi-34B-Chat模型胜率94.08%,超越LLaMA2和ChatGPT。

🏆 在LMSYSORG排行榜中,以1102的Elo评分追平GPT-3.5。

🚀 创新对齐策略和开源成功,尽管受质疑,Yi-34B-Chat在技术创新和用户体验方面备受瞩目。

Handwrytten利用 AI 技术帮助圣诞老人创建手写信件

在即将到来的圣诞节,Handwrytten和他的精灵助手通过人工智能技术,免费制作个性化、手写风格的信件,以满足圣诞季的需求。

【AiBase提要:】

🤖 技术助手登场: 圣诞老人利用AI技术,通过网站 HandwryttenBySanta.com 制作独特的手写风格信件。

💌 个性化定制: 父母代表孩子与圣诞老人联系,定制信息,制成信件后邮寄给孩子,保留圣诞老人的「北极标准」。

💫 特色设计与金色印章: 信件附有特殊的金色认证印章,配有季节性装饰,通过高质量纸张和特选钢笔呈现出真实手写感,成为圣诞季的惊喜。

🤖📱💼AI应用

蚂蚁百灵研发助手CodeFuse插件发布新版

蚂蚁百灵研发助手CodeFuse插件发布新版,现已支持Android Studio,提升了前端语言代码补全准确率,功能包括代码补全、代码优化、注释等。

【AiBase提要:】

🚀 新版CodeFuse插件新增支持Android Studio,已兼容11款主流IDE,包括Visual Studio Code、IDEA等。

🎯 针对JavaScript、TypeScript等前端语言进行优化,提高代码补全准确率,前端代码生成采纳率提升20%。

🌟 新功能包括“研发小蜜”产品答疑入口、“退出登录”功能,最大输出Token数量为1024个,插件面板适配VS Code的浅色主题。

Deepgram推创新文本转语音模型Aura

深瞳公司发布名为Aura的文本转语音模型,旨在为实时语音AI代理提供更快速、高效、人类般对话质量的解决方案。

image.png

官方地址:https://deepgram.com/learn/aura-text-to-speech-api-waitlist

【AiBase提要:】

🚀 创新模型:Deepgram推出Aura,提供比其他语音AI替代品更快速、更高效的实时文本转语音,旨在解决速度、成本、可靠性和对话质量等问题。

🗣️ 人性化声音:Aura赋予AI代理更具人类特征的声音,包括及时回应、自然的语音填充词汇,在对话背景中调整语调和情感,盲评试中被评为更贴近人类声音。

🌐 未来愿景:Deepgram计划通过Aura成为实时、对话式语音AI代理的完整平台,为开发者提供构建高吞吐量、实时AI代理所需的基本构件。

AI图表生成工具Mymap 支持一键生成各种图表

MyMap AI是一款强大的在线工具,支持多种图表类型的一键生成,解决思维难题和信息整理,提高用户的信息可理解性和决策效率。

image.png

体验地址:https://top.aibase.com/tool/mymap

【AiBase提要:】

🚀 多功能工具: MyMap AI不仅限于心智图,还支持各种图表类型,扩展了广泛的应用场景。

🔄 简便操作: 用户通过在AI问答栏中输入问题,选择图表类型,即可一键生成清晰而引人入胜的图表。

🤝 团队协作: MyMap AI支持公开分享和导出功能,方便团队协作,提高图表的灵活性和可应用性。

👨‍💻💡🎯聚焦开发者

智源研究院发布LM-Cocktail模型治理策略

智源研究院推出LM-Cocktail模型治理策略,通过融合多个模型的优势,以低成本方式提升大模型性能,适用于缺乏标签数据或计算资源的开发者。

微信截图_20231211135737.png

论文 :https://arxiv.org/abs/2311.13534

代码 :https://github.com/FlagOpen/FlagEmbedding/tree/master/LM_Cocktail

项目地址:https://github.com/FlagOpen/FlagEmbedding/tree/master/LM_Cocktail

【AiBase提要】

🍹 模型融合创新: LM-Cocktail策略将多个模型优势融合,生成多技能模型,提高目标任务准确度。

🚀 低成本性能提升: 无需重新训练,通过计算加权权重实现性能提升,适用于资源有限的开发者。

🌐 开放实验展示良好性能: LM-Cocktail已在实验中展现出良好性能,为大模型开发者提供了有效的治理策略。

LangChain开源AnythingLLM

LangChain正式开源AnythingLLM,这是一个全栈应用程序,让用户能够轻松构建私有ChatGPT,支持对话和查询模式,提供灵活的工作空间管理和多文档类型支持。

image.png

项目地址:https://github.com/Mintplex-Labs/anything-llm

【AiBase提要:】

🚀 全栈私有ChatGPT应用: LangChain推出AnythingLLM,支持本地或远程托管,可与任何内容进行智能对话。

🤖 灵活聊天模式: 应用包括对话和查询模式,保留上下文、支持文档问答,提供多文档类型支持。

👥 多用户实例和权限控制: 提供多用户支持和权限控制,确保安全管理和使用系统。

高质量3D人体生成新框架HumanGaussian开源

HumanGaussian框架通过结构感知的SDS和负文本引导等核心方法,成功解决了3D人体生成中效率与质量之间的权衡问题,为高质量、真实的3D人体模型提供了新思路和解决方案。

image.png

项目地址:https://github.com/alvinliu0/HumanGaussian

【AiBase提要】

🌐 结构感知的SDS引入: HumanGaussian采用SDS和SMPL-X网格形状初始化3D高斯中心位置,提供更全面的初始信息,促进3D高斯的学习过程。

🔍 负文本引导与消除伪影: 通过退火的负文本引导,HumanGaussian确保真实结果,提高生成质量,同时消除浮动伪影,解决了对齐问题。

🚀 优越的生成成果: 在性能对比实验中,HumanGaussian在3D人体生成领域表现卓越,展现更真实的外观、更连贯的结构、更好的视图一致性,为相关研究和应用提供高质量的解决方案。

举报

  • 相关推荐
  • 大家在看
  • Granola:AI智能笔记工具,提升会议效率。

    Granola是一款专为频繁开会人士设计的AI笔记应用。它能够将会议的原始笔记转化为结构化、易于阅读的格式,并通过AI技术增强笔记内容。Granola支持Mac平台,无需会议机器人即可直接转录Mac音频,提供可定制的会议模板,满足不同团队的需求。内置GPT-4,帮助用户处理会议后的行动项目,如撰写跟进邮件、列出行动项目等。此外,Granola还支持一键分享笔记到常用平台,提高工作效率。

  • Muddy:让团队协作变得流畅而有趣。

    Muddy 是一个专为团队设计的协作工具,它通过人工智能简化了多应用和文件的工作流程,让团队成员能够更高效地协作。Muddy 能够自动整理和分类标签页,支持无限回溯功能,允许用户在应用、文件和对话之间快速切换。此外,它还具有通用评论功能,允许用户在任何地方进行高亮、点击和发送,就像在每个应用和网站上都有 Slack 的线程一样。Muddy 还能自动读取所有标签页,从您的对话中学习,并在需要时提出后续问题。

  • Ivee:B2B影响者营销平台

    Ivee是一个B2B影响者营销平台,旨在帮助企业与行业专家合作,以增长收入、产生潜在客户并提升品牌。它通过AI驱动的搜索引擎集中来自Linkedin、Youtube、Substack和Apple podcast等平台的数据,帮助企业找到与品牌DNA和目标最相关的行业领导者。Ivee还提供数据驱动的洞察来评估受众质量和相关性,并帮助企业建立业务驱动的合作关系,提高运营效率。

  • Visible AI Inbox:将电子邮件转化为投资组合洞察的工具

    Visible AI Inbox是一个专为风险投资公司设计的工具,它能够自动解析、结构化和图表化投资组合公司的数据,从而提供清晰的投资组合洞察。产品通过AI技术帮助用户从电子邮件和文件中提取信息,与现有的数据结合,创建一个投资组合指标和洞察的真实来源。它还允许创始人以他们喜欢的方式分享数据,同时确保数据安全,采用SOC 2认证、TLS 1.2加密和AES-256静态加密等安全措施。

  • DokeyAI:AI工具目录与产品展示平台。

    DokeyAI是一个提供超过1800个AI网站和AI工具的目录与产品展示平台。它通过Photo AI等技术增强了用户喜爱的工具,覆盖了43个不同的类别,包括会计金融、动画3D建模、建筑室内设计、艺术图像生成、聊天机器人、编程数据库助手等。DokeyAI旨在为用户提供一个集中的平台,以发现和使用各种AI增强的工具。

  • Nowadays:AI助力的企业活动规划师

    Nowadays是一个AI驱动的企业活动规划平台,旨在简化活动策划流程,通过电子邮件和电话与最佳场地进行谈判,为公司活动找到合适的地点。它通过AI技术提供快速响应时间,作为IATA认证的旅行代理运营,并提供无限范围的场地搜索,确保结果与活动标准相匹配。此外,AI还协助全球范围内与场地进行谈判,帮助用户节省成本。

  • Unify AI:一站式LLM模型比较与优化平台

    Unify AI是一个为开发者设计的平台,它允许用户通过一个统一的API访问和比较来自不同提供商的大型语言模型(LLMs)。该平台提供了实时性能基准测试,帮助用户根据质量、速度和成本效率来选择和优化最合适的模型。Unify AI还提供了定制路由功能,允许用户根据自己的需求设置成本、延迟和输出速度的约束,并定义自定义质量指标。此外,Unify AI的系统会根据最新的基准数据,每10分钟更新一次,将查询发送到最快提供商,确保持续达到峰值性能。

  • ChatVid.AI:AI生成的用户界面,重新定义视频学习。

    ChatVid.AI 是一个利用人工智能技术,通过生成用户界面来提升视频学习效率的平台。它通过AI技术生成的界面,让用户能够更快速地获取视频内容的核心信息,减少观看时间,提高学习效率。产品背景信息显示,它可能与当前流行的AI技术如LLaMA 3 大模型和GPT-4 Omni等有关联,表明其技术先进性和创新性。

  • Crusoe Cloud:高性能、成本效益高、气候对齐的云平台

    Crusoe提供可扩展的、气候对齐的数字基础设施,专为高性能计算和人工智能优化。我们的创新方法通过使用浪费的、孤立的或清洁能源来减少温室气体排放,支持能源转型,并最大化资源效率。

  • AI 论文速递:提供人工智能领域最新研究论文的速递服务。

    AI 论文速递是一个专注于人工智能领域的学术资源分享平台,旨在帮助研究人员和学者快速获取最新的人工智能研究论文。该平台通过聚合各大学术会议和期刊的论文,为用户提供一个集中的、易于访问的信息源,从而促进知识的传播和学术的交流。

  • Dolphin 2.9.1 Mixtral 1x22b:基于Dolphin-2.9-Mixtral-8x22b的先进AI模型

    Dolphin 2.9.1 Mixtral 1x22b是由Cognitive Computations团队精心训练和策划的AI模型,基于Dolphin-2.9-Mixtral-8x22b版本,拥有Apache-2.0许可。该模型具备64k上下文容量,通过16k序列长度的全权重微调,经过27小时在8个H100 GPU上的训练完成。Dolphin 2.9.1具有多样的指令、对话和编码技能,还具备初步的代理能力和支持函数调用。该模型未进行审查,数据集已过滤去除对齐和偏见,使其更加合规。建议在作为服务公开之前,实施自己的对齐层。

  • PowerToys:微软推出的系统增强工具集

    PowerToys 是微软推出的一款面向高级用户的系统增强工具集,旨在提高用户的工作效率和系统使用体验。它包含了多种实用工具,如颜色选择器、窗口管理、文件资源管理器插件等,以帮助用户更好地管理他们的Windows系统。

  • AI创意商拍:10秒搞定电商出图设计

    美间AI创意商拍是一个专注于电商领域的在线设计平台,它通过人工智能技术,帮助用户快速生成电商所需的各种设计图,如主图、头图等。该平台的核心优势在于其高效的设计生成速度和丰富的模板资源,能够满足不同品类商品的设计需求,从而提升电商运营的效率和效果。

  • Truecaller:全球领先的验证联系人和阻止不受欢迎通信的平台

    Truecaller是一个全球领先的平台,致力于验证联系人和阻止不受欢迎的通信。它使人们之间的安全和相关对话成为可能,并使企业与消费者之间的联系更加高效。Truecaller致力于在数字经济中建立通信信任,特别是在新兴市场。自2009年在斯德哥尔摩成立以来,Truecaller已经成为超过3.83亿活跃用户日常通信的重要组成部分,自推出以来下载量超过5亿次,2021年识别并阻止了近380亿次不受欢迎的呼叫。Truecaller由经验丰富的管理团队领导,是一个具有企业家精神的公司。

  • Mistral-7B-v0.3:一种大型语言模型,具有扩展词汇量。

    Mistral-7B-v0.3是由Mistral AI团队开发的大型语言模型(Large Language Model, LLM),它是Mistral-7B-v0.2的升级版,具有扩展到32768的词汇量。该模型支持文本生成,适合于需要文本生成能力的应用场景。目前,该模型没有内容审核机制,团队正在寻求社区合作,以实现更精细的内容审核,满足需要内容审核的部署环境。

  • CodiumAI Cover-Agent:AI驱动的自动化测试生成和代码覆盖增强工具

    CodiumAI Cover-Agent 是一款利用生成式AI自动化测试生成和增强代码覆盖的工具,旨在简化开发工作流程。它通过与大型语言模型(LLM)交互,为软件项目自动创建单元测试,确保测试的全面性和质量保证。Cover-Agent 计划集成到流行的CI平台中,社区被邀请合作并帮助扩展Cover Agent的功能,使其成为自动化单元测试生成领域的尖端解决方案。

  • 腾讯混元助手:AI伙伴,提供多样化智能服务

    腾讯混元助手是腾讯公司TEG技术工程事业群开发的一款AI聊天服务产品,旨在通过人工智能技术提供多样化的智能服务,包括文本问答、图片理解等。该产品使用腾讯混元大模型V1.7.6,能够生成文本、图片等多种形式的内容,为用户提供灵感和帮助。

  • LemonSpeak:自动化播客营销内容创作工具

    LemonSpeak是一个旨在帮助播客制作者从他们的播客剧集中创建营销内容的在线平台,通过自动化技术节省时间,提高播客的发现性。它通过转录、摘要、创建SEO优化标题、节目笔记、博客文章等,帮助播客制作者扩大在线观众群,提升搜索引擎优化,使播客在播客目录中更具吸引力。

  • Neolocus:利用AI技术,快速设计您的梦想家居空间。

    Neolocus是一个创新的在线设计平台,它利用人工智能技术帮助用户快速设计和装饰他们的生活空间。用户只需上传空间照片,选择风格偏好,Neolocus就能在一分钟内提供令人惊叹的渲染效果,并推荐相应的产品购买,实现梦想家居的构建。该平台不仅服务于个人用户,还特别为Airbnb房东提供服务,帮助他们吸引更多客户。Neolocus的技术背景包括在ROSHN PropTech Hackathon中获得金奖,成为沙特阿拉伯GAIA Cohort 1的一部分,并在2023年的Cityscape Global上展出。

  • Tap4 AI Web UI:开源AI工具目录,构建个性化AI工具平台。

    Tap4 AI Web UI是一个开源的AI工具目录,由Tap4 AI Tools Directory构建。该项目旨在帮助每个人轻松构建自己的AI工具目录。你可以fork项目,一键部署到Vercel,并通过项目中的dataList更新你自己的AI工具。

今日大家都在搜的词: