AI视野：xAI大模型Grok炸场;李开复官宣开源大模型Yi-34B;ChatGPT原型Gizmo新功能曝光;百度网盘引入大模型智能助理

2023-11-06 15:31 · 稿源：站长之家

🤖📈💻💡大模型动态

李开复官宣全球最强开源大模型Yi-34B 一次可处理40万汉字

零一万物发布全球最强的开源大模型Yi-34B，具备超强的语言理解和处理能力，支持处理40万汉字，在中文指标上表现卓越，标志着中国在大模型领域的重大突破。

QQ截图20231106135852.jpg

项目地址:https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard

AiBase提要:
1. 零一万物推出「Yi」系列开源大模型，其中Yi-34B成为全球开源大模型的双料冠军，击败竞品，表现出色，特别在中文指标上表现突出。
2. Yi-34B的上下文窗口大小全球最长，支持200K字符，相比OpenAI的GPT-4大幅增加，提供更丰富的语义信息。
3. 零一万物采用科学训模方法和AI Infra团队的支持，成功降低了训练成本，提高了模型的性能，未来计划推出更多大模型。

马斯克旗下xAI首个大模型Grok炸场

马斯克旗下xAI团队发布了首个AI大模型产品“Grok”，它是一款智能助手，能回答各种问题并实时获取最新信息。

微信截图_20231106084749.png

体验地址:https://grok.x.ai/

【AiBase提要】
🚀 马斯克xAI发布首款AI大模型产品“Grok”。
💡 Grok是智能助手，回答问题并提供实时信息。
🌐 xAI团队计划在可靠性、可验证性、多模态能力方面继续研究。

元象XVERSE开源650亿参数通用大模型XVERSE-65B

深圳元象科技开源650亿参数的XVERSE-65B语言模型，支持多语言，适用于多轮对话和知识问答等任务。

项目地址:https://github.com/xverse-ai/XVERSE-65B

🧐 【AiBase提要】:
1️⃣ 深圳元象科技开源了XVERSE-65B，一个650亿参数的多语言语言模型，具备出色性能和广泛应用领域。
2️⃣ 该模型采用主流的Transformer网络结构，支持16K上下文长度，适用于多轮对话和知识问答等多种任务。
3️⃣ 经过充分训练，模型包含40多种语言的高质量数据，通过精细设置数据采样比例，使中英两种语言表现优异，同时也适用于其他语言。

知乎“知海图AI”大模型开放服务

知乎“知海图AI”大模型即将向公众开放服务，具备千亿级参数和强逻辑推理能力，旨在赋能创作者、讨论场、信息获取、内容运营。知海图AI已在多业务场景广泛应用，提高了效率和准确性。

【AiBase提要】:
1️⃣ 知乎的“知海图AI”大模型即将开放服务，拥有强大的参数和逻辑推理能力。
2️⃣ 该模型在多业务场景应用广泛，提高了效率和准确性。
3️⃣ 知乎将逐步将该模型的能力应用于创作、讨论场和信息获取。

多模态大模型面壁露卡开放服务

面壁智能多模态大模型应用「面壁露卡 Luca」正式面向公众开放服务。经过多次迭代更新，Luca不仅在中英文语言对话方面表现出色，还具备强大的代码、知识、逻辑及图片理解能力。

面壁露卡官网导航:https://top.aibase.com/tool/mianbiluka

【AiBase提要:】
📌 面壁智能多模态大模型「面壁露卡 Luca」正式向公众开放服务，以CPM模型为基础，具备多语言对话和强大的理解能力。
📌 面壁智能在AI Agent领域有突破性成就，与清华大学和OpenBMB开源社区合作，推动大模型技术应用。
📌 多模态大模型领域有不断创新，包括苹果的Ferret、多模态目标检测模型MQ-Det等，推动智能技术的发展。

中科院物理研究所发布材料合成AI大语言模型MatChat

中国科学院计算机网络信息中心与物理研究所合作，利用400多万篇论文数据，开发了MatChat，一款专注于无机材料合成路径预测的大语言模型，展现了潜在的应用潜力。

代码:https://www.scidb.cn/en/detail?dataSetId=37b8ce88305d44db9cdfe7c2d8fef4dd

【AiBase提要】:
📚 利用大规模文献数据，中国科学院发布了MatChat大语言模型，专注于无机材料合成路径预测任务。
💡 MatChat模型在预测合成复杂无机材料时性能表现优越，超过ChatGPT。
🌱 该成果为材料研究领域带来新的启发和思路，尽管需要更多语料以满足不同需求。

DeepSeek发布开源代码大模型DeepSeek Coder

DeepSeek Coder 是一个智能代码助手，可以生成各种代码，包括贪吃蛇游戏、2048游戏、测试样例、修 bug、SQL 查询等。DeepSeek Coder 还在国际权威数据集的测试中表现出色，领先其他开源模型。

【AiBase提要】
DeepSeek团队专注于AGI本质探索。
DeepSeek Coder是智能代码助手，生成各种代码。
模型在国际权威数据集测试中领先，已开放内测并在GitHub上开源。

🤖📱💼AI应用

ChatGPT订阅用户有望获得定制对话AI功能

OpenAI旗下热门聊天机器人ChatGPT即将推出名为"GPT构建器"的重要更新，允许用户创建和管理自定义聊天机器人，拓展其商业化应用。

【AiBase提要】
1. OpenAI将推出名为"GPT构建器"的更新，允许ChatGPT订阅用户创建和管理自定义聊天机器人，包括语言、语气、写作风格等设置。
2. 用户可以配置机器人的功能，如提供事项说明、上传知识库、开启网页浏览和图片生成。
3. OpenAI计划推出机器人市场，用户可以分享和浏览其他用户制作的聊天机器人。

百度网盘引入大模型智能助理

百度网盘进行了重大首页改版，采用多巴胺配色和个性化字体设计，引入智能助理，提供更智能化、年轻化的用户体验。

微信截图_20231106134900.png

【AiBase提要】
🎨 改版采用多巴胺配色和个性化字体设计，呈现年轻化 UI。
🧠 引入大模型智能助理，提供智能文件管理和搜索服务。
📲 用户可轻松访问工具和服务，提升使用效率。

📰🤖📢AI新鲜事

OpenAI首届开发者大会泄露消息，ChatGPT原型Gizmo新功能曝光

今年9月，OpenAI宣布首届开发者大会，而泄露消息透露了ChatGPT原型Gizmo的重大更新，包括自定义聊天机器人、界面改进、企业订阅和更多功能。

【AiBase提要】:
Gizmo将提供自定义聊天机器人、知识文件、工具和更多功能，加强了ChatGPT的能力。
ChatGPT原型Gizmo V8引入了新的模型选择器和高级模式，使用户能够创建自己的GPT。
OpenAI计划推出企业订阅和工作空间管理，提供更多优惠和功能，如无限制快速GPT-4访问和更长上下文。

蚂蚁百灵大模型通过备案

蚂蚁百灵大模型已完成备案，支持32K窗口长度的Transformer架构，多款相关产品即将完成内测并向公众开放。

【AiBase提要】
📋 蚂蚁百灵大模型完成备案，支持32K窗口长度的Transformer架构。
🚀 多款产品即将完成内测，准备向公众开放。
🌐 该大模型将在多领域应用中发挥重要作用。

迪拜将举办“全球AI挑战赛”，冠军可获近200万元奖金

迪拜哈姆丹亲王宣布将举办全球AI挑战赛，冠军可获得100万迪拉姆（约合人民币198.28万元）的奖金，旨在推动迪拜成为全球领先的人工智能创新中心。

【AiBase提要】:
1. 迪拜哈姆丹亲王宣布将主办全球AI挑战赛，奖金高达100万迪拉姆，以生成式人工智能为焦点，推动未来经济转型。
2. 这一挑战赛计划明年五月在迪拜的未来博物馆举行，旨在发展生成式人工智能解决方案。
3. 挑战赛由迪拜未来基金会和迪拜AI中心组织，旨在推进迪拜在科技领域的引领地位。

全球热门AI软件JUNLALA正式进军中国

JUNLALA计划将其AI软件SUPERLALA引入中国市场，注重本地化功能，旨在提供极致用户体验，标志着公司扩大全球影响力的重要举措。

官网:https://Junlala.ai

【AiBase提要】
🚀 JUNLALA的AI软件SUPERLALA将首次在中国正式推出，着重简单性、易用性和对中国用户的关注。
📅2023年11月5日，JUNLALA App将发布最新版本，具备一系列本地化功能和界面。
🌐 SUPERLALA旨在以用户为中心，为中国用户提供多样化的功能，实现顺畅的用户体验。

AI大佬Wolfram最新演讲:宇宙的本质是基于计算模型

英国科学家Stephen Wolfram在最新的TED演讲中分享了他的独特观点，认为宇宙的本质是基于计算模型运行的，由离散元素遵循简单计算规则构成。

【AiBase提要】
1. Wolfram提出了ruliad的概念，将计算视为宇宙的终极表达方式，对基础物理学和其他领域具有潜在影响。
2. 演讲中探讨了不同的科学模型，强调观察者在编织不同时间线和计算规则方面的关键作用。
3. 强调人工智能在科学研究和人类理解中的潜在作用，包括训练模型生成人类所写的文本。

AI面孔识别技术被用来识别鹅的面孔

维也纳大学的生物学家Sonia Kleindorfer博士及其团队开发了一种人工智能工具，用于识别鹅的面部特征，提高对鹅群个体的准确性，这项技术还将在生物多样性保护和生态学研究中发挥重要作用。

【AiBase提要】:
🦢 生物学家Sonia Kleindorfer开发了人工智能工具，识别鹅的面部特征，准确率高达97%。
🦆 研究揭示鹅拥有复杂社交关系，能识别伴侣和朋友的面部，为生态学研究提供新途径。
📸 该技术不仅限于鹅，还应用于识别港口海豹个体，对生物多样性保护有潜在影响。

👨‍💻💡🎯聚焦开发者

李飞飞团队推零样本360度场景合成技术ZeroNVS

斯坦福和谷歌的ZeroNVS技术能从单个图像实现零样本360度场景合成，通过3D感知扩散模型和SDS蒸馏生成逼真的合成图像，聚焦于场景。

论文地址:https://arxiv.org/pdf/2310.17994.pdf

【AiBase提要】
1. ZeroNVS利用3D感知扩散模型和SDS蒸馏生成多样化的逼真合成图像，专注于整个场景而非单个物体。
2. 实验结果显示，ZeroNVS在零样本性能方面明显领先，特别在LPIPS指标上。
3. ZeroNVS的创新技术有望在计算机视觉和图像合成领域产生重要影响。

Together AI发布RedPajama v2:30万亿token数据集用于大模型训练

TogetherAI最近发布了RedPajama v2，这是一个包含30万亿token的在线数据集，专为大型语言模型的培训而设计，为LLM领域提供了高质量的数据支持。

【AiBase提要:】
- 📌 RedPajama v2包含30万亿token，为大型语言模型的培训提供高质量数据支持。
- 📌 数据集强调对CommonCrawl的覆盖，包括高质量注释和去重集群，为LLM的培训提供有力基础。
- 📌 研究团队计划扩展高质量注释集，提供更多有力的数据支持，促进LLM领域的研究和应用。

UNC斯坦福等推出通用修正器LURE 多模态物体幻觉下降23%

多个大学合作开发的通用修正器LURE可解决多模态大模型中的物体幻觉问题，降低了幻觉频发的三个成因，提高了通用物体幻觉评估指标23%以上。

论文地址:https://arxiv.org/abs/2310.00754

代码地址:https://github.com/YiyangZhou/LURE

【AiBase提要】
🔍 通用修正器LURE解决多模态大模型的物体幻觉问题。
🔍 LURE通过统计分析物体共现、不确定性和物体位置，有效减少幻觉问题。
🔍 多模态大模型上的评估显示LURE提高了通用物体幻觉评估指标23%以上。

谷歌DeepMind研究发现Transformer模型难以泛化超出预训练数据范围

谷歌DeepMind的研究揭示，Transformer模型在预训练数据之外的泛化能力受到严重限制，难以解决新问题和函数类别。

论文地址:https://arxiv.org/pdf/2311.00871.pdf

【AiBase提要:】
🔍 谷歌DeepMind的研究人员进行实验，发现Transformer模型在预训练数据范围之外难以泛化。
📊 研究关注数据质量对模型性能的影响，发现模型在上下文学习中能够选择预训练的函数类别，但限制了泛化能力。
🧐 实验揭示了模型在处理不同函数类别和极端版本的函数时的局限性，强调预训练数据对模型性能的重要性。

GPU推理提速4倍!FlashDecoding++技术加速大模型推理

FlashDecoding++技术是一种用于加速大模型推理任务的新方法，可将GPU推理速度提升2-4倍，降低运营成本，支持多种GPU后端。

论文地址:https://arxiv.org/pdf/2311.01282.pdf

【AiBase提要:】
💡 FlashDecoding++技术旨在提高大模型推理效率，支持NVIDIA和AMD的GPU，可将GPU推理速度提升2-4倍。
💡 核心思想包括异步方法实现注意力计算的真正并行以及优化"矮胖"矩阵乘计算，降低大模型推理成本。
💡 公司"无问芯穹"已将FlashDecoding++集成到其大模型计算引擎"Infini-ACC"中，实现256K上下文的处理能力，提供更好的机会降低运营成本并提高效率。

（举报）

相关推荐
大家在看

关键词：

大模型

【腾讯云】11.11云上盛惠！云服务器首年1.8折起，买1年送3个月！

11.11云上盛惠！海量产品 · 轻松上云！云服务器首年1.8折起，买1年送3个月！超值优惠，性能稳定，让您的云端之旅更加畅享。快来腾讯云选购吧！

Docker容器镜像
去看看

Docker容器镜像 60元/15天

爆款产品组合购
去看看

爆款产品组合购低至1元

腾讯云x NVIDIA加速计划
去看看

腾讯云x NVIDIA加速计划最高获赠10万元扶持基金

2核2G云服务器
去看看

2核2G云服务器 112元/1年

查看更多相关信息>>

腾讯云 12-20

广告
百度智能云发布千帆大模型一体机：预置十余个主流开源大模型

在百度智能云GENERATE全球生态大会上，百度智能云发布千帆大模型一体机，从算力资源角度分为通用版、昇腾版、昆仑芯版三个版本，为企业私有化部署大模型提供解决方案。千帆大模型一体机预置了百度自研的文心大模型，以及Llama、Baichuan、ChatGLM等十余个主流开源大模型。过去6个月，百度智能云生态伙伴的数量增长了5倍，伙伴们开发的300多款应用通过千帆应用商店”进入市场。

百度智能云 GENERATE全球生态大会千帆大模型一体机
音乐ChatGPT时刻来临！「天工SkyMusic」音乐大模型今日启动邀测

4月2日，昆仑万维AI音乐生成大模型「天工SkyMusic」即日起面向社会开启免费邀测。昆仑万维已打造了集AI搜索、AI写作、AI长文本阅读、AI对话、AI语音合成、AI图片生成、AI漫画创作、AI图片识别、AI音乐生成、AI代码写作、AI表格生成等多项能力于一体的「天工3.0」多模态“超级模型”，成为AI行业全新里程碑。未申请邀测的用户也可在4月17日免费下载最新版“天工AI智能助手”APP，感受「天工3.0」与「SkyMusic」带来的颠覆性AI体验。

AI音乐生成大模型昆仑万维
DBRX抢占开源大模型王座编程、数学等领域超越GPT-3.5

最新开源大语言模型DBRX以其惊人的1320亿参数量成为业界新宠。该模型不仅在语言理解、编程和数学等方面超越了业内领先的开源模型在效率上有所突破。随着其在各项基准测试中的优异表现，DBRX有望成为未来开源大模型发展的重要里程碑，为人工智能领域的进步贡献力量。

DBRX AI头条
荐发布几小时，微软秒删媲美GPT-4开源大模型！竟因忘记投毒测试

【新智元导读】前段时间，微软公布并开源了最新一代大模型WizardLM-2，号称性能堪比GPT-4。还未上线一天，模型权重和公告全被删除了，原因竟是......上周，微软空降了一个堪称GPT-4级别的开源模型WizardLM-2。开发者们还需要耐心等待，微软团队承诺，会在测试完成后重新上线。

GPT-4 WizardLM-2
蚂蚁集团等发布开源大模型知识抽取框架OneKE

蚂蚁集团和浙江大学合作开发了一个名为OneKE的开源大模型知识抽取框架。该框架旨在帮助处理信息抽取、文本数据结构化和知识图谱构建等任务，为研究人员和开发者提供有力工具。他们将持续优化知识抽取的性能，并将相关技术应用到金融、医疗、政务等领域，推动可控生成技术的产业落地。
中国首个音乐SOTA模型「天工音乐大模型」今日公测

2024年4月17日，在「天工」大模型一周年之际，昆仑万维重磅宣布，「天工3.0」基座大模型与「天工SkyMusic」音乐大模型正式开启公测!一年前的今天，第一版天工大模型正式对外发布上线，一年来我们不断迭代模型，迭代应用产品，模型和应用都越做越好，以此回报广大用户的支持。「天工」系列大模型已集成了AI音乐、AI搜索、AI写作、AI长文本阅读、AI画图、AI语音合成、AI漫画创作、AI图片识别、AI代码写作、AI表格生成等多项能力，并将在未来加入AI视频功能，对标“超级应用”，成为人工智能时代的“超级大模型”。在“实现通用人工智能，让每个人更好地塑造和表达自我”的公司使命驱动下，昆仑万维将始终致力于AI技术与产品的创新开拓，不断提高AI产品的用户体验，与用户、研究人员、开发者们携手，共创国产大模型的未来。

天工3.0 大模型公测
孟子3-13B大模型正式开源

澜舟科技近日宣布，其研发的孟子3-13B大模型正式开源，并向学术研究领域全面开放，同时支持免费商用。这一轻量化大模型在多项基准测试中展现了优异的性能，特别是在参数量20B以内的模型中，其中英文语言能力尤为突出，数学和编程能力也位于行业前列。这一举措无疑将推动大模型技术的发展和应用，为AI产业的进步贡献力量。

大模型 AI头条
荐AI日报：最强大模型Llama 3发布；Midjourney推社交新功能Room；超强AI视频自动剪辑工具Captions；手机上可以玩大模型了

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/1、最强大模型Llama3正式发布Llama3是Meta公司最新发布的开源模型，拥有80亿和700亿参数规模，预计7月正式发布。教师免费使用该AI平台设计个性化课堂体验，提供实时洞察力支持学�

Llama3
荐1320亿参数，性能超LLaMA2、Grok-1！开源大模型DBRX

3月28日，著名数据和AI平台Databricks在官网正式开源大模型——DBRX。DBRX是一个专家混合模型有1320亿参数，能生成文本/代码、数学推理等，有基础和微调两种模型。Databricks主要提数据智能分析服务，帮助企业、个人用户快速挖掘数据的商业价值。

大模型 DBRX
开源大模型食用指南官网地址入口详细环境配置、模型部署、高效微调方法教程

开源大模型食用指南是一个旨在帮助用户学习和应用开源大模型的全流程指导教程。它提供了详细的环境配置、模型部署、高效微调等方法，以简化开源大模型的使用和应用，让更多普通学习者能够轻松上手。要获取更多详细信息并开始您的开源大模型之旅，请访问开源大模型食用指南官网。

开源大模型食用指南

TravAI:是一款AI驱动的旅行培训产品，提供交互式AI培训、模拟、评估和智能助手，为旅行行业人员提供最新的技能和知识。

TravAI是一款旅行行业的AI驱动培训产品，通过注入AI技术，为培训注入活力。它能创建引人入胜、交互式的培训课程，进行逼真的角色扮演模拟，并设计能够真正起作用的测验。同时，TravAI利用您的数据为旅行团队量身定制个性化学习体验，让培训不再是通用的、一刀切的。它是培训旅行业专业人员的更智能、更快速的方式。

旅行培训 AI

Nextminds:是一家提供在线辅导服务的平台，为所有科目和学术水平的学生提供个性化辅导。

Nextminds是一个提供在线辅导服务的平台，通过与经验丰富的导师在线互动，为学生提供个性化的学习经验。平台提供ICSE、CBSE和州委员会等多种教育体系的辅导。Nextminds的主要优点是学生可以在舒适的家中与专业的导师进行一对一的在线学习，为学生提供高质量的辅导服务。

在线辅导学习个性化

Pedagogue.io:每天花费10分钟，提升您的AI技能。

Pedagogue是一款AI技能培训平台，旨在帮助个人和企业提升AI技能。通过该平台，用户可以学习AI工具、技术和策略，并获得40%的生产力提升。Pedagogue的优势在于更新及时的内容库、个性化的技能培养、有趣的学习方式以及具有商业价值的数据驱动洞察。

AI 技能培训教育

LexiGym:你的语言学习伴侣。🚀 # #HinkouLabs

LexiGym是一款语言学习应用，帮助用户提升语言技能。它具有离线和多语言支持的创新功能，是最强大的语言学习伴侣。用户可以根据自己的预算选择免费使用或付费订阅，灵活选择学习方式。LexiGym还提供易于创建字典和智能学习等功能，以及详细的训练统计数据。

语言学习词汇训练多语言

Alevels.ai:A Levels AI是一个利用人工智能提高A Levels学习成绩的工具。

A Levels AI利用人工智能技术，提供个性化的学习计划和辅导资源，帮助学生在A Levels考试中取得优异成绩。它通过分析学生的学习情况和弱点，为其提供针对性的学习建议和练习题。A Levels AI还提供实时答疑和学习进度跟踪功能，帮助学生更好地掌握知识。

教育考试辅导人工智能

MailReply:是一款AI助手，可生成专业且人性化的邮件回复，节省时间。

MailReply通过AI生成邮件回复，帮助用户节省时间。它可以在保持人类写作风格的同时，根据邮件内容生成上下文相关的回复。MailReply适用于Windows和macOS，并兼容多种邮件客户端。

邮件回复 AI助手工具

Notification harbor:高性能团队的电子邮件营销平台

Notification harbor是一个为电子邮件营销团队提供AI优化的电子邮件内容和自动化流程的平台。通过使用LLM技术，我们可以在短短5分钟内创建高性能的电子邮件营销内容，并且随着时间的推移，产品甚至可以自我优化。我们的平台简化了电子邮件营销活动的方式，确保每个活动都能精准地与您的目标受众建立联系。AI生成的电子邮件模板根据您提供的信息和要求选择最合适的模板。实时个性化电子邮件可以提高用户参与度和转化率，并根据每个用户实时定制内容。AI驱动的电子邮件营销使您的团队在创建电子邮件模板和文本方面节省了60％的时间。

AI视野：xAI大模型Grok炸场;李开复官宣开源大模型Yi-34B;ChatGPT原型Gizmo新功能曝光;百度网盘引入大模型智能助理

今日大家都在搜的词：

热文

站长商机