AI视野：OpenAI计划自研AI芯片；Canva发布AI设计工具Magic Studio；DocsGPT登顶GitHub热榜；哩布哩布AI重新上线

2023-10-07 14:47 · 稿源：站长之家

文头.jpg

🤖📈💻💡大模型动态

CMU华人打破大模型黑盒，Llama2撒谎被一眼看穿!

来自CAIS、CMU、斯坦福、康奈尔、马里兰、宾大等机构的学者最近发现，大语言模型不再是黑匣子，其内部具有可解释的表征，甚至可以被测谎仪检测出撒谎行为。他们使用一种名为LAT的扫描技术观察LLM参与真理概念或撒谎时的大脑活动，并发现LLM内部具有一致的内部信念。通过调控大脑区域，可以影响LLM的幻觉、偏见以及诚实程度。这项研究为提高大语言模型的解释性和可控性迈出了重要一步。

论文地址:https://arxiv.org/pdf/2310.01405.pdf

AiBase提要:
🔍 机构学者打破大模型黑盒
🤥 LLM撒谎被测谎仪识破
🧠 大脑活动影响LLM的幻觉和偏见

📰🤖📢AI新鲜事

OpenAI计划自研AI芯片:解决GPU卡脖子问题

OpenAI计划自研AI芯片，以解决AI芯片短缺和高成本问题，考虑潜在的收购目标。英伟达主导市场，导致算力资源稀缺，OpenAI受限于GPU供应。自研芯片或收购公司是解决方案，但需数年时间和巨额投资。

AiBase提要:
🔍 OpenAI计划自研AI芯片，应对AI芯片短缺。考虑收购和与制造商合作。
💼 英伟达主导市场，导致算力稀缺，OpenAI寻求新解决方案避免卡脖子。
💰 自研芯片难度大，考虑收购，但仍有不确定性。需数年时间和巨额投资。

Claude团队成功分解神经网络的不可解释性问题

Anthropic的Claude团队利用字典学习，成功将ChatGPT的神经元分解为约4000个可解释特征，从而克服了神经网络的不可解释性问题。这一方法有望使AI模型更加可理解和安全，为AI领域带来重要进展。

报告链接:https://transformer-circuits.pub/2023/monosemantic-features/index.html

AiBase提要:
1. 😮 Anthropic的Claude团队通过字典学习将ChatGPT的神经元分解为4000个可解释特征。
2. 🤖 这一方法有望克服AI不可解释性问题，使模型更加可理解和安全。
3. 📊 分解后的特征可以用于干预和引导模型的生成，为AI领域带来新的可能性。

DeepMind研发新AI项目Open-X Embodiment，可控制各种类型的机器人

Google DeepMind与33家其他研究机构合作推出Open-X Embodiment项目，旨在解决机器人领域的挑战，通过通用型AI系统为不同机器人和任务训练模型，提高任务成功率。该项目基于Transformer架构，包括RT-1-X和RT-2-X模型，可适用于多种机器人和任务。

AiBase提要:
🤖 通用型AI项目Open-X Embodiment解决机器人领域挑战
🔄 基于Transformer架构的RT-1-X和RT-2-X模型提高任务成功率
🌐 数据集包含来自22种机器人的多种技能和任务示例

百度CIO李莹接棒小度大模型或助力小度增长

百度宣布百度集团副总裁、CIO李莹博士出任小度科技CEO。李莹于2004年加入百度，在多个核心业务IntegerField上获得丰富经验，任百度CIO期间，她运用AI优化内部流程。业内分析，此举意味着小度将承担更多使命，李莹的百度AI背景将有助小度在大模型时代取得进步。小度可望借助百度在AI方面的技术优势，在大模型加持下获得进一步发展。

AiBase提要:
👩‍💼 李莹出任小度科技CEO
🚀 小度将承担更多使命，借助大模型加速发展
🤖 百度AI技术优势将助力小度在AI领域取得进步

哩布哩布AI重新上线

哩布哩布AI是一个多功能的AI绘画网站，曾在今年9月下线。现已重新上线，提供免费AI图片生成、社区互动和定制化模型选项。

体验地址:https://www.liblib.ai/

AiBase提要:
🔄 重新上线: 哩布哩布AI网站重新上线，用户可正常访问。
🎨 多功能平台: 网站提供免费AI图片生成、社区互动和定制化模型选项。
💡 备案完成: 疑似下线原因是缺乏备案，现在似乎已完成备案。

BBC 正在阻止 OpenAI 数据抓取:计划与企业合作找出生成式 AI 最佳用途

英国最大的新闻机构BBC已明确制定了其在评估生成式人工智能使用时的原则，包括新闻研究和制作、档案和「个性化体验」。BBC国家总监Rhodri Talfan Davies表示，他们将始终以公众最大利益为出发点，优先考虑人才和创造力，并承诺保持公开透明，同时阻止来自OpenAI和Common Crawl的网络爬虫访问BBC网站。

AiBase提要:
📌 BBC明确生成式AI合作原则
🎨 优先考虑人才和创造力
🔍 承诺公开透明，阻止网络爬虫访问

Meta 斥巨资打造明星AI数字人

Meta最近宣布将在名人AI领域投入巨资，以打造名人AI双胞胎。根据The Information的一份报道，Meta公司已经签下了一位顶级创作者，为其提供了高达500万美元合同，合同期限为两年，包括六小时的工作时间。

AiBase提要:
🌟 Meta计划投资数百万美元，基于名人如Snoop Dogg、Tom Brady和Charli D'Amelio打造AI角色。
💼 一位顶级创作者以500万美元签下为期两年的非独占性协议，包括六小时工作时间。
💬 这些AI角色目前在Instagram、WhatsApp和Messenger上作为文本聊天机器人运行，明年初将具备语音功能。

亚马逊云科技宣布全托管生成式 AI 服务Amazon Bedrock已正式可用

亚马逊云科技正式推出全托管生成式AI服务Amazon Bedrock，支持各规模企业构建生成式AI应用。此服务包括多项创新，如Amazon Titan Embeddings、Meta Llama2模型、Amazon CodeWhisperer等，提供更多模型选择和数据安全保护。

AiBase提要:
🚀 亚马逊发布全托管生成式AI服务Amazon Bedrock，助力企业构建生成式AI应用。
💡 创新包括Amazon Titan Embeddings、Meta Llama2模型、Amazon CodeWhisperer，提供更多模型选择。
🔒 服务确保数据安全，受到知名企业如阿迪达斯、宝马集团等的应用。

Snap AI聊天机器人涉嫌侵犯青少年隐私，英国展开调查

摘要: 英国信息委员会对Snap公司的生成式AI聊天机器人"My AI"潜在隐私风险展开调查。初步调查结果引发担忧，但尚未成为最终结论，Snap将与信息委员会合作解决问题。

AiBase提要:
🔍 调查发现Snap未充分评估"My AI"对青少年隐私的潜在风险。
🤝 Snap承诺合作解决问题，确保法律和隐私审查。
📈 Snap的AI聊天机器人已有1.5亿用户，但面临潜在停止服务风险。

苹果 AI 战略高级副总裁:苹果曾考虑收购微软 Bing 以对抗谷歌

苹果曾考虑通过收购微软的搜索引擎 Bing 来挑战谷歌的搜索业务，这是一个罕见的对幕后故事的窥视，揭示了在谷歌主导的行业中所发生的情况。

🔍 AiBase提要:
1️⃣ 苹果高级副总裁证实曾考虑过收购微软 Bing 以挑战谷歌。
2️⃣ 法院审判揭示了科技巨头在搜索领域竞争的挑战，谷歌占据着90%的市场份额。
3️⃣ 苹果最终放弃收购 Bing，选择与谷歌继续合作，谈判保密的利润分成协议。

👨‍💻💡🎯聚焦开发者

开源论文查询工具DocsGPT登顶GitHub热榜支持多种文档类型

DocsGPT是一款开源文档助手，旨在改变项目文档查找信息的方式，无需手动搜索，能快速找到所需信息。

项目地址:https://github.com/arc53/DocsGPT

AiBase提要:
📌 自然语言搜索: DocsGPT能理解自然语言问题，提取文档答案，便捷查找信息。
🚀 开源模型优化: DocsGPT提供多种优化模型，适用不同硬件，满足需求。
🌐 灵活部署: DocsGPT支持本地和云端部署，数据安全有保障。

AI视频生成框架AnimateDiff 即使是高速运动视频依然能保持稳定

AnimateDiff是一款强大的工具，能够将任何定制化文生图模型扩展到动画生成领域，而且在保持原有定制化模型画面质量的基础上，还能生成相应的动画片段。

项目地址:https://github.com/guoyww/animatediff/

AiBase提要:
🔍 AnimateDiff开源框架将文生图模型应用于动画生成，提高静态图像表现能力。
🚀 插入动作建模模块，个性化生成动画图像，无需特定优化，降低成本。
💡 提供多功能Motion模块、简便环境设置、Gradio演示等核心功能。

创新免费AI视频创作工具Show-1，仅占普通模型25%GPU内存

新加坡国立大学的研究团队成功研发了一款名为Show-1的AI系统，能够从文本描述中生成高质量视频。该系统采用混合架构，结合像素和潜变模型，以实现文本到视频的精确对齐和高效放大，仅需使用20-25%的GPU内存，成为一款开源的AI视频创作工具。

Show-1项目网址:https://showlab.github.io/Show-1/

AiBase提要:
🌟 混合架构: Show-1采用像素和潜变模型的混合架构，充分利用两者的优势，实现文本到视频的精确对齐和高效放大。
💻 GPU内存节省: 相比纯像素模型，Show-1仅需使用20-25%的GPU内存，同时在逼真度和文本到视频对齐方面表现出相同或更好的结果。
📄 开源代码: Show-1具有开源代码和模型权重，可供研究社区和开发人员自由使用和进一步研究，可应用于视频生成等多种领域。

LongLoRA:提升LLM上下文能力的创新微调方法

LongLoRA是一种创新的微调方法，可以显著增强大语言模型的上下文处理能力，而无需消耗大量算力资源。它采用了两大步骤的高效微调方法，包括使用转变短注意力（S2-Attn）和有效扩大上下文的技巧，可以在不同任务上取得出色的结果。此外，随着上下文大小的增加，模型的性能更好，为处理复杂任务提供了新的可能性。

开源地址:https://github.com/dvlab-research/LongLoRA

论文地址:https://arxiv.org/abs/2309.12307

🚀 AiBase提要:
1. LongLoRA采用创新的微调方法，提高大语言模型的上下文处理能力。
2. 它使用转变短注意力和有效扩大上下文技巧，在不同任务上表现出色。
3. 随着上下文增加，模型性能提升，尤其擅长处理长文本和复杂对话，为语言模型领域带来新可能性。

AutoAgents:基于LLM的自动代理生成框架

AutoAgents是一个创新性的框架，旨在通过GPT生成不同的角色，以形成协作实体，用于处理复杂任务。无需手动编写规则或代理，AutoAgents利用LLM的能力，可以根据您设定的目标生成多个专家角色代理，这些代理可以协同工作，执行复杂任务，无论是信息搜索、问题解答还是其他各种应用。

项目地址:https://github.com/LinkSoul-AI/AutoAgents

AiBase提要:
🧠 AutoAgents是一个创新性的框架，利用GPT生成不同角色代理，协同处理复杂任务。
🛠 框架核心思想是将问题分解成多个专家角色，自动规划执行计划，确保计划合理性，最后执行操作并输出结果。
📈 AutoAgents具有可扩展性，允许添加自定义代理，提供命令行和WebSocket服务模式，适应不同需求。

🤖📱💼AI应用

Canva发布全套AI设计工具Magic Studio 让设计变得更简单

Canva发布了MagicStudio，这是一套AI设计工具，旨在通过自动化设计任务来使内容创作更加普及，无需设计经验。

体验地址:https://magicstudio.com/zh/

AiBase提要:
🧙‍♂️ Magic Studio引入了诸如Magic Switch等功能，可自动将设计转换为博客、社交媒体帖子、电子邮件等，节省手动编辑的时间。
✨ Canva还推出了Canva Shield，一套旨在防止其AI被用于创建不安全或不适当内容的安全和隐私控制。
🌟 Canva宣布将在未来三年内拨款2亿美元，以支付同意将其设计用于训练公司AI模型的设计师。

中国移动139邮箱推出AI工具支持AI总结、回复

中国移动的139邮箱推出了AI内测体验官招募，新版139邮箱引入AI技术，能够自动提取邮件内容，帮助用户高效管理信息和待办事项。此外，它还支持智能写作，用户可以通过与AI对话自动生成所需内容。

微信截图_20231007082712.png

AiBase提要:
📌 自动提取邮件内容:新版139邮箱引入AI技术，可以自动提取邮件内容，提高信息管理效率。
📌 智能回复功能:AI智能回复功能可以根据用户需求自动回复邮件，解决用词问题。
📌 智能写作支持:新版邮箱支持智能写作，用户可以与AI对话，生成所需内容。

AI创企Reka发布多模态AI助手Yasa-1，欲与ChatGPT竞争

Reka发布Yasa-1，一款多模态AI助手，支持20种语言，速度快于Claude2，竞争ChatGPT。Yasa-1具备多模态能力，支持编程任务，计划扩大功能范围。

AiBase提要:
🚀 Yasa-1是多模态AI助手，支持文本、图像、视频、音频互动，竞争ChatGPT。
🌐 支持20种语言，处理长文档，比Claude2快8倍。
🧠 多模态能力、编程任务、未来功能扩展计划。

（举报）

相关推荐

关键词：

OpenAI

OpenAI的开源模型现已在IBM watsonx.ai上提供

OpenAI发布两款开源AI模型GPT-OSS-120B和GPT-OSS-20B，允许开发者自由下载、运行和定制。其中120B模型已部署在IBM Watsonx.ai平台，采用专家混合架构，支持本地或云端部署，不受商业用途限制。模型具备高透明度，输出完整推理链，在多项基准测试中表现优异。此次发布标志着OpenAI首次加入开源生态，IBM强调其开放战略，为企业提供灵活、安全的AI开发选择。

OpenAI模型 IBM watsonx.ai
OpenAI和科大讯飞，瞄准了同一件事

OpenAI正式发布GPT-5大模型，距离GPT-4推出已29个月。GPT-5虽仍是当前最全面的模型，但性能提升未与主流模型拉开显著差距，部分场景甚至被Grok4和Claude+Opus4.1超越。OpenAI强调此次升级重点在于减少幻觉、提升指令遵循能力和降低模型谄媚性，而非单纯追求性能突破。与此同时，国产大模型代表星火X1也在7月25日升级，同样聚焦解决幻觉问题，在事实性幻觉和忠诚性幻觉治理上取得突破。全球顶尖大模型正从"能用"向"好用"转变，OpenAI和科大讯飞都通过多目标奖励机制和思维链监控等技术手段改善模型可靠性。星火X1已全面赋能教育、医疗、企业应用等行业，在复杂场景任务上满足用户核心需求。大模型产业已进入规模化落地关键期，中国人工智能产业正从追赶走向领先阶段。

GPT-5发布大模型行业 OpenAI
奥尔特曼称自己不适合担任CEO OpenAI上市后或卸任

OpenAI首席执行官Sam Altman近日接受采访时透露，虽然公司正推进数万亿美元级的计算基础设施投资计划，但他对上市后继续担任CEO持保留态度。 Altman坦言，尽管主导着OpenAI多项战略级项目，但自认缺乏上市公司CEO所需的核心管理素质与市场敏感度。他特别强调，上市企业领导者需具备应对复杂投资者关系与监管环境的综合能力，而自己可能并非最优人选。

OpenAI Sam Altman
OpenAI CEO：GPT-6将具备个性化记忆记住用户偏好习惯

OpenAI的首席执行官萨姆奥尔特曼（Sam Altman）在近日的一次专访中，透露了下一代大模GPT-6的最新进展。他表示，GPT-6 的开发正在积极推进中，其发布节奏将比从GPT-4到GPT-5的周期更快。奥尔特曼特别强调，GPT-6将不再局限于单纯回答问题，而是朝着与用户深度适配”的方向演进。他举例描述

GPT-6 OpenAI 萨姆奥尔特曼
博士水平的GPT-5依然翻车 OpenAI奥特曼：AGI已失去意义

上周末OpenAI公司发布了传闻已久的GPT-5大模型，号称迄今为止最先进的人工智能模型，具备博士级别的智能水平。 GPT-5发布之后在多个榜单上确实刷榜了，包括编程、数学等，总计拿到了25个榜单的第一，评分表现很震撼。然而上线之后，GPT-5的实际表现引发质疑，跑分第一不代表实际体验第一，甚至被不少用户认为表现倒退了，反应也变慢，这可能是OpenAI翻车最快的旗舰大�

GPT-5发布人工智能模型 OpenAI整改
GPT-5有望明天发布 OpenAI：免费无限使用

OpenAI宣布将于太平洋时间7月4日上午10点（北京时间7月5日凌晨1点）举办重要直播活动。官方预告中"LIVESTREAM"误写为"LIVE5TREAM"，引发网友猜测可能暗示GPT-5即将发布。消息称免费版ChatGPT将在标准设置下开放GPT-5对话功能，但会设置防滥用阈值；Plus和Pro用户则可享受更智能的GPT-5服务，包括语音交互、绘图创作等高级功能。此前CEO奥特曼曾透露GPT-5将整合多项前沿技术。若属实，这将是AI爱好者的重大福利，也将进一步提升ChatGPT的实用性和用户体验。

OpenAI GPT-5 直播活动
OpenAI正式发布GPT-5模型网友：写作像诗人

OpenAI在直播活动中正式推出新一代人工智能模型GPT-5，宣称其覆盖编程、数学、写作、健康咨询、视觉感知等核心领域，实现"公司迄今为止最重大的模型升级"。OpenAI首席执行官萨姆·奥尔特曼（Sam Altman）形容，与GPT-5交互如同与各领域专家对话，其多维度能力突破将重塑人机协作模式。分层开放策略满足多元需求 GPT-5将于本周四启动全球用户分批推送，免费用户与付�
减少幻觉、不再谄媚！OpenAI：即日起史上最强大的GPT-5将免费提供给用户

这是我们迄今为止最智能、最快、最实用的模型，具有内置思维，可将专家级智能交到每个人手中。” OpenAI在官方新闻稿中写道，这是我们迄今为止最优秀的人工智能系统。GPT-5的智能性能远超我们之前的所有模型，在编码、数学、写作、健康、视觉感知等领域均拥有卓越的性能。 GPT-5 不仅在基准测试中超越了之前的模型，回答问题的速度也更快，而且最重要的是，它对现�

GPT-5发布人工智能模型 OpenAI
OpenAI再获巨额融资：估值突破3000亿美元

OpenAI宣布成功完成新一轮融资，筹集资金高达83亿美元，公司的估值也首次突破3000亿美元大关。此次融资的规模和速度令人瞩目，这再次彰显了人工智能领域竞争的激烈程度。 OpenAI的最新融资计划提前完成，距离年初的融资目标提前数月达到。此前，OpenAI曾宣布计划在2025年筹集40亿美元的资金，软银已承诺提供30亿美元的资金支持。其中，最大投资者是龙骑士投资集团（Drago

OpenAI融资人工智能投资风险投资
GPT5上线大翻车！用户强烈呼吁使用旧版 OpenAI重新上线GPT4o

OpenAI发布最强AI模型GPT-5，但引发用户强烈不满。新模型上线后反应速度变慢、回答质量下降，且官方突然下架GPT-4o等8个旧模型，导致付费用户抗议。部分用户对旧版产生情感依赖，认为GPT-4o更具人性化温暖。第三方测试显示GPT-5在复杂任务上虽有提升，但交互体验明显退步。CEO承认低估用户对旧版的喜爱，承诺将恢复部分旧模型并提供更多定制服务。专家指出大模型边际效益递减，面临数据质量和算力成本限制。总体而言，GPT-5在技术指标进步的同时，牺牲了情感交互体验。

GPT-5发布 OpenAI AI模型淘汰

今日大家都在搜的词：

热文

3 天
7天

AI视野：OpenAI计划自研AI芯片；Canva发布AI设计工具Magic Studio；DocsGPT登顶GitHub热榜；哩布哩布AI重新上线

OpenAI的开源模型现已在IBM watsonx.ai上提供

OpenAI和科大讯飞，瞄准了同一件事

奥尔特曼称自己不适合担任CEO OpenAI上市后或卸任

OpenAI CEO：GPT-6将具备个性化记忆记住用户偏好习惯

博士水平的GPT-5依然翻车 OpenAI奥特曼：AGI已失去意义

GPT-5有望明天发布 OpenAI：免费无限使用

OpenAI正式发布GPT-5模型网友：写作像诗人

减少幻觉、不再谄媚！OpenAI：即日起史上最强大的GPT-5将免费提供给用户

OpenAI再获巨额融资：估值突破3000亿美元

GPT5上线大翻车！用户强烈呼吁使用旧版 OpenAI重新上线GPT4o

今日大家都在搜的词：

热文

罗永浩泡面1小时销售额超280万 2小时售罄：一桶近10元

AI日报：即梦上线智能多帧功能；可灵2.1首尾帧升级；钉钉推语音

李国庆婚礼收到11万余元善款受助学生寄来祝福

REDMI Note 15标准版发布：售价999元起

魅族22延期上热搜：将于9月中上旬发布

小米MIX Flip 2钻石限定版发布：售价6999元

荣耀Magic V Flip2发布：售价5499元起

华为首款鸿蒙MateTV发布支持灵犀触控交互等功能

60岁李国庆谈再婚：妻子是“白月光” 年轻时2次爱而不得

罗永浩官宣明日将公布TBT项目号称九年磨一面

《黑神话:钟馗》先导预告公布游戏科学宣布《黑神话:钟馗》官网

REDMI Note 15 Pro+首搭自研澎湃T1S芯片

AI日报：DeepSeek V3.1正式发布；企业微信5.0推出全新AI能力；

AI日报：阿里开源Qwen-Image-Edit；淘宝“AI万能搜”功能灰度测

罗永浩泡面1小时销售额超280万 2小时售罄：一桶近10元

黑神话官号更名系列游戏将开启宏大篇章

AI日报：智谱AI发布AutoGLM 2.0；腾讯元宝接入腾讯视频；字节发

站长商机