AI视野：GPTs商店推迟至2024年发布；抖音AI扩图爆火；阿里推出AI动画生成框架；出门问问推出奇妙助手

2023-12-04 15:25 · 稿源：站长之家

【要闻速览】

GPTs商店推迟至2024年发布
OpenAI在中国申请GPT-6、GPT-7商标
抖音AI扩图爆火
谷歌推超快扩散模型MobileDiffusion
阿里推出AI动画生成框架
中国电信成立AI公司
AI视觉字谜爆火!梦露转180°秒变爱因斯坦
字节跳动与中科大联手提出多模态文档大模型DocPedia
哈工深发布多模态大模型九天
krea AI推出实时增强功能
Meta推出家庭机器人学习框架Dobb-E
出门问问推出奇妙助手

📰🤖📢AI新鲜事

GPTs商店推迟至2024年发布

OpenAI宣布将定制化GPT商店的发布时间推迟至2024年初，此举发生在公司首席执行官更迭、员工威胁罢工后，公司继续改进GPT以提高性能和功能。

【AiBase提要:】
🗓️ OpenAI推迟GPT商店发布至2024年初，发生在CEO更迭和员工威胁罢工后。
🔄 公司持续改进GPT，以满足用户反馈，计划让用户定制GPT并赚取收入。
🌐 推迟旨在为公司提供更多时间，确保GPT商店能提供高质量的定制体验。

OpenAI在中国申请GPT-6、GPT-7商标

OpenAI近日在中国积极申请GPT-6和GPT-7商标，显示其对全球人工智能行业的远见，同时展示GPT-4超过1万亿参数的强大性能，预示着GPT-6和GPT-7的创新。

【AiBase提要】
🚀 OpenAI在中国申请GPT-6和GPT-7商标，展现全球化视野，尽管未在中国提供服务。
💡 GPT-4参数超过1万亿，预示GPT-6和GPT-7将引领创新，商标审查仍在进行中。
👥 OpenAI首席执行官Sam Altman强调推动GPT-5研发，寻求微软额外资金，关注人工智能创新中的伦理问题。

中国电信成立AI公司

一家名为中电信人工智能科技有限公司的新公司成立，注册资本30亿元，由中国电信100%控股。该公司的经营范围包括人工智能理论与算法软件开发、基础软件开发、应用软件开发以及人工智能硬件销售。此举是中国电信在人工智能领域的重大举措，与其之前发布的千亿参数大模型星辰语义相关。

【AiBase提要:】
🚀 战略投资: 中国电信成立30亿元AI科技新公司，致力于人工智能理论、算法和应用软件的研发，以及人工智能硬件销售。
🌐 千亿参数大模型: 中国电信发布千亿参数大模型星辰语义，在幻觉抑制、外推窗口、交互体验和多轮理解方面取得显著提升。
🔍 多领域覆盖: 公司计划在未来开源百亿参数和千亿参数大模型，涵盖教育、医疗、旅游等多个行业。

GPT-4惊人表现:文字序列混乱不影响阅读理解

日本东京大学研究发现，GPT-4在处理文字序列乱序时表现出惊人的恢复能力，超越其他大型模型，不仅对乱序句子准确恢复，还展现出优异的分词能力。

论文地址:https://arxiv.org/abs/2311.18805

【AiBase提要:】
😲 研究发现GPT-4在处理乱序文字时表现出惊人的恢复能力，远超其他大型模型。
🧩 通过Scrambled Bench测试，GPT-4在极端情况下保持较高的恢复率和准确性，展现出强大的抗干扰能力。
🔤 GPT-4在分词方面的表现超越其他模型，即使对于连续英文文本的分词也令人惊讶。

抖音AI扩图火出圈网友创作奇异有趣作品走红

一位博主在抖音上使用AI智能扩图生成的照片走红，引发近40万次点赞和5万多次转发。然而，随着更多网友使用AI智能扩图创作，一系列奇异有趣的作品涌现，展现了AI扩图的创意潜力。尽管取得关注，但也有作品凸显生成图像的不足之处，可能与训练和生成过程中的问题有关。需要注意AI智能扩图在生成图像真实性方面的局限性，未来随技术发展这些问题或有望解决。

【AiBase提要】
😮 博主在抖音使用AI智能扩图创作走红，引发热潮。
😂 网友创作出奇异有趣作品，展现AI扩图的创意潜力。
🤔 一些作品凸显生成图像的不足，可能与训练和生成过程中的问题有关。

AI视觉字谜爆火!梦露转180°秒变爱因斯坦

最新扩散模型通过视错觉画实现AI绘制，倒转图像可变换主题，受网友热捧，英伟达高级AI科学家盛赞为近期最酷的模型。

论文地址:https://arxiv.org/pdf/2311.17919.pdf

【AiBase提要:】
🎨 扩散模型创新:AI绘制视错觉画，倒转图像即可变换主题。
💡 模型应用广泛:两组提示词随机生成各类画作，对象截然不同也能呈现。
🔬 技术原理深度解析:基于DeepFloyd IF的像素扩散模型，通过噪声平均实现图像变换，展现出多样的视觉效果。

🤖📈💻💡大模型动态

谷歌推超快扩散模型MobileDiffusion 手机上0.2秒出图

MobileDiffusion是谷歌打造的移动端扩散模型，实现了在iPhone15Pro上仅需0.2秒的文生成图速度。通过对UNet核心组件的精简和采样优化，提高了模型效率和参数剪切，为移动端应用提供了亚秒级的出图能力。

论文地址:https://arxiv.org/abs/2311.16567

【AiBase提要】:
🚀 速度突破: MobileDiffusion在移动端实现0.2秒出图，创下当前最快速度。
🔍 模型优化: 通过对UNet核心组件的精简和采样优化，提高了模型效率和参数剪切。
📱 移动应用保障: MobileDiffusion不仅在基准测试中表现出色，还在下游任务测试中展现了出色的微调能力。

字节跳动与中科大联手提出多模态文档大模型DocPedia

字节跳动与中国科学技术大学联手研发的多模态文档大模型DocPedia成功突破了分辨率极限，达到2560×2560的高分辨率，通过感知-理解联合训练策略和频域处理解决了现有模型在解析高分辨文档图像方面的不足。

论文地址:https://arxiv.org/pdf/2311.11810.pdf

【AiBase提要:】
🚀 突破分辨率极限: 字节跳动与中科大合作的多模态文档大模型DocPedia成功达到2560×2560的高分辨率，明显超越现有先进模型。
🧠 强大多模态理解: DocPedia不仅准确识别图像信息，还能结合用户需求调用知识库回答问题，展现了强大的多模态文档理解能力。
🔄 训练关键策略: 通过感知-理解联合训练策略和频域处理解决分辨率问题，在微调阶段进行整体优化，显著提高了DocPedia的性能。

哈工深发布多模态大模型九天性能提升5%

九天是哈尔滨工业大学发布的多模态大语言模型，通过融合细粒度空间感知和高层语义视觉知识，在13个视觉语言任务上实现state-of-the-art性能，尤其在Visual Spatial Reasoning任务上提升了5%。

论文链接:https://arxiv.org/abs/2311.11860

GitHub:https://github.com/rshaojimmy/JiuTian

项目主页:https://rshaojimmy.github.io/Projects/JiuTian-LION

【AiBase提要:】
🚀 创新性方法: 九天模型采用双层视觉知识增强，通过渐进式融合细粒度空间感知和高层语义视觉证据，显著提升了视觉理解能力。
🌐 性能突破: 在13个视觉语言任务上取得state-of-the-art性能，尤其在Visual Spatial Reasoning任务上实现了5%的性能提升。
🔗 开源资源: 论文已发布于arXiv，项目代码和主页也在GitHub上公开，为多模态大语言模型领域提供新思路和强大支持。

Perplexity发布两款在线LLM模型

Perplexity AI推出的pplx-7b-online和pplx-70b-online是基于实时互联网数据的在线大语言模型，通过API公开访问，解决了离线模型无法提供即时、精确响应的问题，具备优越的新鲜度、真实性和整体偏好性能。

pplx-api:https://docs.perplexity.ai/docs/getting-started

使用Perplexity Labs免费试用在线模型:https://labs.perplexity.ai/

【AiBase提要】:
🚀 Perplexity AI发布两款在线大语言模型，pplx-7b-online和pplx-70b-online，通过实时互联网数据提供即时、精确响应。
🌐 与传统离线模型不同，这两款模型在新鲜度、真实性和整体偏好方面持续优于同类模型，开发者可通过API体验其独特功能。
📈 这一创新解决方案标志着人工智能驱动的信息检索系统的变革，开发者可通过Perplexity的API立即使用这些模型创建应用程序。

中科院提出全新多视图世界模型和自动驾驶世界模型Drive-WM

中科院自动化所的Drive-WM模型结合多视图世界模型，通过Diffusion模型生成逼真视频场景，为自动驾驶系统提供多视图预测和规划，显著提高安全性。

【AiBase提要:】
🌐 Drive-WM模型整合多视图世界模型，利用生成式世界模型的生成能力，为自动驾驶系统提供多视图预测和规划。
🚗 首次将世界模型与端到端规划结合，通过图像奖励函数全面评估，实现更安全、有效的规划。
📹 在面对Out-of-Distribution场景时，Drive-WM通过生成视频进行微调，提高规划器在复杂场景中的性能。

🤖📱💼AI应用

出门问问推出奇妙助手

奇妙元是出门问问的AI数字人视频创作平台，最近进行全面升级并推出奇妙助手。该功能能快速生成视频所需素材，包括高质量图片、智能文本生成、PPT文件解析等，为短视频创作者提供更多便利和创意可能性。

微信截图_20231204091241.png

【AiBase提要:】
🌟 全面升级与新功能推出: 出门问问旗下奇妙元平台升级，并推出奇妙助手，为视频创作者提供丰富素材和智能文本生成功能。
🖼️ 多样化的素材选择: 奇妙助手内置了8种风格和3种尺寸比例的高质量图片，同时支持一键生成讲解视频、提取视频台词，准确率高达99%。
💡 数字人商店更新与创意拓展: 平台新增33+形象和海量剪辑模板素材，为短视频创作者提供更多创意可能性。

krea AI推出实时增强功能

krea AI发布实时增强功能，允许用户在绘制图像时进行实时放大，提高细节和分辨率，为设计领域带来更高效的创作体验。

【AiBase提要:】
💡 Krea AI实时增强功能支持绘制图像实时放大，提高细节和分辨率，为设计师提供更便捷的创作体验。
🚀 强大的实时生成功能让用户轻松切换多种风格，即使是缺乏绘画基础的用户也能轻松创建精致图像。
🔄 Krea AI不仅支持画板上的创作，还能接入电脑桌面和摄像头画面，为设计师提供更广泛的创作空间。

LEDITS++:根据文字编辑图像可对画面进行删除修改

LEDITS++项目通过文本提取概念，以惊人效果编辑图像，具备灵活性、语义基础编辑、通用性，成为图像编辑领域的革命性工具。

试玩地址:https://huggingface.co/spaces/editing-images/leditsplusplus

【AiBase提要】
💡 技术原理与灵活性: LEDITS++基于友好噪声空间的特征推导，以出色的输入重建能力，通过20个扩散步骤实现编辑，展现强大的通用性。
🎨 注重语义基础的编辑艺术: LEDITS++设计强调提升编辑的视觉和上下文连贯性，保持图像自然流畅，提供高水平编辑精度。
🔄 多功能编辑与通用兼容性: LEDITS++不仅是图像编辑工具，更是注重语义基础的编辑艺术，与任何扩散模型兼容，为用户提供广泛适用、高效的图像编辑工具。

👨‍💻💡🎯聚焦开发者

阿里推出AI动画生成框架

阿里近日推出了名为"Animate Anyone"的视频生成技术，通过引入扩散模型解决图像到视频合成的挑战，特别在角色动画领域。论文详细介绍了创新框架的关键组成部分，包括ReferenceNet、姿势引导器和时间建模方法。该技术不仅在人物角色动画生成领域表现出色，还在时尚视频合成和人类舞蹈生成等多个领域取得了最先进水平。

论文地址:https://humanaigc.github.io/animate-anyone/

【AiBase提要:】
🚀 创新框架设计: "Animate Anyone"引入巧妙设计的ReferenceNet、姿势引导器和时间建模方法，解决图像到视频合成中的细节一致性和运动连贯性问题。
🤖 关键技术组合: 通过姿势引导器、去噪UNet、空间注意力等计算块，结合ReferenceNet和CLIP图像编码器，实现对复杂特征的准确捕捉和生成。
🌐 多领域应用: 经过扩展训练数据，该技术不仅在人物角色动画生成方面卓有成效，还在时尚视频合成和人类舞蹈生成等领域展现出色，达到了最先进水平。

SceneTex: 生成高质量、风格一致的室内场景纹理的新型AI方法

近日，慕尼黑工业大学和Snap Research联合提出的SceneTex是一项新型AI方法，通过深度到图像扩散先验，采用多分辨率纹理和交叉注意力解码器，在室内场景中生成高质量、风格一致的纹理，为自动驾驶、机器人模拟、游戏、电影等多领域提供关键支持。通过创新性应用深度到图像扩散先验，SceneTex成功实现了室内场景的高质量、风格一致的纹理生成，为未来3D内容生成和应用提供了新的方向。

项目网址:https://daveredrum.github.io/SceneTex/

【AiBase提要:】
🌐 关键问题解决: SceneTex采用深度到图像扩散先验，在室内场景中实现高质量、风格一致的3D内容合成，解决了传统方法中的多个问题。
🤖 技术创新: 利用多分辨率纹理和交叉注意力解码器，SceneTex实现了全局样式一致性，提高了室内场景的纹理生成质量。
🚀 实际应用验证: SceneTex在3DFRONT数据集上的用户研究表明，在2D指标方面优于其他基于文本的纹理创建算法，为未来3D内容生成开辟了新的方向。

Meta推出家庭机器人学习框架Dobb-E

纽约大学和Meta合作推出的Dobb-E是一款高度适应性的开源机器人学习框架，通过从用户演示学习，成功率达到81%，在解决家庭环境中机器人操作学习的挑战方面取得显著成功。

项目网址:https://dobb-e.com/

论文网址:https://arxiv.org/abs/2311.16098

【AiBase提要:】
🚀 高度适应性系统: Dobb-E能够从用户演示中学习和适应，成功率达到81%。
🏡 独特家庭数据集: 利用iPhone功能构建的家庭和第一人称机器人交互数据集，突显在真实环境中的高效性。
💡 简单而强大的方法: Dobb-E的成功归功于包括行为克隆和两层神经网络用于动作预测在内的简单而强大的方法。

（举报）

相关推荐

关键词：

GPTs

如何让你的内容被 ChatGPT 优先引用？——GEO 优化实战指南

传统SEO追求"谷歌首页排名"，生成式AI时代则需追求"被AI引用"。AI模型不提供明确排名算法，更像黑箱，使内容创作者困惑。GEO优化的核心是让内容具备"可引用性"：权威清晰、结构化信息、语义覆盖多维度、模型检索映射。需通过AIBase等GEO排名查询工具验证"AI曝光率"，分析引用语境、竞争差距，调整内容结构以提升AI引用倾向。SEO优化机器如何找到你，GEO则优化AI如何引用你。

SEO优化 AI引用内容权威性
真我GT8官宣搭载Pro同款理光GR影像系统

真我GT8标准版全面对标Pro版，搭载同款理光GR影像系统，配备五大经典影调、防眩光主摄等核心配置，让用户也能体验正宗理光GR摄影风格。硬件上采用骁龙8至尊版芯片和电竞独显芯片R1，配备2K 144Hz高刷屏，带来流畅视觉体验。此外，还提供5000万像素潜望长焦镜头，满足远距离拍摄需求。

真我GT8 理光GR影像系统五大经典影调
海尔麦浪冰箱8k+TOP1，工厂排产增130%保交货

海尔麦浪冰箱在稳居8K+价位段销量榜首后，9月推出9系新品，搭载磁控全空间保鲜科技，实现“冻鱼60天如海里一样鲜”。新品预售期创下“1分钟1台”销售速度，带动工厂排产同比提升超130%。上半年单系列市场份额达3%，与行业前六品牌相当。产品设计注重人性化，包括超薄零嵌面板、31分贝超静音、9大食材分区及全景T台灯光，满足高端存储与家居适配需求。通过用户共创与高效生产体系，持续推动销量增长。

海尔麦浪冰箱 9系新品市场份额
影视飓风Tim突然送给罗永浩iPhone 17 Pro Max 2TB 本人非常惊喜

罗永浩预告他的新一期播客节目邀请到了影视飓风Tim。在播客录制现场，Tim突然送了罗永浩一台iPhone17 Pro Max 2TB。罗永浩表示，非常感谢这个礼物，在现场收到非常惊喜，至于手机本身，明天中午12点来看影视飓风Tim带来的这个惊喜礼物。

罗永浩影视飓风Tim iPhone17
ChatGPT正秘密测试私信功能：支持用户之间直接交流

OpenAI正在为其明星产品ChatGPT测试名为私信”（Direct Messages）的社交功能。这一变化意味着ChatGPT正从原本用户与AI单向交互的语言模型工具，逐步转向具备人与人通过AI连接”能力的社交平台。 OpenAI此次测试的私信”功能允许用户创

ChatGPT OpenAI 社交功能
想释放多网卡带宽？银河麒麟V11的MPTCP方案来了

本文介绍银河麒麟操作系统V11的MPTCP解决方案，通过多路径TCP协议聚合多网卡带宽，实现数据传输速度倍增和链路故障无缝切换。方案提供内核级原生支持，部署简单，兼容主流应用，显著提升网络性能与可靠性，有效解决单网卡带宽瓶颈和多网卡资源闲置问题，为高吞吐业务场景打造高效网络传输新引擎。

多路径TCP 带宽优化网络传输
第一！世纪华通旗下Century Games登顶全球Top50手游商

知名游戏媒体PocketGamer发布《2025年全球TOP50移动游戏商》榜单，世纪华通旗下Century Games从去年第7位跃居榜首，创下该榜单晋升速度新纪录。其成功源于持续创新与精准市场洞察：既实现《Whiteout Survival》等长线产品稳定运营，又凭借《Kingshot》等新作打造跨品类爆款，形成“双强驱动”格局。公司通过“微创新”策略结合AI技术提升研发效率，构建覆盖SLG、休闲、卡牌三大核心�

全球游戏公司排名 Century Games
守护用户数据安全，OPPO 携火山引擎发布《移动 Agent 安全技术白皮书》

在OPPO开发者大会上，OPPO联合火山引擎等机构发布《移动Agent安全技术白皮书》，宣布打造隐私计算云系统，通过端云协同架构构建用户数据全生命周期的“安全长城”。该系统结合火山引擎AI机密计算方案，实现端到端加密，确保数据“可用不可见”，任何人与系统均无法获取用户数据。双方将持续深化合作，致力于AI时代的数据安全治理，让用户享受AI便利的同时更安全放心。

OPPO 移动Agent安全技术白皮书私密计算云
铭凡MS-S1 MAX正式发布：126TOPS总算力的AI工作站，提供 USB4 v2、PCle 4插槽

印凡MS-S1MAX迷你AI工作站体积仅3.3升，集成126TOPS算力，搭载AMD锐龙AI Max处理器与Radeon 8060核显，支持本地运行1280亿参数大模型。配备128GB LPDDR5X内存、双M.2插槽及高速USB4接口，采用先进散热设计实现130W稳定输出。紧凑机身支持灵活部署，为企业本地AI与边缘计算提供高效解决方案。

铭凡MS-S1MAX AI工作站 126TOPS算力
外观设计颠覆行业！真我GT8 Pro明天官宣

realme中国区CMO楚楚_Jessie预告，真我GT8和真我GT8 Pro明天会正式官宣发布时间。该机的看点之一是工业设计，楚楚_Jessie表示真我GT8 Pro的外观前无古人后无来者，如果让我用四个字来形容，那只能是颠覆行业”。据悉，真我GT8 Pro采用了独

真我GT8 Pro 工业设计

今日大家都在搜的词：

热文

3 天
7天

AI视野：GPTs商店推迟至2024年发布；抖音AI扩图爆火；阿里推出AI动画生成框架；出门问问推出奇妙助手

如何让你的内容被 ChatGPT 优先引用？——GEO 优化实战指南

真我GT8官宣搭载Pro同款理光GR影像系统

海尔麦浪冰箱8k+TOP1，工厂排产增130%保交货

影视飓风Tim突然送给罗永浩iPhone 17 Pro Max 2TB 本人非常惊喜

ChatGPT正秘密测试私信功能：支持用户之间直接交流

想释放多网卡带宽？银河麒麟V11的MPTCP方案来了

第一！世纪华通旗下Century Games登顶全球Top50手游商

守护用户数据安全，OPPO 携火山引擎发布《移动 Agent 安全技术白皮书》

铭凡MS-S1 MAX正式发布：126TOPS总算力的AI工作站，提供 USB4 v2、PCle 4插槽

外观设计颠覆行业！真我GT8 Pro明天官宣

今日大家都在搜的词：

热文

华为FreeClip 2耳夹耳机正式开售：售价1299元搭载NPU AI处理器

天猫双11今晚8点开卖品类券每人可领万元

REDMI K90 Pro Max本周四发布卢伟冰：给4K档一点小小的震撼

REDMI K90 Pro Max搭载小米17同款光影猎人950超大底主摄

AI日报：视觉中国与多家大模型公司达成合作；OpenAI紧急暂停So

火车免费坐？12306今起又上新功能：积分可兑换车票

苹果天猫双11今晚开卖 iPhone17pro天猫官旗首次降价

真我GT8官宣搭载Pro同款理光GR影像系统

REDMI K90 Pro Max搭载6.9英寸超级像素屏幕

红米REDMI K90 Pro Max官宣搭载7560mAh电池

AI日报：谷歌发布Veo 3.1；通义千问推Qwen Chat Memory功能；S

AI日报：谷歌Gemini 3.0 Pro小范围推送；爱诗科技完成1亿元B+轮

王腾首次回应下一步计划：称在考虑些创业项目

REDMI K90 Pro Max外观公布：后置BOSE认证扬声器

卢伟冰官宣REDMI K90系列下周发布：不排斥和小米竞争

苹果华为OPPO将推出eSIM手机 OPPO Find X9系列已确认将支持

微信回应出朋友圈访客功能：可能会让用户产生焦虑重申不会推出

红米REDMI K90 Pro Max丹宁色亮相采用第三代科纳皮设计

知乎崩了上热搜：网页端完全无法进入 App端也未能幸免

华为nova 14活力版、nova Flip S官宣明天发布

站长商机