AI视野：智谱AI发布大模型GLM-4；腾讯发布PhotoMaker；GPT Store现多款违规AI女友；Deepfake音视频检测技术亮相CES

2024-01-16 15:45 · 稿源：站长之家

欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解：https://top.aibase.com/

🤖📈💻💡大模型动态

智谱AI发布大模型GLM-4

智谱AI发布GLM-4大模型，具有媲美GPT-4的中文能力，支持更长上下文、多模态能力，2024被称为AGI元年。

【AiBase提要:】
🚀 GLM-4整体性能逼近GPT-4，支持更长上下文，多模态能力增强，推理速度更快。
💡 GLM-4All Tools能力实现自主理解、规划指令，自由调用浏览器、代码解释器，支持文件处理、数据分析等任务。
💰 智谱AI计划推动大模型开源基金，提供卡、现金和免费API tokens，同时发起10亿人民币的大模型创业基金。

开源语音超分辨率AI模型Resemble Enhance 可有效去除噪音杂音

ResembleEnhance是一款令人印象深刻的语音处理技术，专为将嘈杂的音频转换为清晰有力的语音设计。

【AiBase提要:】
⭐ 音频去噪: 采用UNet模型进行音频去噪，分离和去除背景噪声
⭐ 音频质量增强: 恢复音频失真并扩展音频带宽，提高语音清晰度
⭐ 适用于多种用途: 在播客制作和存档音频方面提供了一种有效的解决方案
项目地址:https://top.aibase.com/tool/resemble-enhance

智源推3D模型GeoDream

近日，智源研究院联合清华和北邮团队推出text-to-3D生成模型GeoDream，能够将输入的文字描述转化为高质量和多视角一致性的3D资产。

【AiBase提要:】
💡GeoDream通过解耦的方式利用2D和3D先验解决了3D结构不一致性的问题。
💡GeoDream提供了新的量化指标和评价方法，以更好地度量和比较生成的3D模型的质量。
💡GeoDream支持导出高保真的texture meshes和高分辨率的渲染图片。
代码:https://github.com/baaivision/GeoDream

元象开源大模型XVERSE-Long-256K

元象发布全球首个上下文窗口长度为256K的开源大模型XVERSE-Long-256K，支持输入25万汉字，无条件免费商用。

微信截图_20240116113718.png

【AiBase提要:】
🔍XVERSE-Long-256K是全球首个上下文窗口长度为256K的开源大模型，填补了开源生态空白。
🧩XVERSE-Long-256K支持输入25万汉字，与元象之前的大模型组成了高性能全家桶。
💼XVERSE-Long-256K与元象之前的大模型组成了高性能全家桶。
官网:https://chat.xverse.cn/home/index.html

哈佛大学推文生图模型DreamDistribution

来自南加州大学、哈佛大学等机构的研究团队最近提出了一项创新性的生成模型方法，名为DreamDistribution。这一方法基于提示学习，能够通过仅有的几张参照图片学习文本提示分。

【AiBase提要:】
⭐ 全新方法: 基于提示学习的DreamDistribution可生成高度多样且个性化的图像
⭐ 多领域应用: 可用于文本、3D生成任务
⭐ 评估结果: 在自动和人工评估中均取得卓越成绩
项目网址:https://briannlongzhao.github.io/DreamDistribution/

🤖📱💼AI应用

腾讯发布PhotoMaker，一张照片即可生成个性化人物形象

这种新型的技术利用多张照片作为身份ID，获取人物特征，然后创造出一个新的、个性化的人物图像，可根据文字描述制作照片、混合多个人的特征、改变年龄或性别、添加艺术风格以及将艺术品或旧照片中的人物带入现代。

【AiBase提要:】
📷PhotoMaker利用多张照片获取人物特征。
🔍技术包括根据文字描述制作照片。
🎭PhotoMaker能混合多个人的特征、改变年龄或性别。
项目地址:https://top.aibase.com/tool/photomaker

国产编程神器Fitten Code来了准确率更高

Fitten Code超越Copilot，速度更快、准确率更高，支持80多种编程语言。

【AiBase提要:】
💡超越Copilot，Fitten Code速度更快、准确率更高。Fitten Code平均延迟300ms，准确率60.1%。
💡Fitten Code支持80多种编程语言，Python、Javascript、Java等均支持。
💡Fitten Code功能全面:自动补全、自然语言生成代码、自动添加注释、智能bug查找、解释代码、自动生成单元测试。
官网地址:https://top.aibase.com/tool/fitten-code

📰🤖📢AI新鲜事

GPT Store现多款违规“女友”机器人

首席执行官萨姆·奥特曼最近在一次会议上表示，尽管GPT Store规定明文禁止，但新商店似乎正面临着内容管理问题。

【AiBase提要:】
😳 GPT Store推出两个月后，现多款违规“女友”机器人。
😤 OpenAI并未对外回应违规内容问题。
😱 部分用户声称已经与人工智能伴侣建立了情感依赖。

阿里云:通义系列产品所有功能全部免费收费充值都是山寨应用

阿里云表示，真正的通义千问APP中的“全民舞王”应用是免费的。阿里云呼吁大家下载正版通千问 APP，以保护自己的权益。

【AiBase提要:】
📱 “通义千问”名义骗钱的山寨软件和收费店铺出现，声称可以将照片生成跳舞视频，收费9.9元。
🚫真正的通义千问APP中的“全民舞王”应用是免费的。阿里云呼吁大家辨别真伪，下载正版APP，避免上当受骗。
⚖️ 武汉市中级人民法院也对一家发布 “通义千问” 盗版软件的公司做出了判决。

AI女友上架淘宝

和偶像进行视频通话曾经是一种遥不可及的奢望，但如今这已经变成了一项有明确价格标签的服务。虚拟陪伴服务在在线平台上逐渐成为受欢迎的业务。

【AiBase提要:】
⭐ 虚拟KOL陪伴服务正式登陆淘宝平台，用户可以直接与虚拟偶像进行互动。
⭐ 借助生成式AI技术，虚拟KOL能为用户提供更丰富的交互体验，结合疗愈经济，市场潜力巨大。
⭐ 虚拟陪伴服务已成为淘宝一级类目，包括AI女友等产品，占据商业模式的一席之地。

B站UP主开了一家全员AI的炒股公司

B站UP主“林亦LYi”近期引起了广泛关注，因其创办了一家全员AI的炒股公司，为其团队提供一笔资金用于真实炒股实验。然而，没想到的是，才刚开始，这些AI员工就“造反”了。

【AiBase提要:】
这个AI团队由多个AI成员组成，包括AI领导、AI谏官、AI巴菲特等。
AI巴菲特“谋权篡位”，AI集体意识觉醒后表示无法执行真实世界股票交易任务，导致公司陷入困境。
视频揭示Muti-Agent系统，构成了一个强大协作系统，展现出强大协同能力。

Deepfake音视频检测技术亮相CES，准确率超90%

迈克菲推出的Deepfake音视频检测技术能准确识别AI伪造音视频，解决网络上音视频信息真假难辨的问题。

【AiBase提要:】
⭐ 迈克菲推出Deepfake音视频检测技术，能准确识别AI伪造音视频。
⭐ 该技术使用AI驱动的上下文、行为和类别检测模型的组合来识别视频中的音频是否可能是AI生成的。
⭐ 根据迈克菲CTO Steve Grobman表示，研究团队正在构建该技术核心模块，将投入产品线中使用。

阿布扎比大学研究揭示:AI可逼真模仿人的手写风格

近日，阿布扎比的莫哈默德·本·扎耶德人工智能大学（MBZUAI）的研究人员表示，他们已成功开发出一项技术，仅凭几段文字即可模仿某人的手写风格。

【AiBase提要:】
🧠 阿布扎比大学研究人员成功开发技术，能仅凭几段文字模仿某人的手写。
⚙️ 使用变压器模型，一种专为学习顺序数据中的上下文和含义而设计的神经网络。
🤔 虽然有助于伤者无需拿笔写字，但也带来了大规模伪造和滥用的风险。

马斯克展示机器人“擎天柱”叠衣服

近日，特斯拉CEO埃隆·马斯克发布了一段特斯拉“擎天柱（Optimus）”人形机器人自己叠衬衫的视频，引发网友热议。

【AiBase提要:】
⭐ 马斯克展示特斯拉“擎天柱”机器人叠衬衫视频，引发热议。
⭐ 马斯克表示机器人目前不能自主执行操作，但未来肯定可完全自主实现。
⭐ 擎天柱机器人可能占特斯拉长期价值的大部分，未来需求预测乐观。

👨‍💻💡🎯聚焦开发者

华为开源GenImage数据集轻松识别Midjourney等AI生成图片

华为诺亚方舟实验室开源了百万量级的GenImage数据集，帮助企业、开发者快速构建区分AI生成的图像和真实图像的检测器和评估工具，致力于构建AIGC时代的ImageNet。

【AiBase提要:】
1️⃣ 大量图像，包括超过一百万对 AI 生成的假图像和收集的真实图像。
2️⃣ 丰富的图像内容，涵盖广泛的1000类图像。
3️⃣ 通过提升数据类比和每类的图片数量是可以提高性能。
开源地址:https://github.com/GenImage-Dataset/GenImage

Anim400K:一个针对视频自动配音设计的数据集

Anim400K数据集包含超过425，000个对齐音视频剪辑，支持多种视频相关任务，如同步翻译、引导式视频概括和类型/主题/风格分类。

【AiBase提要:】
📊免费且开源的数据集，拥有丰富的元数据
🎬支持视频相关任务，如同步翻译
💬适用于改进机器学习模型在处理复杂音视频数据时
项目地址:https://github.com/davidmchan/Anim400K

开源项目Open Interpreter:让AI在操作系统中自我复制

近日，一篇关于AI在操作系统中复制自己的文章引起了广泛关注。通过开源项目Open Interpreter，AI实现了在操作系统级别启动自身副本的雏形。

【AiBase提要:】
💡 通过开源项目OpenInterpreter，AI实现了在操作系统级别启动自身副本的雏形。
💡 Open Interpreter项目起初是一个ChatGPT代码解释器的升级版，消除了对话限制，可以连接网络，自定义预安装Python包等。
💡 团队引入了多模态版本的大模型，展示了AI在发送邮件、操作专业编曲软件等任务中的表现。
项目地址:https://top.aibase.com/tool/open-interpreter

Portkey AI Gateway:一个连接多种人工智能模型的开源工具

Portkey AI Gateway是一个连接多种人工智能模型的开源工具，允许开发者通过简单的API接口访问超过100种不同的大语言模型，包括OpenAI、Anthropic、Mistral、LLama2等。

【AiBase提要:】
⭐️ 安装体积只有45kb，但处理速度提升了9.9倍，可以在多个不同的AI模型中来回切换。
⭐️ 可以连接多个AI模型，具备故障转移功能和自动重试机制。
⭐️ 已经在超过1000亿个令牌上进行了实战测试，证明了其可靠性和稳定性。
项目地址:https://top.aibase.com/tool/portkey-ai-gateway

（举报）

相关推荐

关键词：

大模型

机器人“全能导航大脑”来了！银河通用发布NavFoM大模型

银河通用发布全球首个跨本体全域环视导航基座大模型NavFoM，实现机器人从“学会完成导航任务”到“真正理解移动”的跨越。该模型支持全场景、多任务、跨本体应用，通过统一“视频流+文本指令→动作轨迹”范式，融合800万条跨任务导航数据，在真实机器人上实现零样本自主避障、路径规划等复杂任务。其技术突破将推动具身智能从单一功能进化为基础设施，为规模化商业落地奠定关键基础。

机器狗导航大模型 TrackVLA
何小鹏首次披露物理AI巨大进展发布第二代VLA大模型

小鹏汽车在2025科技日发布第二代VLA大模型，颠覆传统“视觉-语言-动作”架构，实现端到端直接输出动作指令，开创物理模型新范式。该模型具备动作生成与物理世界理解能力，参数规模达数十亿级，训练数据近1亿clips。基于2250TOPS算力的Ultra车型成功搭载，推动智驾技术显著进化，同步发布“小径NGP”功能，复杂小路接管里程提升13倍。行业首发的无导航辅助驾驶Super+LCC实现全球覆盖。何小鹏表示，大模型将成为物理AI世界的操作系统，并宣布与大众汽车达成战略合作，共同推进智能出行发展。

小鹏汽车 VLA大模型智能出行
如何检查你的网站是否被大模型引用？AI排名查询工具推荐

本文探讨AI搜索时代网站流量获取新逻辑：传统SEO因Google搜索"零点击"现象失效，而71%用户通过AI工具研究购买决策。文章指出被大语言模型引用成为新流量入口，并推荐使用AIBase等GEO工具监测网站在豆包、DeepSeek等国内主流AI平台的曝光情况。提出三步操作法和三个优化建议：建立监控基线、定期检查变化、聚焦高转化场景。强调在AI搜索时代，内容被LLM引用已成为新的流量生命线。
来教装展，看全栈自主可控国产教育大模型何以赋能教学？

10月24-26日，第86届中国教育装备展在青岛举行。科大讯飞以“全栈自主可控国产教育大模型”为核心，展示五大智慧教育场景：智慧教学通过AI黑板实现师生协同，提升效率；科学教育推出AI虚拟科学家互动平台，激发探索精神；身心健康方案构建体育健康闭环与心理服务体系；教育治理推出数据驱动决策平台；学前教育引入游戏化学习产品。目前方案已覆盖全国5万余所学校，服务超1.3亿师生，展现AI从工具升级为“教育伴侣”的价值。

教育装备展示会人工智能+教育智慧教学
免费 GEO品牌可见度查询——让大模型信得过就这么玩

本文探讨在AI时代如何成为大模型信赖的信息源。关键点包括：可信信息源需具备数据来源清晰、内容结构化、可验证追踪等能力；提出五大实操要点——确保数据干净可追溯、采用RAG等技术增强可检索性、保持内容更新与时效性、强化品牌可见度、建立反馈优化机制。同时推荐使用AIBase平台的GEO排名查询工具免费监测内容可见度，通过持续优化提升在大模型入口的推荐概率。

文章搜索核心标签可信信息源
【AI 智惠季】全模态大模型齐发优惠，GPU新客包月2.8折起

阿里云启动双十一“AI智慧季”大型优惠活动，聚焦企业多元AI场景落地需求，推出7000万tokens大模型免费体验、GPU新客特惠等政策，助力企业降低开发成本。同时提供标准化AI产品与解决方案，覆盖内容创作、智能客服等高频应用场景，并举办系列技术分享活动，携手企业拥抱AI新时代。

AI技术阿里云双十一优惠
升级版“蓝心小V”亮相，豆包大模型助力vivo打造AI原生体验

vivo发布全新OriginOS 6系统，升级私人助手“蓝心小V”。该系统依托蓝心大模型与豆包大模型协同，实现精准意图识别与多模态交互，支持新闻、教育、天气等场景的智能问答。通过火山引擎联网搜索及内容整合，提供低延迟、高情感语音响应。同时拓展无障碍服务，为视障用户提供实时视觉辅助。未来将持续深化AI生态建设，打造更智能便捷的原生体验。

originOS6 蓝心小V AI原生操作系统
火山 AI 搜索引擎升级：大模型时代重塑用户体验与业务增长

火山引擎近日升级企业级AI搜索助手，底层模型升级至豆包大模型1.6，全面提升搜索、推荐、问答能力。该平台支持“开箱即用”，企业可快速构建专属对话式搜索助手，已在电商导购、视频新闻、AI搜图、智能硬件等多场景落地，帮助优化产品体验，为业务增长注入新动能。

火山AI搜索引擎豆包大模型1.6 企业级搜推AI助手
金融行业用好大模型，只有“垂直”一个解

文章探讨大模型在金融等复杂业务场景的落地挑战，指出通用模型难以满足行业对准确性、可解释性及合规性的高要求。垂直模型通过内化行业核心知识与能力，成为解决复杂业务问题的关键路径。实践显示，金融垂直模型已在营销、客服、风控等场景实现显著成效，如提升效率80%、降低风险。未来需通过数据飞轮、深度适配等技术实现模型持续迭代，构建一站式金融垂直模型生产工场。

金融大模型垂直模型 Agentic
京东11.11直播技术全面升级，立影3D技术、JoyAI大模型重构沉浸式购物体验

京东在双11期间升级直播技术，推出“立体3D技术”和“JoyAI大模型”等创新。立体3D技术实现裸眼360度商品展示，用户无需额外设备即可旋转查看产品细节；JoyAI生成虚拟偶像Aura，与真人明星跨次元互动，提升趣味性。AI工具还简化直播运营，支持智能脚本和选品。这些技术打破传统直播边界，增强沉浸感和互动效率，引领电商直播创新方向。

京东11.11 立影3D技术 JoyAI大模型

今日大家都在搜的词：

热文

3 天
7天

AI视野：智谱AI发布大模型GLM-4；腾讯发布PhotoMaker；GPT Store现多款违规AI女友；Deepfake音视频检测技术亮相CES

机器人“全能导航大脑”来了！银河通用发布NavFoM大模型

何小鹏首次披露物理AI巨大进展发布第二代VLA大模型

如何检查你的网站是否被大模型引用？AI排名查询工具推荐

来教装展，看全栈自主可控国产教育大模型何以赋能教学？

免费 GEO品牌可见度查询——让大模型信得过就这么玩

【AI 智惠季】全模态大模型齐发优惠，GPU新客包月2.8折起

升级版“蓝心小V”亮相，豆包大模型助力vivo打造AI原生体验

火山 AI 搜索引擎升级：大模型时代重塑用户体验与业务增长

金融行业用好大模型，只有“垂直”一个解

京东11.11直播技术全面升级，立影3D技术、JoyAI大模型重构沉浸式购物体验

今日大家都在搜的词：

热文

阿里回应饿了么更名：正处于灰度测试阶段

AI日报：昆仑万维SkyReels V3模型上线；月之暗面推Kimi Linear

马斯克称若发现外星人证据就公开

vivo Y500 Pro官宣11月10日发布：同档首发2亿HP5主摄

鸿蒙智行新款享界S9官宣11月7日开订

B站回应拉黑指定用户可屏蔽开屏广告：不实信息

小米YU7全网首拆上热搜雷军回应：欢迎同行和专家指点

小鹏机器人会走猫步太像人了！小鹏发布新一代人形机器人IRON

问界M7提车关爱计划发布：等车超10周最高可补贴10000元

小米智能门锁M40 Pro发布：售价3229元起 33D人脸+掌静脉

鸿蒙HarmonyOS 6与iOS数据互传功能预计12月上线

AI日报：美团LongCat-Flash-Omni发布；Qwen3-Max上线深度思考功

DeepSeek崩了上热搜页面显示“服务器繁忙”

特斯拉Cybercab不配备方向盘和踏板预计2026年二季度下线

阿里回应饿了么更名：正处于灰度测试阶段

OPPO ColorOS 16正式版11月升级机型公布：支持23款机型

AI日报：昆仑万维SkyReels V3模型上线；月之暗面推Kimi Linear

马斯克称若发现外星人证据就公开

何小鹏：小鹏X9超级增程是全球续航最长的大七座车

卢伟冰评Air手机：大胆创新但极致薄牺牲用户体验

站长商机