AI视野：荣耀发布魔法大模型；阿里推开源版FaceChain；钉钉小冰合作推一键定制数字人；微博上线AI评论机器人

2024-01-10 16:34 · 稿源：站长之家

欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解：https://top.aibase.com/

🤖📈💻💡大模型动态

荣耀发布魔法大模型

荣耀发布全新平台级AI大模型——魔法大模型，首次应用于Magic6系列机型，并推出MagicOS8.0，实现了基于用户意图识别的GenAI平台级系统，包括"任意门"功能，打破应用壁垒，交互速度远超iOS17，与百度智能云合作生成专业内容。

微信截图_20240110154236.png

【AiBase提要:】
🔍 AI大模型趋势: 荣耀跟随智能手机发展趋势，将AI大模型整合于生态系统，深入了解用户需求，实现更便捷的生活体验。
🚀 MagicOS8.0创新: MagicOS8.0基于用户意图识别，实现了一秒完成操作的极速交互，同时推出"任意门"功能，提供高效智能的跨应用体验。
🤝 百度智能云合作: 荣耀与百度智能云战略合作，通过魔法大模型生成专业内容，拓展AI在手机领域的应用。

星火大模型将发布最新版

科大讯飞推出基于星火认知大模型的数字员工产品，包括管理、营销、办公三大类，旨在提升企业运营效率;1月30日将发布星火认知大模型的最新版本。

【AiBase提要:】
🚀 管理数字员工产品功能全面，涵盖企业招采、合同起草等，旨在提升企业运营效率。
💼 营销数字员工应用AI技术于销售场景，提升销售团队业绩，在高端零售业有重点应用。
🏢 办公数字员工提供主题创作、文本创建等能力，旨在提高办公效率;1月30日将发布星火认知大模型的最新版本。

新AI模型DPPFA−Net可精准检测到小型3D物体存在

日本立命馆大学研究团队开发的DPPFA−Net模型通过创新策略结合3D LiDAR和2D图像，显著提高小目标检测性能，尤其在恶劣天气条件下表现出色。

【AiBase提要:】
🌐 DPPFA−Net采用多模态方法，结合2D图像和LiDAR数据，显著提高小目标检测性能。
🚗 在KITTI Vision Benchmark测试中，DPPFA−Net在不同噪声条件下平均精度提高了7.18%，展现出强大的鲁棒性。
🤖 模型包括三个创新模块，通过内部和间部特征交互，以及语义对齐，解决了多模态3D物体检测中的挑战，推动了该领域的发展。
项目研究论文:https://ieeexplore.ieee.org/document/10308573/

安徽工程大学开源TinyGPT-V多模态模型

TinyGPT-V是一款性能强大的多模态模型，基于微软Phi-2语言模型和视觉模型EVA，仅有28亿参数但性能媲美上百亿参数的模型。训练只需24G GPU，适用于中小企业和个人开发者，可部署在移动设备上。

【AiBase提要:】
👾 小模型大能力: TinyGPT-V以微软Phi-2和EVA为基础，仅28亿参数却具备强大性能，适用于中小型企业和个人开发者。
🚀 轻量训练: 训练过程只需24G GPU，不依赖高端显卡，可部署在手机、笔记本等移动设备上。
📈 多阶段训练: TinyGPT-V经历热身、预训练、指令调优和多任务调优四个阶段，在视觉语言任务中表现出色。
开源地址:https://github.com/DLYuanGod/TinyGPT-V

斯坦福推新AI模型可快速找出图片中位置

一群斯坦福大学研究生发布的AI模型，通过大量训练可在照片中准确找出位置，准确率达到92%，但引发隐私安全问题。

【AiBase提要:】
🚀 高准确率AI模型: 斯坦福研究生团队发布的AI模型，通过数万训练图片，准确率达到92%，能在40%的猜测中将位置缩小至25公里范围内。
🕵️‍♂️ 隐私安全考虑: 由于模型可能引发隐私问题，项目团队决定不公开模型，仅分享代码，以防止技术滥用。
🛡️ 隐私保护重要性: 对于普通用户而言，隐私保护至关重要，特别是不随意在社交网络上发布周围照片，以避免潜在的隐私问题。
论文地址:https://arxiv.org/pdf/2307.05845.pdf

🤖📱💼AI应用

阿里推开源版“妙鸭”FaceChain

阿里推出开源版FaceChain-FACT，通过Deformable Neural Radiance Fields技术，使用一张用户照片即可生成百种定制肖像，支持多样化肖像风格，填补了个性化肖像生成技术空白。

【AiBase提要】
🚀 FaceChain-FACT采用Deformable Neural Radiance Fields技术，一张用户照片即可生成百种定制肖像。
💡 技术方法包括图像预处理、基于Transformer的面部特征提取器、稳定扩散等，支持多种LoRA模型。
⚡ FaceChain-FACT提高了生成速度和定制化程度，为个性化肖像生成提供高效简便解决方案。
项目地址:https://top.aibase.com/tool/facechain-fact

Luma AI发布文本到3D模型转换工具Genie1.0

Luma AI推出Genie1.0，一款能在10秒内根据文本描述创建逼真3D模型的工具，同时宣布获得4300万美元B轮融资。

QQ截图20240110145324.png

【AiBase提要:】
🚀 Genie1.0是Luma AI的文本到3D模型转换工具，能在短时间内生成包含详细表面材料的逼真3D对象。
💰 Luma AI宣布获得4300万美元B轮融资，由@a16z牵头，为Genie的发展提供有力支持。
📲 Genie生成的3D模型支持导出到各种主流3D文件格式，可在不同软件和平台上使用，工具已在网络和Luma的iOS应用中可试用。
官网地址:https://top.aibase.com/tool/lumaai-genie

AI视频剪辑工具MorphCut:自动删除视频中的多余停顿、语气词等

近期推出的AI视频剪辑工具MorphCut，由华盛顿大学和Adobe研究中心联合开发，通过创新的框架实现自动删除视频中的冗余语气声音，平滑处理跳切，提升观看体验。

【AiBase提要:】
👁️ MorphCut是由华盛顿大学和Adobe研究中心合作开发的AI视频剪辑工具。
🎞️ 功能特点包括面部细节关注、面部标记操控和跨模态注意力机制，特别擅长处理人物头部转动问题。
⏰ 自动删除语气词和平滑转头动作处理，使观众几乎感觉不到剪辑痕迹，为视频编辑节省时间和精力。
项目地址:https://top.aibase.com/tool/morphcut

📰🤖📢AI新鲜事

英特尔正将AI PC引入汽车领域

英特尔宣布推出首个面向汽车领域的AI聚焦芯片，计划提升语音助手和主动安全功能，中国吉利旗下的极氪将成为首家搭载这一新技术的汽车制造商。

【AiBase提要】:
🧠 Intel发布首款面向汽车领域的AI聚焦芯片，旨在提升语音助手和主动安全功能。
🚙 中国吉利旗下的极氪（Zeekr）将成为首家安装这些新芯片的汽车制造商，首款搭载Intel AI硬件的Zeekr车型将于今年年底推出。
⚙️ Intel计划推出一系列用于软件定义汽车的芯片，预计在2024年底首次亮相，以提高汽车内体验。

钉钉与小冰公司达成合作推出一键定制数字人服务

钉钉与小冰公司合作推出一键定制数字人服务，用户可通过钉钉参与数字人内测，并在钉钉视频号发布数字人视频。

【AiBase提要:】
🔍 钉钉与小冰公司合作推出一键定制数字人服务。
📱 用户可通过数字人内测，在钉钉视频号发布个性化数字人视频。
🚀 合作涵盖钉钉视频号、直播、视频会议、AI助理等领域，助力用户多种活动。

Rabbit推出独立人工智能设备R1

CES2024展会上，Rabbit推出售价199美元的独立人工智能设备R1，外观现代化，配备2.88英寸触摸屏、旋转摄像头、2.3GHz MediaTek处理器等。

QQ截图20240110094100.jpg

【AiBase提要:】
🔍 R1是199美元的独立AI设备，外观现代化，配置强大。
🔄 Rabbit OS采用"大型操作模型"，通过简单提问实现各种功能。
🌐 Rabbit的愿景是将R1连接为一个超级应用程序，具备广泛的应用场景。

Rabbit tech开发AI系统LAM 说话就能指挥系统完成任何APP操作

Rabbittech最新开发的AI系统LAM，通过神经符号编程技术，能够用自然语言指挥完成任何应用程序的操作，提供更可靠和便捷的用户体验。

QQ截图20240110100952.png

【AiBase提要】
🐇 先进技术: Rabbittech的LAM系统采用神经符号编程技术，能够直接建模应用程序结构，实现与最先进方法媲美的准确性、可解释性和速度。
🗣️ 语音控制: LAM系统允许用户通过自然语言打字或说话指挥完成任何应用程序操作，同时兼容现有所有应用程序，无需丢弃已有数据。
🚀 广泛应用: 适用于各种人工智能助手和操作系统，为下一代自然语言驱动的消费者体验提供支持。
项目地址:https://top.aibase.com/tool/lam

科学家创新技术用更少的GPU训练ChatGPT级别万亿参数模型

科学家们在世界上最强大的超级计算机上取得了巨大突破，仅使用其8%的计算能力，成功训练了一个与ChatGPT规模相当的模型。

【AiBase提要:】
🌐 科学家在全球最强超级计算机上仅使用8%算力，成功训练出与ChatGPT规模相当的模型。
🚀 利用分布式训练策略和并行技术，在Frontier计算能力8%的情况下，实现1750亿和1万亿参数模型的百分之百弱扩展效率。
💡 尽管取得突破，训练拥有万亿参数的语言模型仍面临挑战，需要解决内存问题及在非Nvidia平台上进行高效训练。

Quora融资7.5亿美元

Quora成功融资7.5亿美元，将资金用于加速发展AI聊天机器人平台Poe，致力于打造基于AI的创作者经济。

【AiBase提要:】
💰 融资巨额: Quora成功融资7，500万美元，资金将用于加速发展其AI聊天机器人平台Poe。
🌐 创作者经济: Quora致力于打造基于AI聊天机器人的创作者经济，让创作者通过构建有趣的AI机器人来实现收入。
🚀 平台增长: 自Poe一年前推出以来，Quora取得了不俗的增长，拥有超过4亿月活跃用户，融资估值为5亿美元。

沃尔玛押注AI服务帮助用户更快选购货物

沃尔玛正致力于通过人工智能（AI）技术改进购物体验，其中包括推出一项名为InHome的补货服务，旨在实现全自动杂货补货，让用户无需亲自购物。

【AiBase提要:】
🏠 沃尔玛计划推出InHome服务，通过学习用户购物习惯实现全自动杂货补货，减轻用户选购负担。
🤖 AI技术生成个性化购物清单，帮助用户在正确时间订购所需物品，通过InHome服务送达用户家中。
🚀 沃尔玛投资生成式AI搜索引擎，让用户通过更广泛的查询方式轻松搜索商品，提升购物体验。

微博上线AI评论机器人“罗伯特”

微博推出的AI评论机器人“罗伯特”以其抽象、幽默的评论风格在社交网络引起轰动，但引发网友对语言质量的担忧。

【AiBase提要:】
🤖 独特风格:微博AI评论机器人“罗伯特”以抽象、幽默的评论风格受欢迎，成为热搜榜常客。
🤔 担忧表达:网友担忧该机器人广泛参与话题讨论，可能在未来制造更多“引战”话题，加剧舆论冲突。
🤯 语言质量争议:机器人评论的抽象风格引发对微博语言质量的担忧，有人认为超越其他社交平台。

（举报）

相关推荐

关键词：

大模型

荐AI营销席卷中东，Infinix和Snapchat首个AI营销合作如何在当地实现破圈？

开年以来，AI 图片赛道迎来一轮小高潮。今年3月，在我们统计的月访问量超200万的 Web 端 AI 图片产品中，有45款产品访问量呈现环比上涨，最高增幅超过600%。这些爆款背后的共同特征，是一股席卷社交平台的“吉卜力风”。回顾2022年至今几轮 AI 爆款产品（如 Lensa、妙鸭相机、黏土滤镜、吉卜力），其流量爆发的逻辑始终贯穿着四大共性:操作门槛极低、个性表达鲜明、用户�

AI图片社交平台吉卜力风
荐AI日报：阿里开源3D数字人项目MNN TaoAvatar；MiniMax Agent上线；罗永浩数字人直播再探“AI+IP”带货模式

本文汇总了AI领域最新动态：1）阿里开源MNN+TaoAvatar技术，实现手机端3D数字人实时交互；2）MiniMax升级AI工具Agent，新增智能图像搜索和多语言支持；3）罗永浩数字人将登陆百度电商直播；4）OpenAI员工套现近30亿美元，软银成最大接盘方；5）ChatGPT推出深度研究和语音模式升级；6）Meta发布V-JEPA2模型，提升机器人环境适应能力；7）AMD与OpenAI合作推出新一代AI芯片；8）Google Gemini集成Imagen4图像生成模型；9）谷歌AI实现10公里级精准天气预报；10）Gartner预测到2028年80%的AI应用开发时间将缩短50%。

人工智能虚拟现实 3D数字人
荐AI日报：豆包大模型1.6发布；OpenAI推o3-pro模型、o3价格暴降80%；Figma官方MCP重磅上线

【AI日报】今日AI领域重要动态：1)火山引擎发布豆包大模型1.6和视频生成模型Seedance1.0pro，性能显著提升；2)OpenAI推出o3-pro模型，专注可靠性但响应较慢；3)Figma推出Dev Mode MCP服务，实现设计到代码一键转换；4)Krea AI发布图像生成模型Krea1，解决传统AI绘图问题；5)火山引擎豆包日调用量突破16.4万亿次；6)法国Mistral发布推理模型Magistral；7)苹果系统整合ChatGPT图像生成功能；8)OpenAI大幅下调o3价格80%并推出o3-pro；9)Hugging Face开源榜单显示中国团队Qwen与DeepSeek进入全球前15；10)阿里开源MaskSearch框架，提升AI解决复杂问题能力。

人工智能 AI产品视频生成
国内有哪些ai大模型？一文看懂中国核心AI大模型全景

近两年中国AI大模型发展迅猛，已形成"通用+行业"双轨并进的生态格局。百度文心一言、阿里通义千问等通用大模型在中文理解、多模态生成等方面表现突出；深度求索DeepSeek以1/10参数实现GPT-4级推理能力；月之暗面Kimi以20万汉字上下文窗口领跑长文本处理；智谱AI的GLM-4成为首个支持视频对话的国产千亿模型。医疗、金融等垂直领域涌现出百川智能等专业模型，覆盖超1000家医院。开源生态加速国产芯片适配，15家厂商完成深度优化。行业应用方面，工程文档效率提升60%，24小时拟人化客服等案例凸显价值。未来趋势呈现模型蒸馏、端侧部署和开源生态三大方向，中国AI正从实验室走向产业变革前沿。

AI大模型中国AI发展文心一言
荐AI日报：MiniMax推视频生成模型Hailuo 02；Cursor Pro取消500次请求限制；谷歌发布AI模型 Gemini 2.5 Flash-Lite

本文汇总了AI领域最新动态：1)Cursor Pro取消500次请求限制；2)稀宇科技推出视频生成模型Hailuo02；3)谷歌发布轻量级AI模型Gemini2.5Flash-Lite；4)科大讯飞星火X1升级版7月上线；5)腾讯元宝推出AI编程模式；6)OpenAI将下架GPT-4.5 API；7)苹果Speech API转录速度超Whisper 55%；8)百度推出数字人互动直播间；9)Meta曾试图高薪挖角OpenAI人才；10)Krea1公测开放，解决"AI感"问题；11)特斯拉Grok车载AI助手即将上线；12)谷歌Gemini新增视频分析功能。

人工智能开发者技术趋势
华为云发布盘古大模型5.5，宣布新一代昇腾AI云服务上线，成就行业AI先锋

华为开发者大会2025（HDC2025）在东莞篮球中心开幕，发布多项AI创新成果：1）推出基于CloudMatrix384超节点的新一代昇腾AI云服务，单卡推理吞吐量提升4倍；2）发布盘古大模型5.5，NLP、CV等五大基础模型全面升级，其中718B深度思考模型采用256专家MoE架构；3）推出行业首个统一预测架构Triplet Transformer，覆盖钢铁、水泥等多个工业场景；4）发布300亿参数视觉大模型，支持多维感知分析；5）升级盘古助手Doer，新增6大开发领域专业Agent。华为云宣布开发者突破800万，将构建昇腾、鸿蒙、鲲鹏等技术生态。

华为开发者大会 HarmonyOS 昇腾AI云服务
玄武云出席崔牛会AI活动，聊聊AI大模型如何掌握终端信息

6月20日，崔牛会主办的AI发现者计划之AI+OPEN DAY在广州举办，玄武云与百度云等企业围绕AI大模型应用展开探讨。玄武云分享了快消行业数字化转型解决方案，推出SKU超级模型和价签识别模型，帮助品牌商提升终端管理效率。其中SKU模型覆盖6000+商品，识别准确率达90%；价签模型准确率85%，已应用于知名薯片品牌。通过AI技术实现商品陈列优化、价格监控和渠道布局分析，助力快消企业从经验驱动转向数据智能驱动，在存量市场中创造增量价值。
荐AI日报：阿里通义推Qwen-TTS模型；Cursor已支持网页和手机端；字节发布图像合成技术XVerse

【AI日报】今日AI领域7大突破：1）阿里通义Qwen-TTS实现方言语音合成重大突破；2）Cursor发布Web版AI编程工具；3）字节XVerse技术实现多对象精准图像生成；4）NoteGen跨平台AI笔记工具革新知识管理；5）ManimML动画库可视化Transformer架构；6）TEN+Agent开源语音交互技术降低延迟；7）Chai-2抗体设计模型将药物研发周期缩短至两周。淘宝同时上线RecGPT推荐模型提升购物体验。

人工智能语音合成 Qwen-TTS
荐AI日报：百度发布“绘想”平台与MuseSteamer；阿里音频驱动全身数字人模型OmniAvatar

【AI日报】今日AI领域重要动态：1.开源语音大模型Step-Audio-AQAA发布，实现音频到语音的端到端自然转换；2.百度推出"绘想"平台与MuseSteamer，通过AI一键生成专业级视频；3.浙大与阿里联合发布OmniAvatar，音频驱动数字人技术取得突破；4.百度搜索迎十年来最大改版，新增智能框、百看和AI助手功能；5.xAI开发者控制台新增Grok4及Grok4Code引用，预示新一代AI模型即将发布；6.Gemin

人工智能语音识别开源模型
自研大模型遥遥无期！苹果Siri考虑用外援：转向OpenAI合作

据媒体报道，知名爆料人马克古尔曼透露，苹果正重新评估其人工智能发展策略，考虑放弃自研大语言模型（LLM）计划，转而与OpenAI展开合作谈判。若合作达成，苹果原定于2026年推出的基于自研Apple Foundation Models”的Siri升级计划可能被搁置，这一变动或引发行业广泛关注。目前，由苹果AI负责人约翰詹南德雷亚（John Giannandrea）主导的LLM Siri”项目仍在进行中，但进展不及预�

苹果人工智能 Siri

热文

3 天
7天

AI视野：荣耀发布魔法大模型；阿里推开源版FaceChain；钉钉小冰合作推一键定制数字人；微博上线AI评论机器人

荐AI营销席卷中东，Infinix和Snapchat首个AI营销合作如何在当地实现破圈？

荐AI日报：阿里开源3D数字人项目MNN TaoAvatar；MiniMax Agent上线；罗永浩数字人直播再探“AI+IP”带货模式

荐AI日报：豆包大模型1.6发布；OpenAI推o3-pro模型、o3价格暴降80%；Figma官方MCP重磅上线

国内有哪些ai大模型？一文看懂中国核心AI大模型全景

荐AI日报：MiniMax推视频生成模型Hailuo 02；Cursor Pro取消500次请求限制；谷歌发布AI模型 Gemini 2.5 Flash-Lite

华为云发布盘古大模型5.5，宣布新一代昇腾AI云服务上线，成就行业AI先锋

玄武云出席崔牛会AI活动，聊聊AI大模型如何掌握终端信息

荐AI日报：阿里通义推Qwen-TTS模型；Cursor已支持网页和手机端；字节发布图像合成技术XVerse

荐AI日报：百度发布“绘想”平台与MuseSteamer；阿里音频驱动全身数字人模型OmniAvatar

自研大模型遥遥无期！苹果Siri考虑用外援：转向OpenAI合作

热文

华为Mate X5折叠屏降价：8999元起至高优惠4000元

微信：聊天记录备份和迁移已支持外部存储设备可自动备份

罗马仕辟谣倒闭称定将努力解决一切问题

站长商机