首页 > 业界 > 关键词  > 大模型最新资讯  > 正文

AI视野:荣耀发布魔法大模型;阿里推开源版FaceChain;钉钉小冰合作推一键定制数字人;微博上线AI评论机器人

2024-01-10 16:34 · 稿源:站长之家

欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://top.aibase.com/

🤖📈💻💡大模型动态

荣耀发布魔法大模型

荣耀发布全新平台级AI大模型——魔法大模型,首次应用于Magic6系列机型,并推出MagicOS8.0,实现了基于用户意图识别的GenAI平台级系统,包括"任意门"功能,打破应用壁垒,交互速度远超iOS17,与百度智能云合作生成专业内容。

微信截图_20240110154236.png

【AiBase提要:】

🔍 AI大模型趋势: 荣耀跟随智能手机发展趋势,将AI大模型整合于生态系统,深入了解用户需求,实现更便捷的生活体验。

🚀 MagicOS8.0创新: MagicOS8.0基于用户意图识别,实现了一秒完成操作的极速交互,同时推出"任意门"功能,提供高效智能的跨应用体验。

🤝 百度智能云合作: 荣耀与百度智能云战略合作,通过魔法大模型生成专业内容,拓展AI在手机领域的应用。

星火大模型将发布最新

科大讯飞推出基于星火认知大模型的数字员工产品,包括管理、营销、办公三大类,旨在提升企业运营效率;1月30日将发布星火认知大模型的最新版本。

【AiBase提要:】

🚀 管理数字员工产品功能全面,涵盖企业招采、合同起草等,旨在提升企业运营效率。

💼 营销数字员工应用AI技术于销售场景,提升销售团队业绩,在高端零售业有重点应用。

🏢 办公数字员工提供主题创作、文本创建等能力,旨在提高办公效率;1月30日将发布星火认知大模型的最新版本。

新AI模型DPPFA−Net可精准检测到小型3D物体存在

日本立命馆大学研究团队开发的DPPFA−Net模型通过创新策略结合3D LiDAR和2D图像,显著提高小目标检测性能,尤其在恶劣天气条件下表现出色。

【AiBase提要:】

🌐 DPPFA−Net采用多模态方法,结合2D图像和LiDAR数据,显著提高小目标检测性能。

🚗 在KITTI Vision Benchmark测试中,DPPFA−Net在不同噪声条件下平均精度提高了7.18%,展现出强大的鲁棒性。

🤖 模型包括三个创新模块,通过内部和间部特征交互,以及语义对齐,解决了多模态3D物体检测中的挑战,推动了该领域的发展。

项目研究论文:https://ieeexplore.ieee.org/document/10308573/

安徽工程大学开源TinyGPT-V多模态模型

TinyGPT-V是一款性能强大的多模态模型,基于微软Phi-2语言模型和视觉模型EVA,仅有28亿参数但性能媲美上百亿参数的模型。训练只需24G GPU,适用于中小企业和个人开发者,可部署在移动设备上。

【AiBase提要:】

👾 小模型大能力: TinyGPT-V以微软Phi-2和EVA为基础,仅28亿参数却具备强大性能,适用于中小型企业和个人开发者。

🚀 轻量训练: 训练过程只需24G GPU,不依赖高端显卡,可部署在手机、笔记本等移动设备上。

📈 多阶段训练: TinyGPT-V经历热身、预训练、指令调优和多任务调优四个阶段,在视觉语言任务中表现出色。

开源地址:https://github.com/DLYuanGod/TinyGPT-V

斯坦福推新AI模型 可快速找出图片中位置

一群斯坦福大学研究生发布的AI模型,通过大量训练可在照片中准确找出位置,准确率达到92%,但引发隐私安全问题。

image.png

【AiBase提要:】

🚀 高准确率AI模型: 斯坦福研究生团队发布的AI模型,通过数万训练图片,准确率达到92%,能在40%的猜测中将位置缩小至25公里范围内。

🕵️‍♂️ 隐私安全考虑: 由于模型可能引发隐私问题,项目团队决定不公开模型,仅分享代码,以防止技术滥用。

🛡️ 隐私保护重要性: 对于普通用户而言,隐私保护至关重要,特别是不随意在社交网络上发布周围照片,以避免潜在的隐私问题。

论文地址:https://arxiv.org/pdf/2307.05845.pdf

🤖📱💼AI应用

阿里推开源版“妙鸭”FaceChain

阿里推出开源版FaceChain-FACT,通过Deformable Neural Radiance Fields技术,使用一张用户照片即可生成百种定制肖像,支持多样化肖像风格,填补了个性化肖像生成技术空白。

image.png

【AiBase提要】

🚀 FaceChain-FACT采用Deformable Neural Radiance Fields技术,一张用户照片即可生成百种定制肖像。

💡 技术方法包括图像预处理、基于Transformer的面部特征提取器、稳定扩散等,支持多种LoRA模型。

⚡ FaceChain-FACT提高了生成速度和定制化程度,为个性化肖像生成提供高效简便解决方案。

项目地址:https://top.aibase.com/tool/facechain-fact

Luma AI发布文本到3D模型转换工具Genie1.0

Luma AI推出Genie1.0,一款能在10秒内根据文本描述创建逼真3D模型的工具,同时宣布获得4300万美元B轮融资。

QQ截图20240110145324.png

【AiBase提要:】

🚀 Genie1.0是Luma AI的文本到3D模型转换工具,能在短时间内生成包含详细表面材料的逼真3D对象。

💰 Luma AI宣布获得4300万美元B轮融资,由@a16z牵头,为Genie的发展提供有力支持。

📲 Genie生成的3D模型支持导出到各种主流3D文件格式,可在不同软件和平台上使用,工具已在网络和Luma的iOS应用中可试用。

官网地址:https://top.aibase.com/tool/lumaai-genie

AI视频剪辑工具MorphCut:自动删除视频中的多余停顿、语气词等

近期推出的AI视频剪辑工具MorphCut,由华盛顿大学和Adobe研究中心联合开发,通过创新的框架实现自动删除视频中的冗余语气声音,平滑处理跳切,提升观看体验。

image.png

【AiBase提要:】

👁️ MorphCut是由华盛顿大学和Adobe研究中心合作开发的AI视频剪辑工具。

🎞️ 功能特点包括面部细节关注、面部标记操控和跨模态注意力机制,特别擅长处理人物头部转动问题。

⏰ 自动删除语气词和平滑转头动作处理,使观众几乎感觉不到剪辑痕迹,为视频编辑节省时间和精力。

项目地址:https://top.aibase.com/tool/morphcut

📰🤖📢AI新鲜事

英特尔正将AI PC引入汽车领域

英特尔宣布推出首个面向汽车领域的AI聚焦芯片,计划提升语音助手和主动安全功能,中国吉利旗下的极氪将成为首家搭载这一新技术的汽车制造商。

【AiBase提要】:

🧠 Intel发布首款面向汽车领域的AI聚焦芯片,旨在提升语音助手和主动安全功能。

🚙 中国吉利旗下的极氪(Zeekr)将成为首家安装这些新芯片的汽车制造商,首款搭载Intel AI硬件的Zeekr车型将于今年年底推出。

⚙️ Intel计划推出一系列用于软件定义汽车的芯片,预计在2024年底首次亮相,以提高汽车内体验。

钉钉与小冰公司达成合作 推出一键定制数字人服务

钉钉与小冰公司合作推出一键定制数字人服务,用户可通过钉钉参与数字人内测,并在钉钉视频号发布数字人视频。

【AiBase提要:】

🔍 钉钉与小冰公司合作推出一键定制数字人服务。

📱 用户可通过数字人内测,在钉钉视频号发布个性化数字人视频。

🚀 合作涵盖钉钉视频号、直播、视频会议、AI助理等领域,助力用户多种活动。

Rabbit推出独立人工智能设备R1

CES2024展会上,Rabbit推出售价199美元的独立人工智能设备R1,外观现代化,配备2.88英寸触摸屏、旋转摄像头、2.3GHz MediaTek处理器等。

QQ截图20240110094100.jpg

【AiBase提要:】

🔍 R1是199美元的独立AI设备,外观现代化,配置强大。

🔄 Rabbit OS采用"大型操作模型",通过简单提问实现各种功能。

🌐 Rabbit的愿景是将R1连接为一个超级应用程序,具备广泛的应用场景。

Rabbit tech开发AI系统LAM 说话就能指挥系统完成任何APP操作

Rabbittech最新开发的AI系统LAM,通过神经符号编程技术,能够用自然语言指挥完成任何应用程序的操作,提供更可靠和便捷的用户体验。

QQ截图20240110100952.png

【AiBase提要】

🐇 先进技术: Rabbittech的LAM系统采用神经符号编程技术,能够直接建模应用程序结构,实现与最先进方法媲美的准确性、可解释性和速度。

🗣️ 语音控制: LAM系统允许用户通过自然语言打字或说话指挥完成任何应用程序操作,同时兼容现有所有应用程序,无需丢弃已有数据。

🚀 广泛应用: 适用于各种人工智能助手和操作系统,为下一代自然语言驱动的消费者体验提供支持。

项目地址:https://top.aibase.com/tool/lam

科学家创新技术用更少的GPU训练ChatGPT级别万亿参数模型

科学家们在世界上最强大的超级计算机上取得了巨大突破,仅使用其8%的计算能力,成功训练了一个与ChatGPT规模相当的模型。

【AiBase提要:】

🌐 科学家在全球最强超级计算机上仅使用8%算力,成功训练出与ChatGPT规模相当的模型。

🚀 利用分布式训练策略和并行技术,在Frontier计算能力8%的情况下,实现1750亿和1万亿参数模型的百分之百弱扩展效率。

💡 尽管取得突破,训练拥有万亿参数的语言模型仍面临挑战,需要解决内存问题及在非Nvidia平台上进行高效训练。

Quora融资7.5亿美元

Quora成功融资7.5亿美元,将资金用于加速发展AI聊天机器人平台Poe,致力于打造基于AI的创作者经济。

【AiBase提要:】

💰 融资巨额: Quora成功融资7,500万美元,资金将用于加速发展其AI聊天机器人平台Poe。

🌐 创作者经济: Quora致力于打造基于AI聊天机器人的创作者经济,让创作者通过构建有趣的AI机器人来实现收入。

🚀 平台增长: 自Poe一年前推出以来,Quora取得了不俗的增长,拥有超过4亿月活跃用户,融资估值为5亿美元。

沃尔玛押注AI服务 帮助用户更快选购货物

沃尔玛正致力于通过人工智能(AI)技术改进购物体验,其中包括推出一项名为InHome的补货服务,旨在实现全自动杂货补货,让用户无需亲自购物。

【AiBase提要:】

🏠 沃尔玛计划推出InHome服务,通过学习用户购物习惯实现全自动杂货补货,减轻用户选购负担。

🤖 AI技术生成个性化购物清单,帮助用户在正确时间订购所需物品,通过InHome服务送达用户家中。

🚀 沃尔玛投资生成式AI搜索引擎,让用户通过更广泛的查询方式轻松搜索商品,提升购物体验。

微博上线AI评论机器人“罗伯特”

微博推出的AI评论机器人“罗伯特”以其抽象、幽默的评论风格在社交网络引起轰动,但引发网友对语言质量的担忧。

【AiBase提要:】

🤖 独特风格:微博AI评论机器人“罗伯特”以抽象、幽默的评论风格受欢迎,成为热搜榜常客。

🤔 担忧表达:网友担忧该机器人广泛参与话题讨论,可能在未来制造更多“引战”话题,加剧舆论冲突。

🤯 语言质量争议:机器人评论的抽象风格引发对微博语言质量的担忧,有人认为超越其他社交平台。

举报

  • 相关推荐
  • 登榜LMArena!文心大模型5.0-Preview文本能力国内第一

    11月8日,文心全新模型ERNIE-5.0-Preview-1022在LMArena大模型竞技场排名中位列全球第二、中国第一。该模型在创意写作、复杂长问题理解和指令遵循方面表现突出,超越多款国内外主流模型。创意写作可高效生成文章、营销文案等内容;复杂长问题理解适用于学术问答、报告分析等任务;指令遵循能力支持智能助理、代码生成等场景,为多领域内容生产提供高效支撑。

  • 易鑫正式发布汽车金融行业首个Agentic大模型

    易鑫在2025世界互联网大会乌镇峰会上发布汽车金融行业首个Agentic大模型XinMM-AM1。该模型参数量约300亿,响应延迟低于200毫秒,支持语音实时交互,单卡吞吐达370 tokens/秒,可提升获客、风控与运营效率,解决行业周期长、交互多、决策复杂等难题。易鑫作为AI驱动的金融科技平台,研发投入超20亿元,率先实现AI全场景应用,将持续推动智能汽车金融生态建设。

  • 大模型+反诈+算力三重突破 腾讯云三项成果闪耀金融科技应用场景大赛

    10月30日,2025金融街论坛年会金融科技大会公布“金融科技应用场景大赛”终评结果。腾讯云“金融反电诈治理方案”与“基于TCS的AI异构算力管理平台”凭借技术创新性与场景落地能力,从全国89家机构的280个项目中脱颖而出,双双荣获“十佳应用奖”。腾讯混元大模型信贷助手方案获“探索实践奖”。三大方案在金融风控、算力基座及大模型应用三个关键领域展现突出优势,获专家团高度认可。大赛自2021年启动,已成为金融科技领域极具影响力的赛事平台。

  • 机器人“全能导航大脑”来了!银河通用发布NavFoM大模型

    银河通用发布全球首个跨本体全域环视导航基座大模型NavFoM,实现机器人从“学会完成导航任务”到“真正理解移动”的跨越。该模型支持全场景、多任务、跨本体应用,通过统一“视频流+文本指令→动作轨迹”范式,融合800万条跨任务导航数据,在真实机器人上实现零样本自主避障、路径规划等复杂任务。其技术突破将推动具身智能从单一功能进化为基础设施,为规模化商业落地奠定关键基础。

  • 如何检查你的网站是否被大模型引用?AI排名查询工具推荐

    本文探讨AI搜索时代网站流量获取新逻辑:传统SEO因Google搜索"零点击"现象失效,而71%用户通过AI工具研究购买决策。文章指出被大语言模型引用成为新流量入口,并推荐使用AIBase等GEO工具监测网站在豆包、DeepSeek等国内主流AI平台的曝光情况。提出三步操作法和三个优化建议:建立监控基线、定期检查变化、聚焦高转化场景。强调在AI搜索时代,内容被LLM引用已成为新的流量生命线。

  • 何小鹏首次披露物理AI巨大进展 发布第二代VLA大模型

    小鹏汽车在2025科技日发布第二代VLA大模型,颠覆传统“视觉-语言-动作”架构,实现端到端直接输出动作指令,开创物理模型新范式。该模型具备动作生成与物理世界理解能力,参数规模达数十亿级,训练数据近1亿clips。基于2250TOPS算力的Ultra车型成功搭载,推动智驾技术显著进化,同步发布“小径NGP”功能,复杂小路接管里程提升13倍。行业首发的无导航辅助驾驶Super+LCC实现全球覆盖。何小鹏表示,大模型将成为物理AI世界的操作系统,并宣布与大众汽车达成战略合作,共同推进智能出行发展。

  • 新Siri或明年春季发布 苹果公司或引入谷歌Gemini大模型 AI技术

    苹果因自研大模型项目遇瓶颈,决定引入谷歌Gemini大模型升级Siri,计划每年支付约10亿美元获取定制化Gemini 2.5 Pro使用权。该模型拥有1.2万亿参数,将全面负责Siri的信息摘要、任务规划及复杂指令执行等核心功能,支持多模态交互和超长文本处理。升级版Siri预计2026年春季随iOS 26.4推送,后续将在WWDC大会展示进一步整合。苹果选择谷歌主要因成本优势、长期合作基础及Gemini领先性能。

  • 简知科技“简智AI大模型”通过国家生成式人工智能服务备案,助力兴趣教育迈向智能化新阶段

    广州简知科技自主研发的“简智AI大模型”通过国家生成式人工智能服务备案,标志着该模型在安全性、合规性与可靠性方面达到国家级标准。作为兴趣教育领域AI应用的重要里程碑,该模型围绕用户兴趣成长周期设计,提供个性化学习支持:可为未明确兴趣方向的用户智能推荐内容,为入门用户规划学习路径,为基础扎实用户提供进阶训练与智能反馈。其技术能力在旗下“简小知”等品牌中已实现“学—练—评—测”全流程覆盖,并通过社群互动增强学习动力。公司未来将持续优化模型能力,联合行业伙伴构建完整培养体系,推动兴趣教育向个性化、高质量方向发展。

  • AI日报:广电整治AI动画乱象;360发布大模型安全白皮书;百度推出小度AI眼镜Pro

    国家广电总局宣布自2026年3月起全面整治AI生成内容,要求AIGC作品纳入分类分层审核体系。360发布《大模型安全白皮书》,提出全链路AI安全防线应对新型威胁。百度推出2299元小度AI眼镜Pro,集成智能翻译等多项功能。StepFun开源音频编辑模型Step-Audio-EditX,实现文本化语音编辑。Grok新增纯文本生成视频功能,17秒可生成带特效视频片段。研究发现谷歌Veo-3模型能生成逼真手术视频但缺乏医学逻辑。阿里Qwen3-Max-Thinking在全球数学竞赛夺冠,并在加密货币交易中取得显著回报。OpenAI推出轻量化GPT-5 Codex Mini模型,优化开发者体验。

  • 【AI 智惠季】全模态大模型齐发优惠,GPU新客包月2.8折起

    阿里云启动双十一“AI智慧季”大型优惠活动,聚焦企业多元AI场景落地需求,推出7000万tokens大模型免费体验、GPU新客特惠等政策,助力企业降低开发成本。同时提供标准化AI产品与解决方案,覆盖内容创作、智能客服等高频应用场景,并举办系列技术分享活动,携手企业拥抱AI新时代。

今日大家都在搜的词: