首页 > 业界 > 关键词  > 大模型最新资讯  > 正文

AI视野:荣耀发布魔法大模型;阿里推开源版FaceChain;钉钉小冰合作推一键定制数字人;微博上线AI评论机器人

2024-01-10 16:34 · 稿源:站长之家

欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://top.aibase.com/

🤖📈💻💡大模型动态

荣耀发布魔法大模型

荣耀发布全新平台级AI大模型——魔法大模型,首次应用于Magic6系列机型,并推出MagicOS8.0,实现了基于用户意图识别的GenAI平台级系统,包括"任意门"功能,打破应用壁垒,交互速度远超iOS17,与百度智能云合作生成专业内容。

微信截图_20240110154236.png

【AiBase提要:】

🔍 AI大模型趋势: 荣耀跟随智能手机发展趋势,将AI大模型整合于生态系统,深入了解用户需求,实现更便捷的生活体验。

🚀 MagicOS8.0创新: MagicOS8.0基于用户意图识别,实现了一秒完成操作的极速交互,同时推出"任意门"功能,提供高效智能的跨应用体验。

🤝 百度智能云合作: 荣耀与百度智能云战略合作,通过魔法大模型生成专业内容,拓展AI在手机领域的应用。

星火大模型将发布最新

科大讯飞推出基于星火认知大模型的数字员工产品,包括管理、营销、办公三大类,旨在提升企业运营效率;1月30日将发布星火认知大模型的最新版本。

【AiBase提要:】

🚀 管理数字员工产品功能全面,涵盖企业招采、合同起草等,旨在提升企业运营效率。

💼 营销数字员工应用AI技术于销售场景,提升销售团队业绩,在高端零售业有重点应用。

🏢 办公数字员工提供主题创作、文本创建等能力,旨在提高办公效率;1月30日将发布星火认知大模型的最新版本。

新AI模型DPPFA−Net可精准检测到小型3D物体存在

日本立命馆大学研究团队开发的DPPFA−Net模型通过创新策略结合3D LiDAR和2D图像,显著提高小目标检测性能,尤其在恶劣天气条件下表现出色。

【AiBase提要:】

🌐 DPPFA−Net采用多模态方法,结合2D图像和LiDAR数据,显著提高小目标检测性能。

🚗 在KITTI Vision Benchmark测试中,DPPFA−Net在不同噪声条件下平均精度提高了7.18%,展现出强大的鲁棒性。

🤖 模型包括三个创新模块,通过内部和间部特征交互,以及语义对齐,解决了多模态3D物体检测中的挑战,推动了该领域的发展。

项目研究论文:https://ieeexplore.ieee.org/document/10308573/

安徽工程大学开源TinyGPT-V多模态模型

TinyGPT-V是一款性能强大的多模态模型,基于微软Phi-2语言模型和视觉模型EVA,仅有28亿参数但性能媲美上百亿参数的模型。训练只需24G GPU,适用于中小企业和个人开发者,可部署在移动设备上。

【AiBase提要:】

👾 小模型大能力: TinyGPT-V以微软Phi-2和EVA为基础,仅28亿参数却具备强大性能,适用于中小型企业和个人开发者。

🚀 轻量训练: 训练过程只需24G GPU,不依赖高端显卡,可部署在手机、笔记本等移动设备上。

📈 多阶段训练: TinyGPT-V经历热身、预训练、指令调优和多任务调优四个阶段,在视觉语言任务中表现出色。

开源地址:https://github.com/DLYuanGod/TinyGPT-V

斯坦福推新AI模型 可快速找出图片中位置

一群斯坦福大学研究生发布的AI模型,通过大量训练可在照片中准确找出位置,准确率达到92%,但引发隐私安全问题。

image.png

【AiBase提要:】

🚀 高准确率AI模型: 斯坦福研究生团队发布的AI模型,通过数万训练图片,准确率达到92%,能在40%的猜测中将位置缩小至25公里范围内。

🕵️‍♂️ 隐私安全考虑: 由于模型可能引发隐私问题,项目团队决定不公开模型,仅分享代码,以防止技术滥用。

🛡️ 隐私保护重要性: 对于普通用户而言,隐私保护至关重要,特别是不随意在社交网络上发布周围照片,以避免潜在的隐私问题。

论文地址:https://arxiv.org/pdf/2307.05845.pdf

🤖📱💼AI应用

阿里推开源版“妙鸭”FaceChain

阿里推出开源版FaceChain-FACT,通过Deformable Neural Radiance Fields技术,使用一张用户照片即可生成百种定制肖像,支持多样化肖像风格,填补了个性化肖像生成技术空白。

image.png

【AiBase提要】

🚀 FaceChain-FACT采用Deformable Neural Radiance Fields技术,一张用户照片即可生成百种定制肖像。

💡 技术方法包括图像预处理、基于Transformer的面部特征提取器、稳定扩散等,支持多种LoRA模型。

⚡ FaceChain-FACT提高了生成速度和定制化程度,为个性化肖像生成提供高效简便解决方案。

项目地址:https://top.aibase.com/tool/facechain-fact

Luma AI发布文本到3D模型转换工具Genie1.0

Luma AI推出Genie1.0,一款能在10秒内根据文本描述创建逼真3D模型的工具,同时宣布获得4300万美元B轮融资。

QQ截图20240110145324.png

【AiBase提要:】

🚀 Genie1.0是Luma AI的文本到3D模型转换工具,能在短时间内生成包含详细表面材料的逼真3D对象。

💰 Luma AI宣布获得4300万美元B轮融资,由@a16z牵头,为Genie的发展提供有力支持。

📲 Genie生成的3D模型支持导出到各种主流3D文件格式,可在不同软件和平台上使用,工具已在网络和Luma的iOS应用中可试用。

官网地址:https://top.aibase.com/tool/lumaai-genie

AI视频剪辑工具MorphCut:自动删除视频中的多余停顿、语气词等

近期推出的AI视频剪辑工具MorphCut,由华盛顿大学和Adobe研究中心联合开发,通过创新的框架实现自动删除视频中的冗余语气声音,平滑处理跳切,提升观看体验。

image.png

【AiBase提要:】

👁️ MorphCut是由华盛顿大学和Adobe研究中心合作开发的AI视频剪辑工具。

🎞️ 功能特点包括面部细节关注、面部标记操控和跨模态注意力机制,特别擅长处理人物头部转动问题。

⏰ 自动删除语气词和平滑转头动作处理,使观众几乎感觉不到剪辑痕迹,为视频编辑节省时间和精力。

项目地址:https://top.aibase.com/tool/morphcut

📰🤖📢AI新鲜事

英特尔正将AI PC引入汽车领域

英特尔宣布推出首个面向汽车领域的AI聚焦芯片,计划提升语音助手和主动安全功能,中国吉利旗下的极氪将成为首家搭载这一新技术的汽车制造商。

【AiBase提要】:

🧠 Intel发布首款面向汽车领域的AI聚焦芯片,旨在提升语音助手和主动安全功能。

🚙 中国吉利旗下的极氪(Zeekr)将成为首家安装这些新芯片的汽车制造商,首款搭载Intel AI硬件的Zeekr车型将于今年年底推出。

⚙️ Intel计划推出一系列用于软件定义汽车的芯片,预计在2024年底首次亮相,以提高汽车内体验。

钉钉与小冰公司达成合作 推出一键定制数字人服务

钉钉与小冰公司合作推出一键定制数字人服务,用户可通过钉钉参与数字人内测,并在钉钉视频号发布数字人视频。

【AiBase提要:】

🔍 钉钉与小冰公司合作推出一键定制数字人服务。

📱 用户可通过数字人内测,在钉钉视频号发布个性化数字人视频。

🚀 合作涵盖钉钉视频号、直播、视频会议、AI助理等领域,助力用户多种活动。

Rabbit推出独立人工智能设备R1

CES2024展会上,Rabbit推出售价199美元的独立人工智能设备R1,外观现代化,配备2.88英寸触摸屏、旋转摄像头、2.3GHz MediaTek处理器等。

QQ截图20240110094100.jpg

【AiBase提要:】

🔍 R1是199美元的独立AI设备,外观现代化,配置强大。

🔄 Rabbit OS采用"大型操作模型",通过简单提问实现各种功能。

🌐 Rabbit的愿景是将R1连接为一个超级应用程序,具备广泛的应用场景。

Rabbit tech开发AI系统LAM 说话就能指挥系统完成任何APP操作

Rabbittech最新开发的AI系统LAM,通过神经符号编程技术,能够用自然语言指挥完成任何应用程序的操作,提供更可靠和便捷的用户体验。

QQ截图20240110100952.png

【AiBase提要】

🐇 先进技术: Rabbittech的LAM系统采用神经符号编程技术,能够直接建模应用程序结构,实现与最先进方法媲美的准确性、可解释性和速度。

🗣️ 语音控制: LAM系统允许用户通过自然语言打字或说话指挥完成任何应用程序操作,同时兼容现有所有应用程序,无需丢弃已有数据。

🚀 广泛应用: 适用于各种人工智能助手和操作系统,为下一代自然语言驱动的消费者体验提供支持。

项目地址:https://top.aibase.com/tool/lam

科学家创新技术用更少的GPU训练ChatGPT级别万亿参数模型

科学家们在世界上最强大的超级计算机上取得了巨大突破,仅使用其8%的计算能力,成功训练了一个与ChatGPT规模相当的模型。

【AiBase提要:】

🌐 科学家在全球最强超级计算机上仅使用8%算力,成功训练出与ChatGPT规模相当的模型。

🚀 利用分布式训练策略和并行技术,在Frontier计算能力8%的情况下,实现1750亿和1万亿参数模型的百分之百弱扩展效率。

💡 尽管取得突破,训练拥有万亿参数的语言模型仍面临挑战,需要解决内存问题及在非Nvidia平台上进行高效训练。

Quora融资7.5亿美元

Quora成功融资7.5亿美元,将资金用于加速发展AI聊天机器人平台Poe,致力于打造基于AI的创作者经济。

【AiBase提要:】

💰 融资巨额: Quora成功融资7,500万美元,资金将用于加速发展其AI聊天机器人平台Poe。

🌐 创作者经济: Quora致力于打造基于AI聊天机器人的创作者经济,让创作者通过构建有趣的AI机器人来实现收入。

🚀 平台增长: 自Poe一年前推出以来,Quora取得了不俗的增长,拥有超过4亿月活跃用户,融资估值为5亿美元。

沃尔玛押注AI服务 帮助用户更快选购货物

沃尔玛正致力于通过人工智能(AI)技术改进购物体验,其中包括推出一项名为InHome的补货服务,旨在实现全自动杂货补货,让用户无需亲自购物。

【AiBase提要:】

🏠 沃尔玛计划推出InHome服务,通过学习用户购物习惯实现全自动杂货补货,减轻用户选购负担。

🤖 AI技术生成个性化购物清单,帮助用户在正确时间订购所需物品,通过InHome服务送达用户家中。

🚀 沃尔玛投资生成式AI搜索引擎,让用户通过更广泛的查询方式轻松搜索商品,提升购物体验。

微博上线AI评论机器人“罗伯特”

微博推出的AI评论机器人“罗伯特”以其抽象、幽默的评论风格在社交网络引起轰动,但引发网友对语言质量的担忧。

【AiBase提要:】

🤖 独特风格:微博AI评论机器人“罗伯特”以抽象、幽默的评论风格受欢迎,成为热搜榜常客。

🤔 担忧表达:网友担忧该机器人广泛参与话题讨论,可能在未来制造更多“引战”话题,加剧舆论冲突。

🤯 语言质量争议:机器人评论的抽象风格引发对微博语言质量的担忧,有人认为超越其他社交平台。

举报

  • 相关推荐
  • AI营销席卷中东,Infinix和Snapchat首个AI营销合作如何在当地实现破圈?

    开年以来,AI 图片赛道迎来一轮小高潮。今年3月,在我们统计的月访问量超200万的 Web 端 AI 图片产品中,有45款产品访问量呈现环比上涨,最高增幅超过600%。这些爆款背后的共同特征,是一股席卷社交平台的“吉卜力风”。 回顾2022年至今几轮 AI 爆款产品(如 Lensa、妙鸭相机、黏土滤镜、吉卜力),其流量爆发的逻辑始终贯穿着四大共性:操作门槛极低、个性表达鲜明、用户�

  • AI日报:阿里开源3D数字人项目MNN TaoAvatar;MiniMax Agent上线;罗永浩数字人直播再探“AI+IP”带货模式

    本文汇总了AI领域最新动态:1)阿里开源MNN+TaoAvatar技术,实现手机端3D数字人实时交互;2)MiniMax升级AI工具Agent,新增智能图像搜索和多语言支持;3)罗永浩数字人将登陆百度电商直播;4)OpenAI员工套现近30亿美元,软银成最大接盘方;5)ChatGPT推出深度研究和语音模式升级;6)Meta发布V-JEPA2模型,提升机器人环境适应能力;7)AMD与OpenAI合作推出新一代AI芯片;8)Google Gemini集成Imagen4图像生成模型;9)谷歌AI实现10公里级精准天气预报;10)Gartner预测到2028年80%的AI应用开发时间将缩短50%。

  • AI日报:豆包大模型1.6发布;OpenAI推o3-pro模型、o3价格暴降80%;Figma官方MCP重磅上线

    【AI日报】今日AI领域重要动态:1)火山引擎发布豆包大模型1.6和视频生成模型Seedance1.0pro,性能显著提升;2)OpenAI推出o3-pro模型,专注可靠性但响应较慢;3)Figma推出Dev Mode MCP服务,实现设计到代码一键转换;4)Krea AI发布图像生成模型Krea1,解决传统AI绘图问题;5)火山引擎豆包日调用量突破16.4万亿次;6)法国Mistral发布推理模型Magistral;7)苹果系统整合ChatGPT图像生成功能;8)OpenAI大幅下调o3价格80%并推出o3-pro;9)Hugging Face开源榜单显示中国团队Qwen与DeepSeek进入全球前15;10)阿里开源MaskSearch框架,提升AI解决复杂问题能力。

  • 国内有哪些ai大模型?一文看懂中国核心AI大模型全景

    近两年中国AI大模型发展迅猛,已形成"通用+行业"双轨并进的生态格局。百度文心一言、阿里通义千问等通用大模型在中文理解、多模态生成等方面表现突出;深度求索DeepSeek以1/10参数实现GPT-4级推理能力;月之暗面Kimi以20万汉字上下文窗口领跑长文本处理;智谱AI的GLM-4成为首个支持视频对话的国产千亿模型。医疗、金融等垂直领域涌现出百川智能等专业模型,覆盖超1000家医院。开源生态加速国产芯片适配,15家厂商完成深度优化。行业应用方面,工程文档效率提升60%,24小时拟人化客服等案例凸显价值。未来趋势呈现模型蒸馏、端侧部署和开源生态三大方向,中国AI正从实验室走向产业变革前沿。

  • AI日报:MiniMax推视频生成模型Hailuo 02;Cursor Pro取消500次请求限制;谷歌发布AI模型 Gemini 2.5 Flash-Lite

    本文汇总了AI领域最新动态:1)Cursor Pro取消500次请求限制;2)稀宇科技推出视频生成模型Hailuo02;3)谷歌发布轻量级AI模型Gemini2.5Flash-Lite;4)科大讯飞星火X1升级版7月上线;5)腾讯元宝推出AI编程模式;6)OpenAI将下架GPT-4.5 API;7)苹果Speech API转录速度超Whisper 55%;8)百度推出数字人互动直播间;9)Meta曾试图高薪挖角OpenAI人才;10)Krea1公测开放,解决"AI感"问题;11)特斯拉Grok车载AI助手即将上线;12)谷歌Gemini新增视频分析功能。

  • 华为云发布盘古大模型5.5,宣布新一代昇腾AI云服务上线,成就行业AI先锋

    华为开发者大会2025(HDC2025)在东莞篮球中心开幕,发布多项AI创新成果:1)推出基于CloudMatrix384超节点的新一代昇腾AI云服务,单卡推理吞吐量提升4倍;2)发布盘古大模型5.5,NLP、CV等五大基础模型全面升级,其中718B深度思考模型采用256专家MoE架构;3)推出行业首个统一预测架构Triplet Transformer,覆盖钢铁、水泥等多个工业场景;4)发布300亿参数视觉大模型,支持多维感知分析;5)升级盘古助手Doer,新增6大开发领域专业Agent。华为云宣布开发者突破800万,将构建昇腾、鸿蒙、鲲鹏等技术生态。

  • 玄武云出席崔牛会AI活动,聊聊AI大模型如何掌握终端信息

    6月20日,崔牛会主办的AI发现者计划之AI+OPEN DAY在广州举办,玄武云与百度云等企业围绕AI大模型应用展开探讨。玄武云分享了快消行业数字化转型解决方案,推出SKU超级模型和价签识别模型,帮助品牌商提升终端管理效率。其中SKU模型覆盖6000+商品,识别准确率达90%;价签模型准确率85%,已应用于知名薯片品牌。通过AI技术实现商品陈列优化、价格监控和渠道布局分析,助力快消企业从经验驱动转向数据智能驱动,在存量市场中创造增量价值。

  • AI日报:阿里通义推Qwen-TTS模型;Cursor已支持网页和手机端;字节发布图像合成技术XVerse

    【AI日报】今日AI领域7大突破:1)阿里通义Qwen-TTS实现方言语音合成重大突破;2)Cursor发布Web版AI编程工具;3)字节XVerse技术实现多对象精准图像生成;4)NoteGen跨平台AI笔记工具革新知识管理;5)ManimML动画库可视化Transformer架构;6)TEN+Agent开源语音交互技术降低延迟;7)Chai-2抗体设计模型将药物研发周期缩短至两周。淘宝同时上线RecGPT推荐模型提升购物体验。

  • AI日报:百度发布“绘想”平台与MuseSteamer;阿里音频驱动全身数字人模型OmniAvatar

    【AI日报】今日AI领域重要动态:1.开源语音大模型Step-Audio-AQAA发布,实现音频到语音的端到端自然转换;2.百度推出"绘想"平台与MuseSteamer,通过AI一键生成专业级视频;3.浙大与阿里联合发布OmniAvatar,音频驱动数字人技术取得突破;4.百度搜索迎十年来最大改版,新增智能框、百看和AI助手功能;5.xAI开发者控制台新增Grok4及Grok4Code引用,预示新一代AI模型即将发布;6.Gemin

  • 自研大模型遥遥无期!苹果Siri考虑用外援:转向OpenAI合作

    据媒体报道,知名爆料人马克古尔曼透露,苹果正重新评估其人工智能发展策略,考虑放弃自研大语言模型(LLM)计划,转而与OpenAI展开合作谈判。 若合作达成,苹果原定于2026年推出的基于自研Apple Foundation Models”的Siri升级计划可能被搁置,这一变动或引发行业广泛关注。 目前,由苹果AI负责人约翰詹南德雷亚(John Giannandrea)主导的LLM Siri”项目仍在进行中,但进展不及预�