首页 > 业界 > 关键词  > Meta最新资讯  > 正文

AI视野:Meta开源文生图模型RCG;百川智能发布角色大模型;AMD推AI电脑处理器Ryzen8000G;大众汽车将ChatGPT集成至多款车型

2024-01-09 15:46 · 稿源:站长之家

欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://top.aibase.com/

🤖📈💻💡大模型动态

麻省理工、Meta开源创新文生图模型RCG

麻省理工与Meta共同开发了“表示条件的图像生成”模型,无需任何人工标注,生成出来的图片效果显著。

图片

【AiBase提要:】

1. 有条件图像生成的效果,远超无条件的图像生成。

2. 模型不需要人工标注数据,使用MoCo v3进行预训练。

3. 通过对比学习方法获得更有效的图像表示。

开源地址:https://github.com/LTH14/rcg

百川智能发布角色大模型 Baichuan-NPC

百川智能推出角色大模型Baichuan-NPC,结合“角色创建平台 + 搜索增强知识库”解决方案,优化角色知识和对话能力,提供低成本、高效率的游戏AI角色定制。

【AiBase提要:】

🌐 知识库定制解决方案: Baichuan-NPC通过超过3T Tokens的领域知识预训练,创新地使用多方法模型合成数据,提高Token利用效率。

🤖 思维链对齐技术: 首次应用于角色模型对齐,使模型思考和行动更接近人类,提升角色一致性和基础对话能力。

🎭 开发简洁高效: 角色创建平台使用强多轮对齐技术和搜索增强知识库技术,提供简洁高效的开发流程,实现一键复制角色代码。

🤖📱💼AI应用

钉钉发布AI超级助理

今天,钉钉在7.5产品发布会上正式发布智能化产品——AI助理。用户点击钉钉首屏右上角的魔法棒,可唤起AI助理,该产品可以进行信息摘要、写工作总结、写文档等工作,用户还可以通过对话,让AI助理打开钉钉投屏、脑图、白板等功能,实现超过30项高频功能的一键唤起。

【AiBase提要:】

🚀钉钉推出AI助理产品,可以进行信息摘要、写工作总结、写文档等工作,同时上线敲一敲新功能。

🔄截至2023年底,用户数突破7亿,组织数量达2500万,付费DAU为2800万,付费企业数达12万。

🎉 钉钉表示已有20+条产品线、80多个场景全面接入大模型,展示了其在人工智能领域的布局。

微软发布DragNUWA1.5版本

新版本的功能让用户在通过图像生成视频之前,能够在图像上画出对应方向的箭头标记,并通过人工智能技术自动调整视频画面的运动方向。

image.png

【AiBase提要:】

⭐ 视频生成前,可在图像上画出方向的箭头标记。

⭐ 功能通过人工智能技术自动调整视频画面的运动方向。

⭐ 提高视频编辑效率和方便性,无需复杂后期编辑。

项目地址:https://top.aibase.com/tool/dragnuwa

Magnific AI正式发布升级内容 图像可放大8倍

图像放大应用MagnificAI近期发布了新的升级内容,包括10K *10K的输出尺寸、新的“分形度”设置和对滚轮缩放的支持,提升用户体验和服务。

【AiBase提要:】

⭐ 新版本将图像放大到10K *10K大小,保持清晰度

⭐ 新增“分形度”设置,避免锐化过度

⭐ 新版本新增滚轮缩放支持,提升使用体验

📰🤖📢AI新鲜事

AMD推面向AI时代的PC处理器Ryzen8000G

AMD于2024年CES上发布了面向AIPC时代的AMDRyzen8000G系列处理器,强调其搭载了XDNANPU加速,其中一些型号内置XDNANPU加速,新系列以Zen4核心、RDNA3图形和新的XDNANPU为特色。

image.png

【AiBase提要:】

😀 AMD发布面向AIPC时代的AMDRyzen8000G系列处理器

😎 Ryzen8000G系列搭载XDNANPU加速

🤖 Zen4核心、RDNA3图形和新的XDNANPU为特色

谷歌开发机器学习工具Teachable Machine

eachable Machine是由Google开发的机器学习工具,用户可以快速、简单地创建自己的机器学习模型,无需专业知识或编程技能,教电脑识别图片、声音或人的动作。

【AiBase提要:】

👩‍🏫 用户无需专业知识或编程技能即可创建机器学习模型

📸 用户可以通过上传图片、录制声音或动作视频收集数据进行模型训练

🔐 提供多种方式创建模型,可在用户自己的电脑上完成操作,保护数据隐私

OpenAI 称《纽约时报》版权诉讼毫无根据

人工智能公司OpenAI日前对《纽约时报》提起的版权诉讼做出公开回应,称利用公开文章等数据训练AI系统属于“合理使用”。

【AiBase提要:】

🔸 OpenAI重申利用公开文章等数据训练AI系统属于“合理使用”。

🔸 公司认为生成式AI模型在提示下并不会逐字输出单一信息源的数据。

🔸 OpenAI表示愿意与《纽约时报》合作,且认为纽时的指控没有根据。

大众汽车将ChatGPT集成至多款车型

大众汽车宣布将在多款车型中批量集成ChatGPT,与其最新一代IDA语音助手结合,为用户提供通过自然语言与汽车进行互动的体验。

【AiBase提要:】

🚗 大众汽车集成ChatGPT: 大众汽车宣布将在多款车型中批量集成ChatGPT,与IDA语音助手结合,提供更人性化的语音交互服务。

🤖 多功能语音助手: ChatGPT不仅执行车辆功能,还提供多项新功能,包括路况查询、导航、设备控制、回答专业知识、搜索网络新闻等,实现多轮深度对话。

🔐 启动与隐私保护: 用户通过说出“你好IDA”或按下方向盘按钮激活ChatGPT,为保障隐私,ChatGPT无法访问车辆数据,问题和答案会立即删除。

微软推出“AI奥德赛”项目

微软推出“AI奥德赛”项目,助力印度培训开发人员,普及人工智能技术应用,加速数字化转型。

【AiBase提要:】

⦁ 项目名为“AI奥德赛”,培训印度开发人员掌握最新的AI技术和工具

⦁ 参与者需完成两个级别挑战,通过完成在线评估获得微软应用技能认证

⦁ 完成挑战的参与者还可获得机会参加微软AI巡演,共同塑造人工智能的未来。

👨‍💻💡🎯聚焦开发者

实时渲染3D技术BakedAvatar 可通过简短视频复制出人物3D头部

BakedAvatar是一项实时创建和渲染逼真的动态3D头像的技术。它可以通过简短的视频复制出人物的3D头部模型,并精确捕捉面部特征,模拟表情和头部运动。另外,它还能在移动设备上进行实时渲染,编辑和调整头像的表情和姿势。

image.png

【AiBase提要:】

⭐ BakedAvatar技术可通过简短视频复制出逼真的3D头部模型。

⭐ 可在移动设备上实时渲染、编辑和调整头像的表情和姿势。

⭐ 增强游戏互动性和真实感,能够实时进行面部重演和姿势编辑。

项目地址:https://top.aibase.com/tool/bakedavatar

新AI图像分割方法GenSAM:一个提示实现批量图片分割

GenSAM模型通过通用任务描述,实现对图像的有针对性分割,摆脱了对样本特定提示的依赖。

image.png

【AiBase提要:】

⚙️ 模型使用CCTP思维链和PMG框架,实现任务通用的文本提示映射和自适应分割。

🚀 实验证明,GenSAM在伪装样本分割任务上表现更好,具备良好的泛化性能。

🧩 通过提供通用任务描述,GenSAM模型可以批量地处理所有相关任务的无标注图片,更加高效和可扩展。

项目链接:https://top.aibase.com/tool/gensam

举报

  • 相关推荐
  • 阿里ATH推出AI开发工具秒悟Meoo

    4月15日,阿里ATH事业群推出首款AI开发工具“Meoo”(秒悟)。该工具集成千问、Kimi、GLM、MiniMax四大国内顶尖模型,用户仅需用自然语言描述想法,即可快速生成包含前后端完整代码的网站或H5页面,并支持在阿里云一键部署上线。Meoo内置数据库、存储等核心产品,无需繁琐配置,极大提升开发效率。其创新的蜂群Agent模式支持多任务并行处理,简单应用生成时间低至1分钟。即

  • 科大国创智銮CMEF首秀收官,“智驾助行”受关注

    第93届CMEF展会进入尾声,首次参展的科大国创智能出行品牌智銮,不仅成功展示了其首款量产车型智銮S5智能助行机器人,更向外界描绘了品牌未来的发展蓝图。智銮以稳健而积极的姿态,驶入发展的快车道。其采取“国内深耕+海外拓展”的双轮驱动模式:一方面聚焦国内重点一线及新一线城市,打造集展示、体验、交付、服务于一体的渠道网络;另一方面同步启动海外市场布局,通过线上业务推进品牌的全球化战略。智銮S5凭借其创新的产品设计受到多家行业及权威媒体争相报道,其产品团队表示,初心是打造一款有品质、有温度的产品,真正帮助到出行不便的老年人、残障人士。未来,智銮将持续推动产品的迭代升级,深化其在人工智能、大数据等领域的技术积累,重塑智能出行体验。

  • 从“我”到“我们”:一场定义好生活的女性合声正在响起丨CBNData报告

    文章探讨了当代女性自我认知与社会角色的深刻变革。女性正从个体觉醒走向集体共鸣,通过消费等直接方式表达真实需求,拒绝单一标签,接纳复杂真实的自我。90后与00后女性成为核心引领者,带动跨年龄层广泛共议。消费不仅是个人选择,更是为“我们”的需求投票,推动市场规则与社会认知改变。品牌需以专业设计回应“她需求”,融入女性叙事,并以实质性行动助推社会进步,让女性友好从口号走向日常。

  • 2026 CMEF圆满收官 | 康众医疗:新启程·全矩阵·瞰全球,三大赛道并驾齐驱

    4月的上海,春潮涌动,创新汇聚。2026年4月12日,以“创新聚变,无限跃迁”为主题的第93届中国国际医疗器械博览会(CMEF)在上海国家会展中心圆满落下帷幕。从迁址总部开启发展新篇,到医疗、口腔、工业三大产品矩阵全场景覆盖,再到全球市场纵深布局——康众医疗(688607)正以“探测器+”为核心,向业界清晰展示平台型企业的技术纵深与宽度。新启程:乔迁再出发,产�

  • 更多数据,更AI:源诺医疗亮相上海CMEF,以科技硬核实力定义AI决策时代

    第93届中国国际医疗器械博览会(CMEF)于4月12日在上海闭幕。源诺医疗(ANOVATOR)以其极简视觉设计和“硬核”医疗技术成为展会焦点,展示了人体成分分析从“工具时代”向“决策时代”的跨越。其智能决策系统将多维数据转化为结构化医学指标与疾病风险模型,提供可落地的干预建议,辅助医生制定方案。设备与DEXA相关性达97%~98%,拥有二类医疗器械注册证,已在多科室及体检、慢病管理等场景实现应用。企业立足全球医疗数据网络,以硬核技术为品牌护城河,致力于让每一组人体成分数据成为守护生命质量的科学决策依据。

  • 直击2026CMEF,科大国创智能助行机器人爆火

    智行S5智能助行机器人亮相第93届中国国际医疗器械博览会,将汽车级智驾技术应用于个人出行领域。它拥有“智慧大脑”,可识别路况、预警风险、自动刹停,并配备ACC自适应续航系统,保障安全。座舱设计人性化,采用零重力座椅,支持按摩、通风、加热等功能,并配备可收纳小桌板、蓝牙音响等,打造移动智能生活空间。该产品不仅可作为日常代步工具,还适用于社区康养、景区代步等场景,为医疗大健康领域提供全新出行选择。

  • 谷歌Chrome浏览器功能更新:AI Skills支持保存复用提示词

    谷歌为Chrome桌面版浏览器推出全新AI Skills功能。该功能基于 Gemini AI打造,能支持用户保存并跨网页重复调用常用 AI 提示词,减少重复输入操作,进一步提升浏览器使用效率。 该功能是谷歌将Gemini AI深度整合进Chrome生态的重要升级。用户可直接从Gemini聊天记录中将常用提示词保存为专属技能,保存后的技能支持实时编辑。 调用方式十分简便,用户在Chrome的Gemini交互界面中输�

  • 安利一个11万Star的必装插件,能让你的Agent体验直接质变。

    ​最近一直在聊Agent、聊Vibe Coding。 但是在给越来越多的朋友安利的时候,发现其实,一直有一个问题被忽略了。 就是,真正卡住大多数人的,是自己没有一个标准的工作流程。 特别在创造一个你想要的软件或者程序的时候,没有标准流程,其实是一件非常可怕的事情。 所以,我想给大家分享一个我自己在vibe coding的时候,一直在用的一个超好用的帮我提高Coding体验的一个

  • 予之文化X火山引擎:AI MediaKit+Seedance 2.0,探索品牌与电商内容工业化新路径

    当前AIGC视频生成技术正从“技术探索”迈向“规模化应用”的关键阶段。以Seedance2.0为代表的新一代视频生成模型在创意、语义理解和画面一致性等方面表现出色,并在2026年央视春晚展示了8K/50FPS超清视频的生成能力。然而,商业化落地仍面临原生分辨率不足、帧率受限、生成成本高昂等瓶颈。火山引擎推出的AI+MediaKit画质增强产品,与Seedance2.0形成“最佳拍档”,通过“低分辨率生成+智能筛选+画质增强”的分层策略,在控制成本的同时提升输出画质,助力用户完成从“可用”到“好用”的品质跃升。该方案已在电商、品牌营销等场景得到验证,为AIGC视频的规模化、高质量生产提供了可靠路径。

  • 腾讯音乐(TME)携手中国唱片集团 以数字力量助力中国音乐走向世界

    腾讯音乐娱乐集团(TME)与中国唱片集团宣布深化战略合作,双方将整合核心资源与产业优势,围绕海内外内容发行、精品内容共创、传播生态共建等领域展开深度协同,共同探索“中国音乐 世界表达”的全新路径。合作聚焦三大方向:全面激活经典音乐IP生命力,推动民族音乐、戏曲曲艺等珍贵内容的数字化创新传播;携手推动当代精品内容出海,重点推广中国唱片集团的特色品牌系列与原创精品;构建多语种、多场景的全球传播矩阵,依托腾讯音乐的全球发行网络与数据洞察能力,推动中国音乐实现从“走出去”到“走进去”的深度跨越。此次合作旨在以音乐为桥,促进中外文明互鉴,助力更多承载民族记忆、彰显文化自信的中国音乐作品走向全球。

今日大家都在搜的词: