首页 > 业界 > 关键词  > Meta最新资讯  > 正文

AI视野:Meta开源文生图模型RCG;百川智能发布角色大模型;AMD推AI电脑处理器Ryzen8000G;大众汽车将ChatGPT集成至多款车型

2024-01-09 15:46 · 稿源:站长之家

欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://top.aibase.com/

🤖📈💻💡大模型动态

麻省理工、Meta开源创新文生图模型RCG

麻省理工与Meta共同开发了“表示条件的图像生成”模型,无需任何人工标注,生成出来的图片效果显著。

图片

【AiBase提要:】

1. 有条件图像生成的效果,远超无条件的图像生成。

2. 模型不需要人工标注数据,使用MoCo v3进行预训练。

3. 通过对比学习方法获得更有效的图像表示。

开源地址:https://github.com/LTH14/rcg

百川智能发布角色大模型 Baichuan-NPC

百川智能推出角色大模型Baichuan-NPC,结合“角色创建平台 + 搜索增强知识库”解决方案,优化角色知识和对话能力,提供低成本、高效率的游戏AI角色定制。

【AiBase提要:】

🌐 知识库定制解决方案: Baichuan-NPC通过超过3T Tokens的领域知识预训练,创新地使用多方法模型合成数据,提高Token利用效率。

🤖 思维链对齐技术: 首次应用于角色模型对齐,使模型思考和行动更接近人类,提升角色一致性和基础对话能力。

🎭 开发简洁高效: 角色创建平台使用强多轮对齐技术和搜索增强知识库技术,提供简洁高效的开发流程,实现一键复制角色代码。

🤖📱💼AI应用

钉钉发布AI超级助理

今天,钉钉在7.5产品发布会上正式发布智能化产品——AI助理。用户点击钉钉首屏右上角的魔法棒,可唤起AI助理,该产品可以进行信息摘要、写工作总结、写文档等工作,用户还可以通过对话,让AI助理打开钉钉投屏、脑图、白板等功能,实现超过30项高频功能的一键唤起。

【AiBase提要:】

🚀钉钉推出AI助理产品,可以进行信息摘要、写工作总结、写文档等工作,同时上线敲一敲新功能。

🔄截至2023年底,用户数突破7亿,组织数量达2500万,付费DAU为2800万,付费企业数达12万。

🎉 钉钉表示已有20+条产品线、80多个场景全面接入大模型,展示了其在人工智能领域的布局。

微软发布DragNUWA1.5版本

新版本的功能让用户在通过图像生成视频之前,能够在图像上画出对应方向的箭头标记,并通过人工智能技术自动调整视频画面的运动方向。

image.png

【AiBase提要:】

⭐ 视频生成前,可在图像上画出方向的箭头标记。

⭐ 功能通过人工智能技术自动调整视频画面的运动方向。

⭐ 提高视频编辑效率和方便性,无需复杂后期编辑。

项目地址:https://top.aibase.com/tool/dragnuwa

Magnific AI正式发布升级内容 图像可放大8倍

图像放大应用MagnificAI近期发布了新的升级内容,包括10K *10K的输出尺寸、新的“分形度”设置和对滚轮缩放的支持,提升用户体验和服务。

【AiBase提要:】

⭐ 新版本将图像放大到10K *10K大小,保持清晰度

⭐ 新增“分形度”设置,避免锐化过度

⭐ 新版本新增滚轮缩放支持,提升使用体验

📰🤖📢AI新鲜事

AMD推面向AI时代的PC处理器Ryzen8000G

AMD于2024年CES上发布了面向AIPC时代的AMDRyzen8000G系列处理器,强调其搭载了XDNANPU加速,其中一些型号内置XDNANPU加速,新系列以Zen4核心、RDNA3图形和新的XDNANPU为特色。

image.png

【AiBase提要:】

😀 AMD发布面向AIPC时代的AMDRyzen8000G系列处理器

😎 Ryzen8000G系列搭载XDNANPU加速

🤖 Zen4核心、RDNA3图形和新的XDNANPU为特色

谷歌开发机器学习工具Teachable Machine

eachable Machine是由Google开发的机器学习工具,用户可以快速、简单地创建自己的机器学习模型,无需专业知识或编程技能,教电脑识别图片、声音或人的动作。

【AiBase提要:】

👩‍🏫 用户无需专业知识或编程技能即可创建机器学习模型

📸 用户可以通过上传图片、录制声音或动作视频收集数据进行模型训练

🔐 提供多种方式创建模型,可在用户自己的电脑上完成操作,保护数据隐私

OpenAI 称《纽约时报》版权诉讼毫无根据

人工智能公司OpenAI日前对《纽约时报》提起的版权诉讼做出公开回应,称利用公开文章等数据训练AI系统属于“合理使用”。

【AiBase提要:】

🔸 OpenAI重申利用公开文章等数据训练AI系统属于“合理使用”。

🔸 公司认为生成式AI模型在提示下并不会逐字输出单一信息源的数据。

🔸 OpenAI表示愿意与《纽约时报》合作,且认为纽时的指控没有根据。

大众汽车将ChatGPT集成至多款车型

大众汽车宣布将在多款车型中批量集成ChatGPT,与其最新一代IDA语音助手结合,为用户提供通过自然语言与汽车进行互动的体验。

【AiBase提要:】

🚗 大众汽车集成ChatGPT: 大众汽车宣布将在多款车型中批量集成ChatGPT,与IDA语音助手结合,提供更人性化的语音交互服务。

🤖 多功能语音助手: ChatGPT不仅执行车辆功能,还提供多项新功能,包括路况查询、导航、设备控制、回答专业知识、搜索网络新闻等,实现多轮深度对话。

🔐 启动与隐私保护: 用户通过说出“你好IDA”或按下方向盘按钮激活ChatGPT,为保障隐私,ChatGPT无法访问车辆数据,问题和答案会立即删除。

微软推出“AI奥德赛”项目

微软推出“AI奥德赛”项目,助力印度培训开发人员,普及人工智能技术应用,加速数字化转型。

【AiBase提要:】

⦁ 项目名为“AI奥德赛”,培训印度开发人员掌握最新的AI技术和工具

⦁ 参与者需完成两个级别挑战,通过完成在线评估获得微软应用技能认证

⦁ 完成挑战的参与者还可获得机会参加微软AI巡演,共同塑造人工智能的未来。

👨‍💻💡🎯聚焦开发者

实时渲染3D技术BakedAvatar 可通过简短视频复制出人物3D头部

BakedAvatar是一项实时创建和渲染逼真的动态3D头像的技术。它可以通过简短的视频复制出人物的3D头部模型,并精确捕捉面部特征,模拟表情和头部运动。另外,它还能在移动设备上进行实时渲染,编辑和调整头像的表情和姿势。

image.png

【AiBase提要:】

⭐ BakedAvatar技术可通过简短视频复制出逼真的3D头部模型。

⭐ 可在移动设备上实时渲染、编辑和调整头像的表情和姿势。

⭐ 增强游戏互动性和真实感,能够实时进行面部重演和姿势编辑。

项目地址:https://top.aibase.com/tool/bakedavatar

新AI图像分割方法GenSAM:一个提示实现批量图片分割

GenSAM模型通过通用任务描述,实现对图像的有针对性分割,摆脱了对样本特定提示的依赖。

image.png

【AiBase提要:】

⚙️ 模型使用CCTP思维链和PMG框架,实现任务通用的文本提示映射和自适应分割。

🚀 实验证明,GenSAM在伪装样本分割任务上表现更好,具备良好的泛化性能。

🧩 通过提供通用任务描述,GenSAM模型可以批量地处理所有相关任务的无标注图片,更加高效和可扩展。

项目链接:https://top.aibase.com/tool/gensam

举报

  • 相关推荐
  • 重磅预告:全链路自主进化 AI 数据分析师 TabTab 将于10月24日上线

    灵快科技推出的AI数据分析师TabTab将于10月24日上线。该产品通过Multi-Agent系统实现全链路自动化数据分析,覆盖数据获取、建模到可视化全流程。用户可用自然语言交互,系统自主规划任务并输出可维护结果,支持Excel、PPT等多种报告格式。核心定位为智能数据分析助手,旨在降低分析门槛,助力企业高效挖掘数据价值,适用于数据分析师、营销人员等各类用户。

  • VITA平台赋能AI办公,沸蛇AI语音鼠标提升办公效率

    云决科技推出VITA一站式AI办公平台,结合自研AI语音鼠标,通过软硬件协同创新提升企业效率。该平台集成DeepSeek等大模型,用户无需切换工具,语音即可调用文字处理、数据分析、创意设计等多元功能,实现会议纪要生成、PPT自动制作、视频一键合成等操作,节省80%工作时间。针对教育、IT、行政等不同行业提供专属解决方案,整合100多个AI应用场景和200多种模板,持续优化产品功能,致力于成为职场人士提升效率的智能助手。

  • “全球Robotaxi第一股”文远知行:港股上市临近,商业化进程加速

    文远知行通过港交所聆讯,正式进入港股上市冲刺阶段,将构建“美股+港股”双资本平台。作为全球自动驾驶标杆企业,其产品已在7个国家获自动驾驶牌照,在11国30城开展测试运营,安全运营超2200天。技术层面,预测算法误差控制在0.2米内,感知模型延迟小于10毫秒,系统检测精度达99%。成本大幅下降,单车成本降至几十万元,二季度营收同比增长60.8%,自动驾驶网约车业务猛增836.7%。近期获准在北京开展夜间道路测试,向全天候服务网络迈出关键一步。随着技术成熟与商业模式验证,万亿级自动驾驶市场正迎来规模化运营拐点。

  • OpenAI 推出浏览器:“让位吧,Chrome”

    ​北京时间10月22日凌晨,没等来传闻中的Gemini3,等来了OpenAI正式发布首款AI浏览器ChatGPT Atlas。 简单来说,这是一个把ChatGPT"塞进"浏览器的产品,你在任何网页上都能随时唤出ChatGPT侧边栏,让AI帮你总结内容、编辑文字、甚至代替你完成购物和预订任务。 听起来有点像Chrome装了个ChatGPT插件?确实如此,但OpenAI的野心远不止于此。

  • 第 一!世纪华通旗下Century Games登顶全球Top50手游商

    知名游戏媒体PocketGamer发布《2025年全球TOP50移动游戏商》榜单,世纪华通旗下Century Games从去年第7位跃居榜首,创下该榜单晋升速度新纪录。其成功源于持续创新与精准市场洞察:既实现《Whiteout Survival》等长线产品稳定运营,又凭借《Kingshot》等新作打造跨品类爆款,形成“双强驱动”格局。公司通过“微创新”策略结合AI技术提升研发效率,构建覆盖SLG、休闲、卡牌三大核心�

  • iOS 26液态玻璃效果能关了 苹果iOS 26.1 Beta 4新增液态玻璃开关

    苹果公司10月21日向iPhone用户推送iOS 26.1开发者预览版Beta4更新,新增Liquid Glass液态玻璃透明度切换开关,用户可将界面调整为“色调”模式以增强通知可读性。此次更新延续iOS 26的液态玻璃设计语言,带来更沉浸的视觉体验。同时支持关闭锁屏滑动相机功能避免误触,并扩展Apple Intelligence对丹麦语、荷兰语、繁体中文等七种语言的支持,让更多地区用户享受智能服务。

  • Checkout.com正式推出Flow Remember Me: 一键支付,全球通用

    Checkout.com推出嵌入式支付产品Flow的"记住我"功能,消费者仅需存储一次银行卡信息即可在全球商户网络实现跨平台快捷支付。测试数据显示,该功能最高可缩短70%付款时间并提升7%支付成功率。同时公司升级AI分析套件、支付优化工具及收单网络,并与Visa、Mastercard和Google达成AI智能体合作,助力商户在数字支付领域保持领先地位。

  • 澎湃OS 3 Beta版第三批截止招募:正式版11月15日前推送 覆盖小米14/K70等

    澎湃OS 3 Beta版内测招募将于10月23日结束,覆盖12款机型,包括小米14系列、MIX Fold 4/Flip及Redmi K70系列等。正式版不晚于11月15日陆续推送,用户可通过小米社区报名参与。新系统采用自研底层技术,任务执行效率提升19%,流畅度与稳定性显著增强,支持“三岛并存”显示快递提醒、导航等信息。超级小爱同学全面升级,实现智能场景化交互。

  • 真我GT8 Pro首发!realme UI 7.0正式版升级计划公布

    真我中国区总裁徐起公布realme UI 7.0正式版升级计划:即将发布的真我GT8 Pro将首发搭载该系统,并公布了老机型适配时间表。2025年11月起,真我GT7 Pro、GT7等机型开始升级;12月覆盖真我GT5 240W、14 Pro等;2026年1月扩展至真我GT Neo5系列、数字系列及V系列等多款机型。

  • 特斯拉V14终于来了!整合Robotaxi技术 马斯克:FSD有了意识

    以下是FSD 14的主要功能更新 1、新增到达选项(Arrival Options):驾驶者可选择目的地停车类型,包括停车场、街边、车道、停车库或路边停靠。 2、系统可识别警车、消防车、救护车等紧急车辆并自动避让或靠边停车。 3、实现对封路与临时绕行的实时处理。 4、增加自定义速度档位”以调整驾驶风格。新增SLOTH”模式,以更低车

今日大家都在搜的词: