首页 > 业界 > 关键词  > Meta最新资讯  > 正文

AI视野:Meta开源文生图模型RCG;百川智能发布角色大模型;AMD推AI电脑处理器Ryzen8000G;大众汽车将ChatGPT集成至多款车型

2024-01-09 15:46 · 稿源:站长之家

欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://top.aibase.com/

🤖📈💻💡大模型动态

麻省理工、Meta开源创新文生图模型RCG

麻省理工与Meta共同开发了“表示条件的图像生成”模型,无需任何人工标注,生成出来的图片效果显著。

图片

【AiBase提要:】

1. 有条件图像生成的效果,远超无条件的图像生成。

2. 模型不需要人工标注数据,使用MoCo v3进行预训练。

3. 通过对比学习方法获得更有效的图像表示。

开源地址:https://github.com/LTH14/rcg

百川智能发布角色大模型 Baichuan-NPC

百川智能推出角色大模型Baichuan-NPC,结合“角色创建平台 + 搜索增强知识库”解决方案,优化角色知识和对话能力,提供低成本、高效率的游戏AI角色定制。

【AiBase提要:】

🌐 知识库定制解决方案: Baichuan-NPC通过超过3T Tokens的领域知识预训练,创新地使用多方法模型合成数据,提高Token利用效率。

🤖 思维链对齐技术: 首次应用于角色模型对齐,使模型思考和行动更接近人类,提升角色一致性和基础对话能力。

🎭 开发简洁高效: 角色创建平台使用强多轮对齐技术和搜索增强知识库技术,提供简洁高效的开发流程,实现一键复制角色代码。

🤖📱💼AI应用

钉钉发布AI超级助理

今天,钉钉在7.5产品发布会上正式发布智能化产品——AI助理。用户点击钉钉首屏右上角的魔法棒,可唤起AI助理,该产品可以进行信息摘要、写工作总结、写文档等工作,用户还可以通过对话,让AI助理打开钉钉投屏、脑图、白板等功能,实现超过30项高频功能的一键唤起。

【AiBase提要:】

🚀钉钉推出AI助理产品,可以进行信息摘要、写工作总结、写文档等工作,同时上线敲一敲新功能。

🔄截至2023年底,用户数突破7亿,组织数量达2500万,付费DAU为2800万,付费企业数达12万。

🎉 钉钉表示已有20+条产品线、80多个场景全面接入大模型,展示了其在人工智能领域的布局。

微软发布DragNUWA1.5版本

新版本的功能让用户在通过图像生成视频之前,能够在图像上画出对应方向的箭头标记,并通过人工智能技术自动调整视频画面的运动方向。

image.png

【AiBase提要:】

⭐ 视频生成前,可在图像上画出方向的箭头标记。

⭐ 功能通过人工智能技术自动调整视频画面的运动方向。

⭐ 提高视频编辑效率和方便性,无需复杂后期编辑。

项目地址:https://top.aibase.com/tool/dragnuwa

Magnific AI正式发布升级内容 图像可放大8倍

图像放大应用MagnificAI近期发布了新的升级内容,包括10K *10K的输出尺寸、新的“分形度”设置和对滚轮缩放的支持,提升用户体验和服务。

【AiBase提要:】

⭐ 新版本将图像放大到10K *10K大小,保持清晰度

⭐ 新增“分形度”设置,避免锐化过度

⭐ 新版本新增滚轮缩放支持,提升使用体验

📰🤖📢AI新鲜事

AMD推面向AI时代的PC处理器Ryzen8000G

AMD于2024年CES上发布了面向AIPC时代的AMDRyzen8000G系列处理器,强调其搭载了XDNANPU加速,其中一些型号内置XDNANPU加速,新系列以Zen4核心、RDNA3图形和新的XDNANPU为特色。

image.png

【AiBase提要:】

😀 AMD发布面向AIPC时代的AMDRyzen8000G系列处理器

😎 Ryzen8000G系列搭载XDNANPU加速

🤖 Zen4核心、RDNA3图形和新的XDNANPU为特色

谷歌开发机器学习工具Teachable Machine

eachable Machine是由Google开发的机器学习工具,用户可以快速、简单地创建自己的机器学习模型,无需专业知识或编程技能,教电脑识别图片、声音或人的动作。

【AiBase提要:】

👩‍🏫 用户无需专业知识或编程技能即可创建机器学习模型

📸 用户可以通过上传图片、录制声音或动作视频收集数据进行模型训练

🔐 提供多种方式创建模型,可在用户自己的电脑上完成操作,保护数据隐私

OpenAI 称《纽约时报》版权诉讼毫无根据

人工智能公司OpenAI日前对《纽约时报》提起的版权诉讼做出公开回应,称利用公开文章等数据训练AI系统属于“合理使用”。

【AiBase提要:】

🔸 OpenAI重申利用公开文章等数据训练AI系统属于“合理使用”。

🔸 公司认为生成式AI模型在提示下并不会逐字输出单一信息源的数据。

🔸 OpenAI表示愿意与《纽约时报》合作,且认为纽时的指控没有根据。

大众汽车将ChatGPT集成至多款车型

大众汽车宣布将在多款车型中批量集成ChatGPT,与其最新一代IDA语音助手结合,为用户提供通过自然语言与汽车进行互动的体验。

【AiBase提要:】

🚗 大众汽车集成ChatGPT: 大众汽车宣布将在多款车型中批量集成ChatGPT,与IDA语音助手结合,提供更人性化的语音交互服务。

🤖 多功能语音助手: ChatGPT不仅执行车辆功能,还提供多项新功能,包括路况查询、导航、设备控制、回答专业知识、搜索网络新闻等,实现多轮深度对话。

🔐 启动与隐私保护: 用户通过说出“你好IDA”或按下方向盘按钮激活ChatGPT,为保障隐私,ChatGPT无法访问车辆数据,问题和答案会立即删除。

微软推出“AI奥德赛”项目

微软推出“AI奥德赛”项目,助力印度培训开发人员,普及人工智能技术应用,加速数字化转型。

【AiBase提要:】

⦁ 项目名为“AI奥德赛”,培训印度开发人员掌握最新的AI技术和工具

⦁ 参与者需完成两个级别挑战,通过完成在线评估获得微软应用技能认证

⦁ 完成挑战的参与者还可获得机会参加微软AI巡演,共同塑造人工智能的未来。

👨‍💻💡🎯聚焦开发者

实时渲染3D技术BakedAvatar 可通过简短视频复制出人物3D头部

BakedAvatar是一项实时创建和渲染逼真的动态3D头像的技术。它可以通过简短的视频复制出人物的3D头部模型,并精确捕捉面部特征,模拟表情和头部运动。另外,它还能在移动设备上进行实时渲染,编辑和调整头像的表情和姿势。

image.png

【AiBase提要:】

⭐ BakedAvatar技术可通过简短视频复制出逼真的3D头部模型。

⭐ 可在移动设备上实时渲染、编辑和调整头像的表情和姿势。

⭐ 增强游戏互动性和真实感,能够实时进行面部重演和姿势编辑。

项目地址:https://top.aibase.com/tool/bakedavatar

新AI图像分割方法GenSAM:一个提示实现批量图片分割

GenSAM模型通过通用任务描述,实现对图像的有针对性分割,摆脱了对样本特定提示的依赖。

image.png

【AiBase提要:】

⚙️ 模型使用CCTP思维链和PMG框架,实现任务通用的文本提示映射和自适应分割。

🚀 实验证明,GenSAM在伪装样本分割任务上表现更好,具备良好的泛化性能。

🧩 通过提供通用任务描述,GenSAM模型可以批量地处理所有相关任务的无标注图片,更加高效和可扩展。

项目链接:https://top.aibase.com/tool/gensam

举报

  • 相关推荐
  • 大家在看
  • 优设 AI 导航:专业 AIGC 网站导航,每周更新热门 AI 工具。

    优设 AI 导航是专业全面的 AIGC 网站导航,为 AI 创作者提供 AI 绘画、智能对话、翻译等 AI 工具指引。其主要优点在于定期更新热门 AI 工具,为用户提供最新的 AI 技术应用信息。

  • Hyper-SD:高效图像合成的新框架

    Hyper-SD是一个创新的图像合成框架,它通过轨迹分割一致性模型和低步数推理的优势,实现了高效的图像合成。该框架结合了ODE轨迹保留和重构的优势,同时通过人类反馈学习进一步提升了性能,并通过分数蒸馏技术增强了低步数生成能力。Hyper-SD在1到8步推理步骤中实现了SOTA性能,特别适合需要快速且高质量图像生成的应用场景。

  • Unsloth:快速训练和微调大型语言模型

    Unsloth 是一个旨在提高大型语言模型(LLMs)训练和微调速度的平台。它通过手动推导所有计算密集型数学步骤并手写GPU内核,实现了无需硬件更改即可显著加快训练速度。Unsloth 支持多种GPU,包括NVIDIA、AMD和Intel,并提供开源版本供用户在Google Colab或Kaggle Notebooks上免费试用。它还提供了不同级别的定价方案,包括免费版、Pro版和企业版,以满足不同用户的需求。

  • 有言一站式 AIGC 视频创作平台:无需拍摄、剪辑,一键生成 3D 视频

    有言是一站式 AIGC 视频创作平台,提供上千个高质量的 3D 虚拟人角色选择,无需真人出镜。用户无需拍摄、剪辑,一键生成场景、灯光、动画、运镜和镜头,还集成了智能镜头剪辑、高质量视频后期包装。价格分为免费和付费订阅两种模式,定位于帮助用户简单快速地制作高质量视频。

  • 蝉镜:AI 数字人视频创作平台

    蝉镜是一个在线数字人视频创作平台,利用 AI 简化视频创作过程,提供 AI 数字人播报、短视频制作、分身定制等服务。广告营销、跨境电商、短视频口播等领域的用户可以在此提升创作效率、降低成本。

  • SC-GS:用于编辑动态场景的稀疏控制高斯溅射技术

    SC-GS是一种新型表示技术,将动态场景的运动和外观分别用稀疏控制点和密集高斯函数表示。它使用少量控制点学习紧凑的6自由度变换基,这些基可通过插值权重在局部插值,得到3D高斯函数的运动场。它采用变形MLP预测每个控制点的时变6自由度变换,降低学习复杂度,增强学习能力,实现时空连贯的运动模式。同时联合学习3D高斯函数、控制点的规范空间位置和变形MLP,重建3D场景的外观、几何和动态。在训练过程中,控制点的位置和数量会自适应调整以适应不同区域的运动复杂度,并采用尽可能刚性的损失函数强制运动的空间连续性和局部刚性。由于运动表示的显式稀疏性和外观分离,该方法实现了用户控制的运动编辑,同时保留高保真度外观。大量实验表明,该方法在新视图合成和高速渲染方面优于现有方法,并支持新的保留外观的运动编辑应用。

  • XTuner:高效灵活的大规模模型微调工具包

    XTuner是一个为大型模型(如InternLM, Llama, Baichuan, Qwen, ChatGLM)设计的高效、灵活且功能齐全的微调工具包。它支持在几乎所有GPU上进行LLM和VLM的预训练和微调,能够自动调度高性能操作,如FlashAttention和Triton内核,以提高训练吞吐量。XTuner与DeepSpeed兼容,支持多种ZeRO优化技术。它还支持各种LLMs和VLM(如LLaVA),并设计了良好的数据管道,能够适应任何格式的数据集。此外,XTuner支持多种训练算法,包括QLoRA、LoRA和全参数微调,使用户能够选择最适合其需求的解决方案。

  • Neta:AI魔法,创造你的虚拟灵魂伴侣

    Neta是一个结合了AI技术的网站,用户可以自定义虚拟角色的服装,并通过AI技术让角色栩栩如生。用户可以与这些虚拟角色一起踏上冒险旅程,探索奇妙的世界,培养深厚的情感联系。Neta提供了一个充满想象力和创造性的平台,让用户在虚拟世界中体验不同的生活和情感。

  • VideoGigaGAN:视频超分辨率模型,细节丰富

    VideoGigaGAN是一款基于大规模图像上采样器GigaGAN的视频超分辨率(VSR)模型。它能够生成具有高频细节和时间一致性的视频。该模型通过添加时间注意力层和特征传播模块,显著提高了视频的时间一致性,并使用反锯齿块减少锯齿效应。VideoGigaGAN在公共数据集上与最先进的VSR模型进行了比较,并展示了8倍超分辨率的视频结果。

  • Llama3-8B-Chinese-Chat:专为中文优化的聊天模型

    Llama3-8B-Chinese-Chat 是一个专为中文优化的聊天模型,基于 Meta-Llama-3-8B-Instruct 模型并通过 ORPO 进行微调。该模型显著减少了中文问题英文回答以及回答中中英文混合的现象,同时减少了回答中表情符号的使用,使得回答更加正式。

  • SAM:智能视频对象分割技术

    SAM是一个先进的视频对象分割模型,它结合了光学流动和RGB信息,能够发现并分割视频中的移动对象。该模型在单对象和多对象基准测试中均取得了显著的性能提升,同时保持了对象的身份一致性。

  • Picture To Text:在线图片转文字

    Picture to Text是一款在线图片文字识别工具,能够批量提取和复制图片中的文字内容。它免费转换照片为可编辑的文字。

  • HueMan:开发者用户的人像 API

    HueMankey 是一个为开发者提供的用户人像 API。它能够为每个用户分配一个独特的人像头像,支持批量请求和直接存储在平台上。它提供轻量级的图像数据,动态适应用户规模,并具备灵活的订阅计划。

  • Santelmo:在线混音和母带处理服务

    使用我们的专业混音和母带处理服务,将您的音乐推向新的高度。通过AI的力量,将您的音轨转化为令人惊叹的杰作,让它在竞争激烈的音乐行业中脱颖而出。可靠的交付时间,无限修订,保证退款。

  • The best Suno AI Lyrics Generator:免费生成歌曲歌词

    Suno AI是一个专门用于生成歌曲歌词的在线工具。它只需指定一个歌曲主题,就能生成完整的歌词,包括歌词内容、旋律和伴奏。Suno AI可以生成2分钟的完整歌曲,支持各种音乐风格和流派。用户可以免费使用Suno AI网站或Discord频道生成歌曲。同时,Suno AI还提供付费版本,提供更多的生成点数和商业使用权。

  • Ongkanon:提升您每天的对话体验

    Ongkanon是一款智能对话AI助手,提供有意义且上下文相关的对话体验。它能够自然地与您交谈,就像与亲密的朋友聊天一样。Ongkanon会根据您的偏好进行个性化定制,还能记住以前对话的上下文,以便进行更连贯、有意义的交互。

  • X:生成你的AI头像视频!

    X Me是一个AI头像视频生成工具,通过输入文本即可快速生成个性化的AI头像视频。它使用轻量级的AI模型,无需复杂的训练过程,快速生成逼真的数字人物视频。X Me提供多种AI名人头像供用户选择,并支持将用户自己的面部特征和声音克隆到生成的头像视频中。用户可以根据自己的喜好和需求,自由创造个性化的AI头像视频。

  • Portrait Studio:AI生成专业商务头像

    Portrait Studio Pro是一款AI生成的专业商务头像服务。用户只需上传几张照片,我们的AI引擎将生成完美的商务照片,适用于LinkedIn等场景,无需进行实际拍摄。价格实惠,仅需191美元起,支持14天退款保证。

  • InterviewQueue:在线评估软件平台

    InterviewQueue是一个在线评估工具,帮助您轻松筛选候选人。通过ChatGPT集成,这个在线评估软件平台将帮助您创建逻辑评估,为您的组织找到理想的候选人!

  • Skyla:您的 Shopify 商店的 ChatGPT 客服聊天机器人

    Skyla 是专为 Shopify 商户打造的最佳客户支持聊天机器人。通过 ChatGPT 提供先进的 AI 动力,为您的商店提供最佳的客户支持体验。

今日大家都在搜的词: