AI视野：Meta开源文生图模型RCG；百川智能发布角色大模型；AMD推AI电脑处理器Ryzen8000G；大众汽车将ChatGPT集成至多款车型

2024-01-09 15:46 · 稿源：站长之家

欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解：https://top.aibase.com/

🤖📈💻💡大模型动态

麻省理工、Meta开源创新文生图模型RCG

麻省理工与Meta共同开发了“表示条件的图像生成”模型，无需任何人工标注，生成出来的图片效果显著。

【AiBase提要:】
1. 有条件图像生成的效果，远超无条件的图像生成。
2. 模型不需要人工标注数据，使用MoCo v3进行预训练。
3. 通过对比学习方法获得更有效的图像表示。
开源地址:https://github.com/LTH14/rcg

百川智能发布角色大模型 Baichuan-NPC

百川智能推出角色大模型Baichuan-NPC，结合“角色创建平台 + 搜索增强知识库”解决方案，优化角色知识和对话能力，提供低成本、高效率的游戏AI角色定制。

【AiBase提要:】
🌐 知识库定制解决方案: Baichuan-NPC通过超过3T Tokens的领域知识预训练，创新地使用多方法模型合成数据，提高Token利用效率。
🤖 思维链对齐技术: 首次应用于角色模型对齐，使模型思考和行动更接近人类，提升角色一致性和基础对话能力。
🎭 开发简洁高效: 角色创建平台使用强多轮对齐技术和搜索增强知识库技术，提供简洁高效的开发流程，实现一键复制角色代码。

🤖📱💼AI应用

钉钉发布AI超级助理

今天，钉钉在7.5产品发布会上正式发布智能化产品——AI助理。用户点击钉钉首屏右上角的魔法棒，可唤起AI助理，该产品可以进行信息摘要、写工作总结、写文档等工作，用户还可以通过对话，让AI助理打开钉钉投屏、脑图、白板等功能，实现超过30项高频功能的一键唤起。

【AiBase提要:】
🚀钉钉推出AI助理产品，可以进行信息摘要、写工作总结、写文档等工作，同时上线敲一敲新功能。
🔄截至2023年底，用户数突破7亿，组织数量达2500万，付费DAU为2800万，付费企业数达12万。
🎉 钉钉表示已有20+条产品线、80多个场景全面接入大模型，展示了其在人工智能领域的布局。

微软发布DragNUWA1.5版本

新版本的功能让用户在通过图像生成视频之前，能够在图像上画出对应方向的箭头标记，并通过人工智能技术自动调整视频画面的运动方向。

【AiBase提要:】
⭐ 视频生成前，可在图像上画出方向的箭头标记。
⭐ 功能通过人工智能技术自动调整视频画面的运动方向。
⭐ 提高视频编辑效率和方便性，无需复杂后期编辑。
项目地址:https://top.aibase.com/tool/dragnuwa

Magnific AI正式发布升级内容图像可放大8倍

图像放大应用MagnificAI近期发布了新的升级内容，包括10K *10K的输出尺寸、新的“分形度”设置和对滚轮缩放的支持，提升用户体验和服务。

【AiBase提要:】
⭐ 新版本将图像放大到10K *10K大小，保持清晰度
⭐ 新增“分形度”设置，避免锐化过度
⭐ 新版本新增滚轮缩放支持，提升使用体验

📰🤖📢AI新鲜事

AMD推面向AI时代的PC处理器Ryzen8000G

AMD于2024年CES上发布了面向AIPC时代的AMDRyzen8000G系列处理器，强调其搭载了XDNANPU加速，其中一些型号内置XDNANPU加速，新系列以Zen4核心、RDNA3图形和新的XDNANPU为特色。

【AiBase提要:】
😀 AMD发布面向AIPC时代的AMDRyzen8000G系列处理器
😎 Ryzen8000G系列搭载XDNANPU加速
🤖 Zen4核心、RDNA3图形和新的XDNANPU为特色

谷歌开发机器学习工具Teachable Machine

eachable Machine是由Google开发的机器学习工具，用户可以快速、简单地创建自己的机器学习模型，无需专业知识或编程技能，教电脑识别图片、声音或人的动作。

【AiBase提要:】
👩‍🏫 用户无需专业知识或编程技能即可创建机器学习模型
📸 用户可以通过上传图片、录制声音或动作视频收集数据进行模型训练
🔐 提供多种方式创建模型，可在用户自己的电脑上完成操作，保护数据隐私

OpenAI 称《纽约时报》版权诉讼毫无根据

人工智能公司OpenAI日前对《纽约时报》提起的版权诉讼做出公开回应，称利用公开文章等数据训练AI系统属于“合理使用”。

【AiBase提要:】
🔸 OpenAI重申利用公开文章等数据训练AI系统属于“合理使用”。
🔸 公司认为生成式AI模型在提示下并不会逐字输出单一信息源的数据。
🔸 OpenAI表示愿意与《纽约时报》合作，且认为纽时的指控没有根据。

大众汽车将ChatGPT集成至多款车型

大众汽车宣布将在多款车型中批量集成ChatGPT，与其最新一代IDA语音助手结合，为用户提供通过自然语言与汽车进行互动的体验。

【AiBase提要:】
🚗 大众汽车集成ChatGPT: 大众汽车宣布将在多款车型中批量集成ChatGPT，与IDA语音助手结合，提供更人性化的语音交互服务。
🤖 多功能语音助手: ChatGPT不仅执行车辆功能，还提供多项新功能，包括路况查询、导航、设备控制、回答专业知识、搜索网络新闻等，实现多轮深度对话。
🔐 启动与隐私保护: 用户通过说出“你好IDA”或按下方向盘按钮激活ChatGPT，为保障隐私，ChatGPT无法访问车辆数据，问题和答案会立即删除。

微软推出“AI奥德赛”项目

微软推出“AI奥德赛”项目，助力印度培训开发人员，普及人工智能技术应用，加速数字化转型。

【AiBase提要:】
⦁ 项目名为“AI奥德赛”，培训印度开发人员掌握最新的AI技术和工具
⦁ 参与者需完成两个级别挑战，通过完成在线评估获得微软应用技能认证
⦁ 完成挑战的参与者还可获得机会参加微软AI巡演，共同塑造人工智能的未来。

👨‍💻💡🎯聚焦开发者

实时渲染3D技术BakedAvatar 可通过简短视频复制出人物3D头部

BakedAvatar是一项实时创建和渲染逼真的动态3D头像的技术。它可以通过简短的视频复制出人物的3D头部模型，并精确捕捉面部特征，模拟表情和头部运动。另外，它还能在移动设备上进行实时渲染，编辑和调整头像的表情和姿势。

【AiBase提要:】
⭐ BakedAvatar技术可通过简短视频复制出逼真的3D头部模型。
⭐ 可在移动设备上实时渲染、编辑和调整头像的表情和姿势。
⭐ 增强游戏互动性和真实感，能够实时进行面部重演和姿势编辑。
项目地址:https://top.aibase.com/tool/bakedavatar

新AI图像分割方法GenSAM:一个提示实现批量图片分割

GenSAM模型通过通用任务描述，实现对图像的有针对性分割，摆脱了对样本特定提示的依赖。

【AiBase提要:】
⚙️ 模型使用CCTP思维链和PMG框架，实现任务通用的文本提示映射和自适应分割。
🚀 实验证明，GenSAM在伪装样本分割任务上表现更好，具备良好的泛化性能。
🧩 通过提供通用任务描述，GenSAM模型可以批量地处理所有相关任务的无标注图片，更加高效和可扩展。
项目链接:https://top.aibase.com/tool/gensam

（举报）

相关推荐
大家在看

关键词：

Meta

【腾讯云】11.11云上盛惠！云服务器首年1.8折起，买1年送3个月！

11.11云上盛惠！海量产品 · 轻松上云！云服务器首年1.8折起，买1年送3个月！超值优惠，性能稳定，让您的云端之旅更加畅享。快来腾讯云选购吧！

Docker容器镜像
去看看

Docker容器镜像 60元/15天

爆款产品组合购
去看看

爆款产品组合购低至1元

腾讯云x NVIDIA加速计划
去看看

腾讯云x NVIDIA加速计划最高获赠10万元扶持基金

2核2G云服务器
去看看

2核2G云服务器 112元/1年

查看更多相关信息>>

腾讯云 12-20

广告
华为发布全新OceanStor A800 AI存储：10TB级带宽专攻AI大模型

近日，在2024华为数据存储用户精英论坛上，AI-Ready的数据基础设施”分论坛成功举行。为促进AI大模型健康发展，华为推出了全新的OceanStorA800AI存储。华为全新OceanStorA800AI存储提供了全新解决方案。

华为 AI存储 OceanStor
荐性能秒杀SD3、DALL·E-3，开源文生图模型杀出大黑马

昨天Midjourney刚进行大更新，今天文生图片开源领域就杀出了一匹大黑马—FLUX.1。根据其测试数据显示，性能大幅度超过了DALL·E-3、MidjourneyV6闭源模型，开源SD3系列的Ultra、Medium、Turbo和SDXL被全线秒杀。FLUX.1生成的图片质量、细节和光影效果还行吧，期待一下他的文生视频模型。

FLUX.1
AMD RX 8000显卡首次现身！只略强于RX 7700 XT

GeekBench里第一次出现了AMD下一代显卡，显示核心编号为gfx1201，正好对应RDNA4架构。RDNA1、RDNA2、RDNA3、RDNA3.5核心编号分别为gfx101x、gfx103x、gfx11xx、gfx115x。显存容量多达16GB，相当于RX7800XT、RX7900GRE必然还是GDDR6，不可能上GDDR7，AMDRX8000系列将放弃旗舰产品，只有高端的Navi48、主流的Navi44，预计分别对应RX8800/8700系列、RX8600/8500系列。

AMD显卡 RDNA 4架构
起猛了，GPT-4o被谷歌新模型击败，ChatGPT官号：大家深吸一口气

GPT-4o被谷歌新模型超越了!历时一周，超1，2000人匿名投票，Gemini1.5Pro代表谷歌首次夺得lmsys竞技场第一。且这次还是双冠王，除了总榜，在视觉排行榜上也是第一。面对谷歌最新取得的一系列新排名，竞技场榜单权威性再次受到大家质疑。

GPT-4o GPT-4o
荐15秒出圈视频，千万次网友观看，AI广告何时迎来“ChatGPT时刻”？

AI超级个体的广告时代要来临了?最近，麦当劳联动X博主“KakuDrop”整了个大活:15秒的视频，10个AI美女，1份超大份麦当劳薯条，超1000万次观看，这个用LumaAI的DreamMachine1.5制作的麦当劳AI广告在X上火了，甚至由麦当劳官方发布:还得到了Luma官方的转发:这次AI广告的创作者“KakuDrop”是AI视频圈的知名博主，视频风格颇具个人特色，以“人像转场”为主，其作品在Instagram上最高播放�

AI广告 ChatGPT
荐语言图像模型大一统！Meta将Transformer和Diffusion融合，多模态AI王者登场

【新智元导读】就在刚刚，Meta最新发布的Transfusion，能够训练生成文本和图像的统一模型了!完美融合Transformer和扩散领域之后，语言模型和图像大一统，又近了一步。真正的多模态AI模型，可能很快就要来了!Transformer和Diffusion，终于有了一次出色的融合。他在卡耐基梅隆大学语言技术研究所获得博士学位，师从EduardHovy教授，并在上海交通大学获得了计算机科学硕士和学士学位�

Transformer Diffusion Meta
ChatGPT有多全能，女生用ChatGPT测网恋对象是否谎报身高，误差只有2厘米

【新智元导读】担心相亲对象谎报身高怎么办?交给ChatGPT!最近小编学到了一组男性身高公式:过5减4，低5取0。一位男性在相亲信息中报身高174，则他的实际身高是170;如果一位男性在相亲信息中报身高179——这个世界上没有179的男生，179一定会报180，他的真实身高应该是175左右。很多投资分析手段技术门槛和专业知识要求非常高，有个AI工具之后，散户们可以通过工具更好地检验

ChatGPT
荐ChatGPT后，人工智能的终极里程碑却倒了

大模型的拟人行为，在让我们产生恐怖谷效应。「图灵测试是一个糟糕的测试标准，因为对话能力和推理完全是两码事。这可能就是我们能够获得的最好结果。

ChatGPT
荐比Stable Diffusion便宜118倍！1890美元训出11.6亿参数高质量文生图模型

【新智元导读】近日，来自加州大学尔湾分校等机构的研究人员，利用延迟掩蔽、MoE、分层扩展等策略，将扩散模型的训练成本降到了1890美元。训练一个扩散模型要多少钱?之前最便宜的方法用了28400美元像StableDiffusion这样的模型还要再贵一个数量级。由上表结果可知发现，在所有三个性能指标上，分层缩放方法都优于基线的恒定宽度方法，这表明分层缩放方法更适合DiT的掩蔽�

SD 文生图模型
荐OpenAI支持的最强实体“ChatGPT机器人”，8月6日发布

Figure.AI联合创始人BrettAdcock宣布，将于8月6日发布Figure02型号。Brett没有过多的介绍Figure02新功能和技术特性，只放出了一句狠话——这将是地球最强的人形机器人。宝马已经与Figure.AI签署了合作协议，将在实际业务中使用Figure系列实体机器人。

人形机器人 Figure02发布 Brett

BNA:多功能AI超级应用，涵盖社交、电商、娱乐和教育。

BNA AI Super App是一款集成了多种智能服务的超级应用，它不仅提供社交功能，如分享帖子、写博客、聊天和视频通话，还涵盖了AI电商和娱乐服务。此外，该应用还提供40种语言的AI教学服务，帮助用户学习不同的语言。BNA AI Super App以其强大的AI功能和多语言支持，满足了不同用户群体的需求。

AI 多语言学习社交

Elisi:高效能自主层级式计划助手

Elisi 是一款旨在帮助用户实现个人成长的终极组织者和指南。它通过直观的设计和用户友好的说明，帮助用户将梦想转化为清晰的结果，分解成可实现的里程碑，并通过AI技术理解并适应用户的个人需求，确保每一天都更有条理和高效。Elisi 致力于提供便捷服务，主要功能套件完全免费。

个人成长时间管理目标设定

Omi AI:个性化AI助手，记录每一刻，与AI对话获取反馈。

OMI APP是一个任务驱动的个性化AI助手，旨在通过语音和音频转录功能帮助用户提高记忆力和沟通效率。它是一个开源的AI记事本，提供提醒、建议等功能，同时注重用户隐私。

AI助手语音转录隐私保护

MeowMail:高送达率的AI电子邮件营销工具

MeowMail是一款集成在Shopify后台的电子邮件营销应用，利用AI技术自动选择最佳发送时间，提高邮件的送达率至98%以上。它支持拖放编辑、从Klaviyo导入邮件列表、使用Beefree编辑器创建新邮件，并通过设定支出限制来管理邮件营销活动。MeowMail还提供企业级支持和自动翻译文本功能，帮助商家以低成本实现高效的邮件营销。

邮件营销 AI技术 Shopify应用

Maia 100:微软定制AI加速器，专为大规模AI工作负载设计。

Maia 100是微软为Azure设计的首款定制AI加速器，专为大规模AI工作负载而打造，通过软硬件的协同优化，实现了性能、可扩展性和灵活性的最大化。它采用了TSMC N5工艺和COWOS-S互连技术，具备高达1.8TB/s的带宽和64GB的容量，支持高达700W的热设计功耗(TDP)，但以500W运行，确保了高效的能效比。Maia 100集成了高速张量单元、向量处理器、DMA引擎和硬件信号量，支持多种数据类型和张量切分方案，并通过以太网互连支持大规模AI模型。此外，Maia SDK提供了丰富的组件，支持快速部署PyTorch和Triton模型，并通过双编程模型确保高效的数据处理和同步。

AI加速器 Azure 大规模计算

LTM:超长上下文模型，革新软件开发

Magic团队开发的超长上下文模型（LTM）能够处理高达100M tokens的上下文信息，这在AI领域是一个重大突破。该技术主要针对软件开发领域，通过在推理过程中提供大量代码、文档和库的上下文，极大地提升了代码合成的质量和效率。与传统的循环神经网络和状态空间模型相比，LTM模型在存储和检索大量信息方面具有明显优势，能够构建更复杂的逻辑电路。此外，Magic团队还与Google Cloud合作，利用NVIDIA GB200 NVL72构建下一代AI超级计算机，进一步推动模型的推理和训练效率。

AI 软件开发上下文推理

EZ-work AI文档翻译:智能AI翻译，高效文档语言转换助手。

EZ-work AI文档翻译是一款专注于文档翻译的在线服务，支持多种语言的翻译，包括中文、英语、日语、俄语、阿拉伯语和西班牙语等。它使用先进的AI技术，如gpt-4o-mini和deepseek-chat模型，为用户提供快速、准确的翻译服务。该产品适用于需要文档翻译的个人和企业，尤其在国际交流和学术研究领域尤为重要。

翻译 AI 文档处理

Watson AI:会议助手，自动记录并总结会议要点。

Watson AI是一款会议助手应用程序，它通过录制系统音频和麦克风来转录和总结会议内容，自动提取行动项和会议摘要，帮助用户更高效地进行会议记录和回顾。

会议助手自动记录效率工具

PicTech AI: 免费在线AI图片翻译助力跨境电商

PicTech AI是由学以致用科技旗下的智能图像工具品牌，专注于为跨境电商提供AI驱动的图片翻译服务。该产品利用人工智能技术，实现高准确率和高清晰度的图片翻译，支持中文、英语到日语、韩语等多国语言的翻译。PicTech AI的智能抠图功能，能够准确检测图片主体边缘，一键去除背景，无需专业编辑。产品背景信息显示，其团队由来自百度、网易、阿里巴巴等行业巨头的顶尖高科技人才组成，具备强大的技术实力和产品能力。该产品定位于帮助跨境电商从业者简化工作流程，提高效率，无需懂外语或图像处理技能即可使用。

AI翻译跨境电商智能抠图

AnythingLLM:一站式AI应用，支持多种文档和模型。

AnythingLLM是一个多功能的桌面客户端，支持多种语言模型（LLM）和文档类型，提供完全私密的使用体验。用户可以根据自己的需求选择企业级模型、自定义模型或开源模型，如GPT-4、Llama、Mistral等。产品支持一键安装，本地运行，无需互联网连接，保护用户隐私。

AI 文档处理隐私保护

林哥的大模型野榜:更适合中国宝宝体质的大模型产品排行榜

林哥的大模型野榜是一个专注于中国用户需求的大模型产品排行榜，提供了多维度的评估和排名，帮助用户更好地了解和选择适合的大模型产品。

大模型排行榜多维度评估

Fluximg.com:AI文本到图像生成器，支持多尺寸和自动翻译。

Fluximg.com是一个基于Flux模型的AI图像生成网站，提供从文本到图像的转换服务。它支持多种语言，包括中文和英文，并且具有用户友好的界面。网站提供免费和专业版本，使用户能够根据自己的需求选择不同的服务级别。

AI图像生成多尺寸自动翻译

现代文转古文:将现代汉语转化为古汉语，提升文采。

现代文转古文是一款能够将现代汉语自动转换为古汉语的模型，它通过先进的自然语言处理技术，使得用户可以轻松地将现代文本转换成具有古典韵味的古文。这种转换不仅能够增加文本的文学价值，还能在教育、文学创作、文化传承等方面发挥重要作用。

古文文学转换

Zamba2-mini:先进的小型语言模型，专为设备端应用设计。

Zamba2-mini是由Zyphra Technologies Inc.发布的小型语言模型，专为设备端应用设计。它在保持极小的内存占用(<700MB)的同时，实现了与更大模型相媲美的评估分数和性能。该模型采用了4bit量化技术，具有7倍参数下降的同时保持相同性能的特点。Zamba2-mini在推理效率上表现出色，与Phi3-3.8B等更大模型相比，具有更快的首令牌生成时间、更低的内存开销和更低的生成延迟。此外，该模型的权重已开源发布(Apache 2.0)，允许研究人员、开发者和公司利用其能力，推动高效基础模型的边界。

AI视野：Meta开源文生图模型RCG；百川智能发布角色大模型；AMD推AI电脑处理器Ryzen8000G；大众汽车将ChatGPT集成至多款车型

今日大家都在搜的词：

热文

站长商机