AI视野：Stability AI发布代码模型Stable Code3B；书生·浦语2.0正式开源；阿里推新项目MotionShop；Win11新增AI生成图像功能

2024-01-17 15:25 · 稿源：站长之家

欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解：https://top.aibase.com/

🤖📈💻💡大模型动态

Stability AI发布全新代码模型Stable Code3B

Stability AI公司发布了其首个新型人工智能模型，商业许可的Stable Code3B。这一模型仅有30亿参数，专注于软件开发的代码完成能力，可在没有专用GPU的笔记本上本地运行。

【AiBase提要:】
⭐ Stability Code3B，仅30亿参数，可在没有专用GPU的笔记本上本地运行，性能竞争力强。
⭐ 新模型具备代码完成能力，不仅建议新代码行，还可填充现有代码中的较大缺失部分，实现Fill in the Middle（FIM）
⭐ Stability Code3B覆盖Python、Java、JavaScript、Go、Ruby、C++等18种编程语言，在跨多语言基准测试中表现卓越，声称超越了两倍大小模型的完成质量。
产品网址入口:https://top.aibase.com/tool/stable-code-3b

书生·浦语2.0正式开源支持200K超长上下文

新一代200亿「书生·浦语2.0」是一款开源的大语言模型，支持200K超长上下文，且20B版本在数学推理方面的性能超越了ChatGPT。

【AiBase提要:】
💡InternLM2达到了与ChatGPT比肩的整体表现
💡新一代大语言模型书⽣·浦语2.0综合性能全面领先
💡第三代数据清洗过滤技术大幅度提升模型训练效率
项目地址:https://top.aibase.com/tool/internlm2

新文生图模型PIXART-δ:引入ControlNet，加速文本生成图像生成

PIXART-δ采用Latent Consistency Distillation（LCD）提高训练效率，支持低内存GPU。在推理速度和性能上超越SDXL LCM-LoRA、PIXART-α，成为文本到图像领域的领先模型。

【AiBase提要:】
🔬 创新ControlNet-Transformer设计，提升对Transformer模型的控制性能
⚙️ 采用Latent Consistency Distillation（LCD）提高训练效率，支持低内存GPU
📈 PIXART-δ在推理速度和性能上超越SDXL LCM-LoRA、PIXART-α，成为文本到图像领域的领先模型
项目网址入口:https://top.aibase.com/tool/pixart-

🤖📱💼AI应用

阿里推新项目MotionShop 可将视频中的角色替换为3D

MotionShop利用先进的视频处理和3D渲染技术，能够高效地将视频中的某个角色替换为3D人物，同时不改变视频中的其他场景和人物。

【AiBase提要:】
⭐ 视频处理和背景提取，利用视频处理技术分离出人物，留下无人的背景，并使用角色检测和分割追踪方法完成对目标的检测和追踪。
⭐ 姿势估计，利用姿势估计技术分析视频中人物的动作，并生成相应的3D动画人物。
⭐ 视频合成将渲染好的3D动画人物合成回无人背景视频中，生成最终的视频成果。
试用地址:https://top.aibase.com/tool/motionshop

微软Windows11Paint新增AI生成图像功能

微软Windows11最新更新增加了AI生成图像功能，用户可以选择描述和风格来生成图像。除了描述您想要的内容之外，还可以选择特定的风格，例如水彩或照片写实风格。

【AiBase提要:】
🎨 微软Windows11Paint新增AI生成图像功能，用户可以选择描述和风格来生成图像。
🌐Microsoft于2023年9月推出的Moment4更新将AI智能添加到Paint中，可以通过Windows11版本的Paint使用名为Cocreator的AI驱动工具来生成图像。
🖼️用户可以在画布中央查看生成的三个图像，并选择编辑保存喜欢的图像，也可以选择保存图像并通过电子邮件与其他人共享。

AI创作绘本摩笔天书开放邀请测试

摩尔线程宣布AI创作绘本“摩笔天书”已开放邀请测试，产品基于全功能GPU，为用户提供一站式、多模态、全流程、全自动的创作体验。

【AiBase提要:】
📱摩尔线程AI创作绘本“摩笔天书”已开放邀请测试。
📖用户可以通过输入标题和简要的故事大纲，一键生成完整故事、绘本图片、旁白、字幕、背景音乐等素材。
📚用户可以根据个人喜好进行选择旁白声音、背景音乐、字幕等，也可以进行图文编辑。
官网:https://top.aibase.com/tool/mobitianshu

实时翻译工具Byrdhouse AI 可在视频通话中翻译100多种语言

ByrdhouseAI是一个强大的工具，可以在视频通话中实时翻译100多种语言。它提供了语音翻译字幕和AI驱动的实时口译功能，让用户在会议或聊天中可以将自己的语言转换成另一种语言。

【AiBase提要:】
⭐ 提供语音翻译字幕和AI驱动的实时口译功能
⭐ 自动识别用户语言并进行翻译，允许编辑翻译后的字幕
⭐ 支持自动生成会议或通话摘要，实时语音到语音翻译服务
体验地址:https://top.aibase.com/tool/byrdhouse

📰🤖📢AI新鲜事

Airbnb斥资2亿，收购了家只有12个人的AI初创

前不久，民宿巨头Airbnb宣布收购一家12人规模的AI初创企业GamePlanner.AI。CNBC称Airbnb此次收购花了差不多2亿美金，这也是Airbnb上市后的首次收购。

【AiBase提要:】
Airbnb斥资2亿美元收购AI初创GamePlanner.AI;
AI为Airbnb打开大饼画面，也增强用户体验;
AI的影响正在扩展至各行业，估计将为全球经济贡献15.7万亿美元。

21岁哈佛辍学生开发的首款生活伴侣式AI项链预售火爆

21岁哈佛辍学生Avi Schiffmann近日带来了一款新型可穿戴AI产品Tab AI项链，可全天候记录周围对话并分析用户生活内容，目标成为智能生活伴侣。

QQ截图20240117091014.jpg

【AiBase提要:】
👂Tab AI项链通过麦克风和电池记录用户周围的对话，持续30小时。
📱记录的音频通过蓝牙传输到手机和云端，分析用户的全部生活内容。
💡项链通过大模型技术分析用户的对话，旨在提供有用信息并成为智能生活伴侣。

前谷歌研究人员筹集3000万美元在日本开发人工智能

在东京总部的人工智能初创公司Sakana AI宣布成功筹集3000万美元的种子轮融资。该公司由前谷歌研究人员David Ha和Llion Jones于去年共同创立，致力于开发新的人工智能模型。

【AiBase提要:】
💰 资金规模: Sakana AI 宣布成功筹集3000万美元的种子轮融资。
💼 投资方阵容: 美国Lux Capital和Khosla Ventures领投，索尼、NTT、KDDI等知名公司也参与投资。
🤖 研发重心: 公司将专注于未来一两年的研发，探索基于更小型“代理”网络的人工智能系统。

👨‍💻💡🎯聚焦开发者

PALP:基于提示对齐的个性化文本到图像生成方法

该方法通过使用得分采样来保持模型与目标提示的对齐，提高文本对齐度，并能生成复杂和精细的图像。通过这种方式，PALP可以实现更高程度的个性化，根据用户需求生成个性化的图像。

【AiBase提要:】
⭐️ 使用得分采样保持模型与目标提示的对齐。
⭐️ 可以实现更高程度的个性化，保持对齐度。
⭐️ 支持多主题的个性化生成。
项目地址:https://top.aibase.com/tool/palp

Vanna:一个便捷的SQL数据库交互工具

Vanna是一个工具，通过允许用户使用自然语言来查询数据库，然后将这些语言转换成SQL语句，实现数据库信息的查询和获取。

【AiBase提要:】
⦁ 用户可以使用自然语言来查询数据库，然后Vanna自动将其转换成SQL语句，并查询数据库。
⦁ Vanna可以连接到任何使用SQL的数据库，不论数据库的类型。
⦁ 用户可以根据自己的数据和需求训练Vanna，使得它在转换问题为SQL语句时更准确。
官网地址:https://top.aibase.com/tool/vanna-ai

字节复旦团队提出meta prompts 扩散模型图像理解力刷新SOTA

过去一年，扩散模型逐渐在文生图领域扩展，能否处理视觉感知任务呢?字节跳动和复旦大学技术团队提出了简单有效方案，旨在提高模型在视觉识别任务中的性能。

【AiBase提要:】
💡 复旦大学和字节跳动的团队提出meta prompts 扩散模型图像理解力刷新SOTA
💡 通过引入可学习的元提示到预训练的扩散模型中，以提取适合特定感知任务的特征。
💡 扩散模型在去噪UNet中生成多尺度特征，技术团队引入meta prompts作为特征重组的过滤器，以提高模型在视觉识别任务中的性能。
项目地址:https://github.com/fudan-zvg/meta-prompts

（举报）

相关推荐
大家在看

关键词：

StableCode3B

【腾讯云】11.11云上盛惠！云服务器首年1.8折起，买1年送3个月！

11.11云上盛惠！海量产品 · 轻松上云！云服务器首年1.8折起，买1年送3个月！超值优惠，性能稳定，让您的云端之旅更加畅享。快来腾讯云选购吧！

Docker容器镜像
去看看

Docker容器镜像 60元/15天

爆款产品组合购
去看看

爆款产品组合购低至1元

腾讯云x NVIDIA加速计划
去看看

腾讯云x NVIDIA加速计划最高获赠10万元扶持基金

2核2G云服务器
去看看

2核2G云服务器 112元/1年

查看更多相关信息>>

腾讯云 12-20

广告
荐AI日报：性能超GPT-4o！Meta4050亿参数开源模型Llama3.1遭泄漏；Stability AI开源音频生成模型Stable Audio Open

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/1、震惊AI界！14、微软研究院推AI框架E5-V:用文本对的单模态训练简化多模态学习降低成本微软研究院与北京航空航天大学联合推出的E5-V框架通过单模态训练简化多模态学习，降低成本，在多个任务中展现出优异性能，代表了多模态学习的重大进步。

Llama3.1
荐好消息！Stable Diffusion 3允许商业化，很快开源更大版本模型

7月6日凌晨，著名开源大模型平台StabilityAI修改了社区许可协议，最新发布的文生图模型StableDiffusion3Medium允许商业化。如果企业、个人开发者每年收入低于100万美元，只需向StabilityAI填写一份申请，就可以免费将SD3-M用于商业化，包括数据微调、开发生成式AI应用等。红色的火星表面，人类建立的第一个殖民地，有透明穹顶覆盖的居住区，科学家们在户外进行研究，背景是隐约可见的地球。

SD3
Stable Diffusion 教程：玉石翡翠材质图标

logo版权归各公司所有！本笔记仅供AIGC案例练习展示！通过详细的步骤和实例，学习如何将AI绘图与宝石的天然美相结合，创造出独特的玉石图标，提升设计的质感和专业度。

SD教程 AI会员教程
荐AI日报：微软推设计神器Microsoft Designer；苹果开源小模型 DCLM-Baseline-7B；小爱宣布新增AI文档问答等功能

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、微软推设计神器MicrosoftDesigner作为一款集成人工智能技术的设计应用程序，MicrosoftDesigner让设计变得更简单、高效。它支持股票、外汇、债券和加密货币，提供全面的市场分析，为

Designer
Stable Diffusion教程：效果超好的Instant-ID换脸使用方法（纯干货）

InstantID是controlnet比较新的一个模型，主要作用也是固定人物的面部特征。它可以仅通过一张图片进行完美换脸，可能是目前最强的脸部迁移模型。【重绘幅度】0.6具体参数可以参考下图步骤三：ControlNet设置你的第一个单元必须是embedding和ip-adapter的组合第一个单元是获取人脸特征的模型你的第二个单元必须是keypoints和control-instant-id-sdxl的组合这个单元是作为替换模版，在图生图

StableDiffusion教程 Instant-ID AI会员教程
Stable Diffusion 教程：轻松打造透明质感轻图标

本教程将指导你如何使用StableDiffusion技术轻松打造具有透明质感的轻图标。通过实用的步骤和技巧，学习如何在短时间内创作出充满创意的图标设计。

AI会员教程
荐AI日报：对标GPT-4o！开源大模型Moshi登场；Google Pixel 9新增多个AI功能；ElevenLabs发布消音神器VOICE ISOLATOR

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/1、对标GPT-4o！任天堂将谨慎对待生成式人工智能的使用，依靠团队内部的创造力和经验。

Moshi
荐AI日报：文本转语音模型Fish Speech；Meta 3D Gen发布，1分钟快速构建3D模型；AI生成熊猫吃泡面视频刷屏抖音

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/1、媲美GPT-SoVITS！艺术家们已经无法与计算机生成的图像竞争，导致许多人放弃了艺术家的职业。

文本转语音
热到变形？城市地标融化成冰淇淋！Stable Diffusion 冰淇淋建筑详细教程

全国各地进入高温蒸烤模式，有网友给大家想了个妙招，把建筑变身冰淇淋，给大家来了个视觉上的“降温”。博主@曲元的冰淇淋建筑系列在小红书上备受欢迎，他将利用AI工具将北京天坛、大裤衩、黄鹤楼等城市地标建筑全部变成了冰淇淋，让大家望“冰”止渴。以下是AIbase测试的sd和即梦的冰淇淋建筑的成品图，大家可以根据自己的情况选择。

冰淇淋建筑 AI会员教程
Stable Diffusion教程：如何使用水墨风格Lora增强品牌标识

本教程分享了使用StableDiffusion和水墨风格LoRa技术来提升品牌标识的方法。通过详细的步骤和示例，学习如何将传统水墨艺术与现代AI技术结合，创造出独特的品牌视觉体验。

SD教程 AI会员教程

知了zKnown:致力于信息降噪 / 阅读提效的个人知识助手

知了 zKnown 是一款 AI-Native 构建的个人知识助手，专注于信息降噪和阅读提效。它通过多端同步、多渠道总结、长文本支持等功能，帮助用户高效地管理和整理信息。产品的主要优点包括：- 多端同步：用户可以在移动app、桌面客户端、网页版、小程序等多个平台同步使用。- 多渠道总结：支持微信公众号、知乎、简书、36Kr、少数派等多个渠道的文章总结。- 长文本支持：最长支持总结3万字的文章内容。- 摘要导出：用户可以将摘要保存到 Notion、Flomo 等平台。- 产品背景：知了 zKnown 致力于通过 AI 技术提升用户的阅读和信息管理效率，适合需要高效处理大量信息的用户。

信息管理阅读提效 AI助手

MBox AI Meet:实时转录与会议总结的谷歌会议扩展

MBox AI Meet是一款免费Chrome扩展，专为Google Meet设计，提供实时转录和自动生成会议总结的功能。它利用AI技术帮助用户在会议中专注于讨论，而无需担心记笔记。该工具通过实时转录捕捉会议的每一个细节，并在会议结束后自动生成总结，确保用户不会错过任何重要信息。MBox AI Meet的隐私优先策略确保会议安全，不存储任何音频或视频内容。此外，该扩展还计划在未来更新中增加更多AI功能，如发言人识别、实时AI助手等。

AI 会议管理实时转录

Klee:本地安全AI，保障数据隐私。

Klee是一款macOS原生的AI助手应用程序，专注于本地处理数据，确保数据安全和隐私。它使用先进的AI技术，如RAG（检索增强生成）和开源大型语言模型，如Llama 3和Mistral，为用户提供高效、智能的笔记、搜索和知识管理功能。Klee的主要优点包括本地运行以保护隐私、支持团队协作、免费使用以及优化的macOS体验。

AI助手 macOS原生数据隐私

Kipps.AI:快速构建AI助手，提升业务效率

Kipps.AI 是一个在线平台，允许用户在短短两分钟内构建自己的AI助手，并将其集成到业务中。该平台支持多种数据源，如PDF、Notion、网站链接和文本，用户只需提供这些数据，Kipps.AI 会处理其余部分。它还与常用的工具如GoDaddy、Wordpress、Drupal、Squarespace、Magento和Wix等进行集成，使得用户可以轻松地将AI助手集成到现有的业务流程中。

AI助手自动化数据处理

CrossPrism for MacOS:图像识别、标注和关键词生成工具

CrossPrism for MacOS 是一款专为摄影师设计的图像识别、标注和关键词生成工具。它利用多核 CPU、GPU 和神经引擎，能够识别物种、生成标题和描述，并支持模型训练的可定制性。用户可以在本地自动标注无限量的原始照片，确保所有照片安全地存储在 Mac 上，无需担心云服务中断、数据锁定或文件传输问题。其20多个专家模型可以对从鸟类到地标的各种内容进行分类，并提供新的视角来整理目录和重新发现旧照片。此外，它还支持视频处理、Lightroom 插件、图像质量评估等功能，使其成为一个强大的筛选工具。

AI视野：Stability AI发布代码模型Stable Code3B；书生·浦语2.0正式开源；阿里推新项目MotionShop；Win11新增AI生成图像功能

今日大家都在搜的词：

热文

站长商机