智能体生命力觉醒！可自我更新的AI来了，妈妈再也不用担心数据瓶颈难题

2024-04-29 14:06 · 稿源：量子位公众号

声明:本文来自于微信公众号量子位（ID:QbitAI），作者:衡宇，授权站长之家转载发布。

哭死啊，全球狂炼大模型，一互联网的数据不够用，根本不够用。

训练模型搞得跟《饥饿游戏》似的，全球AI研究者，都在苦恼怎么才能喂饱这群数据大胃王。

尤其在多模态任务中，这一问题尤为突出。

一筹莫展之际，来自人大系的初创团队，用自家的新模型，率先在国内把“模型生成数据自己喂自己”变成了现实。

而且还是理解侧和生成侧双管齐下，两侧都能生成高质量、多模态的新数据，对模型本身进行数据反哺。

模型是啥?

中关村论坛上刚刚露面的多模态大模型Awaker1.0。

团队是谁?

智子引擎。由人大高瓴人工智能学院博士生高一钊创立，高瓴人工智能学院卢志武教授担任顾问。公司成立时还是2021年，就早早打入多模态这条“无人区”赛道。

MOE架构，解决多模态多任务训练冲突问题

这不是智子引擎第一次发布模型。

去年3月8日，潜心研发两年的团队对外发布了自研的第一个多模态模型，百亿级别参数的ChatImg序列模型，并基于此推出世界首个公开评测多模态对话应用ChatImg（元乘象）。

后来，ChatImg不断迭代，新模型Awaker的研发也在并行推进。后者还继承了前代模型的基础能力。

相较于前代的ChatImg序列模型，Awaker1.0采用了MoE模型架构。

要说原因嘛，是想要解决解决多模态多任务训练存在严重冲突的问题。

采用MoE模型架构，可以更好地学习多模态通用能力以及各个任务所需的独特能力，从而让整个Awaker1.0的能力在多个任务上有进一步提升。

数据胜千言:

鉴于主流多模态评测榜单存在评测数据泄露问题，智子团队从严构建了自有评测集，大部分测试图片来自个人手机相册。

表格显示，团队让Awaker1.0和国内外最先进的3个多模态大模型进行了评测。

多提一嘴，由于GPT-4V和Intern-VL并不直接支持检测任务，它们的检测结果是通过要求模型使用语言描述物体方位得到的。

可以看到，在视觉问答和业务应用任务上，Awaker1.0的基座模型超过了GPT-4V、Qwen-VL-Max和Intern-VL。

在描述、推理和检测任务上，Awaker1.0的基座模型达到了次好效果。

最后来看平均分，Awaker1.0处于几者中的最高值。

因此，上述结果也印证了多任务多模态模型采用MoE架构的有效性。

数据集评测结果有了，真实效果还需进一步上手体验。

这里主要问了它和对比大模型一些关于中文OCR（图片文字识别）和计数问题、详细描述任务等问题。

这个主要考计数:

Awaker1.0能正确地给出答案，而其它三个模型均回答错误。

这个主要考中文OCR:

正确回答的选手是Qwen-VL-Max和Awaker1.0。

最后这题考图片内容理解。

GPT-4V和Awaker1.0不但能够详细地描述图片的内容，而且能够准确地识别出图片中的细节，如图中展示的可口可乐。

不得不提一嘴的是，Awaker1.0继承了一些智子团队此前广为关注的研究成果。

说的就是你——Awaker1.0的生成侧。

Awaker1.0的生成侧，是智子引擎自主研发的类Sora视频生成底座VDT（Video Diffusion Transformer）。

VDT的学术论文早于OpenAI Sora的发布（去年5月），并已被顶会ICLR2024接收。

VDT与众不同的创新之处，主要有两点。

一是在技术架构上采用Diffusion Transformer，在OpenAI之前就展现了Transformer在视频生成领域的巨大潜力。

它的优势在于其出色的时间依赖性捕获能力，能够生成时间上连贯的视频帧，包括模拟三维对象随时间的物理动态。

二是提出统一的时空掩码建模机制，使VDT能够处理多种视频生成任务。

VDT灵活的条件信息处理方式，如简单的token空间拼接，有效地统一了不同长度和模态的信息。

同时，通过与该工作提出的时空掩码建模机制结合，VDT成为了一个通用的视频扩散工具，在不修改模型结构的情况下可以应用于无条件生成、视频后续帧预测、插帧、图生视频、视频画面补全等多种视频生成任务。

据了解，智子引擎团队不仅探索了VDT对简单物理规律的模拟，发现它能模拟物理过程:

还在超写实人像视频生成任务上进行了深度探索。

因为肉眼对人脸及人的动态变化非常敏感，所以这个任务对视频生成质量的要求非常高。不过，智子引擎已经突破超写实人像视频生成的大部分关键技术，比起Sora也没在怕的。

口说无凭。

这是智子引擎结合VDT和可控生成，对人像视频生成质量提升后的效果:

据悉，智子引擎还将继续优化人物可控的生成算法，并积极进行商业化探索。

生成源源不断的新交互数据

更值得关注的是，智子引擎团队强调:

Awaker1.0是世界上首个能自主更新的多模态大模型。

换句话说，Awaker1.0是“活”的，它的参数可以实时持续地更新——这就导致Awaker1.0区别于所有其它多模态大模型，

Awaker1.0的自主更新机制，包含三大关键技术，分别是:

数据主动生成
模型反思评估
模型连续更新

这三项技术，让Awaker1.0具备自主学习、自动反思和自主更新的能力，可以在这个世界自由探索，甚至与人类互动。

基于此，Awaker1.0在理解侧和生成侧都能生成源源不断的新交互数据。

怎么做到的?

在理解侧，Awaker1.0与数字世界和现实世界进行交互。

在执行任务的过程中，Awaker1.0将场景行为数据反哺给模型，以实现持续更新与训练。

在生成侧，Awaker1.0可以进行高质量的多模态内容生成，为理解侧模型提供更多的训练数据。

在理解侧和生成侧的两个循环中，Awaker1.0实际实现了将视觉理解与视觉生成进行融合。

要知道，Sora问世后，越来越多声音表示，要通往AGI，必须达成“理解和生成的大一统”。

以新知识注入为例，下面来看个具体跑通的例子。

Awaker1.0能够不断在互联网上学习实时新闻信息，同时，它结合新学习到的新闻信息来回答各种复杂问题。

这和目前两种主流，即RAG和传统长上下文方式还不太一样，Awaker1.0是真的把新知识“记忆”在自个儿模型的参数上。

可以看到，连续3天的自我更新过程中，Awaker1.0每天都能学习当天的新闻信息，并在描述中准确地说出对应信息。

而且虽然一直在学，Awaker1.0倒没有顾此失彼，它并不会很快地遗忘学过的知识。

譬如，4月16日学进去的智界S7相关知识，在2天后仍然被Awaker1.0记住或理解。

So，在这个数据如金的时代，别再哀叹“数据不够用”了。

面对数据瓶颈的团队们，一种可行、可用的新选择，不就被Awaker1.0送来了?

具身智能“活”的大脑

话说回来，正是由于实现了视觉理解与视觉生成的融合，当遇到“多模态大模型适配具身智能”的问题，Awaker1.0的骄傲已经显露无疑。

事情是这样的:

Awaker1.0这类多模态大模型，其具有的视觉理解能力可以天然与具身智能的“眼睛”相结合。

而且主流声音也认为，“多模态大模型+具身智能”有可能大幅地提升具身智能的适应性和创造性，甚至是实现AGI的可行路径。

理由不外乎两点。

第一，人们期望具身智能拥有适应性，即智能体能够通过持续学习来适应不断变化的应用环境。

这样一来，具身智能既能在已知多模态任务上越做越好，也能快速适应未知的多模态任务。

第二，人们还期望具身智能具有真正的创造性，希望它通过对环境的自主探索，能够发现新的策略和解决方案，并探索AI的能力边界。

但是二者的适配，并不是简简单单把多模态大模型链接个身体，或直接给具身智能装个脑子那么简单。

就拿多模态大模型来说，至少有两个明显的问题摆在面前。

一是模型的迭代更新周期长，需要大量的人力投入;

二是模型的训练数据都源自已有的数据，模型不能持续获得大量的新知识。虽然通过RAG和扩长上下文窗口也可以注入持续出现的新知识，模型记不住，补救方式还会带来额外的问题。

总之，目前的多模态大模型在实际应用场景中不具备很强的适应性，更不具备创造性，导致在行业落地时总是出现各种各样的困难。

妙啊——还记得我们前面提到，Awaker1.0不仅可以学新知识，还能记住新知识，并且这种学习是每天的、持续的、及时的。

从这张框架图可以看出，Awaker1.0能够与各种智能设备结合，通过智能设备观察世界，产生动作意图，并自动构建指令控制智能设备完成各种动作。

在完成各种动作后，智能设备会自动产生各种反馈，Awaker1.0能够从这些动作和反馈中获取有效的训练数据进行持续的自我更新，不断强化模型的各种能力。

这就相当于具身智能拥有一个活的大脑了。

谁看了不说一句how pay（狗头）～

尤其重要的是，因为具备自主更新能力，Awaker1.0不单单是可以和具身智能适配，它还适用于更广泛的行业场景，能够解决更复杂的实际任务。

例如，Awaker1.0与各种智能设备结合，从而实现云边协同。

这时候，Awaker1.0就是部署在云端的“大脑”，观察、指挥，控制各种边端智能设备执行各项任务。

而边端智能设备执行各项任务时获得的反馈，又会源源不断地传回给Awaker1.0，让它持续地获得训练数据，不断进行自我更新。

这可不是纸上谈兵，Awaker1.0与智能设备的云边协同的技术路线，已经应用在电网智能巡检、智慧城市等应用场景中，并取得了远好于传统小模型的识别效果。

多模态大模型能听、能看、能说，在语音识别、图像处理、自然语言理解等多个领域展现出了巨大的潜力和应用价值，几乎无所不能。

但它的烦恼很明显，如何不断吸收新知识、适应新变化?

可以说，修炼内功、提升武艺成为了多模态大模型面临的一个重要课题。

智子引擎Awaker1.0的问世，为多模态大模型的自我超越提供了一把钥匙。

它好像会了那个吸星大法，通过自主更新机制，打破了数据短缺的瓶颈，为多模态大模型的持续学习和自我进化提供了可能;再就是利用云边协同技术，勇闯在具身智能等智能体设备的具体应用场景。

这或许是迈向AGI的一小步，但同时也是多模态大模型自我超越之旅的一个开始。

漫长而艰难的旅程，需要智子引擎这样的团队，向技术的高峰不断攀登。

（举报）

相关推荐
大家在看

关键词：

【腾讯云】11.11云上盛惠！云服务器首年1.8折起，买1年送3个月！

11.11云上盛惠！海量产品 · 轻松上云！云服务器首年1.8折起，买1年送3个月！超值优惠，性能稳定，让您的云端之旅更加畅享。快来腾讯云选购吧！

Docker容器镜像
去看看

Docker容器镜像 60元/15天

爆款产品组合购
去看看

爆款产品组合购低至1元

腾讯云x NVIDIA加速计划
去看看

腾讯云x NVIDIA加速计划最高获赠10万元扶持基金

2核2G云服务器
去看看

2核2G云服务器 112元/1年

查看更多相关信息>>

腾讯云 12-20

广告
华为要把纯血鸿蒙打造成原生智能的操作系统 “小艺”超级智能体来了

在第21届华为分析师大会上，华为副董事长、轮值董事长徐直军发表了题为《全面智能化之路》的主题演讲。徐直军在演讲中提到，随着大模型出来以后，为每一个终端用户配一个智能助手，越来越成为了现实。但之前都没用到大模型，很多场景用专署模型也够了，如今大模型问世，华为也将抓住智能化战略机遇，推进全面智能化。
于海：联想小天个人智能体，最懂你的个人AI伙伴

4月18日，在2024联想创新科技大会现场，一场独特的演示吸引了众多目光。联想集团高级副总裁、IDG商用产品中心及全球中小企业业务总经理于海使用最新发布的联想AIPC新品，在无网络环境下，仅数秒就将十几页的英文科研论文精准总结成中文摘要。作为推动AI普惠的第一终端，联想的AIPC在注入“联想小天”这一灵魂之后，不仅将实现从工具到个人AI伙伴的跃升，也将成为新质生产力的AI伙伴。

联想创新科技大会联想AI PC
联想昭阳AI PC内嵌个人智能体助力新质生产力跃升

在2024年联想创新科技大会上，联想推出了专为政企客户打造的全新商用AIPC——联想昭阳AIPC，旨在通过全新的AI终端体验升级，提升各行业的生产力和创造力。联想昭阳X5AI全能本联想昭阳X7AI高能本随着ChatGPT出现以及生成式AI技术的爆发，AI大模型逐渐应用到了各行各业中。此次联想昭阳AIPC的全新发布，更是在AI发展大浪潮下为各行各业每一位用户量身定制的办公助手，为千行百业的智能化转型和AI应用迈出重要的一步。

联想 AI PC
手机智能体或成AI时代的天然入口

提到AI，大多数人首先想到的可能就是像ChatGPT这样的聊天机器人，在惊叹其提高工作效率的同时，也在思考着AI的未来。比尔盖茨认为，Agent将是AI的未来，它不仅将改变人们与计算机的互动方式将颠覆软件行业，引发自从我们从键入命令到点击图标以来计算机领域的最大革命。对企业来说，积极应对挑战或打不过就加入，都要好过视不见。

AI Agent 智能体
荐AI时代新风口！吴恩达亲授智能体四大设计模式

【新智元导读】吴恩达认为，智能体的发展将会成为AI时代重要的力量，甚至比基础模型还要重要。「吴老师」连发多篇博客，向大家介绍了AI智能体的四大设计模式。吴恩达表示Planning仍是一项不太成熟的技术，用户很难提前预测它会做什么，——不过我们可以期待技术的快速发展来解决这个问题。

智能体
百度灵境矩阵升级文心智能体平台，人人都是智能体开发者

4月16日，Create2024百度AI开发者大会在深圳举行。百度创始人、董事长兼首席执行官李彦宏发表主题为「人人都是开发者」的演讲，现场展示了「组团出道」的文心大模型系列以及AgentBuilder、AppBuilder、ModelBuilder三大开发神器。对于AI时代和每个个体来说，百度文心智能体平台正像阿基米德的支点、纳瓦尔的杠杆，给予每个人机会，让每个人有可能成为「超级个体」。

Create2024 百度 AI开发者大会
联想昭阳AI 商用笔记本内置“联想小天”智能体

4月18日，以“AIforAll，让世界充满AI”为主题的2024联想创新科技大会在上海成功举办。大会全面展现了联想围绕混合式人工智能所构建的核心主张、战略图蓝图及最新技术成果，联想昭阳AI笔记本也进行了全新升级，并内置了AI新物种——“联想小天”商用版。这意味着联想小天将作为个人专属“智能体”，带领我们正式迈入AI时代，为各行各业带来更高效、智能的工作体验，激发更澎湃的创新动能。

人工智能联想商用笔记本
人参泡酒15年后竟“复活”：发芽生机勃勃展现惊人生命力

哈尔滨市的赵大爷近日在家中发现了一瓶尘封十五载的人参白酒，令人惊奇的是，酒中的人参竟然“复活”了，展现出惊人的生命力。这一奇妙的景象让赵大爷惊喜不已，也在邻里间引发了广泛关注和热烈讨论。大家都纷纷表示，这株人参的生命力令人敬佩，也让人对生活充满了希望和信心。

人参白酒人参奇迹生命力
moto X50 Ultra AI手机亮相，搭载联想AI个人智能体

2024F1联想中国大奖赛在上海国际赛车场拉开帷幕，吸引了全球观众的关注。摩托罗拉旗下首款AI手机——motoX50Ultra也成为了焦点。相信这款AI手机新品也即将登陆国内市场，并将给用户带来更多惊喜。

2024 F1联想中国大奖赛 moto
AI原生方案服务应对智能新时代IT需求，联想开启企业智能体落地元年

4月18日，以“AIforAll，让世界充满AI”为主题的第十届联想创新科技大会在上海成功举办。大会全面展现了联想集团基于混合式人工智能判断的核心主张、战略图景和最新技术成果。正如本次大会的主题“AIforAll，让世界充满AI”，联想通过推动整个产业生态系统，在开发和应用的各个环节，保证人工智能的普惠性、公正性和包容性，让人人都能从人工智能的发展中获益，打造一个“让世界充满AI和爱”的可持续发展的美好未来。

打标助手:一个批量给图片进行文字标注的免费工具，专为模型训练提供标注数据。

打标助手是基于GPT4-Vision开发的一个在线工具，它通过微调prompt实现批量图片文字标注，为基于SD模型的训练提供数据支持。该工具的主要优点在于其免费性、批量处理能力和高效的标注准确性，特别适合需要大量图片标注的科研和商业用户。

AI标注批量处理数据安全

Gemma 2:谷歌下一代Gemma模型，提供突破性的性能和效率。

Gemma 2是下一代谷歌Gemma模型，拥有27亿参数，提供与Llama 3 70B相当的性能，但模型大小仅为其一半。它在NVIDIA的GPU上运行优化，或在Vertex AI上的单个TPU主机上高效运行，降低了部署成本，使更广泛的用户能够访问和使用。Gemma 2还提供了强大的调优工具链，支持云解决方案和社区工具，如Google Cloud和Axolotl，以及与Hugging Face和NVIDIA TensorRT-LLM的无缝合作伙伴集成。

AI 机器学习深度学习

Gemini 1.5 Flash:Google 一款轻量级、高效能的AI模型，专为大规模高频任务设计。

Gemini 1.5 Flash是Google DeepMind团队推出的最新AI模型，它通过'蒸馏'过程从更大的1.5 Pro模型中提炼出核心知识和技能，以更小、更高效的模型形式提供服务。该模型在多模态推理、长文本处理、聊天应用、图像和视频字幕生成、长文档和表格数据提取等方面表现出色。它的重要性在于为需要低延迟和低成本服务的应用提供了解决方案，同时保持了高质量的输出。

AI 机器学习多模态

Imagen 3:谷歌高质量文本到图像模型，生成逼真、生活化图像。

Imagen 3 是谷歌一个先进的文本到图像的生成模型，它能够生成具有极高细节水平和逼真效果的图像，并且相较于之前的模型，其视觉干扰元素显著减少。该模型对自然语言的理解更为深入，能够更好地把握提示背后的意图，并从更长的提示中提取细节。此外，Imagen 3 在渲染文本方面表现出色，为个性化生日信息、演示文稿标题幻灯片等提供了新的可能性。

AI图像生成文本到图像创意工具

Veo:Google最先进的视频生成模型，提供高质量1080p视频生成。

Veo是Google最新推出的视频生成模型，能够生成高质量的1080p分辨率视频，支持多种电影和视觉风格。它通过先进的自然语言和视觉语义理解，能够精确捕捉用户创意愿景，生成与提示语调一致且细节丰富的视频内容。Veo模型提供前所未有的创意控制水平，理解电影术语如“延时摄影”或“航拍景观”，创造出连贯一致的画面，使人物、动物和物体在镜头中逼真地移动。

AI 视频生成创意工具

PaliGemma:Google的尖端开放视觉语言模型

PaliGemma是Google发布的一款先进的视觉语言模型，它结合了图像编码器SigLIP和文本解码器Gemma-2B，能够理解图像和文本，并通过联合训练实现图像和文本的交互理解。该模型专为特定的下游任务设计，如图像描述、视觉问答、分割等，是研究和开发领域的重要工具。

视觉语言模型图像理解文本生成

lluminous:一个快速、轻量级的开源聊天界面。

lluminous是一个快速、轻量级的开源聊天界面，支持多供应商API密钥，提供完整的隐私保护，所有对话历史和密钥都存储在本地。它支持多模态输入、多轮对话提示、预填充响应、模型切换以及对话分享等功能。

开源聊天界面多供应商支持

CuMo:一种用于扩展多模态大型语言模型（LLMs）的先进架构。

CuMo是一种多模态大型语言模型（LLMs）的扩展架构，它通过在视觉编码器和MLP连接器中融入稀疏的Top-K门控专家混合（MoE）块，提高了模型的可扩展性，同时在推理时几乎不增加激活参数。CuMo在预训练MLP块后，初始化MoE块中的每个专家，并在视觉指令调整阶段使用辅助损失以确保专家的均衡负载。CuMo在各种VQA和视觉指令遵循基准测试中超越了其他同类模型，且完全基于开源数据集进行训练。

AI 多模态学习大型语言模型

混元-DiT:高性能细粒度中文理解模型，提供双语生成能力，专注于中国元素理解。

混元-DiT是腾讯推出的首个中英双语DiT架构的人工智能模型，专注于中文元素理解，具备长文本理解能力和细粒度语义理解。该模型能够分析和理解长篇文本中的信息，并生成相应的艺术作品，包括但不限于人物写真、创意创作等。混元-DiT的推出，对于提升中文文本理解的深度和广度，以及促进中英双语交流具有重要意义。

人工智能文本理解艺术创作

GPT-4o:，一款能够实时处理音频、视觉和文本的旗舰模型。

GPT-4o（'o'代表'omni'）是自然人机交互的重要一步，它可以接受任意组合的文本、音频、图像和视频输入，并生成任意组合的文本、音频和图像输出。它在音频输入响应上的速度极快，平均响应时间仅为320毫秒，与人类对话的响应时间相近。在非英语文本处理上取得了显著进步，同时在API上速度更快且成本降低了50%。GPT-4o在视觉和音频理解方面也比现有模型更出色。

人工智能自然语言处理机器学习

AutoGroq:AI驱动的对话助手，自动生成专家代理，简化AI工具交互。

AutoGroq是一个AI驱动的对话助手，旨在通过自动生成专家代理来彻底改变用户与AI工具的互动方式。它克服了现有解决方案的局限性，提供了一个用户友好、强大且无需配置的体验。该平台专注于通过自动生成专门针对任何问题的专家代理，无论问题的复杂性如何，提供即时和相关的帮助。

AI 对话助手自动化

OpenGlass:记录生活，获取有用的总结和建议，为任何用例定制眼镜

OpenGlass是一款可穿戴眼镜，它能够记录用户的生活，并提供有帮助的总结和建议。这款眼镜可以针对不同的使用场景进行定制，适合追求个性化体验和生活记录的用户。它结合了最新的硬件技术和软件开发，为用户带来全新的交互体验。

可穿戴设备生活记录智能建议

Refuel LLM-2:专为数据标注、清洗和丰富设计的先进语言模型

Refuel LLM-2 是一款为数据标注、清洗和丰富而设计的先进语言模型。它在约30种数据标注任务的基准测试中超越了所有现有的最先进语言模型，包括GPT-4-Turbo、Claude-3-Opus和Gemini-1.5-Pro。Refuel LLM-2 旨在提高数据团队的工作效率，减少在数据清洗、规范化、标注等前期工作上的手动劳动，从而更快地实现数据的商业价值。

数据标注语言模型自动化

Llama3-Aloe-8B-Alpha:Aloe是一款专为医疗领域设计的高性能语言模型，提供先进的文本生成和对话能力。

Aloe是由HPAI开发的一款医疗领域的语言模型，基于Meta Llama 3 8B模型进行优化。它通过模型融合和先进的提示策略，达到了与其规模相匹配的最先进水平。Aloe在伦理和事实性指标上得分较高，这得益于红队和对齐工作的结合。该模型提供了医疗特定的风险评估，以促进这些系统的安全使用和部署。

医疗语言模型文本生成

FunClip:开源、精准、方便的视频切片工具

FunClip是一款完全开源、本地部署的自动化视频剪辑工具，通过调用阿里巴巴通义实验室开源的FunASR Paraformer系列模型进行视频的语音识别，随后用户可以自由选择识别结果中的文本片段或说话人，点击裁剪按钮即可获取对应片段的视频。FunClip集成了阿里巴巴开源的工业级模型Paraformer-Large，是当前识别效果最优的开源中文ASR模型之一，并且能够一体化的准确预测时间戳。

语音识别视频剪辑自动化

FilmAction:国内一站式AI文生电影制作平台

FilmAction 是一款一站式 AI 电影制作平台，通过 AI 技术革新创作流程，使艺术创作更简单。它提供脚本、分镜、视频和旁白的一键生成，支持模拟胶片风格，适用于奇幻片等不同类型的电影创作。FilmAction 还可以生成配乐和合成成片，方便创作者进行后期制作。它的优点是节省时间和精力，提供丰富的创作工具和资源，以及强大的 AI 技术支持。

电影制作 AI 技术影片编辑

Voicenotes:智能语音笔记应用，记录和整理你的想法。

Voicenotes 是一款智能语音笔记应用，它允许用户记录新想法、家庭时刻、会议要点、播客收获等任何内容。用户可以要求AI回顾过去的笔记或头脑风暴新想法，因为AI具有完美的记忆力。该应用支持创建摘要、待办事项列表、博客文章等，提供智能建议，并支持50多种语言。它即将在智能手表上推出，承诺对隐私、持久性和美观的承诺。

语音笔记 AI助手多语言支持

Yi-1.5:是零一万物2024年5月更新的先进文本生成模型。

Yi-1.5是零一万物一款文本生成模型，它利用最新的人工智能技术，能够生成流畅、连贯且多样化的文本。该模型特别适合于需要大量文本创作的领域，如内容创作、新闻撰写、社交媒体管理等。它的优势在于能够快速生成高质量的文本，提高工作效率，同时降低人力成本。

文本生成人工智能内容创作

The AI Reports:Junia AI是一个AI工具，用于创建在搜索引擎上排名高的文章和数字内容。

Junia AI是一个强大的AI工具，帮助用户创建在搜索引擎上排名高的文章和数字内容。它结合了AI和SEO工具，提供性能功能和安全的AI营销。Junia AI的主要优点是帮助用户优化内容创作，从而提高搜索引擎排名，并提供有竞争力的AI营销功能。它的背景信息是在AI技术的支持下，Junia AI能够分析搜索引擎算法并为用户提供有效的SEO建议。Junia AI的定位是为个人用户和团队提供一种简单而有效的方式来创造具有竞争力的内容并获得更多的流量和曝光。

SEO 内容创作数字营销

CreateAICourse (cAIc):使用最好的AI课程创作工具简化课程创建流程，快速生成有趣的迷你课程，并简化在线学习体验。

Ai Course Creator是一个使用AI技术简化在线课程创建过程的工具。它可以帮助您快速生成互动课程，并提供全面的课程大纲和课程内容。它的主要优点是节省时间和精力，使课程创建变得简单而高效。无论是初次创建课程还是多次创建，Ai Course Creator都能帮助您与学生建立真正的连接。

智能体生命力觉醒！可自我更新的AI来了，妈妈再也不用担心数据瓶颈难题

MOE架构，解决多模态多任务训练冲突问题

生成源源不断的新交互数据

具身智能“活”的大脑

今日大家都在搜的词：

热文

站长商机