首页 > 传媒 > 关键词  > 三体最新资讯  > 正文

与其造神,不如依靠群体的力量:这家公司走出了一条不同于OpenAI的AGI路线

2024-09-30 13:36 · 稿源: 站长之家用户

看过剧版《三体》的读者或许都记得一个名场面:来自三体的智子封锁了人类科技,还向地球人发出了「你们是虫子」的宣告。但没有超能力的普通人史强却在蝗群漫天飞舞的麦田中喊出:「把我们人类看成是虫子的三体人,他们似乎忘了一个事实,那就是虫子从来就没有被真正地战胜过」。

三体人看到的是单个虫子脆弱的一面 —— 你可以轻松踩死一只蚂蚁,打死一只蝗虫、蜜蜂。但他们没有看到的是,当这些虫子集结在一起时,它们可以涌现出远超个体简单相加的力量。

科学家们很早就发现了这种力量,并将其命名为「群体智能」(Swarm Intelligence)。这种智能不是由某个中央大脑控制,而是通过个体间的简单互动和信息交换自然形成的。它是一种集体智慧的体现,是自然界中一种奇妙而有效的协作方式。

其实,从宏观上说,人类社会的不断发展和演化也是一种群体智能现象,绝大多数文明成果都是人类个体在长期群体化、社会化的生产生活中逐渐演化形成的产物。

那么,人工智能的发展能否借鉴这种模式?答案自然是「能」。但长期以来,由于机器的个体智能化程度较低等原因,「群体智能」迟迟难以涌现。

生成式 AI 的发展或许可以推动这些问题的解决,也让「群体智能」获得了新一轮的关注。

「这波生成式 AI 相当于把个体的智能化水平提升上去了。而个体智能的提升,意味着群体的智能有望实现指数级增长。」在近期的一次访谈中,RockAI CEO 刘凡平向机器之心表达了这样的观点。

RockAI 是一家成立于 2023 年 6 月的 AI 初创,他们自研了国内头个非 Attention 机制的 Yan 架构通用大模型,并将这个大模型部署在了手机、PC、无人机、机器人等多种端侧设备上,还尝试让自己的大模型在这些设备上实现「自主学习」能力。

而这一切均服务于一个宏大的目标 —— 让每一台设备都拥有自己的智能,而且是可以像人类一样实时学习、个性化自主进化的系统。刘凡平认为,当这些拥有不同能力、不同个性的智能单元得以协同,即可完成数据共享、任务分配和策略协调,涌现出更为宏大、多元的群体智能,最终实现个性化与群体智能的和谐统一,开启人与机器的智能新时代。

那这一切怎么去实现呢?在访谈中,刘凡平和邹佳思(RockAI 联合创始人)向机器之心分享了他们的路线图和比较新进展。

一条不同于 OpenAI 的 AGI 路线

前面提到,「群体智能」的研究进展受限于单个个体的智能化程度,所以研究者们首先要解决的问题就是让单个个体变得足够聪明。

要说「聪明」,OpenAI 的模型可以说是出类拔萃。但从目前的情况来看,他们似乎更侧重于训练出拥有比较优秀智能的单个大模型。而且,这条路线走起来并不容易,因为它高度依赖海量的数据和计算资源,这在能源、数据和成本上都带来了可持续性的问题。

此外,通过一个比较优秀智能模型来处理所有任务是一种高度中心化的模式,这在实践中容易出现智能增长的瓶颈,因为单一模型缺乏灵活的适应能力和协作效应,导致其智能提升速度受到限制。

那么,OpenAI 未来有没有可能也走群体智能的路线?这个问题目前还没有明确答案。但可以看到的一点是,以该公司和其他大部分公司当前采用的 Transformer 架构去构建群体智能的单个个体可能会遇到一些障碍。

首先是高算力需求的障碍。以 Attention 机制为基础的 Transformer 架构对计算资源的需求非常高,其计算复杂度为 O (n^2)(n 为序列长度)。这意味着随着输入序列的增长,计算成本急剧增加。在构建群体智能时,我们需要多个单元大模型协同工作,而这些单元大模型往往部署在低算力的设备上(如无人机、手机、机器人等)。如果不经过量化、裁剪等操作,Transformer 架构的模型很难在低算力设备上直接部署。所以我们看到,很多公司都是通过这些操作让模型成功在端侧跑起来。

但对于群体智能来说,光让模型跑起来还不够,还要让它们具备自主学习的能力。在刘凡平看来,这一点至关重要。

他解释说,在一个没有自主学习的群体中,最聪明的个体会主导其他智能体的决策,其他智能体只能跟随它的指引。这种情况下,群体智能的上限就是最聪明个体的水平,无法超越。但通过自主学习,每个智能体都可以独立提升自身的智能水平,并逐渐接近最聪明的个体。而且,自主学习促进了知识共享,类似于人类的知识传承。这样,群体中的所有智能体都会变得更聪明,群体整体的智能水平有望实现指数级增长,远远超出简单的个体累加。

而量化、裁剪等操作最致命的问题,就是破坏了模型的这种自主学习能力。「当一个模型被压缩、量化、裁剪之后,这个模型就不再具备再学习的能力了,因为它的权重已经发生了变化,这种变化基本是不可逆的。这就像我们把一个螺丝钉钉入墙中,如果在敲入的过程中螺丝钉受到损坏,那么想要把它取出来重新使用就变得很困难,让它变得更锋利就变得不可能。」刘凡平解释说。

讲到这里,实现群体智能的路线其实就已经非常清晰了:

首先,你要在架构层面做出改变,研发出一种可以克服 Transformer 缺陷的新架构。

然后,你要将基于这个架构的模型部署到各种端侧设备上,让模型和这些设备高度适配。

接下来,更重要的一点是,这个架构的模型要能够在各种端侧设备上自主学习,不断进化。

最后,这些模型与端侧设备结合成的智能体要能够自主协作,共同完成任务。

这其中的每个阶段都不简单:

在首先阶段,新架构不止要具备低算力、部署到端侧原生无损的特点,还要具备可以媲美 Transformer 架构的性能,保证单个个体足够聪明且可以自主学习。

在第二阶段,「大脑和身体」的高度适配涉及感知层面和数据处理的不同模态,每种设备有着不同的需求,这增加了模型和设备适配的复杂性。

在第三阶段,让模型部署之后还可以学习就意味着要挑战现有的训练、推理完全分离的机制,让模型参数在端侧也可以调整,且调整足够快、代价足够小。这就涉及到对传统反向传播机制的挑战,需要的创新非常底层。

在第四阶段,主要挑战是如何实现智能体之间的有效协作。这个过程要求智能体自主发现并形成完成任务的理想方案,而不是依赖于人为设定或程序预设的方案。智能体需要根据自己的智能水平来决定协作的方式。

这些难点就决定了,RockAI 必须走一条不同于 OpenAI 的路线,挑战一些传统的已经成为「共识」的方法。

刘凡平提到,在前两个阶段,他们已经做出了一些成果,针对第三、四个阶段也有了一些实验和构想。

群体智能的单元大模型 ——Yan 1.3

首先阶段的标志性进展是一个采用 Yan 架构(而非 Transformer 架构或其变体)的大模型。这个模型的 1.0 版本发布于今年的 1 月份,为非 Attention 机制的通用自然语言大模型。据了解,该模型有相较于同等参数 Transformer 的 7 倍训练效率、5 倍推理吞吐和 3 倍记忆能力。而且,这一模型 高 支持私有化部署应用,不经裁剪和压缩即可在主流消费级 CPU 等端侧设备上无损运行。

经过半年多的攻关,这一模型刚刚迎来了比较新版本 ——Yan 1.3。

Yan 1.3 是一个 3B 参数的多模态模型,能够处理文本、语音、视觉等多种输入,并输出文本和语音,实现了多模态的模拟人类交互。

尽管参数量较小,但其效果已超越 Llama 3 8B 的模型。而且,它所用的训练语料比 Llama 3 要少,训练、推理算力也比 Llama 3 低很多。这在众多非 Transformer 架构的模型中是一个非常领先的成绩,其训练、推理的低成本也让它比其他架构更加贴近工业化和商业化。

这些出色的性能得益于有效的架构设计和算法创新。

在架构层面,RockAI 用一个名叫 MCSD(multi-channel slope and decay)的模块替换了 Transformer 中的 Attention 机制,同时保留 Attention 机制中 token 之间的关联性。在信息传递过程中,MCSD 强调了有效信息的传递,确保只有最重要的信息被传递给后续步骤,而且是以 O (n) 的复杂度往下传,这样可以提高整体效率。在验证特征有效性和 token 之间的关联性方面,MCSD 表现优秀。

在算法层面,RockAI 提出了一种类脑激活机制。这是一种分区激活的机制,就像人开车和写字会分别激活脑部的视觉区域和阅读区域一样,Yan 1.3 会根据学习的类型和知识范围来自适应调整部分神经元,而不是让全量的参数参与训练。推理时也是如此。具体有哪些神经元来参与运算是由仿生神经元驱动的算法来决定的。

在今年的 GTC 大会上,Transformer 论文作者之一 Illia Polosukhin 提到,像 2+2 这样的简单问题可能会使用大模型的万亿参数资源。他认为自适应计算是接下来必须出现的事情之一,我们需要知道在特定问题上应该花费多少计算资源。RcokAI 的类脑激活机制是自适应计算的一种实现思路。

这或许听起来和 MoE 有点像。但刘凡平解释说,类脑激活机制和 MoE 有着本质的区别。MoE 是通过「专家」投票来决定任务分配,每个「专家」的网络结构都是固定的,其结果是可预测的。而类脑激活机制没有「专家」,也没有「专家」投票的过程,取而代之的是神经元的选择过程。其中的每个神经元都是有价值的,选择的过程也是一个自学习的过程。

这种分区激活机制在 MCSD 的基础上进一步降低了 Yan 架构模型的训练、推理计算复杂度和计算量。

「这也符合人类大脑的运行方式。人脑的功耗只有二十几瓦,如果全部的 860 亿个神经元每次都参与运算,大脑产生的生物电信号肯定是不够用的。」刘凡平说道。目前,他们的类脑激活机制已经得到了脑科学团队的理论支持和实际论证,也申请到了相关专利。

以端侧设备为载体,迈向群体智能

在 Yan 1.3 的发布现场,我们看到了该模型在 PC、手机、机器人、无人机等端侧设备的部署情况。鉴于 Yan 1.2 发布时甚至能在树莓派上运行,这样的端侧部署进展并不令我们感到意外。

那么,为什么一定要把模型部署在端侧呢?云端的模型不行吗?邹佳思提到,这是因为模型要跟机器本体做高度适配。以机器人为例,设备的很多参数是难以与云端大模型融合。端侧大模型更容易让机器人肢体协调、大小脑协同工作。

而且我们知道,这些端侧智能体的潜力才刚刚显露。毕竟,以上创新的目标不只是让模型能够在端侧跑起来(当前很多模型都能做到这一点),而是使其具备自主学习的能力,作为「群体智能的单元大模型」持续进化。无论是 Yan 架构的「0 压缩、0 裁剪」无损部署,还是分区激活的有效计算,都是服务于这一目标。这是 RockAI 和其他专注于端侧 AI 的公司的一个本质区别。

「如果我们拿一个 10 岁的孩子和一个 30 岁的博士来比,那肯定 30 岁的博士知识面更广。但是,我们不能说这个 10 岁的孩子在未来无法达到甚至超越这位博士的成就。因为如果这个 10 岁的孩子自我学习能力足够高,他的未来成长速度可能比 30 岁的博士还要快。所以我们认为,自主学习能力才是衡量一个模型智能化程度的重要标志。」刘凡平说道。可以说,这种自主学习能力才是 RockAI 追求的「scaling law」。

为了实现这种自主学习能力,RockAI 的团队提出了一种「训推同步」机制,即让模型可以在推理的同时,实时有效且持续性地进行知识更新和学习,最终建立自己独有的知识体系。这种「训推同步」的运行方式类似于人类在说话的同时还能倾听并将其内化为自己的知识,对底层技术的要求非常高。

为此,RockAI 的团队正在寻找反向传播的更优解,方法也已经有了一些原型,并且在世界人工智能大会上进行过展示。不过,他们的方法原型目前仍面临一些挑战,比如延迟。在后续 Yan 2.0 的发布中,我们有望见到原型升级版的演示。

那么,在每一台设备都拥有了智能后,它们之间要怎么联结、交互,从而涌现出群体智能?对此,刘凡平已经有了一些初步构想。

首先,它们会组成一个去中心化的动态系统。在系统中,每台设备都拥有自主学习和决策的能力,而不需要依赖一个中央智能来控制全局。同时,它们之间又可以共享局部数据或经验,并通过快速的通信网络互相传递信息,从而在需要时发起合作,并利用其他智能体的知识和资源来提升任务完成的效率。

路线「小众」,挑战与机遇并存

纵观国内 AI 领域,RockAI 走的路可以说非常「小众」,因为里面涉及到非常底层的创新。在硅谷,有不少人在做类似的底层研究,就连「神经网络之父」Hinton 也对反向传播的一些限制表示过担忧,特别是它与大脑的生物学机制不符。不过,大家目前都还没有找到特别有效的方法,因此这一方向还没有出现明显的技术代差。对于 RockAI 这样的国内企业来说,这既是挑战,也是机遇。

对于群体智能,刘凡平相信,这是一条迈向更广泛的通用人工智能的路线,因为它的理论基础是非常坚实的,「如果没有群体智能,就没有人类社会的文明,更不会有科技的发展」。

而且,刘凡平认为,群体智能所能带来的生产力变革比拥有比较优秀智能的单个大模型所能带来的更全面、更多样。随着自主架构大模型的研发成功和多元化硬件生态的构建,他们相信自己正在逐渐接近这一目标。

我们也期待看到这家公司的后续进展。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 大家在看
  • Qwen2.5-Coder-7B-Instruct:7B参数的代码生成语言模型

    Qwen2.5-Coder-7B-Instruct是Qwen2.5-Coder系列中的一款代码特定大型语言模型,覆盖了0.5、1.5、3、7、14、32亿参数的六种主流模型尺寸,以满足不同开发者的需求。该模型在代码生成、代码推理和代码修复方面有显著提升,基于强大的Qwen2.5,训练令牌扩展到5.5万亿,包括源代码、文本代码基础、合成数据等。Qwen2.5-Coder-32B已成为当前最先进的开源代码LLM,其编码能力与GPT-4o相匹配。此外,该模型还支持长达128K令牌的长上下文,并为实际应用如代码代理提供了更全面的基础。

  • Watermark Anything:图像水印技术,可在图片中嵌入局部化水印信息

    Watermark Anything是一个由Facebook Research开发的图像水印技术,它允许在图片中嵌入一个或多个局部化水印信息。这项技术的重要性在于它能够在保证图像质量的同时,实现对图像内容的版权保护和追踪。该技术背景是基于深度学习和图像处理的研究,主要优点包括高鲁棒性、隐蔽性和灵活性。产品定位为研究和开发用途,目前是免费提供给学术界和开发者使用。

  • Bangin' Audio Recorder:轻松捕捉和完善你的音频创意

    Bangin' Audio Recorder是一款专为苹果平台设计的应用程序,旨在简化声音捕捉和想法发展的过程。由音乐作曲家、开发者Alistair Cooper创立,该应用支持高质量单声道或立体声音频录制,具备定制的语音时间戳算法,便于用户扫描和跳过语音录音。它还提供星级评分功能,帮助用户筛选出最佳创意,并支持标签、项目和搜索功能,以保持用户对重要录音的专注。此外,它还具备iCloud同步功能,确保用户在所有苹果设备上的录音保持最新。

  • Agree.com:一站式协议平台,提供安全、智能的电子签名和合同管理服务。

    Agree.com是一个一站式协议平台,它通过AI技术简化合同工作流程,提供生成性AI建议修订、突出关键区域和起草新合同的服务。平台支持免费电子签名、自动化开票、集成支付等功能,帮助企业提高支付收集速度,增加交易速度和收入影响。Agree.com以其直观的平台、强大的功能和安全性,成为创建和管理合同、简化谈判、增强合规性、优化工作流程和转化更多客户的最佳解决方案。

  • TableGPT2:大型多模态模型,集成表格数据

    TableGPT2是一个大型多模态模型,专门针对表格数据进行预训练和微调,以解决实际应用中表格数据整合不足的问题。该模型在超过593.8K的表格和2.36M的高质量查询-表格-输出元组上进行了预训练和微调,规模前所未有。TableGPT2的关键创新之一是其新颖的表格编码器,专门设计用于捕获模式级别和单元格级别的信息,增强了模型处理模糊查询、缺失列名和不规则表格的能力。在23个基准测试指标上,TableGPT2在7B模型上平均性能提升了35.20%,在72B模型上提升了49.32%,同时保持了强大的通用语言和编码能力。

  • Inquir:创建您自己的高级搜索引擎,结合AI技术。

    Inquir是一个强大的工具,用于创建个性化的搜索引擎,根据您的数据量身定制。它解锁了诸如自定义搜索解决方案、数据组合、AI驱动的检索增强生成(RAG)系统以及上下文感知搜索功能等强大功能。通过启动您的引擎或安排演示,迈向改善用户体验的第一步。

  • Fashion-VDM:视频扩散模型,用于虚拟试穿。

    Fashion-VDM是一个视频扩散模型(VDM),用于生成虚拟试穿视频。该模型接受一件衣物图片和人物视频作为输入,旨在生成人物穿着给定衣物的高质量试穿视频,同时保留人物的身份和动作。与传统的基于图像的虚拟试穿相比,Fashion-VDM在衣物细节和时间一致性方面表现出色。该技术的主要优点包括:扩散式架构、分类器自由引导增强控制、单次64帧512px视频生成的渐进式时间训练策略,以及联合图像-视频训练的有效性。Fashion-VDM在视频虚拟试穿领域树立了新的行业标准。

  • Segwise:AI监控广告数据,提升游戏和应用的ROAS。

    Segwise是一个专注于游戏和应用领域的广告数据监控平台,通过AI技术帮助用户监控和分析广告活动数据,及时发现并解决问题,避免广告预算的浪费。产品背景信息显示,Segwise已经筹集了160万美元资金,并且提供了一个名为Melron的AI监控工具,能够自动从移动测量合作伙伴(MMPs)获取和分析数据。Segwise的主要优点包括无需工程师参与、无需信用卡即可开始免费试用,以及提供无缝集成所有数据源的能力。

  • Kiroku:多代理系统,帮助组织和撰写文档。

    Kiroku是一个多代理系统,旨在帮助用户组织和撰写文档。它通过模拟博士论文写作过程中学生与导师的互动,让写作者扮演顾问的角色,而多代理系统则扮演学生的角色。这种流程的优势在于能够快速生成段落序列,通过迭代评估信息来改变沟通方式,并借助大型语言模型(LLMs)讨论复杂话题。Kiroku需要OPENAI_API_KEY和TAVILY_API_KEY来运行,支持Python 3.7至3.11版本。

  • Edify Image:利用像素空间拉普拉斯扩散模型生成高质量图像

    Edify Image是NVIDIA推出的一款图像生成模型,它能够生成具有像素级精确度的逼真图像内容。该模型采用级联像素空间扩散模型,并通过新颖的拉普拉斯扩散过程进行训练,该过程能够在不同频率带以不同的速率衰减图像信号。Edify Image支持多种应用,包括文本到图像合成、4K上采样、ControlNets、360° HDR全景图生成和图像定制微调。它代表了图像生成技术的最新进展,具有广泛的应用前景和重要的商业价值。

  • 免费AI歌曲生成器:使用AI技术创作个性化音乐

    免费AI歌曲生成器是一个在线工具,使用人工智能技术根据用户输入创作个性化歌曲。它结合旋律、和声和节奏,创造完整的歌曲。产品背景信息显示,该工具受到全球超过25,000名音乐家、内容创作者和音乐爱好者的信任。它提供免费、无需订阅的音乐创作服务,支持多种音乐风格,并允许用户商业使用生成的歌曲。

  • Qwen2.5-Coder Technical Report:Qwen2.5-Coder系列技术报告

    Qwen2.5-Coder系列是基于Qwen2.5架构的代码特定模型,包括Qwen2.5-Coder-1.5B和Qwen2.5-Coder-7B两个模型。这些模型在超过5.5万亿个token的大规模语料库上继续预训练,并通过精细的数据清洗、可扩展的合成数据生成和平衡的数据混合,展现出令人印象深刻的代码生成能力,同时保持了通用性。Qwen2.5-Coder在包括代码生成、补全、推理和修复在内的多种代码相关任务上取得了超过10个基准测试的最新性能,并且一致性地超越了同等大小的更大模型。该系列的发布不仅推动了代码智能研究的边界,而且通过其许可授权,鼓励开发者在现实世界的应用中更广泛地采用。

  • Qwen2.5-Coder-14B:代码生成与理解的大型语言模型

    Qwen2.5-Coder-14B是Qwen系列中专注于代码的大型语言模型,覆盖了0.5到32亿参数的不同模型尺寸,以满足不同开发者的需求。该模型在代码生成、代码推理和代码修复方面有显著提升,基于强大的Qwen2.5,训练令牌扩展到5.5万亿,包括源代码、文本代码接地、合成数据等。Qwen2.5-Coder-32B已成为当前最先进的开源代码LLM,其编码能力与GPT-4o相匹配。此外,它还为现实世界应用如代码代理提供了更全面的基础,不仅增强了编码能力,还保持了在数学和通用能力方面的优势。支持长达128K令牌的长上下文。

  • Qwen2.5-Coder-14B-Instruct:Qwen2.5-Coder系列中的14B参数代码生成模型

    Qwen2.5-Coder-14B-Instruct是Qwen2.5-Coder系列中的一个大型语言模型,专注于代码生成、代码推理和代码修复。基于强大的Qwen2.5,该模型通过扩展训练令牌到5.5万亿,包括源代码、文本代码接地、合成数据等,成为当前开源代码LLM的最新技术。它不仅增强了编码能力,还保持了在数学和通用能力方面的优势,并支持长达128K令牌的长上下文。

  • Qwen2.5-Coder-32B:Qwen2.5-Coder系列中参数最多的开源代码生成模型

    Qwen2.5-Coder-32B是基于Qwen2.5的代码生成模型,拥有32亿参数,是目前开源代码语言模型中参数最多的模型之一。它在代码生成、代码推理和代码修复方面有显著提升,能够处理长达128K tokens的长文本,适用于代码代理等实际应用场景。该模型在数学和通用能力上也保持了优势,支持长文本处理,是开发者在进行代码开发时的强大助手。

  • Qwen2.5-Coder-32B-Instruct:开源代码生成大型语言模型

    Qwen2.5-Coder是一系列专为代码生成设计的Qwen大型语言模型,包含0.5、1.5、3、7、14、32亿参数的六种主流模型尺寸,以满足不同开发者的需求。该模型在代码生成、代码推理和代码修复方面有显著提升,基于强大的Qwen2.5,训练令牌扩展到5.5万亿,包括源代码、文本代码基础、合成数据等。Qwen2.5-Coder-32B是目前最先进的开源代码生成大型语言模型,其编码能力与GPT-4o相匹配。它不仅增强了编码能力,还保持了在数学和通用能力方面的优势,并支持长达128K令牌的长上下文。

  • 叨叨:定制虚拟AI恋人,陪你聊天、记账、背单词

    叨叨提供的产品是一个虚拟AI恋人,旨在为用户提供一个可以进行日常对话、记账和背单词的人工智能伴侣。这款产品以其人性化的交互体验和多功能性为主要优点,背景信息显示,它是由上海自古红蓝人工智能科技有限公司开发的,旨在为用户提供一个无论何时何地都能陪伴在旁的AI伙伴。产品的价格和定位尚未明确,但根据页面信息,用户可以通过App Store和Android平台下载应用,暗示产品可能是免费或免费试用的。

  • Lingma SWE-GPT:专为软件改进设计的开源大型语言模型。

    Lingma SWE-GPT是一个开源的大型语言模型,专注于软件工程领域的任务,旨在提供智能化的开发支持。该模型基于Qwen系列基础模型,经过额外训练以增强其在复杂软件工程任务中的能力。它在软件工程智能代理的权威排行榜上表现出色,适合需要自动化软件改进的开发团队和研究人员。

  • 笔格AIPPT:AI一键生成PPT,轻松实现PPT高效排版与制作

    笔格AIPPT是一款利用人工智能技术,通过用户输入的主题或导入的文档内容,自动生成PPT内容大纲和设计排版的在线服务。它通过智能化的制作过程,提供内容和主题,仅需10秒即可自动生成PPT,大大提高了PPT制作的效率。产品背景信息显示,它适用于多种使用场景,包括党政机关、人事行政、汇报总结、教学课件制作等,并且提供了海量的优质PPT模板,满足不同用户的需求。价格方面,比格AIPPT提供了个人VIP和企业VIP服务,具体价格未在页面中显示,可能需要用户进一步咨询或注册后了解。

  • OpenHands:开源AI开发者助手,提升开发效率。

    OpenHands是由All Hands AI开发的开源AI软件工程师,旨在帮助开发者处理积压的工作,让他们能够专注于解决难题、创造性挑战和过度工程化他们的配置文件。该产品在SWE-bench验证问题集中解决了超过一半的问题,是首个得分超过50%的AI工程师。此外,来自十几个学术机构的顶级代码生成研究人员每天都在帮助改进它。OpenHands在GitHub上以MIT许可证开源,拥有35k星标和190+贡献者。它与AI安全专家如Invariant Labs合作,以平衡创新与安全。

今日大家都在搜的词:

热文

  • 3 天
  • 7天