首页 > 传媒 > 关键词  > 人工智能最新资讯  > 正文

实现千人千面的普惠化AI?波形智能发布新一代个性化自适应私人语言模型

2024-07-29 10:38 · 稿源: 站长之家用户

每一项革命性的技术诞生后,人类都需要探寻技术走向“应用普惠”的方法。

正如造纸术的诞生带来了文明的传播,蒸汽机带来了人流、物流,电子计算机技术带来了今天互联网的一切,它们背后的逻辑都是先进技术普惠穿透了应用边界,触达每个人,带来社会级的变化,从而形成了文明的更迭。

而如今,AI正在扮演着同样的角色。作为推动人类进入智能时代的决定性力量,在AGI引领的第四次工业革命里,一个迫切的问题摆在眼前:怎样才能让更多人用上AI?

在7月28日举办的2024波形智能Summer DevDay上,波形智能发布了《2024年技术路线白皮书:Life-long Personalized AI》,并特别提出了对于“AI应用”的新思考——千人千面的个性化、可进化、普惠化。

基于全新的LPA技术探索,波形智能还发布了新一代多模态无限式长内容生成的个性化自适应私人语言模型「Weaver2.0」,以及重磅升级的多语言多模态的AI内容创作工具「蛙蛙写作2.0」、「Siuuu.AI」、「AI Learning」等系列产品。

“做LPA的目的,就是希望让每个人都普惠地拥有一个能‘越来越懂你’的「私人语言模型」。”波形智能创始人兼CEO姜昱辰表示,“只有当AI与大众的生产生活真正建立起强关联,并且能够自理解、自适应每个很少见的个体时,才算迎来真正的千人千面的普惠化AI。”

01

个性化的实践,从通用为王转向千人千面

Scaling Law是近几年AGI概念和大模型领域最火热的技术名词之一。拼参数、拼数据、拼算力,是厂商推出大模型后最喜欢做的几件事。但换个角度看,大模型仍处于“无尽刷分”的阶段,虽然基础的泛化性和通用性可以得到提升,但落地到现实中的应用场景还有诸多局限,比如很多用户的个性化需求无法以通用模型来处理,技术与使用场景之间存在代沟等等。

让大模型从可用走向好用,需要一场更有针对性的转向。而这就是本次波形智能Summer DevDay最亮眼的一个发布和升级。对于用户而言,AI最重要的还是「为我所用」,依据每个人不同的背景和使用方式决定它的实际价值和使用效果。这样的话,模型如何结合实际应用环境、满足个性化需求才是关键。

“我们基于LPA技术对Weaver进行了特性优化,包括「千人千面的个性专属、数据为核的自适应/自进化,以及端云结合的有效部署」。”波形智能CTO周王春澍介绍说。

具体来看,千人千面的个性专属指的是通过用户反馈交互信息,比如对生成内容质量的好/坏评价,Weaver模型可以逐渐理解每一个用户的创作偏好。配合波形智能一直在做的「动态长短期记忆机制」工作,创作者们可以实现更高质量、更准确、以及更个性化的无限式长内容生成,大幅提高用户体验。

然而,每个人的需求和背景都是不断变化的,想要做到个性化,模型必须能够实时理解并动态适应用户的需求。

为此,波形智能自研了以数据为核心的可“自主进化”的智能体框架——AIWaves Self-Evolving Agents,不仅集成了1.0版本的可控性能力,还采用Symbolic Learning方式,让Agent可以在不断更新的数据环境中解析自身的性能表现,并根据用户习惯和反馈定期或者主动进行调整。这意味着,Weaver将可以持续更新,通过一次次自主进化、自我适应,从而在未来表现得更好、与用户需求更加适配。

“高质量的、个性化的用户体验,能够带来更多的用户积累。”姜昱辰说,“利用用户反馈形成的数据飞轮,也能反过来推动模型和组件能力的持续迭代,形成良性循环。”

除了需求匹配方向上的优化升级,端云结合是另一个更有针对性、更人性化的实现。在常规情况下,模型或是在本地部署,或是在云端部署,但各有隐私安全和价格方面的优缺点。而Weaver可以根据需求,在不同环境下打造端云结合的“本地私钥”,以适应更加灵活的应用场景并且保障用户隐私。

(端云结合的LPA)

以小说创作为例,一位作者的几十万字存稿内容只会在用户本地的私人文档和大模型云端之间传送,公开互联网上无法爬取,所以不会出现未发表的作品内容提前泄露等问题。同时,前面提到的“模型会根据用户数据和反馈进行自我更新”,其数据和反馈也只会对用户自己的文档生效,因此不会存在数据/隐私泄露的情况,还能够在保障用户隐私安全的前提下提供全面且个性化的体验。

一次部署、持续更新、千人千面……这些特殊的性能优化让Weaver的应用场景具备了更广泛的可能性,能够满足更多样化的需求。目前,新一代的「Weaver2.0」模型和「LPA技术」已经部署在波形智能的多个产品和应用中,以期为用户带来更具个性化的体验。

02

走普惠化之路,让AI门槛更低落地更快

1879年,当爱迪生测试的灯丝终于持久点亮,他的下一个大想法是:怎样才能让“灯泡”走进千家万户?

虽然近两年AI应用产品已经在普罗大众的生活中有所普及,但主流通用大模型的智能能力与日益增长、日益细化的个性化需求之间仍有鸿沟。并且,这个鸿沟无法通过大模型本身的迭代逐渐消弭,这使得L1层的存在价值绝不会被大模型“吞噬”。

作为目前L1层全球最领先的公司,波形智能具备领先的从训练模型到agent搭建的全流程大模型能力。因此,波形智能的思路也非常明确,通过提供低门槛的AI工具、数据准备、模型训练部署的AI Infra等,跨越大模型和个性化需求的鸿沟,去匹配不同圈层用户的不同需求,进而让更多人真正用上AI。

在DevTool方面,波形智能发布了LLM Factory——一个实现垂域大模型“数据+训练+部署”的一站式应用搭建平台,希望在帮助用户降低AI使用成本的同时,较大程度地缩短学习曲线。

而如果把LLM Factory视为是“基建”生态层面的AI普及,消费端产品的快速落地、快速应用,则是波形智能协助AI走入更加个人化的垂直使用场景中的直接举措。

利用新一代Weaver模型具备的个性化、可进化特性,叠加新增的多模态、多语言能力,波形智能实现了产品的全面焕新升级,带来了更新迭代的AI内容创作工具「蛙蛙写作2.0」以及海外版「Siuuu.AI」。

对于本次迭代的核心亮点,波形智能CPO万磊给了很凝练的总结——一站式全链路创作工具平台的转型升级。

“从无限长文本生成到无限长内容生成,蛙蛙写作打造了一个多模态赋能的视频故事工具,轻松实现了从小说到剧本到视频,覆盖文本、音频、影像的全链路内容创作。”万磊介绍道,“同时,LPA技术的加持让蛙蛙写作成为一个‘越写越懂你’的私人助手,能够终身学习并记住用户的一切,有效消除通用工具的‘偏差’,实现高度个性化的创作过程,为故事创作提供了决定性的竞争力。”

想象一下,一个能够理解并反映你独特创作审美的AI助手随时陪伴、帮助你,这正是新一代多模态无限式长内容生成的个性化自适应私人语言模型所带来的革命性体验。

值得一提的是,在个人消费领域之外,波形智能还同步发布了原生的企业级「AI Learning」产品,能够用AI重构企业传统的培训路径,以业务数据反哺业务成长所需的能力提升。

企业端的模型应用多是以深度解决垂直领域的业务问题为主,很少关注到每个员工的个性化问题。但在LPA技术加持下,波形智能「AI Learning」产品可以根据每个人不同的基础、学习能力,匹配不同的实施方案,从而实现千人千面、千人千练、千人千测的个性化培训和准确评估指导。

“传统的培训其实存在一个很明显的特征,覆盖广、人员散,如果光靠人力去组织是非常困难的。但通过AI去做培训,可以很大程度上提升效率,大大降低传统培训中涉及的物理移动的成本支出。”作为波形智能AI Learning产品客户的顾家家居AI负责人胡建宝说。

目前来看,千人千面的“普惠化AI”正在应用落地端极大地丰富起来,人人可上手AI的时代已经到来。在底层算力的支持之上,个性化的、自驱动进化的底层模型,安全的、保证用户隐私的使用环境,以及像蛙蛙写作、AI Learning这样多元化领域的落地产品缺一不可,而这些正是波形智能的能力和优势所在。

“在技术研发、平台打造、生态培育、应用落地的一重重探索下,我们一步步、一点点锤炼出来了这些能力和产品。”姜昱辰说。正如波形智能的观察:个性化、可进化、普惠化将会是主流通用大模型之后的重要探索方向,有望为AI注入比较罕见的生命力。“全方位降低使用AI的技术门槛、成本门槛,让更多的组织和个人更容易、更广泛地使用AI,才能实现真正的AGI for Everyone's Good。”

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 大家在看
  • Pixtral-12B-2409:多模态12B参数模型,结合视觉编码器处理图像和文本。

    Pixtral-12B-2409是由Mistral AI团队开发的多模态模型,包含12B参数的多模态解码器和400M参数的视觉编码器。该模型在多模态任务中表现出色,支持不同尺寸的图像,并在文本基准测试中保持最前沿的性能。它适用于需要处理图像和文本数据的高级应用,如图像描述生成、视觉问答等。

  • Pixtral 12B:首个多模态 Mistral 模型,支持图像和文本的混合任务处理。

    Pixtral 12B 是 Mistral AI 团队开发的一款多模态 AI 模型,它能够理解自然图像和文档,具备出色的多模态任务处理能力,同时在文本基准测试中也保持了最先进的性能。该模型支持多种图像尺寸和宽高比,能够在长上下文窗口中处理任意数量的图像,是 Mistral Nemo 12B 的升级版,专为多模态推理而设计,不牺牲关键文本处理能力。

  • World Labs:构建大型世界模型,感知、生成和与3D世界互动

    World Labs 是一家专注于空间智能的公司,致力于构建大型世界模型(Large World Models),以感知、生成和与3D世界进行互动。公司由AI领域的知名科学家、教授、学者和行业领导者共同创立,包括斯坦福大学的Fei-Fei Li教授、密歇根大学的Justin Johnson教授等。他们通过创新的技术和方法,如神经辐射场(NeRF)技术,推动了3D场景重建和新视角合成的发展。World Labs 得到了包括Marc Benioff、Jim Breyer等知名投资者的支持,其技术在AI领域具有重要的应用价值和商业潜力。

  • g1:使用开源模型Llama-3.1 70b在Groq上创建类似o1的推理链

    g1是一个实验性的项目,旨在通过使用Llama-3.1 70b模型在Groq硬件上创建类似于OpenAI的o1模型的推理链。这个项目展示了仅通过提示技术,就可以显著提高现有开源模型在逻辑问题解决上的能力,而无需进行复杂的训练。g1通过可视化的推理步骤,帮助模型在逻辑问题上实现更准确的推理,这对于提高人工智能的逻辑推理能力具有重要意义。

  • Dream Machine API:创意智能平台,用于构建魔法般的AI产品

    Dream Machine API是一个创意智能平台,它提供了一系列先进的视频生成模型,通过直观的API和开源SDKs,用户可以构建和扩展创意AI产品。该平台拥有文本到视频、图像到视频、关键帧控制、扩展、循环和相机控制等功能,旨在通过创意智能与人类合作,帮助他们创造更好的内容。Dream Machine API的推出,旨在推动视觉探索和创造的丰富性,让更多的想法得以尝试,构建更好的叙事,并让那些以前无法做到的人讲述多样化的故事。

  • AI问我:一站式AI工具导航平台,探索人工智能的无限可能。

    AI问我是一个集合了多种人工智能工具的导航平台,它为用户展示了从AI写作、设计、编程到娱乐和教育等多个领域的AI工具。该平台通过提供丰富的AI工具列表,帮助用户快速找到适合自己需求的AI解决方案,无论是提高工作效率、创造艺术作品还是进行学术研究,都能在这里找到合适的工具。AI问我的背景信息显示,它旨在为用户提供一个安全、便捷、内容广泛的AI工具搜索和使用环境。

  • 百度AI助手:智能对话平台,提供多领域AI服务。

    百度AI助手是一个集成了多种智能体的在线服务平台,它通过人工智能技术为用户提供包括医疗、教育、娱乐等多领域的智能对话服务。该平台利用大数据分析和机器学习算法,能够理解用户的需求并提供个性化的回答。百度AI助手的主要优点包括快速响应、高准确性和广泛的服务范围。它的背后是百度强大的人工智能技术支撑,旨在为用户提供便捷、高效的智能服务体验。目前,该平台对所有用户免费开放。

  • Shangchen Zhou:专注于计算机视觉和机器学习领域的研究与创新的博客网站

    Shangchen Zhou 是一位在计算机视觉和机器学习领域有着深厚研究背景的博士生,他的工作主要集中在视觉内容增强、编辑和生成AI(2D和3D)上。他的研究成果广泛应用于图像和视频的超分辨率、去模糊、低光照增强等领域,为提升视觉内容的质量和用户体验做出了重要贡献。

  • MiniMax:引领AI视频、音乐、文本创作新潮流

    MiniMax模型矩阵是一套集成了多种AI大模型的产品,包括视频生成、音乐生成、文本生成和语音合成等,旨在通过先进的人工智能技术推动内容创作的革新。这些模型不仅能够提供高分辨率和高帧率的视频生成,还能创作各种风格的音乐,生成高质量的文本内容,以及提供超拟人音色的语音合成。MiniMax模型矩阵代表了AI在内容创作领域的前沿技术,具有高效、创新和多样化的特点,能够满足不同用户在创作上的需求。

  • Magickimg AI 贴纸生成器:快速创建个性化AI贴纸,让沟通更生动有趣。

    Magickimg AI贴纸生成器是一个利用人工智能技术,根据用户输入的提示词快速生成个性化贴纸的在线工具。它主要面向需要为社交媒体、聊天应用等增添个性化元素的用户。产品背景基于深度学习技术,通过用户友好的界面,提供简单快捷的操作体验。产品的主要优点包括快速生成、易于操作、高质量输出以及安全可靠的服务。

  • 讯飞虚拟人:全栈式虚拟人多场景应用服务

    讯飞虚拟人利用最新的AI虚拟形象技术,结合语音识别、语义理解、语音合成、NLP、星火大模型等AI核心技术,提供虚拟人形象资产构建、AI驱动、多模态交互的多场景虚拟人产品服务。一站式虚拟人音视频内容生产,AIGC助力创作灵活高效;在虚拟'AI演播室'中输入文本或录音,一键完成音、视频作品的输出,3分钟内渲染出稿。

  • 智谱AI大模型开放平台:几行代码接入大模型

    智谱AI大模型开放平台是一个提供多种AI模型服务的平台,支持开发者和企业快速接入大模型API,构建变革性AI体验。平台提供GLM-4系列大模型,包括免费模型GLM-4-Flash、全自研最新版本GLM-4-Plus、支持200万上下文的GLM-4-Long等。此外,还提供多模态大模型,如视觉能力GLM-4V-Plus、文生图CogView-3-Plus、文生视频CogVideoX。平台面向开发者提供模型API、Alltools API、批处理API等服务,面向企业服务提供医疗健康、汽车、游戏娱乐、文旅、智能终端、智能制造、消费等行业解决方案。

  • 24h搜书:一站式免费电子书搜索和下载平台

    24h搜书是一个提供各类电子书资源的在线平台,用户可以通过书名、作者、出版社或ISBN编号进行搜索,找到所需的电子书资源并进行下载,内置AI辅助功能的电子书搜索引擎和下载工具。该平台支持多种语言版本的书籍,包括中文、英文、日文等,满足不同用户的需求。24h搜书以其便捷的搜索功能和丰富的电子书资源库,成为电子书爱好者和学习者的优选平台。

  • Hello!GPT:AI繪本創作系統,激發孩子的創意與想像力。

    Hello!GPT是一套专为小学生设计的AI绘本创作系统,通过集成的AI引擎,帮助学生生成适合的故事文案,并根据想法自动绘制出画家级别的图片。它能够自动生成电子绘本,不仅可作为学习工具,还可出版发行,参加比赛。产品通过AI智能绘图、文案生成等技术,为孩子们提供了一个创意无限、操作简单的创作平台,旨在提升他们的语言表达、创意思维和绘画技巧。

  • C知道:专业程序员AI问答工具

    C知道是由CSDN和外部合作伙伴联合研发的生成式AI产品,专注于为程序员提供问答、对话、文件分析、代码生成等服务,旨在提高工作学习效率。它通过先进的人工智能技术,能够理解并回答与编程相关的问题,支持多种编程语言和框架,是程序员日常开发和学习过程中的得力助手。

  • Miniflow:轻松创建AI工作流程,提升效率。

    Miniflow是一个AI工作流程自动化平台,它允许用户无需编写代码即可轻松创建和自动化各种AI工具的工作流程。该平台通过直观的拖放界面,提供了大量内置的工作流节点和模板,旨在简化任务,提高生产力。Miniflow适合希望简化工作流程、提高效率的用户,无论是技术用户还是非技术用户。目前产品仍在开发中,预计2024年推出。

  • Zhou Yi Easy Fortune:提供个性化的风水和占卜服务

    Zhou Yi Easy Fortune周易简易占卜是一个结合了中国传统文化和现代互联网技术的网站,它通过用户提供的出生信息和问题,运用周易的智慧来提供个性化的风水和占卜服务。该产品以周易为背景,结合现代算法,为用户提供一个简单易用的占卜平台,帮助用户在日常生活中寻找指导和启示。

  • StoryTribe:在线故事板制作工具,无需绘画技能。

    StoryTribe是一个在线故事板制作工具,它为UX设计师、营销人员和内容创作者提供定制化的故事板和插图。用户无需具备绘画技能即可轻松创建故事板,支持多种角色组合和场景道具,提供高质量的插画,适合专业和学术使用。StoryTribe旨在支持多元文化、种族和身体条件,其角色设计反映了现实生活中的人物比例,便于与真实照片背景结合,增强视觉叙事的沉浸感。

  • Flux AI 图像生成器:利用尖端AI技术,将创意转化为高质量图像。

    Flux AI 图像生成器是由Black Forest Labs开发的,基于革命性的Flux系列模型,提供尖端的文本到图像技术。该产品通过其120亿参数的模型,能够精确解读复杂的文本提示,创造出多样化、高保真的图像。Flux AI 图像生成器不仅适用于个人艺术创作,也可用于商业应用,如品牌视觉、社交媒体内容等。它提供三种不同的版本以满足不同用户的需求:Flux Pro、Flux Dev和Flux Schnell。

  • Google Illuminate:将内容转化为引人入胜的AI生成音频讨论。

    Illuminate是Google一个实验性技术,利用人工智能将选定的论文内容转化为两个AI生成的声音进行讨论的音频。这项技术特别适合计算机科学领域的学术论文,能够根据用户的学习偏好进行内容适应。它通过将复杂的学术内容转化为易于理解的音频讨论,帮助用户更有效地学习和理解论文中的关键点。

今日大家都在搜的词: