首页 > 传媒 > 关键词  > 虚拟化身最新资讯  > 正文

亮相2024 GITEX海湾信息技术博览会 Soul App多模态大模型实现超拟人互动体验

2024-10-15 09:43 · 稿源: 站长之家用户

通过理解自身的行为方式、记忆、偏好等内容,复刻一个专属于自己的虚拟化身,实现打破次元壁的互动,结识好友,获得陪伴......如今,科幻电影中描绘的场景正走向现实。

2024 年 10 月 14 日- 18 日, GITEX GLOBAL海湾信息技术博览会在迪拜举办。在这个全球范围颇具影响力的科技盛会上,新型社交平台Soul App携最 新自研的多模态大模型参展,该模型具备多模态理解、真实拟人、文字对话、语音通话、多语种等特性。在活动现场,观众可以通过数字装置,即时生成3D虚拟数字分身,通过实时动作捕捉与还原,体验自然、流畅、沉浸式的多模态互动。

Soul App CTO 陶明表示,“在受全球关注的科技大会上,我们期待与来自国内外的创新企业、科技公司共同交流,展现中国企业在社交领域的最 新应用实践和数字娱乐的创新方案,共同探索社交发展的新可能。”

3D数字孪生,虚拟与现实的创新交互

GITEX GLOBAL至今已举办至第 44 届,自诞生以来,始终聚焦于以技术为驱动的创新,吸引了来自大型科技企业、全球政府、创新初创公司、专业投资者等的广泛关注和参与。目前,GITEX GLOBAL已发展成为中东地区规模最 大、最成功的计算机通讯及消费性电子产品展,同时也是全球三大IT展之一。

自ChatGPT横空出世,标志着人工智能发展至新阶段,在世界进入全面拥抱人工智能的新时代的当下,今年,GITEX GLOBAL2024 规模再次升级,横跨两个大型场馆 —— 迪拜世界贸易中心和迪拜港,有全球超过 6700 家科技巨头和创新公司参展,展示AI领域较具突破性的科技发展、智能互联新发现、以及来自数字娱乐、社交、教育、健康等各大领域的应用落地标杆案例,汇聚最前沿的尖 端技术思潮,引领行业变革的新风向。

作为国内较早将AI引入社交关系的互联网平台代表之一,Soul 携最 新自研的多模态大模型参展GITEX GLOBAL 2024,展示AI技术积累以及在社交场景的最 新落地实践。此次也是Soul首 次亮相国际大型展会,大会上,现场观众可以重点体验到Soul集成3D虚拟人能力的多模态AI交互方案。

为了降低用户社交压力,Soul自 2016 年上线之初便不支持用户上传真实头像,年轻人通过平台提供的捏脸系统,自主创造个性化虚拟形象,在不强调颜值、地理位置等物理因素的情况下,自在表达,分享热爱,相遇同好。

2022 年,Soul集成AI、渲染和图像处理等技术,推出自研的NAWA引擎,为用户创建个性化的3D社交形象和场景提供技术加持。基于该引擎,用户可以自主创作生动的虚拟形象,塑造网络世界的化身,并能灵活地配合声音、文字等各种信息,展现每个人鲜明的个性,准确传递情绪温度,在各种虚实融合的场景中与他人自在交流、互动,感受全新的社交体验。

集合过往的技术储备以及大模型研发进展的突破,现阶段,Soul 3D虚拟人能力全面升级,形成了成熟的集成3D虚拟人能力的多模态AI交互方案——即集合文字、语音、动作交互的多模态大模型方向,实现更接近人类模式的互动体验和更有效、自然、丰富维度的信息传递。

在大会现场,参与体验的用户可以实现高相似度的3D虚拟人的AI建模,通过包含人脸的 90 余个形状参数和 6 个属性参数,于几秒钟内,快速在3D世界精细化还原真实人脸的特征,打造专属的虚拟化身。

同时,基于实时的人体动作识别、数字还原以及多模态对话交互能力,现场可以实现3D虚拟人与真人的沉浸式互动

多模态端到端大模型,超拟人的情感体验

事实上,包括语言、对话、3D虚拟人等维度在内,Soul聚焦于多模态大模型方向持续深耕。

在推出智能推荐引擎“灵犀”、以AI算法助力社交关系的发现沉淀环节后, 2020 年,Soul正式启动对AIGC的技术研发工作,系统推进在智能对话、语音技术、3D虚拟人等AIGC关键技术能力研发工作,并推动AI能力在社交场景的快速落地。

目前,Soul已先后上线了自研语言大模型Soul X,以及语音生成大模型、语音识别大模型、语音对话大模型、音乐生成大模型等语音大模型能力。今年 6 月,Soul还在社交行业中较早推出了自研端到端全双工语音通话大模型,具备超低交互延迟、快速自动打断、超真实声音表达和情绪感知理解能力等特点,能够直接理解丰富的声音世界,支持超拟人化的多风格语言,实现更接近生活日常的交互对话和“类真人”的情感陪伴体验。

2024 年,Soul AI大模型能力整体升级为了多模态端到端大模型,支持文字对话、语音通话、多语种、多模态理解、真实拟人等特性。

多模态端到端大模型的推出标志着Soul对人机交互体验的创新突破,同时,从文字、语音到视觉的模态升级,也意味着交互方式的颠覆式改变。

例如,Soul已基于自研AI能力推出了“数字分身”功能,用户可以直接授权平台基于聊天记录、发帖内容,或者以自定义方式,设置数字分身的形象和特征,在表征层(形象、声音、文字风格),身份层(社交关系、长期记忆、人设信息)和认知层(决策、观点、偏好),使数字分身达到最 大程度复刻真人的效果。而“数字分身”不仅能实现更个性化、更千人千面的智能回复推荐,帮助用户进行社交破冰,还能在助力人设搭建和认知决策中,提升社交沟通效率。

接下来,通过最 新集成的3D虚拟人能力和多模态端到端大模型的AI交互方案,Soul用户自主打造的3D虚拟人,可以作为数字世界的多模态全能助手,在平台群聊派对、瞬间广场等丰富社交场景中全面赋能用户的关系发现、建立、沉淀环节,拓展新关系的同时,提供高质量、趣味性、沉浸式的人机交互体验,反馈真实、自然的情感陪伴。

Soul App CTO陶明表示,“作为天然的流量聚集地和交互入口,社交被视为AI率先落地的最 佳场景之一。我们将围绕用户的实际社交需求和具体社交场景,持续加大对AI技术的投入,给用户带来长期的可持续的价值。预计今年年底,Soul多模态端到端大模型将再次升级,推出全双工视频通话能力,让用户可以真正便捷、自然的体验到包括文字、语音、视觉在内的多模态创新交互。”

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • AI日报:阿里云通义灵码AI IDE上线;小米多模态大模型Xiaomi MiMo-VL开源;黑森林实验室推出FLUX.1Kontext

    【AI日报】今日AI领域重要动态:1)阿里云推出通义灵码AI IDE,集成千问3模型,显著提升编程效率;2)小米开源多模态大模型MiMo-VL-7B,性能超越更大规模闭源模型;3)黑森林实验室发布FLUX.1Kontext图像生成模型,支持文本和参考图像多次编辑;4)Midjourney V7渲染速度提升40%,新增用户投票功能;5)DeepSeek R1-0528大模型在AGI领域取得突破,性能超越xAI等公司;6)Hugging Face进军机器人市场,推出开源人形机器人HopeJR;7)字节跳动火山方舟接入DeepSeek最新大模型;8)Anthropic开源"电路追踪"工具,揭示大模型决策过程;9)阿里巴巴开源自主搜索AI智能体WebAgent;10)Hume发布低延迟语音语言模型EVI3;11)Manus Slides支持一键生成专业幻灯片;12)Runway Gen-4 References支持手机照片艺术化处理。

  • 上海人民广播电台对话Soul App:AI时代,重新定义社交

    上海人民广播电台发起"新质生产力调研行"活动走进社交平台Soul App,探讨AI社交时代创新技术如何赋能关系体系、升级交互体验。作为AI社交领域代表,Soul App通过自研"灵犀引擎"智能推荐系统,运用AI技术分析用户行为数据,实现精准内容匹配。平台持续升级AI大模型能力,推出AI陪伴、AI聊天助手等功能,打造差异化社交体验。数据显示,国内AI情感陪伴产业规模快速增长,预计三年后将达近600亿元。Soul致力于构建"原生情绪价值第一模型",重点发展超拟人、多模态等能力,让AI实现自然流畅的情感交互。调研显示超八成年轻人通过AI辅助建立了真实社交关系。

  • 穿拖鞋办婚礼?Z 世代情侣流行在 Soul App 制造云端浪漫!

    Soul App用户"毛毛绒"和"小方"在相识五周年纪念日举办了一场特别的线上婚礼。这对情侣2018年在社交平台相识,疫情期间互相扶持,共同养宠物培养责任感,最终步入婚姻。他们在领证当天选择回到相识的平台,举办了一场没有繁文缛节的云婚礼,近2000名网友送上祝福。这反映了Z世代婚恋观:轻形式重情感,追求个性表达。数据显示,当代年轻人更重视婚姻中的精神契合,六成受访者认为领证是对伴侣的公开承诺。平台近年已促成超10万对情侣,见证着数字时代年轻人从"流程化仪式"到"个性化叙事"的婚恋方式变革。

  • AI日报:昆仑万维天工超级智能体APP上线;谷歌重磅发布三大Gemma模型变体;字节推出开源多模态模型BAGE

    本文介绍了AI领域最新动态:1)昆仑万维推出全球首款AI+Agent架构的Office智能体应用;2)研究显示ChatGPT能提升K12学生成绩近87%;3)谷歌视频生成工具Veo3扩展至更多地区;4)谷歌发布三款Gemma模型变体,覆盖医疗、手语翻译和海豚语言研究;5)VideoTutor实现一句话生成定制教学视频;6)字节跳动开源多模态模型BAGEL;7)Rork支持无代码开发iOS/Android应用;8)AingDesk降低AI助手开发门槛;9)Claude4登陆亚马逊Bedrock平台;10)Youware通过MCP协议提升网页生成能力。这些创新展示了AI技术在各领域的快速发展和应用潜力。

  • Soul App Z世代婚姻登记态度调研:领证是爱情从浪漫到现实的“仪式感里程碑”

    5月10日起,我国婚姻登记制度迎来重大改革:新修订的《婚姻登记条例》正式实施,取消户籍限制、实现"全国通办",仅凭身份证即可完成登记。新政首日,上海婚姻登记中心迎来462对异地新人,其中山西小伙与开封姑娘在相恋第1000天完成"异地登记"。年轻人通过国风旅拍、宠物见证、景区颁证等创新形式重构仪式感,既坚持法律保障的契约精神,又追求个性化表达。调研显示,91.2%的年轻人重视法律保障,72.6%青睐创新登记形式,00后更以角色扮演(17.37%)、携宠登记(25.28%)等突破性方式重塑仪式场景。六成青年愿尝试"领证+旅行"模式,杭州、厦门等地已出现"高铁婚旅专线"。数据揭示当代青年婚姻观呈现"法律根基稳固,仪式创新多元"特征,既强调社会认同,又通过个性化表达重构婚恋价值。值得注意的是,27.39%女性支持"只办婚礼不领证",同时该群体对婚姻法律课程(38.7%)和心理测试(41.2%)需求旺盛,反映年轻人挣脱形式束缚时仍渴求情感稳定性。

  • 安卓/iOS双端无障碍适配覆盖核心社交社区场景,Soul App持续升级“数字盲道”

    社交平台Soul App在无障碍宣传日之际推出"被看见的无障碍"活动,倡导关注无障碍设施建设。数据显示我国残障人士总数达8591.4万,其中视力障碍者2856.5万。Soul自2022年起组建专项小组推进无障碍适配工作,目前已覆盖注册登录、内容发布、社交互动等核心场景,让视障用户也能流畅使用平台。平台通过技术创新构建无障碍交互空间,获评"人民企业社会责任奖"等荣誉。未来将持续优化信息无障碍环境,从可用到易用,实现更自然流畅的无障碍社交体验。

  • 字节最强多模态模型登陆火山引擎!Seed1.5-VL靠20B激活参数狂揽38项SOTA

    5月13日,火山引擎在上海搞了场 FORCE LINK AI 创新巡展,一股脑发布了5款模型和产品,包括豆包・视频生成模型 Seedance1.0lite、升级后的豆包1.5・视觉深度思考模型,以及新版豆包・音乐模型。同时,Data Agent 和 Trae 等产品也有了新进展。

  • 音箱智商史诗升级 AI大模型渗透率已20%

    目前上市的新品已经全面搭载AI大模型技术,例如小度大金刚Pro和小米智能音箱等搭载大模型技术的新品在4月上市,兼顾了声学、美学和语音技术的多方面升级。

  • 从产品霸榜到行业引领,九号公司 2024 年的亮眼答卷

    九号公司2024年业绩亮眼,总营收141.96亿元,同比增长38.87%;净利润10.84亿元,同比大增81.29%。公司采用Segway和Ninebot双品牌战略,智能电动车表现突出,全球电动滑板车销量124.31万台,收入24.79亿元,市场份额第一。国内电动两轮车销量约260万台,收入72.11亿元,增长70.38%。研发投入8.26亿元,同比增长34.13%,累计申请全球知识产权7452项。线下门店突破7600家,覆盖全国1200余县市。公司积极推动行业标准化,参与制定100余项国内外技术标准,并率先推出锂电池回收业务。通过"硬件+数据+服务"生态模式,九号公司正加速全球化布局,在智慧出行和服务机器人领域持续创新。

  • 慧科讯业AI赋能数据标签化,破局多模态数据治理难题

    文章探讨了数字化浪潮下数据标签化的重要性及其商业应用。数据标签化作为大数据分析的基础,能帮助企业实现精准营销和智能决策。然而,多模态数据处理复杂、人工标注成本高、业务理解不足等问题制约了数据价值的释放。文章提出数据标签化在构建用户画像、舆情监控、市场趋势预测等场景中的核心价值,并分析了当前面临的挑战:包括传统NLP算法不精准、大语言模型成本高且不稳定等。慧科讯业通过TDaaS服务模式,结合行业领先的数据源、NLP技术和垂直知识图谱,为企业提供高效的数据标注解决方案,显著提升数据处理效率。未来,随着AI技术发展,知识图谱驱动的TDaaS模式将重新定义数据价值变现方式。