首页 > 传媒 > 关键词  > 多模态AI最新资讯  > 正文

GITEX GLOBAL2024开展,Soul 多模态大模型引关注

2024-10-19 21:59 · 稿源: 站长之家用户

如今的 AI 看起来已经无所不能,不仅能够胜任感知、学习、推理、决策等不同层面的任务,甚至可以打造虚拟数字分析,为人类带来多模态AI交互体验。近日, 新型社交平台Soul App 在GITEX GLOBAL海湾信息技术博览会上展出了其比较新自研的多模态大模型,该模型具备多模态理解、真实拟人、文字对话、语音通话、多语种等特性,实现打破次元壁的互动,让现场的观众们惊艳不已。

3D数字孪生,虚拟与现实的创新交互

Soul作为国内较早将AI引入社交关系的互联网平台代表之一,此次携比较新自研的多模态大模型参展GITEX GLOBAL2024,向世界展现了中国企业在社交领域的比较新应用实践和数字娱乐的创新方案。此次是Soul初次亮相国际大型展会,其自研的多模态大模型集合文字、语音、动作交互等多模态方向,实现更接近人类模式的互动体验和更有效、自然、丰富维度的信息传递。

大会上,现场观众可以实现高相似度的3D虚拟人的AI建模,通过包含人脸的90余个形状参数和6个属性参数,于几秒钟内,快速在3D世界精细化还原真实人脸的特征 ,打造专属的虚拟化身。同时,基于实时的人体动作识别、数字还原以及多模态对话交互能力,实现3D虚拟人与真人的沉浸式互动。

多模态端到端大模型,超拟人的情感体验

事实上,自成立以来Soul便一直聚焦于多模态大模型方向持续深耕。

在推出智能推荐引擎“灵犀”、以AI算法助力社交关系的发现沉淀环节后,2020年,Soul正式启动对AIGC的技术研发工作,系统推进在智能对话、语音技术、3D虚拟人等AIGC关键技术能力研发工作,并推动AI能力在社交场景的快速落地。

目前,Soul已先后上线了自研语言大模型Soul X,以及语音生成大模型、语音识别大模型、语音对话大模型、音乐生成大模型等语音大模型能力。今年6月,Soul还在社交行业中较早推出了自研端到端全双工语音通话大模型,具备超低交互延迟、快速自动打断、超真实声音表达和情绪感知理解能力等特点,能够直接理解丰富的声音世界,支持超拟人化的多风格语言,实现更接近生活日常的交互对话和“类真人”的情感陪伴体验。

多模态端到端大模型的推出标志着Soul对人机交互体验的创新突破,同时,从文字、语音到视觉的模态升级,也意味着交互方式的颠覆式改变。在未来,Soul将持续加大对AI技术的投入,致力于通过AI技术更好地帮助用户进行社交破冰,助力人设搭建和认知决策,提升社交沟通效率。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • AI日报:阿里云通义灵码AI IDE上线;小米多模态大模型Xiaomi MiMo-VL开源;黑森林实验室推出FLUX.1Kontext

    【AI日报】今日AI领域重要动态:1)阿里云推出通义灵码AI IDE,集成千问3模型,显著提升编程效率;2)小米开源多模态大模型MiMo-VL-7B,性能超越更大规模闭源模型;3)黑森林实验室发布FLUX.1Kontext图像生成模型,支持文本和参考图像多次编辑;4)Midjourney V7渲染速度提升40%,新增用户投票功能;5)DeepSeek R1-0528大模型在AGI领域取得突破,性能超越xAI等公司;6)Hugging Face进军机器人市场,推出开源人形机器人HopeJR;7)字节跳动火山方舟接入DeepSeek最新大模型;8)Anthropic开源"电路追踪"工具,揭示大模型决策过程;9)阿里巴巴开源自主搜索AI智能体WebAgent;10)Hume发布低延迟语音语言模型EVI3;11)Manus Slides支持一键生成专业幻灯片;12)Runway Gen-4 References支持手机照片艺术化处理。

  • 字节最强多模态模型登陆火山引擎!Seed1.5-VL靠20B激活参数狂揽38项SOTA

    5月13日,火山引擎在上海搞了场 FORCE LINK AI 创新巡展,一股脑发布了5款模型和产品,包括豆包・视频生成模型 Seedance1.0lite、升级后的豆包1.5・视觉深度思考模型,以及新版豆包・音乐模型。同时,Data Agent 和 Trae 等产品也有了新进展。

  • 从产品霸榜到行业引领,九号公司 2024 年的亮眼答卷

    九号公司2024年业绩亮眼,总营收141.96亿元,同比增长38.87%;净利润10.84亿元,同比大增81.29%。公司采用Segway和Ninebot双品牌战略,智能电动车表现突出,全球电动滑板车销量124.31万台,收入24.79亿元,市场份额第一。国内电动两轮车销量约260万台,收入72.11亿元,增长70.38%。研发投入8.26亿元,同比增长34.13%,累计申请全球知识产权7452项。线下门店突破7600家,覆盖全国1200余县市。公司积极推动行业标准化,参与制定100余项国内外技术标准,并率先推出锂电池回收业务。通过"硬件+数据+服务"生态模式,九号公司正加速全球化布局,在智慧出行和服务机器人领域持续创新。

  • 慧科讯业AI赋能数据标签化,破局多模态数据治理难题

    文章探讨了数字化浪潮下数据标签化的重要性及其商业应用。数据标签化作为大数据分析的基础,能帮助企业实现精准营销和智能决策。然而,多模态数据处理复杂、人工标注成本高、业务理解不足等问题制约了数据价值的释放。文章提出数据标签化在构建用户画像、舆情监控、市场趋势预测等场景中的核心价值,并分析了当前面临的挑战:包括传统NLP算法不精准、大语言模型成本高且不稳定等。慧科讯业通过TDaaS服务模式,结合行业领先的数据源、NLP技术和垂直知识图谱,为企业提供高效的数据标注解决方案,显著提升数据处理效率。未来,随着AI技术发展,知识图谱驱动的TDaaS模式将重新定义数据价值变现方式。

  • 2025上海车展:BBA等八成主流车企已接入豆包大模型

    2025年4月23日,第二十一届上海国际车展开幕。本届车展以"新能源"和"智能化"为核心主题,吸引近千家中外汽车企业参展,展出车辆超千辆,其中新能源车占比超七成。奔驰、奥迪、长安马自达等品牌展示了基于豆包大模型的智能座舱系统,交互效率提升50%,唤醒速度仅0.2秒。火山引擎与多家车企达成战略合作,共同推进AI大模型在智能驾驶、数字座舱等领域的�

  • 破局多模态数据治理难点,数据标注重构企业营销新基建

    文章探讨了AI数据标注行业的发展现状与未来趋势。主要内容包括:1)AI数据标注已成为企业数字化转型的核心基础设施,92.9%数据为非结构化形态;2)营销领域多模态数据融合正在重塑商业决策模式;3)慧科讯业等企业通过TDaaS服务帮助客户构建数据资产;4)数据标注服务商分为国际头部、自有生态型、垂直领域型和综合营销数字化型四类;5)未来趋势包括AI驱动的自动化标注、数据合规升级和人机协同模式创新。文章强调,高质量数据标注服务将助力企业实现从"可用"到"可信高效"的数字化转型。

  • AI日报:昆仑万维天工超级智能体APP上线;谷歌重磅发布三大Gemma模型变体;字节推出开源多模态模型BAGE

    本文介绍了AI领域最新动态:1)昆仑万维推出全球首款AI+Agent架构的Office智能体应用;2)研究显示ChatGPT能提升K12学生成绩近87%;3)谷歌视频生成工具Veo3扩展至更多地区;4)谷歌发布三款Gemma模型变体,覆盖医疗、手语翻译和海豚语言研究;5)VideoTutor实现一句话生成定制教学视频;6)字节跳动开源多模态模型BAGEL;7)Rork支持无代码开发iOS/Android应用;8)AingDesk降低AI助手开发门槛;9)Claude4登陆亚马逊Bedrock平台;10)Youware通过MCP协议提升网页生成能力。这些创新展示了AI技术在各领域的快速发展和应用潜力。

  • Soul举办“心理医诗”音乐会 用音乐搭建情绪疗愈桥梁

    文章探讨了音乐对情绪的治愈作用,指出集体音乐活动正成为都市人对抗孤独的良方。Soul App联合多家机构将于6月1日在上海举办"心理医诗音乐会3.0",通过"诗歌+音乐"的复合形式为都市人提供心理疗愈。研究表明音乐能直接调节情绪,全球"焦虑缓解"歌单播放量激增90%。文章追溯了音乐疗愈的历史渊源,从远古动物通过鸣叫传递安全信号,到现代人用音乐唤醒被封存的情感记忆。这场音乐会融合多种艺术形式,旨在为原子化时代的年轻人搭建情感连接的桥梁,让每个孤独个体在集体共鸣中找到归属。活动体现了社交平台在心理健康领域的创新探索,为数字时代的情感陪伴模式提供了新思路。

  • 2024云计算市场排名出炉,AI驱动市场集中度提升

    2024年全球IaaS市场持续高速增长,规模达1717.55亿美元,增速22.5%。亚马逊、微软、谷歌、阿里云和华为位居全球前五。中国市场中,阿里云、华为云和腾讯云占据71%份额,同比增长12%。AI需求增长推动云服务商加强计算能力和基础设施部署优势,市场集中度持续提升。

  • Soul调研Z世代领证新态度,探索婚姻登记新趋势

    5月10日起,新版《婚姻登记条例》实施,取消户籍限制实现"全国通办",仅凭身份证即可登记。Soul平台调研显示:95后最坚持领证(50.83%),认为领证是爱情从浪漫到现实的仪式;超六成受访者看重"社会认可和公开承诺";女性对"只办婚礼不领证"接受度高于男性,一线城市居民接受度更高。00后更倾向专业摄影跟拍(57.02%),多数人希望民政局提供仪式服务,免费捧花和纪念相框最受欢迎。调研表明Z世代婚姻观呈现传统与创新并存特点,既重视仪式感又追求个性表达,为婚庆产业发展提供新方向。