首页 > 业界 > 关键词  > 正文

2024外滩大会大模型论坛:发布3个大模型产品、多项行业共建成果落地

2024-09-06 23:15 · 稿源:站长之家

2024年9月5日,Inclusion·外滩大会成功举办了主题为“大模型的创造力边界与应用想象力”的论坛。本次论坛由中国人工智能学会和蚂蚁集团主办,中国信息通信研究院华东分院承办,汇聚了包括中国工程院院士蒋昌俊、清华大学人工智能研究院常务副院长孙茂松、上海人工智能实验室领军科学家乔宇在内的多位行业重量级嘉宾。他们就大模型技术的最新趋势和未来应用进行了深入的分享和讨论。论坛上还首次发布了三个行业重磅级的大模型新产品,推出一系列行业共建成果,这些成果标志着大模型技术在专业领域的应用迈出了重要一步。

_x0000_i1025

9月5日,2024Inclusion·外滩大会“大模型的创造力边界与应用想象力”见解论坛召开

智能体、多模态等技术有新变化

论坛上,专家们深入讨论了智能体、多模态技术、知识图谱等前沿科技话题,为与会者提供了一场思想的盛宴。

中国工程院院士蒋昌俊介绍,金融大模型为智能化决策、风险管理等领域带来了创新体验和生产力增效,未来则更应兼顾产业发展与安全两大关键诉求,着力提升应用可控性与安全性,推进金融行业迈入更高质量的发展阶段。

清华大学人工智能研究院常务副院长孙茂松认为,目前已经具备条件做比较好的智能体,主要得益于语言大模型的生成能力、生成代码的能力、图像视频处理能力、3D建模能力这“四板斧”的进步,这给了智能体新的发展机会。

上海人工智能实验室主任助理、领军科学家乔宇一直专注多模态大模型的研发,他认为具身智能是未来重要的发展方向,而多模态是具身智能的基础,因为要利用多模态技术对环境进行感知和理解,具身智能还需要具备一个世界模型,能对整个世界中各种各样的物理信号进行很好的理解。

浙江大学计算机科学与技术学院教授陈华钧介绍了“知识图谱+语言模型”如何赋能通用AI,他通过诸多实验,证明了提升语料的结构性和逻辑性能够比较好地提升模型推理能力,比如把很多不同的代码语料根据结构性和逻辑性做了分级,再将其融入到模型的预训练和提示过程中,最终模型的推理能力会表现更好。

浙大二院人工智能与信息化部主任相鹏认为医疗AI技术的融合和应用将进一步推动医疗行业的数字化转型。这不仅将改变医生的工作方式,也将为患者带来更高效、更精准的医疗服务体验。随着这些技术的不断成熟和普及,我们有理由相信,医疗AI将成为推动健康产业发展的关键力量。

西湖心辰CEO醒辰、沐曦集成电路(上海)有限公司高级副总裁孙国梁、NVIDIA英伟达开发与技术部门亚太区资深总监李曦鹏、中国信通院华东分院人工智能事业部主任常永波等也分别做了主题演讲。

两项行业生态共建成果落地

_x0000_i1026

大模型产业应用技术联盟正式成立

“大模型产业应用技术联盟(LM-IATA,Large Model Driven Industrial Application TechnicalAlliance)”也在会上正式成立,联盟旨在促进成员之间的协作,行业共建大模型产业应用技术资源,推动大模型产业应用可信能力、服务体系的开放,促进人工智能在行业规模化应用的成熟和推广。

联盟设置医疗专业委员会、金融专业委员会以及基础技术委员会,共12家创始成员单位。

联盟创始成员单位代表、蚂蚁集团副总裁徐鹏表示:“目前大模型技术与严谨产业应用的结合,需要多方联接,通过联盟的方式,将有助于成员间资源共建、技术共创、成果共享。”

为了促进产业应用落地,蚂蚁集团还联合信通院共同发布了《大模型行业可信应用框架研究报告》。报告体系化地提出面向专业领域的大模型可信应用框架,即在面向金融、医疗等专业严谨领域,通过在大模型开发和应用的不同环节,施加相应的技术保障手段,以确保应用的专业性、可控性、真实性和安全性。

报告还展示了大模型可信应用框架在金融、医疗、政务的已有实践案例。

信通院副总工程师,中国人工智能产业发展联盟副秘书长王爱华表示:“大模型可信应用框架是推动大模型在产业中规模化落地应用释放价值的初步探索,未来的产业化突破还需要从多个维度系统统筹推进。我们期待产业上下游各方通力协作,共同推动大模型在产业中的规模化可信应用落地,助力产业智能化升级。”

三大行业重磅大模型新产品发布

论坛上,三项大模型成果正式发布:同济大学和上海人工智能实验室联合发布的“书生·济世”数字金融平台,西湖心辰推出的“心辰Lingo”端到端语音大模型,沐曦与新华社合作的新华本源一体机。在人工智能技术的快速发展背景下,三大行业的最新产品发布不仅展示了各自领域的创新成果,也反映了一个共同的趋势:技术的融合与创新正在推动各行各业的智能化应用加速推广落地。。

举报

  • 相关推荐
  • 大家在看
  • Batteries Included:现代服务开发的终极平台

    Batteries Included是一个为现代服务开发设计的全功能平台,提供源代码可用的一站式解决方案。它基于开源代码构建,支持从Docker到Knative的部署,拥有自动化安全和更新、智能自动化、高可靠性、先进的AI技术、以及易于集成的SSO等特点。这个平台旨在帮助开发者构建、部署和轻松扩展项目,同时确保数据隐私和成本效益。

  • Knowledge Table:开源工具,简化从非结构化文档中提取和探索结构化数据。

    Knowledge Table 是一个开源工具包,旨在简化从非结构化文档中提取和探索结构化数据的过程。它通过自然语言查询界面,使用户能够创建结构化的知识表示,如表格和图表。该工具包具有可定制的提取规则、精细调整的格式化选项,并通过UI显示的数据溯源,适应多种用例。它的目标是为业务用户提供熟悉的电子表格界面,同时为开发者提供灵活且高度可配置的后端,确保与现有RAG工作流程的无缝集成。

  • DisEnvisioner:定制化图像生成的先进方法

    DisEnvisioner是一种先进的图像生成技术,它通过分离和增强主题特征来生成定制化的图像,无需繁琐的调整或依赖多张参考图片。该技术有效地区分并增强了主题特征,同时过滤掉了不相关的属性,实现了在编辑性和身份保持方面的卓越个性化质量。DisEnvisioner的研究背景基于当前图像生成领域对于从视觉提示中提取主题特征的需求,它通过创新的方法解决了现有技术在这一领域的挑战。

  • RF-Inversion:利用随机微分方程进行语义图像反转和编辑

    RF-Inversion是一个专注于图像生成和编辑的技术,它通过随机微分方程(SDE)来实现图像的反转和编辑。这项技术的主要优点在于它不需要额外的训练、潜在优化、提示调整或复杂的注意力处理器,即可实现高效的图像反转和编辑。RF-Inversion在零样本反转和编辑方面表现出色,超越了以往的工作,在笔画到图像合成和语义图像编辑方面,通过大规模人类评估确认了用户偏好。该技术背景信息显示,它由德克萨斯大学奥斯汀分校和谷歌的研究人员共同开发,得到了NSF资助和其他研究合作奖的支持。

  • Animate-X:通用角色图像动画框架,支持多种角色类型动画生成。

    Animate-X是一个基于LDM的通用动画框架,用于各种角色类型(统称为X),包括人物拟态角色。该框架通过引入姿势指示器来增强运动表示,可以更全面地从驱动视频中捕获运动模式。Animate-X的主要优点包括对运动的深入建模,能够理解驱动视频的运动模式,并将其灵活地应用到目标角色上。此外,Animate-X还引入了一个新的Animated Anthropomorphic Benchmark (A2Bench) 来评估其在通用和广泛适用的动画图像上的性能。

  • Zamba2-7B:高效能小型语言模型

    Zamba2-7B是由Zyphra团队开发的一款小型语言模型,它在7B规模上超越了当前领先的模型,如Mistral、Google的Gemma和Meta的Llama3系列,无论是在质量还是性能上。该模型专为在设备上和消费级GPU上运行以及需要强大但紧凑高效模型的众多企业应用而设计。Zamba2-7B的发布,展示了即使在7B规模上,前沿技术仍然可以被小团队和适度预算所触及和超越。

  • iPad mini:功能强大的新款 ,专为 Apple Intelligence 打造

    新款 iPad mini 是一款超便携的设备,搭载了强大的 A17 Pro 芯片和支持 Apple Pencil Pro,提供了出色的性能和多功能性。它配备了8.3英寸Liquid Retina显示屏,拥有全天的电池续航能力,并预装了全新的iPadOS 18系统。这款新设备不仅性能出色,而且设计精美,提供了蓝色、紫色、星光色和深空灰四种颜色选择。iPad mini的起售价为499美元,提供了128GB的存储空间,是上一代产品的两倍,为用户带来了极高的性价比。

  • TANGO Model:共语手势视频重现技术

    TANGO是一个基于层次化音频-运动嵌入和扩散插值的共语手势视频重现技术。它利用先进的人工智能算法,将语音信号转换成相应的手势动作,实现视频中人物手势的自然重现。这项技术在视频制作、虚拟现实、增强现实等领域具有广泛的应用前景,能够提升视频内容的互动性和真实感。TANGO由东京大学和CyberAgent AI Lab联合开发,代表了当前人工智能在手势识别和动作生成领域的前沿水平。

  • gait:AI原生版本控制工具,提升代码协作效率。

    gait是一个AI原生版本控制工具,它通过存储提示、上下文和代码的结合,帮助团队更容易理解和编辑AI生成的代码。gait自动保存AI代码生成对话,并通过版本控制与团队共享开发上下文。它支持GitHub Copilot和Cursor,并且提供了包括AI Blame、Codegen Analytics和Team Collaboration在内的多种功能。gait旨在通过AI技术提高开发人员的生产力,同时确保代码的版权和知识产权得到保护。

  • Code2.AI:将你的想法快速转化为代码

    Code2.AI是一个创新的在线平台,它通过人工智能技术帮助开发者将想法快速转化为代码。该平台通过压缩代码库,使AI能够理解并与开发者一同编程。Code2.AI的主要优点包括加速开发进程、无限制的编码能力以及与现有项目的无缝集成。它支持任何编程语言,无论是Web还是移动开发,都能提供完整的函数代码,而不仅仅是代码片段。此外,Code2.AI还提供了详细的使用指南,帮助用户更有效地利用AI进行编程。

  • Parseflow:智能文档处理解决方案

    Parseflow是一个数据自动化平台,专注于通过先进的OCR和AI技术实现文档数据的自动提取和结构化。它能够显著降低操作成本,提高工作效率,适用于从发票、合同到电子邮件和简历等多种文档类型。该平台易于集成,支持60多种语言,并提供安全的数据存储。Parseflow的主要优点包括快速的数据提取、广泛的文档类型支持、多语言识别能力以及与6000多个应用的集成能力。它的目标是帮助企业释放数据的潜力,提高运营效率。

  • Dovetail 3.0:AI驱动的客户洞察中心,助力产品决策

    Dovetail 3.0是一个AI驱动的客户洞察平台,它通过自动化分析、渠道监控、即时问答和招募研究参与者等功能,帮助企业快速获取客户反馈并将其转化为产品决策。该产品利用最新的大型语言模型,自动对用户反馈、支持工单、应用评论等进行主题分类,同时提供定制化的视图,帮助企业洞察客户需求,优化产品方向。Dovetail 3.0的界面经过重新设计,更直观易用,适合各类用户。

  • FunASR:功能强大的语音离线文件转写服务

    FunASR是一款语音离线文件转写服务软件包,集成了语音端点检测、语音识别、标点等模型,能够将长音频与视频转换成带标点的文字,并支持多路请求同时转写。它支持ITN与用户自定义热词,服务端集成有ffmpeg,支持多种音视频格式输入,并提供多种编程语言客户端,适用于需要高效、准确语音转写服务的企业和开发者。

  • Perplexity for Mac:通过AI搜索和发现知识

    Perplexity是一个基于人工智能的搜索和发现工具,旨在为用户提供可信、最新的答案。它通过AI引导的搜索、语音或文本提问、深入的线索跟进、内置的信任体系(引用来源)以及个人知识库等功能,帮助用户快速获取所需的信息。这款应用适合那些追求高效获取准确信息的用户,无论是学生、研究人员还是普通知识探索者。Perplexity目前可以免费下载,并且提供内购选项。

  • Strella:AI驱动的客户研究工具,快速获取深入洞察

    Strella是一个利用人工智能技术进行客户研究的平台,它通过AI主持的访谈和即时综合分析,帮助企业和研究人员快速做出更明智的决策。该产品的主要优点包括快速研究、高响应率、实时分析、多语言支持等,它能够显著提高研究效率,降低成本,并提供灵活的访谈安排。Strella的背景信息显示,它已经为多个行业提供了客户研究服务,并且得到了积极的市场反馈。产品的价格和定位信息未在页面上明确提供,但提供了试用和演示的选项。

  • Zupport AI:为SaaS公司提供客户支持的AI解决方案

    Zupport AI是一个专为SaaS公司设计的客户支持平台,它利用人工智能技术帮助解决客户支持中的重复问题,通过意图检测提供上下文感知的回复,同时支持在应用内收集功能请求,以及与Slack同步,以提升客户支持效率和客户满意度。该产品背景信息表明,它旨在帮助SaaS公司应对产品发展过程中客户支持的挑战,通过自动化和智能化手段提高支持团队的工作效率和响应速度。

  • Project Concept:AI驱动的创意概念化和情绪板工具

    Project Concept 是 Adobe 推出的一款基于 AI 的创意概念化和情绪板工具,旨在帮助创意专业人士在项目初期快速探索和迭代创意概念。它利用 Adobe 的 Firefly 生成式 AI 模型,允许用户混合图像、变换资产区域、混合风格和背景等。该产品支持多人协作,并与 Adobe Creative Cloud 集成,使得与 Photoshop、Illustrator 或 Adobe Express 的工作流程无缝衔接。Project Concept 还通过 Content Credentials 技术尊重艺术家的工作,确保图像来源的透明度和 AI 使用的合规性。

  • eSearch:一款多功能的屏幕搜索和截屏软件。

    eSearch 是一款基于Electron开发的跨平台屏幕搜索和截屏软件,支持Linux、Windows和Mac系统。它集成了截屏、OCR文字识别、搜索、翻译、贴图、屏幕翻译、以图搜图、滚动截屏和录屏等功能。eSearch旨在提供一种方便快捷的方式来获取屏幕上的信息,并通过OCR技术将图片中的文字转换为可编辑的文本,支持多语言识别和翻译,极大地提高了工作效率。

  • RealAnime:基于Stable Diffusion的LoRA模型,生成逼真动漫风格图像

    RealAnime - Detailed V1 是一个基于Stable Diffusion的LoRA模型,专门用于生成逼真的动漫风格图像。该模型通过深度学习技术,能够理解并生成高质量的动漫人物图像,满足动漫爱好者和专业插画师的需求。它的重要性在于能够大幅度提高动漫风格图像的生成效率和质量,为动漫产业提供强大的技术支持。目前,该模型在Tensor.Art平台上提供,用户可以通过在线方式使用,无需下载安装,方便快捷。价格方面,用户可以通过购买Buffet计划来解锁下载权益,享受更灵活的使用方式。

  • VirtualWife:一个支持B站直播的虚拟数字人项目

    VirtualWife是一个虚拟数字人项目,旨在打造一个拥有自己“灵魂”的虚拟伴侣。该项目支持B站直播,并且兼容openai、ollama等大语言模型。VirtualWife不仅能够提供情感陪伴,还能作为恋爱导师和心理咨询师,满足人类的情感需求。项目处于孵化阶段,作者投入了大量的业余时间进行开发,希望用户能够通过点star来支持项目的发展。

今日大家都在搜的词:

热文

  • 3 天
  • 7天