首页 > 传媒 > 关键词  > 人工智能最新资讯  > 正文

聚焦AI大模型 激发城市新活力 城市云数字领军人才研修班·东莞站成功举办

2024-04-26 17:41 · 稿源: 站长之家用户

新一代人工智能发展如火如荼 ,大模型如何落地推动数字转型赋能城市发展?4月25日,以“AI大模型 打造城市新质生产力”为主题的城市云数字领军人才研修班在东莞举办。

国家信息中心信息化和产业发展部主任单志广、东莞市发展与改革局副局长魏亚东、 中国信息通信研究院云计算与大数据研究所政企数字化转型部主任徐恩庆、广东工业大学机电工程学院院长刘强、华为云中国区副总裁刘少华,全国20多个省市城市数字化建设相关负责人等政府、高校、研究院以及企业的专家、学者参加了此次活动。

本次活动是在国家信息中心智慧城市发展研究中心的指导下,由中国信息通信研究院、东莞市发展和改革局、华为云计算技术有限公司联合主办,旨在通过产业专家学者、城市数字化建设主官以及产业代表的经验交流碰撞,共同探索AI大模型激发城市活力的无限可能。

聚焦大模型发展新质生产力

单志广在致辞中表示,智慧城市是数字中国的综合载体,是发展数字经济的核心关键支撑力量,新质生产力以创新为主题,以有效、高质为关键特征,需要战略性新兴产业和未来产业做支撑。今年是大模型的落地元年,AI大模型如何和千行万业相互结合,如何打造大模型落地应用为城市、产业带来新动能,需要社会各界共同探讨推进,本次研修班提供了非常宝贵的交流和学习机会。

刘少华在致辞中表示,在大模型时代华为可以提供有效稳定的算力服务,通过盘古大模型和矿山、政务、制药、钢铁、生物等各个行业结合,运用AI重塑千行万业。各个行业都可能在未来几年内会被AI重塑、改造,针对全国各地城市不同类型、不同基础的智能化转型的需求,华为希望能携手行业的专家学者、生态伙伴,共同打造满足城市发展智能化转型的解决方案。

徐恩庆在致辞中表示,中国信通院秉持“国家高端专业智库 产业创新发展平台”的发展定位,目前正在开展关于政务大模型、城市大模型如何落地相关的标准研究工作,强化标准引领发展。中国信通院围绕数字政府、智慧城市领域将开展新一轮报告编制工作,同时积极搭建产业交流的生态平台,推动新技术模式充分地交流沟通。

随后,单志广、魏亚东、徐恩庆、刘强、刘少华共同出席城市云数字领军人才研修班·东莞站开班仪式。本次研修班设置课题分享、圆桌论坛和样板点考察等环节,让学员们深入了解AI大模型的前沿动态和实际应用,互相交流分享城市数字化转型和智能升级的经验和成果。

人工智能推动数字化转型

研修班上,单志广聚焦《城市+Al 加速数字经济蓬勃发展》这一主题,围绕国家政策、产业发展、大模型技术与行业应用,深度解读在人工智能时代城市发展从有机体向智能体、从数据智能向模型智能、从传统计算向智能计算转变的三个趋势,重点介绍了智慧城市发展、AI大模型赋能城市数字化转型、智能计算与一体化算力体系等内容。

我国部署加快人工智能在各领域发展与创新,多地积极布局大模型应用场景落地。徐恩庆带来《大模型时代下的产业数字化转型》,指出大模型推动城市产业数字化转型进入“深水区”,介绍了大模型在政务领域和智能工业的应用案例,并表示我国大模型发展机遇与挑战并存,中国信通院将持续推动政务大模型产业研究和标准评估工作、持续完善政务大模型标准体系建设。

第四次工业革命方兴未艾,全球制造业新竞争格局正在重构。刘强以《Al+制造,推动制造业高质量发展》为主题授课,解读了中国制造业的特征、内在动力与外在压力、“Al+制造应用”等内容。他认为,对于制造业企业而言,适合自身场景、优化生产的领域小模型更合适,通过释放智力优势和创新应用形态,制造业可以实现更高质量发展。

AI大模型赋能城市实践与探索

制造业是东莞的立市之本和核心竞争力,经过多年发展,东莞构建了“科技创新+先进制造”的产业体系。魏亚东介绍了大小模型协同发展、打造工业大模型赋能产业创新的“东莞模式”,东莞以创新人才培养赋能新质生产力发展,坚持发展“AI+制造”打造全市人工智能创新高地,并规划建设人工智能小镇,赋能制造业高质量发展。

贵州贵安发展集团副总经理汪榕分享了贵州与华为最近十年的建设情况、贵州对于AI大模型的需求痛点和应用场景。依托华为盘古大模型,立足贵安发展,贵安发展集团建设政务、矿山大模型,服务全省、覆盖其他行业,并分享了贵安发展集团大模型的建设蓝图、建设目标、建设规划、建设成效等。

华为云盘古大模型坚持“AI for Industries“,探索大模型与千行万业的理想耦合路径。华为云人工智能工业大模型总经理史扬在分享中讲解了AI大模型发展趋势和AI释放新质生产力,并介绍了盘古城市安全大模型、制造大模型、矿山大模型、气象大模型等在城市与产业的探索实践案例。

在圆桌讨论环节,围绕“城市大模型建设运营及本地产业赋能”主题,来自全国多个城市的嘉宾们聚焦城市如何构建算力体系、大模型技术解决城市支柱型产业智能化转型及城市治理场景痛点和难点、大模型技术如何持续赋能本地产业、高校、人才等方向议题进行经验分享、提问互动,气氛热烈。

4月26日,主办方组织学员走进华为南方工厂、全球网络安全透明中心(东莞)、慕思智能睡眠等样板点,为城市数字化建设者提供学习借鉴和成果交流的平台,一同探索AI大模型在城市新质生产力发展中的潜力。

据悉,从“政务云”升级“城市云”,华为城市云以智能有效、安全可靠的技术及运营能力,深耕全国160多个城市,服务800多个项目,在技术创新、数字赋能、产业生态、人才培养方面深度参与城市的数字化建设和智能化升级,致力于成为城市数字化转型“合伙人”。未来,“城市云数字领军人才研修班”将针对不同层级、领域、区域的数字化建设者,建立差别化的课程体系,紧扣智慧城市、数字政府、数字化转型实际需要,增强学员的数字思维和专业素质,为全面增强数字城市建设效能提供重要人才保障。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 大家在看
  • Nemotron-4-340B-Reward:多维奖励模型,助力构建自定义大型语言模型。

    Nemotron-4-340B-Reward是由NVIDIA开发的多维奖励模型,用于合成数据生成管道,帮助研究人员和开发者构建自己的大型语言模型(LLMs)。该模型由Nemotron-4-340B-Base模型和一个线性层组成,能够将响应末尾的标记转换为五个标量值,对应于HelpSteer2属性。它支持最多4096个标记的上下文长度,并能够对每个助手轮次的五个属性进行评分。

  • Nemotron-4-340B-Instruct:NVIDIA的高级语言模型,优化于英文对话场景。

    Nemotron-4-340B-Instruct是由NVIDIA开发的大型语言模型(LLM),专为英文单轮和多轮对话场景优化。该模型支持4096个token的上下文长度,经过监督式微调(SFT)、直接偏好优化(DPO)和奖励感知偏好优化(RPO)等额外的对齐步骤。模型在约20K人工标注数据的基础上,通过合成数据生成管道合成了超过98%的用于监督微调和偏好微调的数据。这使得模型在人类对话偏好、数学推理、编码和指令遵循方面表现良好,并且能够为多种用例生成高质量的合成数据。

  • BookSlice:让阅读更有趣,用游戏化的方式增加阅读量。

    BookSlice是一款面向忙碌人群的游戏化阅读应用,通过心理学原理帮助用户建立阅读习惯,并通过设置每日挑战来维持阅读连续性。它利用实施意图、习惯叠加等心理工具,使阅读变得习惯性和上瘾。此外,BookSlice还提供AI问答功能,帮助用户在阅读过程中获得上下文答案。

  • agentUniverse:基于大型语言模型的多智能体应用开发框架

    agentUniverse 是一个基于大型语言模型的多智能体应用开发框架,提供了构建单一智能体和多智能体协作机制的所有必需组件。通过模式工厂,允许开发者构建和自定义多智能体协作模式,轻松构建多智能体应用,并分享不同技术与业务领域的模式实践。

  • HunyuanDiT Distillation Acceleration:高性能图像生成模型的蒸馏加速版本

    HunyuanDiT Distillation Acceleration 是腾讯 Hunyuan 团队基于 HunyuanDiT 模型开发的蒸馏加速版本。通过渐进式蒸馏方法,在不降低性能的情况下,实现了推理速度的两倍提升。该模型支持多种GPU和推理模式,能够显著减少时间消耗,提高图像生成效率。

  • WonderWorld:从单张图片生成交互式3D场景

    WonderWorld是一个创新的3D场景扩展框架,允许用户基于单张输入图片和用户指定的文本探索和塑造虚拟环境。它通过快速高斯体素和引导扩散的深度估计方法,显著减少了计算时间,生成几何一致的扩展,使3D场景的生成时间少于10秒,支持实时用户交互和探索。这为虚拟现实、游戏和创意设计等领域提供了快速生成和导航沉浸式虚拟世界的可能性。

  • ChatTTS_Speaker:基于ERes2NetV2模型的音色稳定性评分与音色打标。

    ChatTTS_Speaker是一个基于ERes2NetV2说话人识别模型的实验性项目,旨在对音色进行稳定性评分和音色打标,帮助用户选择稳定且符合需求的音色。项目已开源,支持在线试听和下载音色样本。

  • fastc:轻量级文本分类工具,使用大型语言模型嵌入。

    fastc是一个基于大型语言模型嵌入的简单且轻量级的文本分类工具。它专注于CPU执行,使用高效的模型如deepset/tinyroberta-6l-768d生成嵌入。通过余弦相似度分类代替微调,实现文本分类。它还可以在不增加额外开销的情况下,使用相同的模型运行多个分类器。

  • MeshAnything:3D资产的自动生成工具

    MeshAnything是一个利用自回归变换器进行艺术家级网格生成的模型,它可以将任何3D表示形式的资产转换为艺术家创建的网格(AMs),这些网格可以无缝应用于3D行业。它通过较少的面数生成网格,显著提高了存储、渲染和模拟效率,同时实现了与先前方法相当的精度。

  • HunyuanDiT-v1.1:多分辨率扩散变换器,支持中英文理解

    HunyuanDiT-v1.1是由腾讯Hunyuan团队开发的一款多分辨率扩散变换模型,它具备精细的中英文理解能力。该模型通过精心设计的变换器结构、文本编码器和位置编码,结合从头开始构建的完整数据管道,实现数据的迭代优化。HunyuanDiT-v1.1能够执行多轮多模态对话,根据上下文生成和细化图像。经过50多名专业人类评估员的全面评估,HunyuanDiT-v1.1在中文到图像生成方面与其他开源模型相比,达到了新的最先进水平。

  • UniAnimate:高效生成一致性人物视频动画的模型

    UniAnimate是一个用于人物图像动画的统一视频扩散模型框架。它通过将参考图像、姿势指导和噪声视频映射到一个共同的特征空间,以减少优化难度并确保时间上的连贯性。UniAnimate能够处理长序列,支持随机噪声输入和首帧条件输入,显著提高了生成长期视频的能力。此外,它还探索了基于状态空间模型的替代时间建模架构,以替代原始的计算密集型时间Transformer。UniAnimate在定量和定性评估中都取得了优于现有最先进技术的合成结果,并且能够通过迭代使用首帧条件策略生成高度一致的一分钟视频。

  • LVBench:长视频理解基准测试

    LVBench是一个专门设计用于长视频理解的基准测试,旨在推动多模态大型语言模型在理解数小时长视频方面的能力,这对于长期决策制定、深入电影评论和讨论、现场体育解说等实际应用至关重要。

  • Mo:通过卡片式学习,轻松掌握AI科技知识。

    Mo是一款结合超现实主义艺术和堂吉诃德理想主义精神的AI科技学习APP。它通过卡片形式,以图文、动画、视频、语音等多样化内容,使AI和科技知识的学习变得生动有趣。Mo不仅覆盖了AI的基础知识,还包含了元宇宙、大数据、大模型等前沿技术,适合各种背景的学习者,旨在打造一个个性化的学习体验。

  • 开搜AI搜索:面向大众的AI问答搜索引擎

    开搜AI问答搜索引擎是一款面向大众的、直达答案的AI问答搜索引擎,它能够帮助用户从海量的文献资料中筛选出有用的信息,提供直接、精准的答案,并且能够自动总结重点、生成大纲、思维导图并下载。

  • AI Math Notes:一个交互式绘图应用,用于数学方程的绘制和计算。

    AI Math Notes 是一个开源的交互式绘图应用程序,允许用户在画布上绘制数学方程。应用程序利用多模态大型语言模型(LLM)计算并显示结果。该应用程序使用Python开发,利用Tkinter库创建图形用户界面,使用PIL进行图像处理。灵感来源于Apple在2024年全球开发者大会(WWDC)上展示的'Math Notes'。

  • VideoTetris:文本到视频生成的创新框架

    VideoTetris是一个新颖的框架,它实现了文本到视频的生成,特别适用于处理包含多个对象或对象数量动态变化的复杂视频生成场景。该框架通过空间时间组合扩散技术,精确地遵循复杂的文本语义,并通过操作和组合去噪网络的空间和时间注意力图来实现。此外,它还引入了一种新的参考帧注意力机制,以提高自回归视频生成的一致性。VideoTetris在组合文本到视频生成方面取得了令人印象深刻的定性和定量结果。

  • Visual Sketchpad:多模态语言模型的视觉推理工具

    Visual Sketchpad 是一种为多模态大型语言模型(LLMs)提供视觉草图板和绘图工具的框架。它允许模型在进行规划和推理时,根据自己绘制的视觉工件进行操作。与以往使用文本作为推理步骤的方法不同,Visual Sketchpad 使模型能够使用线条、框、标记等更接近人类绘图方式的元素进行绘图,从而更好地促进推理。此外,它还可以在绘图过程中使用专家视觉模型,例如使用目标检测模型绘制边界框,或使用分割模型绘制掩码,以进一步提高视觉感知和推理能力。

  • GoMate:基于RAG框架的可靠输入和可信输出系统

    GoMate是一个基于Retrieval-Augmented Generation (RAG)框架的模型,专注于提供可靠输入和可信输出。它通过结合检索和生成技术,提高信息检索和文本生成的准确性和可靠性。GoMate适用于需要高效、准确信息处理的领域,如自然语言处理、知识问答等。

  • SD3-Controlnet-Canny:一种用于生成图像的深度学习模型。

    SD3-Controlnet-Canny 是一种基于深度学习的图像生成模型,它能够根据用户提供的文本提示生成具有特定风格的图像。该模型利用控制网络技术,可以更精确地控制生成图像的细节和风格,从而提高图像生成的质量和多样性。

  • Tencent EMMA:多模态文本到图像生成模型

    EMMA是一个基于最前沿的文本到图像扩散模型ELLA构建的新型图像生成模型,能够接受多模态提示,通过创新的多模态特征连接器设计,有效整合文本和补充模态信息。该模型通过冻结原始T2I扩散模型的所有参数,并仅调整一些额外层,揭示了预训练的T2I扩散模型可以秘密接受多模态提示的有趣特性。EMMA易于适应不同的现有框架,是生成个性化和上下文感知图像甚至视频的灵活有效工具。

今日大家都在搜的词:

热文

  • 3 天
  • 7天