首页 > 传媒 > 关键词  > 正文

掘力计划第28期为你揭秘大模型技术探索与AIGC应用创新

2023-12-31 18:27 · 稿源: 站长之家用户

2023年12月17日,掘力计划在深圳成功举办第28期分享活动。本次活动以《大模型的技术探索与 AIGC 应用创新》为主题,云集多名人工智能业内大咖,就大模型技术的最 新进展与商业化应用进行深入探讨。会场座无虚席,现场气氛热烈。

本次活动内容丰富,观点独特,深受与会者好评。其中,RWKV 元始智能联合创始人罗璇讲师详细解析了 RWKV 模型的计算效率优势;NVIDIA 资 深工程师王猛讲师介绍了 TensorRT-LLM 强大的推理性能;阿里巴巴企业智能算法负责人陈祖龙讲师分享了大模型助力企业内部数字化转型的实例;爱创作人工智能联合创始人朱强强讲师则阐述了 AIGC 怎样颠覆出口跨境行业的运作模式。

二、RWKV模型带来计算效率和成本的双提升

罗璇讲师带来主题为《RWKV,新架构的大模型》的分享,他不仅是 RWKV 元始智能的联合创始人,还拥有丰富的技术研发与产品管理经验。罗璇讲师指出,RWKV模型通过其特有的网络结构设计,使得其时间和空间复杂度分别降至 O(1) 和 O(T),极大提升了计算效率。其中,Receptance 模块提取输入的语义特征,Weight 模块通过位置权重实现长程依赖建模,two-stream 设计则兼具了 RNN 和 Transformer 的优点。这种算法架构避免了 Self-Attention 中顺序操作的计算瓶颈,可实现顺序长度不变的恒定时间复杂度。

例如,在一项翻译任务中,当文本长度增加到2048时,RWKV 的加速比达到45倍之多。即使在长度为4096的极端情况下,其吞吐量仍远超过基准模型。在推理阶段,RWKV 消耗的内存也保持恒定,这使其可以在大多数设备上峰畅部署,而不受长度限制。

与此同时,RWKV 模型显著降低了训练和使用的计算成本。相比 BERT-Large 等模型,其参数量减少75%,计算量减少65%。这不仅大幅降低了算力需求,也使得商业部署门槛更低。业内测试表明,其算力价格比可以低至1/20,存储成本也更加经济。因此,RWKV 使大模型的应用变得更加实用与可行。

三、TensorRT-LLM 构建高性能的LLM推理架构

NVIDIA 资 深 DevTech 工程师王猛带来名为《Introduction to TensorRT-LLM》的主题演讲。王猛讲师在 NVIDIA 已经工作四年多,主要负责 TensorRT 和 TensorRT-LLM 等相关框架的支持,在推理加速领域具有丰富的经验。

王猛讲师在演讲中详细介绍了 TensorRT-LLM 这一 NVIDIA 自研的 LLM 推理加速解决方案。TensorRT-LLM 通过软硬件协同设计,专门针对大语言模型的推理特点进行了优化,以提供业界领先的执行效率。它支持主流的 Transformer 类模型,提供了优化的内核,实现了高性能的张量并行与流水线并行。同时,TensorRT-LLM 也在易用性上下足功夫,提供了类似 PyTorch 的 Python API,通过预定义模型与面向对象的方式简化了使用。

目前,TensorRT-LLM 以开源形式在 GitHub 上提供,其中 Python API 等大部分内容开源。这降低了用户的入门门槛,也便于基于现有实现进行扩展开发。在支持模型的广度与深度、执行效率、易用性等多个维度,TensorRT-LLM 都展现出业内知名的水准。它的出现将有效降低企业和研究人员部署大模型的难度,助力大模型架构在产业界的广泛落地。

四、大模型助力企业数字化转型

陈祖龙讲师带来演讲主题为《大模型+企业办公数字化实践》的分享。他是现任阿里巴巴企业智能算法负责人,在人工智能领域有着丰富的从业经验。陈祖龙讲师在演讲中表示,数字化转型已经成为企业发展的必由之路。一方面,国家政策和实际需求都在推动企业数字化;另一方面,数字化可以提升企业运营效率,为决策提供支撑。但是企业数字化面临数据复杂、业务复杂和评估难度大的三大挑战。

为此,阿里巴巴构建了面向员工和办公系统的完整数字化解决方案。在员工层面,通过智能小助手为员工提供所需服务;在系统层面,则通过智能文档解析、质量控制、权限管理等模块处理数据,并使用GPT生成数据提高查询理解准确率,采用 BGE 优化多文档排序等方法不断优化系统性能。

可以看出,大模型在理解非结构化数据、生成训练数据等方面发挥了重要作用,有效提升了数字化系统的智能化水平。陈祖龙讲师表示,未来数字化办公将呈现“信息化+机器人”的形态,数据与业务场景不断深度融合,大模型将推动企业实现数字化转型。

五、AIGC 颠覆出口跨境行业

本次活动也邀请到了朱强强讲师做名为《AIGC 如何改变出口跨境行业》的分享,朱强强讲师是爱创作的人工智能联合创始人,长期致力于将AI技术应用于内容制作领域,在该领域积累了丰富的实战经验和独到的专业视角。

朱强强讲师指出,AIGC 工具为出口跨境企业带来了翻天覆地的变化。在产品设计上,Midjourney 等工具可以通过文字描述快速绘制产品设计草图,这为中小企业解决了设计难题;在电商运营上,ChatGPT 可以深入理解海外市场,以及模拟用户反馈来优化决策;在品牌建设上,AIGC 可以有效生成创意设计和文案,提升品牌实力。可以说,AIGC 将持续渗透到出口企业的各个领域,成为标准工作流程的一部分,并将帮助更多企业实现产业升级。

AIGC 的出现给出口跨境企业带来了翻天覆地的变化。从产品设计到品牌运营,AIGC 提高了工作效率,降低了成本,实现了本土化市场的深入理解。可以预见,AIGC将持续渗透到出口跨境企业的各个领域,成为标准的工作流程。

六、总结和展望

本次技术分享会聚焦大模型技术的发展前沿,以及 AIGC 在实际业务中的应用创新实践。四位业内专家从理论和实践两个维度进行探讨,内容丰富,对行业发展提供了宝贵思考。相信大模型作为AI的重要趋势,必将产生深远的技术和商业影响。让我们继续关注其产生的更多可能性!

掘力计划

掘力计划由稀土掘金技术社区发起,致力于打造一个高品质的技术分享和交流的系列品牌。聚集国内外顶 尖的技术专家、开发者和实践者,通过线下沙龙、闭门会、公开课等多种形式分享最前沿的技术动态。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • AI科普新星崛起:陈天桥用AIGC技术重塑知识传播

    大圆镜科普通过AIGC技术打造电影级科普视频,以严谨科学内容和震撼视听体验成为知识传播领域标杆。依托天桥脑科学研究院资源,团队将电影制作标准引入AI创作,实现科学性与故事性完美融合。视频在B站、抖音等平台获得超1.8亿播放量,多次登上热榜并获专业奖项认可。从技术展示到价值创造,大圆镜科普展现了AIGC在科普领域的应用潜力,推动观众关注点从"是否AI制作"转向内容价值本身。

  • 锻造新质生产力新引擎 三大创新背后的海尔探索

    9月19日,“现代化进程中的新质生产力”国际研讨会在北京召开。会议由国务院新闻办公室、国家发展改革委指导,中国人权发展基金会、中国宏观经济研究院、海尔集团联合主办。会议聚焦激发新质生产力,推动经济社会高质量发展。海尔集团代表周云杰强调企业是发展新质生产力的核心主体,需通过科技创新、激发人才活力和构建开放生态实现突破。2024年海尔业绩创新高,全球收入达4016亿元,增长8%,利润总额302亿元,增长13%。会议呼吁企业从有限博弈转向无限共创,以科技引领产业升级,服务国家战略。

  • 智惠家AIGC——打造中国AI 服务第一入口

    文章探讨了从“互联网+”到“人工智能+”的信息技术革命深化进程,重点介绍了我国积极推动人工智能在各领域赋能与应用落地的举措。国务院印发《关于深入实施“人工智能+”行动的意见》,明确2027年新一代智能体应用普及率超70%的目标。智慧家AIGC响应政策,以社区家庭AI+教育场景为切入点,推出智能PAD等产品,通过免费使用策略获取用户流量,打造一站式服务平台,整合电商、本地生活及供应链资源,提供智能化、便捷化、个性化的新型生活服务。

  • 数据创新高但依然赚钱难,短剧出海“平台期”如何活得“更滋润”?

    尽管下载量一路走高,但在内购流水上,海外短剧市场反而从3月开始进入了相对的平台期。DataEye 的数据显示7月海外短剧 App 内购双端流水1.875亿美元,环比6月反而出现下降。DataEye 表示下载量上涨、但流水回落的主要原因在于“用户付费能力正在进一步分化”。 一方面来讲,随着短剧市场不断发展,IAA 用户也开始出现明显增长,为满足这一需求,主推 IAA 的新品大量上线抬�

  • AI日报:美团发布推理大模型LongCat-Flash-Thinking;阿里Wan-Animate开源;字节推豆包翻译大模型

    AI日报栏目聚焦人工智能领域最新动态。美团推出高性能推理大模型LongCat-Flash-Thinking;阿里开源Wan-Animate模型革新AI视频生成;字节跳动发布豆包翻译模型,支持28种语言互译;华为与浙大联合推出安全大模型DeepSeek-R1-Safe;阿里云即将发布跨模态模型Qwen3-Omni;xAI推出计算成本降低98%的Grok4Fast模型;YouTube发布多项AI创作辅助功能;IBM推出轻量级文档处理模型Granite-Docling-258M;中科院发布类脑大模型SpikingBrain实现百倍速度突破;OpenAI将推出仅限Pro用户的计算密集型新功能。

  • “全链覆盖”“全向集成”|移动云开启大模型普惠应用新篇章

    国际数据公司报告显示,2024年中国MaaS市场规模达7.1亿元,同比增长215.7%,预计2024-2029年复合增长率将达66.1%。随着AI大模型落地,企业对全生命周期工具链、开发平台及通用模型需求激增。移动云通过构建四层云智算架构,提供一站式模型服务,推动AI普惠化。平台已服务30余家央企,覆盖6大行业,未来将持续提升算力智能化水平,助力各行业轻量化拥抱AI时代。

  • 《鹅鸭杀》手游“鸭轴”测试定档9月28日,全民推理盛宴即将开启!

    《鹅鸭杀》手游将于9月28日开启不限号删档测试,无需激活码。本次测试新增“轮抽”和“超级金水铃”模式,推出全新地图“丛林神殿”,并强化社交玩法,包括专属个人房间和送礼系统。游戏还优化了画面和服务器稳定性,支持安卓/iOS双端下载。官方邀请主播参与互动,并筹备综艺节目,丰富娱乐内容。测试期间充值将在公测时返利。

  • 真我GT8 Pro不改名!真我CMO:用产品力说话 而不是用改名发声

    真我GT8系列将于10月发布,包括GT8和GT8 Pro两款旗舰机型。新机搭载高通骁龙8至尊版芯片,采用台积电3nm工艺,配备2K直屏、2亿像素潜望长焦、大师级对称双扬声器等顶级配置。真我高管强调产品力优先,拒绝跟风改名,以Pro之名诠释Ultra级产品实力。

  • 赫力昂联合Springer Nature旗下自然定制揭秘大脑抗衰

    全球老龄化加速,大脑健康成为焦点。9月16日是中国脑健康日,9月21日是世界阿尔茨海默病日。数据显示,2020至2023年全球60岁以上人口增长40%,达14亿;中国60岁以上人口超3亿,占比22%。阿尔茨海默病带来的经济负担约占GDP的1.47%。科学界正探索维持大脑年轻态的机制,企业合作举办高峰论坛,专家分享前沿研究成果,强调40-60岁是干预黄金窗口期。复合维生素矿物质等营养干预手段显示认知改善潜力,未来需跨学科协作推动大脑抗衰研究普及。

  • AI日报:可灵AI发布数字人新功能;腾讯混元新技术给大模型 “去油”;抖音上线AI求真功能

    AI日报今日聚焦多项技术突破:可灵AI推出图片转视频功能,腾讯混元SRPO技术提升图像真实感,IBM开源文档处理模型Granite-Docling-258M。Meta发布带屏AI眼镜Ray-Ban,DeepSeek论文登《Nature》封面。OpenAI新增GPT-5思考时长调节功能,抖音上线“AI求真”辟谣工具,通用DeepResearch开源模型性能超越国际知名模型。

今日大家都在搜的词: