首页 > 传媒 > 关键词  > 正文

掘力计划第28期为你揭秘大模型技术探索与AIGC应用创新

2023-12-31 18:27 · 稿源: 站长之家用户

2023年12月17日,掘力计划在深圳成功举办第28期分享活动。本次活动以《大模型的技术探索与 AIGC 应用创新》为主题,云集多名人工智能业内大咖,就大模型技术的最 新进展与商业化应用进行深入探讨。会场座无虚席,现场气氛热烈。

本次活动内容丰富,观点独特,深受与会者好评。其中,RWKV 元始智能联合创始人罗璇讲师详细解析了 RWKV 模型的计算效率优势;NVIDIA 资 深工程师王猛讲师介绍了 TensorRT-LLM 强大的推理性能;阿里巴巴企业智能算法负责人陈祖龙讲师分享了大模型助力企业内部数字化转型的实例;爱创作人工智能联合创始人朱强强讲师则阐述了 AIGC 怎样颠覆出口跨境行业的运作模式。

二、RWKV模型带来计算效率和成本的双提升

罗璇讲师带来主题为《RWKV,新架构的大模型》的分享,他不仅是 RWKV 元始智能的联合创始人,还拥有丰富的技术研发与产品管理经验。罗璇讲师指出,RWKV模型通过其特有的网络结构设计,使得其时间和空间复杂度分别降至 O(1) 和 O(T),极大提升了计算效率。其中,Receptance 模块提取输入的语义特征,Weight 模块通过位置权重实现长程依赖建模,two-stream 设计则兼具了 RNN 和 Transformer 的优点。这种算法架构避免了 Self-Attention 中顺序操作的计算瓶颈,可实现顺序长度不变的恒定时间复杂度。

例如,在一项翻译任务中,当文本长度增加到2048时,RWKV 的加速比达到45倍之多。即使在长度为4096的极端情况下,其吞吐量仍远超过基准模型。在推理阶段,RWKV 消耗的内存也保持恒定,这使其可以在大多数设备上峰畅部署,而不受长度限制。

与此同时,RWKV 模型显著降低了训练和使用的计算成本。相比 BERT-Large 等模型,其参数量减少75%,计算量减少65%。这不仅大幅降低了算力需求,也使得商业部署门槛更低。业内测试表明,其算力价格比可以低至1/20,存储成本也更加经济。因此,RWKV 使大模型的应用变得更加实用与可行。

三、TensorRT-LLM 构建高性能的LLM推理架构

NVIDIA 资 深 DevTech 工程师王猛带来名为《Introduction to TensorRT-LLM》的主题演讲。王猛讲师在 NVIDIA 已经工作四年多,主要负责 TensorRT 和 TensorRT-LLM 等相关框架的支持,在推理加速领域具有丰富的经验。

王猛讲师在演讲中详细介绍了 TensorRT-LLM 这一 NVIDIA 自研的 LLM 推理加速解决方案。TensorRT-LLM 通过软硬件协同设计,专门针对大语言模型的推理特点进行了优化,以提供业界领先的执行效率。它支持主流的 Transformer 类模型,提供了优化的内核,实现了高性能的张量并行与流水线并行。同时,TensorRT-LLM 也在易用性上下足功夫,提供了类似 PyTorch 的 Python API,通过预定义模型与面向对象的方式简化了使用。

目前,TensorRT-LLM 以开源形式在 GitHub 上提供,其中 Python API 等大部分内容开源。这降低了用户的入门门槛,也便于基于现有实现进行扩展开发。在支持模型的广度与深度、执行效率、易用性等多个维度,TensorRT-LLM 都展现出业内知名的水准。它的出现将有效降低企业和研究人员部署大模型的难度,助力大模型架构在产业界的广泛落地。

四、大模型助力企业数字化转型

陈祖龙讲师带来演讲主题为《大模型+企业办公数字化实践》的分享。他是现任阿里巴巴企业智能算法负责人,在人工智能领域有着丰富的从业经验。陈祖龙讲师在演讲中表示,数字化转型已经成为企业发展的必由之路。一方面,国家政策和实际需求都在推动企业数字化;另一方面,数字化可以提升企业运营效率,为决策提供支撑。但是企业数字化面临数据复杂、业务复杂和评估难度大的三大挑战。

为此,阿里巴巴构建了面向员工和办公系统的完整数字化解决方案。在员工层面,通过智能小助手为员工提供所需服务;在系统层面,则通过智能文档解析、质量控制、权限管理等模块处理数据,并使用GPT生成数据提高查询理解准确率,采用 BGE 优化多文档排序等方法不断优化系统性能。

可以看出,大模型在理解非结构化数据、生成训练数据等方面发挥了重要作用,有效提升了数字化系统的智能化水平。陈祖龙讲师表示,未来数字化办公将呈现“信息化+机器人”的形态,数据与业务场景不断深度融合,大模型将推动企业实现数字化转型。

五、AIGC 颠覆出口跨境行业

本次活动也邀请到了朱强强讲师做名为《AIGC 如何改变出口跨境行业》的分享,朱强强讲师是爱创作的人工智能联合创始人,长期致力于将AI技术应用于内容制作领域,在该领域积累了丰富的实战经验和独到的专业视角。

朱强强讲师指出,AIGC 工具为出口跨境企业带来了翻天覆地的变化。在产品设计上,Midjourney 等工具可以通过文字描述快速绘制产品设计草图,这为中小企业解决了设计难题;在电商运营上,ChatGPT 可以深入理解海外市场,以及模拟用户反馈来优化决策;在品牌建设上,AIGC 可以有效生成创意设计和文案,提升品牌实力。可以说,AIGC 将持续渗透到出口企业的各个领域,成为标准工作流程的一部分,并将帮助更多企业实现产业升级。

AIGC 的出现给出口跨境企业带来了翻天覆地的变化。从产品设计到品牌运营,AIGC 提高了工作效率,降低了成本,实现了本土化市场的深入理解。可以预见,AIGC将持续渗透到出口跨境企业的各个领域,成为标准的工作流程。

六、总结和展望

本次技术分享会聚焦大模型技术的发展前沿,以及 AIGC 在实际业务中的应用创新实践。四位业内专家从理论和实践两个维度进行探讨,内容丰富,对行业发展提供了宝贵思考。相信大模型作为AI的重要趋势,必将产生深远的技术和商业影响。让我们继续关注其产生的更多可能性!

掘力计划

掘力计划由稀土掘金技术社区发起,致力于打造一个高品质的技术分享和交流的系列品牌。聚集国内外顶 尖的技术专家、开发者和实践者,通过线下沙龙、闭门会、公开课等多种形式分享最前沿的技术动态。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 魔乐社区AIGC创作专区正式上线

    魔乐社区推出免费开放的AIGC创作专区,提供快速生图和专业生图两大核心功能。专区首页汇聚热门AI模型和优质作品展示,支持中英文输入和多种艺术风格模板。快速生图功能操作简单,用户输入文字描述即可一键生成高质量图像;专业生图模块提供LoRA模型组合、采样方法等高级参数调节,满足商业设计等专业需求。同时推出"AI夏日造梦"创作活动,7月12日至8月12日期间分享作品可参与人气打榜赢取奖品。该平台整合免费NPU算力资源,为从入门到专业的创作者提供高效低门槛的AI内容创作环境。

  • 融合数据中台与动态调度:林剑峰在共享出行智能算法开发中的技术探索

    本文讲述了林剑峰在智能出行领域的十年深耕历程。作为系统工程师,他主导构建了融合数据、算法与规则引擎的智能调度体系,通过动态聚类和路径规划模型显著提升了共享单车调度效率。其创新包括分级围栏模型、嵌入式调度判断模块等专利技术,实现了跨区域精准调度和系统自主运行能力。数据显示,他推动的系统使车辆调度效率提升37.38%,异常识别准确率显著提高。林剑峰的工作体现了"技术+业务"的系统设计理念,为城市智能交通建设提供了可借鉴的技术范式。

  • YY 直播首部 AIGC 真人短剧上线!实现了制作效率与成本控制的双重突破

    YY直播旗下短剧厂牌麦芬推出首部AIGC真人短剧《权谋之帝王心术》,取材于平台主播真实故事,联合百度AIGC技术实现剧本创作与视觉制作的智能化。该剧制作成本较传统模式降低58%,周期缩短53%,通过多平台分发扩大传播范围。作为"生态短剧"创新尝试,既展现YY在内容领域的深耕,也验证了AIGC技术在影视制作中的降本增效能力,为行业探索"真实生态+智能技术"的内容生产新模式提供了实践样本。

  • 探索AI时代出海新范式!impact.com荣获TopDigital创新营销奖「年度营销技术公司」

    2025年7月1日,impact.com在第十三届TopDigital创新营销盛典上荣获"年度营销技术公司"大奖。该平台凭借技术能力、商业影响和全球化战略的综合表现获得认可,其AI技术正深刻改变品牌营销工作方式,尤其在效率提升与流程优化方面成效显著。impact.com通过智能推荐、智能审批等功能,将AI能力引入合作伙伴管理核心环节,帮助出海企业构建全球化合作网络。大中华区总裁Jennifer Zhang表示,AI不是替代营销人,而是释放其判断力与创造力。作为全球合作伙伴经济核心引擎,impact.com已服务众多中国出海品牌,未来将继续深化AI在营销管理平台的应用。

  • 文生图大模型有哪些?探索AI绘画的核心引擎与选择利器

    本文探讨了当前主流的AI文生图技术及其应用场景。国际阵营中,OpenAI的DALL·E3擅长复杂语义理解,MidJourney以艺术风格见长,Stable Diffusion则以开源生态支持深度定制。中国力量方面,百度文心一格在中文语义和国风创作表现突出,阿里通义万相侧重商业化应用,昆仑万维天工支持长文本生成连贯图像。垂直领域工具如Adobe Firefly深度集成设计流程,Runway ML革新视频创作。文章建议通过聚合平台高效对比模型特性,并指出下一代技术将突破分辨率限制,实现跨模态生成。从精准语义到无限可能,AI文生图正在重塑视觉创作边界。

  • 挑战极限出意外 俄罗斯一男子从28米高悬崖跳水当场身亡

    不少人喜欢挑战极限,那就需要承担相应的后果,有可能送命那种。 近日,俄罗斯一名32岁男子在诺里尔斯克附近的峡谷进行极限运动,他从28米高的悬崖一跃而下,结果重重拍到了水面上激起大片浪花并迅速沉入水底。 随后救援人员与潜水员展开搜救行动,几个小时后才找到并打捞起他的遗体。 据悉,该地点是当地极限运动爱好者与旅客的朝圣地,男子朋友表示,他曾多�

  • DC新宇宙开篇之作 电影《超人》今日上映 IGN打8分

    今日,DC新宇宙开篇之作《超人》在中国内地上映。 DC电影官微发布上映宣传图,超人和喷火巨兽及神秘对手正面对决,鹰女惊喜亮相。 据了解,IGN为本片给出8分好评,称《超人》是一部充满娱乐性、感人至深的电影,为钢铁之躯带来了一次出色的重启,也为DC宇宙的电影重启迈出了坚实的第一步。 《超人》由漫威电影《银河护卫队》三部曲的导演詹姆斯古恩执导、编剧、�

  • HKIT携手WALLX推出创新区块链奖励模型,引领心理治疗与AI技术融合新趋势

    香港智能有限公司(HKIT)与WALLX公司合作,将AI技术与心理治疗相结合,开发出基于区块链的奖励和参与模式。该创新系统能精准评估用户心理状态并提供个性化治疗方案,同时利用区块链确保数据安全。双方还推出奖励机制,用户参与心理课程或贡献数据可获得,用于兑换咨询服务或健康产品。这一模式获得市场广泛关注,多家机构表达合作意向,被视为心理健康服�

  • 得一微登榜WICA 2025中国集成电路创新百强企业,AI存力芯片领跑智能时代

    世界集成电路协会(WICA)发布"2025中国集成电路创新百强企业"名单,得一微电子凭借在AI存储芯片领域的技术创新和市场表现成功入选。报告显示,2024年全球半导体市场规模达6351亿美元,存储芯片以75.6%增速成为增长最快品类。得一微电子通过存储控制、存算互联等核心技术,构建智能处理范式,产品已进入手机、智能汽车、AI服务器等多个领域。在AI计算需求激增背景下,该公司将持续推动存算融合,提升数据处理智能化水平,助力中国芯片产业在全球AI浪潮中保持领先地位。

  • A日报:月之暗面开源大模型Kimi K2;智源全面开源RoboBrain2.0;通义千问发布Qwen Chat桌面客户端

    本期AI日报重点报道了多项AI领域突破性进展:1.月之暗面推出万亿参数开源大模型Kimi K2,展现强大智能能力;2.智源研究院开源RoboBrain2.0和RoboOS2.0机器人系统;3.通义千问发布桌面客户端Qwen Chat;4.IndexTTS2实现影视级语音合成;5.HuggingFace开源机器人Reachy Mini热销;6.Meta推出实时视频生成模型StreamDiT;7.PixVerse新增多关键帧视频生成功能;8.特斯拉推出仅支持AMD处理器的Grok AI助手;9.OpenAI推迟开源大模型发布以加强安全测试;10.Liquid AI开源边缘AI模型LFM2;11.AI"时间穿越"特效在社交媒体走红。