首页 > 传媒 > 关键词  > 正文

数禾科技亮相技术盛会,共同探讨使用Knative加速AI模型服务部署实践

2023-10-13 09:16 · 稿源: 站长之家用户

9 月 26 日至 28 日,数禾科技亮相世界 级盛会KubeCon+CloudNativeCon+OpenSourceSummitChina2023。在这场技术盛会上,数禾科技团队成员就“数禾使用Knative加速AI模型服务部署实践”主题展开了分享。

使用Knative加速AI模型服务

Knative是基于Kubernetes之上提供的一款开源Serverless应用框架,目标打造企业级Serverless应用平台。根据2020CNCF云原生调查报告,Knative已成为开源自建Serverless平台之选。随着 2022 年 3 月 2 日加入到CNCF,越来越多的开发者拥抱Knative。阿里云容器服务从Knative早期版本开始产品化集成,持续跟进Knative社区功能迭代,并与容器服务ACK、消息、存储、网络等云产品进行了全方位的融合,提供了生产级别的Knative能力。

数禾科技是业界最早使用阿里云容器服务的专业机构之一,数禾科技使用阿里云容器服务Knative和弹性节点配合部署,在保证线上模型应对突发流量的稳定性大幅提升的同时,又使资源利用效率获得了显著的提高,极大的节约了资源成本。

基于Knative驱动开展实践

基于Knative的Serverless服务方案,具备有根据请求的扩缩容能力、允许pod缩容到 0 的冷启动能力以及多版本的管理能力。通过对内部模型部署的pipeline进行改造后,目前数禾的所有新增模型均已通过ACK+Knative方式部署在线上提供服务。得益于Knative的多版本管理能力,数禾快速解决了模型的灰度发布和多版本并存的问题。同时加之基于请求的自动扩缩容能力,在多个版本并存的情况下,并没有对资源产生额外的消耗,也节约了晚上的谷时资源。

在实际应用中,以数禾AI模型服务系统为基础的线上AI模型为业务决策人员提升决策效率,减轻人工操作的负担,同时也可以大幅降低客户流失率和风险损失。例如,在营销获客方面,数禾AI模型可以通过数据分析技术,实现客户画像,提升准确营销能力;在风险管理方面,数禾AI模型可以快速检测风险预警信号,提供实时决策支持。截至目前,数禾AI模型服务平台已上线部署500+AI模型服务,每天能够提供上亿次查询决策服务,具备无限横向扩展的能力。ASK的实时弹性扩展能力帮助数禾节约资源成本约60%,同时平稳地应对了诸多运营活动等突发峰值场景,整个云原生部署和发布系统将公司平均部署周期由之前的 1 天缩短至0. 5 天,有效加速了商业化应用的迭代进程,为业务的拓展增长提供了强有力的支撑。

持续深耕攻坚克难收获行业认可

技术是科技企业持续发展生命力的根本。作为高新技术企业的代表,在坚定不移地深耕数字化创新的发展道路上,数禾科技取得的一系列金融科技成果。前不久,数禾科技基于阿里云云原生应用构架打造的“数禾AI模型服务”,荣获了由云原生产业联盟颁发的“ 2023 年度云原生应用实践先锋-云原生应用优秀案例”奖项。云原生是基于分布部署和统一运管的分布式云,以容器、微服务、DevOps等技术为基础建立的一套云技术产品体系。它可以帮助企业快速构建和部署应用程序,提高应用的可靠性、弹性和可扩展性,让企业可以更加敏捷地响应市场需求,快速上线新产品和服务,提高数字化转型的效率和速度。

数禾科技在人工智能、云计算、大数据等前沿技术领域已积极开展研究和应用,截至目前,数禾科技已申请近 230 项技术等相关专利,已授权发明专利 11 个,其中技术专利覆盖人工智能、人机交互、数据治理、系统设计、架构设计、云计算和智能识别等数字经济的核心领域,体现出强大的自主科技研发实力。

技术终将造福于人民,在科技驱动普惠金融发展的道路上,数禾科技以科技创新为手段,持续推动普惠金融服务更加数字化、智能化。数禾科技以大数据和技术为驱动,为金融机构提供智能零售金融解决方案,服务银行、信托、消费金融公司、保险、小贷公司等持牌金融机构,业务涵盖消费信贷、小微企业信贷、场景分期等多个领域,提供营销获客、风险防控、运营管理等服务。

作为金融科技创新先锋,数禾科技拥抱Knative技术,并与容器服务ACK、消息、存储、网络等云产品进行了全方位的融合,为技术普惠和行业蓬勃发展做出了巨大贡献。数禾科技将继续开拓创新、担当作为,助力行业汇聚起推动云原生领域技术发展的强大力量。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 反诈助万家 数禾科技金融安全教育入人心

    文章主要介绍了金融科技在消费者权益保护方面的重要作用。随着金融市场日益复杂,金融诈骗风险增加,数禾科技等企业通过构建"大消保"工作体系、智能反诈防线和数据安全全流程监测链路,有效保护消费者权益。具体措施包括:建立"审查+体验+投诉"闭环管理机制,开展差异化内部消保指引标准,实现14万次APP弹窗提醒和25万通人工电话提醒,成功劝阻8千潜在被骗用户,避免1.3亿元损失。同时,公司还通过技术创新构建系统性治理框架,打击金融黑产,获得了多项行业荣誉。未来将继续秉持"用户至上、安全为先"理念,提升金融消费者权益保护水平。

  • 第四届上海网络安全博览会暨发展论坛顺利举办 数禾科技受邀参展

    第四届上海网络安全博览会近日在上海新国际博览中心举办。数禾科技连续两年受邀参展,展示其前沿数据安全技术成果。该公司自主研发反欺诈模型,通过人工智能和大数据技术识别诈骗手法,模型识别准确率提升50%,样本训练密度提升200倍。数禾科技还组建专业反欺诈团队,累计拨出25万通提醒电话,发送14万条短信,劝阻8000名潜在受害用户,避免损失超1.3亿元。同时,该公司针对不同人群开展立体化反诈宣传,通过社交媒体短视频普及金融知识,并深入社区开展线下讲座。在数字经济时代,数禾科技以自主研发技术为用户构建数据安全屏障,展现企业责任担当。

  • 趣链科技亮相国际金融科技盛会,全面展示数字出海能力

    2025年6月3-5日,全球顶级金融科技盛会Money20/20 Europe在荷兰阿姆斯特丹成功举办。本届大会聚焦嵌入式智能、数字基因、治理2.0和货币未来四大议题,吸引120多个国家的3万余名金融科技从业者参与。浙江省商务厅组织省内数字服务与金融科技企业参展,重点展示区块链、跨境支付等领域创新成果。趣链科技创始人李伟博士发表主题演讲,分享区块链与AI融合如何重塑金融基础设施,并透露将持续拓展国际生态,深化在隐私计算、数据互操作性等领域的技术合作。活动期间同步举办2025浙江服务贸易金融展,推动浙江金融科技品牌走向国际舞台。

  • StarRocks 优化实践:揭秘毫秒级实时分析的三大核心技术

    StarRocks是一款高性能实时分析数据库,通过三大核心技术解决海量数据分析难题:1)向量化执行引擎,采用批处理方式减少CPU开销,支持SIMD指令集加速计算;2)CBO优化器,基于统计信息智能选择最优执行计划,支持复杂查询改写和物化视图优化;3)列式存储结构,结合稀疏索引和Bitmap索引提升I/O效率。其企业级产品镜舟数据库在此基础上增强多租户隔离、RBAC权限控制等特性

  • 微算法科技(NASDAQ:MLGO)利用Pool验证池机制,结合传统分布式一致性技术(如Paxos和Raft),实现秒级共识验证

    本文探讨了区块链和分布式系统中验证池机制的应用。传统共识机制在实时性要求高的场景存在局限,验证池机制通过集中验证节点提高效率,结合Paxos和Raft等分布式一致性技术,实现秒级共识验证。该技术具有高效性、可靠性和扩展性优势,可应用于金融交易、物联网数据交换和供应链管理等领域,确保数据一致性和系统稳定性。未来有望通过优化算法和结合AI技术进一步提升性能,拓展更多应用场景。

  • 云迹科技港交所申请上市,加速AI服务机器人多元化布局

    近日,云迹科技创始人、董事长、总裁支涛针对人工智能与智能制造产业,尤其是机器人“智造”的发展等话题进行分享,她说,在国家政策红利、技术突破以及行业趋势的多重驱动下,人工智能相关产业正迎来发展黄金期。

  • 《卓世科技MCP 技术融合实践白皮书》发布

    本文介绍了AI应用开发中MCP(模型上下文协议)的重要作用。MCP作为标准化AI工具交互协议,允许AI代理根据任务上下文自主发现、选择和编排工具,突破传统预定义工具映射的局限。文章重点展示了卓世科技在医疗健康领域的创新实践:通过MCP整合多源异构医疗知识图谱,构建全栈式健康监测网络,实现诊疗规范、药品信息等动态同步;同时开发智能周报系统,实现多模态内容自动生成与精准推送。MCP架构采用客户端-服务器模式,支持本地高效通信与云端实时交互,为AI应用提供灵活性和互操作性。未来,MCP将与A2A协议互补协作,推动AI从单点工具向系统化智能协同演进。

  • Meta整合AI团队实力跃升,OpenAI/微美全息多维技术发展锚定前沿未来

    Meta在AI领域面临激烈竞争,正重组团队加速产品开发。其AI部门将分为产品团队和AGI基础部门,同时保持FAIR研究部门的独立性。OpenAI以65亿美元收购Jony Ive创立的设备公司,计划开发"物理AI"设备。Anthropic发布新一代AI模型Claude Opus4和Sonnet4,在基准测试中击败OpenAI和谷歌。微美全息(WIMI.US)布局AI大模型、人形机器人、AR/VR等多个前沿领域,推动AI从技术突破向价值创造跃迁。全球AI竞争白热化,模型加速融入千行百业,开源整合成为新焦点。

  • 九章云极智能科技论坛全览:为AI加速

    九章云极DataCanvas公司在北京召开智能计算论坛,发布新一代全栈智能计算云平台Alaya NeW Cloud2.0,创新融合Serverless与强化学习技术,突破百万级token生成性能瓶颈。该平台支持万卡级异构算力统一调度,显著降低AI开发门槛,推出"一度算力"按需计费模式。同时成立1.8亿元"AI-STAR生态基金",联合产业伙伴共建开放生态。Forrester预测2025年全球企业将积极采用AI原生智算云平台,认为其能实现AI应用全生命周期性能最大化。九章云极还发布强化学习云平台AgentiCTRL,将AI训练门槛压缩至单行代码,训练效率提升5倍。公司表示未来3-5年将通过技术创新突破算力成本瓶颈,实现普惠化应用。

  • 阿里云”618创新加速季“开启:先进、领先的大模型限免 超7000万 token,加速多场景 AI 应用落地

    阿里云启动"618创新加速季"活动,聚焦AI创新与云端智能,推出多项优惠:1)提供7000万+免费大模型token体验及最高1728元优惠券;2)通义大模型限免超7000万token,推出10-100元多档资源包,GPU服务0.9折起;3)PAI平台推出通用节省计划,最低3折;4)针对中小企业推出AI火花会主题活动,提供场景化定制服务;5)基础云产品全线优惠,包括轻量服务器38元/年、RDS MySQL 88元/年等。活动还包含5亿算力补贴计划、10万元出海满减券等专项支持,助力企业智能化升级。