首页 > 传媒 > 关键词  > 正文

StarRocks 2024 数据技术峰会圆满收官,Lakehouse引领数据技术新趋势

2024-12-11 10:59 · 稿源: 站长之家用户

12 月 7 日,StarRocks Summit Asia 2024 于北京圆满落幕。本次峰会以"Lakehouse Is All You Need"为主题,汇聚行业佼佼者和技术专家,共同探讨 Data+AI 的创新与行业实践。

技术引领,构筑湖仓新范式

StarRocks TSC Member,镜舟科技 CTO 张友东分享

StarRocks TSC Member,镜舟科技 CTO 张友东以“Lakehouse Is All You Need”为题开场演讲,深入解读 Lakehouse 的演进趋势以及 StarRocks 在 Lakehouse方向的技术深耕与创新。

“StarRocks 社区正以比较罕见的速度发展,” 张友东展示了一组数据:“在过去三年里,我们在 GitHub 上获得超过 9300 颗 star,活跃贡献者超过 400 人,超过 450+ 市值 10 亿美金以上的企业在生产环境使用 StarRocks,各行业对 StarRocks 的认可与期待与日俱增。”

镜舟科技 CTO 张友东致谢 StarRocks 用户及贡献者

他详细介绍了 StarRocks 在多个技术方向上的突破:

StarRocks 通过创新的向量化执行引擎和智能查询优化技术,将分析性能提升至行业领先水平,同时,在 3.X 版本中实现了对数据湖的原生支持,使得企业可以在不迁移数据的情况下进行有效分析。

此外,StarRocks 在半结构化、非结构化数据分析方面取得显著进展。Flat JSON 兼顾半结构化数据分析的灵活性与查询性能,性能提升达到数十倍;文本检索、向量检索使得 RAG 应用构建过程简单有效,更好地支撑 AI 应用场景。

“Lakehouse 是未来所有数据分析的基础”,张友东强调,Lakehouse 是一种新的架构范式,结合数据湖和数据仓库的优势,提供统一的数据存储,并基于一份数据同时支持企业 BI 和 AI 的应用场景,实现 One data,all analytics 的业务价值。

通过与 Apache Iceberg、Apache Paimon、Apache Hive 等开放数据湖的深度集成,StarRocks 正在构建完善的数据湖生态,为用户提供极速统一的湖仓分析体验。

商业突破:以终为始的商业选择

镜舟科技 CEO 孙文现在StarRocks峰会分享

镜舟科技 CEO 孙文现以《镜舟数据库与 Lakehouse:面向全球,挖掘商业增长新潜力》为题,分享了这两年来的商业化心路历程。

他提到 StarRocks 在业务场景覆盖上的突破性进展:“从最初的固定报表分析,到如今的实时数据分析、数据跑批加工、湖仓一体化分析等全场景支持,StarRocks 展现了强大的技术适应性。截至目前,实时数据分析场景已服务 270 多家企业,湖仓分析能力也获得 50 多家企业的实践验证。”

在商业化道路上,镜舟科技坚持“为客户创造更大的业务成功”的理念,付费客户数已突破 120 家,镜舟科技的 ARR(年经常性收入)连续三年翻倍增长,NRR(净留存率)保持在 130%。2024 年新增中信银行、民生银行、广发证券等多家重量级客户,充分证明了镜舟数据库在企业级市场的竞争力。

谈到增长背后的战略,孙文现阐述了一个商业上的转变:即以终为始的商业选择,以构建一家能够长期经营的商业化公司为目标,打造能够满足致胜场景、带来商业化价值的产品。

孙文现也分享了镜舟的奋斗目标:“以商业成功为伴,面向星辰大海,打造一份长久奋斗的事业。”

生态共融,与行业携手共进

Apache Iceberg PMC member 顾宇飞在StarRocks峰会分享

Apache Iceberg PMC member 顾宇飞带来了《The Evolving Landscape of Iceberg REST Catalog》的精彩分享。“开放的生态系统是推动技术创新的关键。”顾宇飞表示,REST Catalog 的演进为数据湖提供了更灵活、更有效的访问机制。StarRocks 对 Iceberg 的原生支持,不仅提升了查询性能,更为企业构建现代化数据架构提供了坚实基础。

阿里云计算平台开源 OLAP 负责人范振(辰繁)在StarRocks峰会分享

“StarRocks 是最适合 Paimon 湖格式的 Lakehouse 开源引擎。”阿里云计算平台开源 OLAP 负责人范振(辰繁)介绍,“在阿里集团的数据湖仓实践分享中,StarRocks 展现了卓越的查询性能和系统稳定性,在与 Paimon 的协同场景中,我们实现了流批一体的数据处理能力,分析性能有 13 倍提升。目前,这一解决方案已在阿里集团内部广泛应用,也正通过阿里云向更多企业客户提供服务。”

他也从云服务商的角度,阐述了对湖仓的理解:“未来的数据架构必将是开放、统一的,StarRocks 在这方面的探索很有前瞻性。选择 StarRocks 作为战略合作伙伴,也是看中其在实时分析领域的技术领先性和商业化潜力。”

应用实践,让价值落地

微众银行大数据工程师,StarRocks 平台负责人林俊锋在StarRocks峰会分享

客户代表、微众银行大数据工程师,StarRocks 平台负责人林俊锋分享了其数字化转型实践。“在用户画像、人群圈选等大数据量分析场景中,StarRocks 展现出卓越性能,查询速率相比原有 Trino 方案提升 235%。”林俊锋介绍,“目前 StarRocks 已支持行内 5 个以上部门的 10 多个应用场景,结合自研的 Exchangis 数据交换平台,实现了跨集群数据互通、灵活的权限管理等特性。”

腾讯音乐专家工程师,业务运维中心总监曹凤龙在StarRocks峰会分享

腾讯音乐集团(TME)专家工程师,业务运维中心总监曹凤龙详细阐述了其数据仓库的演进历程。“从 2018 年的 Druid 到如今的 StarRocks,StarRocks 的存算分离架构为我们带来了显著收益:组件更精简、维护更便捷,数据存储成本降低 50%,同时支持智能的冷热数据管理。”

在具体业务场景中,通过存储桶打散、表结构优化、物化视图等技术手段,大表查询响应时间从 30.97 秒降至 0.08 秒,查询秒级响应率达到 99%。目前,StarRocks 集群支撑着 QQ 音乐、全民 K 歌等多个音乐平台的数据分析需求。

未来可期

全天共 30 余个演讲议题,汇聚了 7 大行业,包括小红书、腾讯游戏、Shopee、爱奇艺、得物、杭银消费金融、理想汽车、唯品会、微信、西南证券等多家标杆企业。这些企业用自身实践说明,StarRocks 正在通过技术创新推动各行业数字化转型,在降本增效的同时,为企业创造新的业务价值。

通过与合作伙伴和用户的深度互动,StarRocks 社区正在构建一个更开放、更繁荣的数据技术生态。随着数字化转型深入推进,StarRocks 将继续发挥技术引领作用,助力更多企业实现数据价值比较大化。

随着峰会落幕,StarRocks 在湖仓技术领域的愿景更加清晰:以开放、创新的技术理念,携手合作伙伴共建现代化数据分析生态,为企业数字化转型提供强有力的支撑。正如张友东在演讲结束时所说:“Lakehouse 不仅是技术演进的方向,更是释放数据价值的关键,Lakehouse is ALL you need,StarRocks will power your lakehouse!”

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 全球开源技术峰会GOTC 2025 圆满落幕

    11月2日,为期两天的全球开源技术峰会GOT C2025在北京圆满落幕。本届峰会聚焦开源与人工智能深度融合,汇聚全球顶尖专家、行业领袖与数千开发者,共同探讨开源驱动的AI未来蓝图。现场吸引超3000人次参与,线上直播观看量突破500万,全网曝光超6亿次。大会设立十二大专题论坛,覆盖大模型应用、AI编程、云原生AI等前沿领域,并发布Open AgentKit等关键项目。通过“论坛+市集�

  • 科杰科技&甲子光年:2025中国Data&AI数据基础设施白皮书

    当前全球正经历地缘政治重塑与人工智能革命驱动的深刻变革。全球化向区域化演进,供应链加速本土化,AI从前沿技术跃升为核心生产力。麦肯锡研究显示,生成式AI有望为全球经济贡献7万亿美元,中国预计占2万亿美元,接近全球总量三分之一。传统数据系统难以满足AI对实时性、多模态处理和高弹性算力的需求,企业需构建新一代数据基础设施,实现数据生产、治理与AI应用的动态融合,突破"数据烟囱",支持跨场景智能部署。Data&AI一体化将推动数据价值从效率提升向产业协同跃升,成为智能社会的核心引擎。

  • 小鹏将推出3款全球化Robotaxi 2026年同步开启试运营

    小鹏汽车在2025科技日宣布,将于2026年推出三款全栈自研L4级Robotaxi,同步开启试运营。该车型搭载4颗图灵AI芯片,算力达3000TOPS,配备第二代VLA模型,具备强大泛化学习能力,能自适应全球不同交通习惯。作为中国首款全栈自研Robotaxi,无需额外改装,不依赖高精地图即可实现量产。车辆提供两套智驾方案,分别侧重通勤效率与极致安全,并在六大关键系统采用双冗余设计,确保行驶安全。小鹏还将开放Robotaxi SDK,与高德地图等伙伴共建全球服务生态。

  • 数据智能体 TabTabAI 正式上线,零门槛上手,让 “数据分析” 人人可用

    AI数据智能体TabTabAI正式上线,以“零门槛交互+全流程自主处理”为核心优势,打破数据分析技术壁垒。该工具通过自然语言对话,支持多源数据采集、智能处理、深度洞察与可视化,让普通职场人无需编程背景即可完成复杂分析任务。其多智能体协同架构与自动化能力,覆盖从数据收集到决策建议的全链路,助力用户将原始数据高效转化为精准决策依据,真正实现“人人都是数据分析师”。

  • 九号公司举办首届「MoTech Day 2025」:让技术回归生活,让创新成为日常

    10月24日,九号公司举办首届“MoTech Day 2025”技术文化节,这是专属于工程师的节日,也是公司首次以“技术文化”为核心议题的集团级活动。活动通过嘉宾演讲、互动体验与创意挑战等形式,聚焦智能出行、AI芯片、能源技术等前沿领域,旨在让“工程师精神”成为九号文化的核心符号,推动技术与文化双向融合,构建长期创新驱动力。活动还同步推出面向高校的“MoTech创意挑战赛”,并搭建线下互动打卡区,强化内部技术认同与组织活力,重塑品牌科技形象。

  • 文创赋能,食礼融合:第26届上海国际礼品文创展即将启幕,定义年末消费新趋势

    第26届上海国际礼品、文创产品及家居用品展览会(华礼展)将于2025年11月12-14日在上海新国际博览中心举办。本届展会聚焦"文创产品"与"礼盒食品"两大核心展区,通过产业融合新模式,为行业搭建趋势洞察与资源对接平台。文创展区汇集博物馆IP衍生品、非遗创新设计及数字艺术藏品;礼盒食品展区整合高端定制食品与环保包装解决方案,提供一站式美食美器体验。展会旨在推动文创赋能与食礼融合,重塑礼品行业新格局,助力企业把握2026年市场机遇。

  • 连续三年折桂!瓴羊Dataphin荣膺2025年度DAMA数据治理优秀产品奖!

    2025全球数据管理峰会以“数据×人工智能”为主题,聚焦行业最佳实践,构建从理念探讨到技术落地的完整交流链。会上,瓴羊与DAMA联合发布数据治理实践证书体系,覆盖数据分析等认证,旨在提升全民数据素养。瓴羊副总裁王赛提出Data与AI双向赋能重构企业数字化生产力,强调未来系统需支持自主决策与自动化执行。以快消品牌为例,通过Quick BI智能分析工具实现业务效率提升。瓴羊Dataphin平台助力企业构建AI友好型数据模型,连续三年获“数据治理优秀产品”大奖,提供全链路数据服务,加速释放数据价值。

  • 课题发布2025京东方技术策源地开放课题计划重磅发布!

    京东方面向全球创新伙伴发布2025年技术策源地开放课题计划,聚焦半导体显示、物联网创新及传感器件三大技术方向。该计划秉承"深度合作、协同开发、价值共创"理念,邀请学术界与产业界全职研究人员参与,通过定向课题与创意征集两种方式,共同攻关新型显示材料、AR/VR光学方案、钙钛矿电池等前沿技术,旨在构建开放共赢的创新生态,推动产业高质量发展。申报截止日期为2025年11月30日。

  • 《2025快手三农生态数据报告》:三农社区持续向下扎根,西部省份与银发族用户增速显著

    快手《2025年三农生态数据报告》显示,平台三农兴趣用户规模达1.4亿,甘肃、西藏、新疆、青海、四川增长最快。新农人创作者同比增长34.2%,女性占比63%,95后成为创作主力。农技内容通过直播连麦和短视频普及,覆盖96.7%农业细分领域,日均有超150万用户获取农业资讯。乡村娱乐与相亲内容兴起,“村口小舞台”直播日观看超千万次,相亲内容消费量年增52%。平台形成“社区信任经济”,三农创作者近八成GMV由粉丝贡献,洪泽湖大闸蟹等特产借力出圈。快手构建了集技术学习、产品销售、文化展示于一体的乡村数字生态。

  • 重磅预告:全链路自主进化 AI 数据分析师 TabTab 将于10月24日上线

    灵快科技推出的AI数据分析师TabTab将于10月24日上线。该产品通过Multi-Agent系统实现全链路自动化数据分析,覆盖数据获取、建模到可视化全流程。用户可用自然语言交互,系统自主规划任务并输出可维护结果,支持Excel、PPT等多种报告格式。核心定位为智能数据分析助手,旨在降低分析门槛,助力企业高效挖掘数据价值,适用于数据分析师、营销人员等各类用户。

今日大家都在搜的词: