首页 > 业界 > 关键词  > 阿里巴巴最新资讯  > 正文

阿里蔡崇信吴泳铭首封致股东信:对“大公司病”开刀 未来10年视自己为初创企业

2024-05-24 06:55 · 稿源: 快科技

快科技5月23日消息,今日,阿里巴巴发布2024财年年报,同时,蔡崇信、吴泳铭发布了第一封联合署名的致股东信

据了解,信中阐述了阿里巴巴是谁”,明确了阿里巴巴用户为先”AI驱动”两大战略方向,并分享了阿里发展策略和如何投资未来。

股东信提到,未来十年,没有哪个行业能免于AI带来的颠覆,AI不会是一种威胁,而是作为突破性用户体验和商业模式的驱动力,将带来巨大机遇。如果不能跟上AI每天带来的持续而惊人的进步,我们就会被取代。

股东信强调,阿里拥有两大核心业务:电商和云计算

未来,阿里继续投资于两大领域,包括加速核心业务增长,并保持基础技术的领先以及包括人工智能在内的创新。

蔡崇信、吴泳铭表示,阿里永远关注未来,并表达了将积极对大公司病”开刀、保持创业精神的决心:在接下来的10年里,我们将再次视自己为一家初创企业,坚守让天下没有难做的生意的使命初心,以创业的精神持续创新。我们将秉持长期主义,为今天而取舍,为明天而投资。”

阿里蔡崇信吴泳铭首封致股东信:对“大公司病”开刀 未来10年视自己为初创企业

以下是2024财年致股东信全文:

尊敬的投资者:

截至2024年3月31日的过去一个财年,对阿里巴巴来说是一个分水岭。这一年,我们围绕战略清晰与聚焦做出了一系列关键调整。战略的清晰与聚焦帮助我们定义了我们是谁,我们的方向,以及我们将如何执行发展策略。我们认为,有必要分享一下我们过去一年的思考过程,以及这对阿里巴巴的未来有何意义。

我们是谁

阿里巴巴拥有两大核心业务:电商和云计算。作为中国消费经济的一部分,我们构建了一个基于互联网平台的生态系统,旨在把握本地服务、通讯、搜索及数字娱乐等领域的机遇。

在电商领域,我们运营淘天集团(TTG),含服务中国国内消费者和B2B市场的平台,以及阿里国际数字商业集团(AIDC),含服务国际消费者和B2B市场的平台。其他业务部门的战略价值则在于通过发挥协同效应,令我们的电子商务业务更有价值。例如,饿了么作为即时配送基础设施,服务于消费者从我们的电商平台购买生鲜产品的需求;我们的物流子公司菜鸟依托供应链、运输和配送能力,为消费者在淘天和AIDC平台上购物创造良好的用户体验。

在云计算领域,我们的目标是成为中国领先的公共云基础设施和平台技术提供商,为我们的客户提供广泛的能力,包括弹性计算、存储、网络基础设施、安全、大数据和人工智能(AI)。

我们的战略方向

我们为公司的战略方向选择了两条重要路径。作为公司的领导者,我们必须清晰地阐明我们的方向。

第一个战略是用户为先”。 对于我们拥有的各个平台而言,用户都是第一位的,这意味着我们从经营宗旨到产品理念上,都以用户第一”的优先级来设计我们的公司经营目标和产品流程。中国拥有世界上最大的互联网人口11亿用户,中国是全世界电子商务渗透率最高的国家之一,电商约占消费者零售总额的28%。今天,互联网上的消费品供给十分丰富,品牌和商家想要脱颖而出,越来越需要互联网平台提供的精准化消费者营销服务。

我们的用户为先”战略将保障在业务策略和产品设计中将用户体验作为第一优先级,提升用户体验将会提高用户留存和复购。这将为淘宝、天猫、闲鱼、飞猪、饿了么、高德地图、速卖通等平台上的商品和服务卖家提供最佳价值主张。因为在阿里巴巴平台上,商家们可以找到最有活力、最细分、最高频的线上消费者群体。

第二个战略方向是聚焦人工智能。我们将AI作为改变和加速业务增长的最强大变量。

未来十年,没有哪个行业能免于AI带来的颠覆。AI不会为旧的做事方式提供保护,而是重新点燃我们的创业激情和想象力。我们的每个业务都有大量应用场景,所有场景都可以通过人工智能创造更大的价值。同时人工智能的部署将增加计算需求,从而也将推动阿里云的增长。AI不会是一种威胁,而是作为突破性用户体验和商业模式的驱动力,将带来巨大机遇。如果不能跟上AI每天带来的持续而惊人的进步,我们就会被取代。

经营原则

我们在执行战略时遵循以下经营原则。

首先,在做困难的决定时,要秉持长期主义。我们以10年为周期来考虑战略,因为科技企业的发展节奏通常会经历投资、成长、收获、盈利和不可避免的下降阶段。我们的业务处于不同的发展阶段,必须以不同的方式管理。例如,AIDC刚刚起步,需要前期投资; 阿里云正在为未来增长而投资,同时收获规模效应带来的成果;淘天集团作为一个成熟的企业,则必须快速创新,把握住下一个增长周期。

其次,我们在做每一件事时,都要极度专注、目的明确。专注意味着我们不会被无关紧要的事情分散注意力,在决定什么是重要的或不重要的事情时保持聚焦,在面临艰难选择时不会情绪化。目的明确意味着我们在作出决策时,都必须有充分坚实的理由。例如,阿里云转向公共云优先,反映了我们在技术和规模方面的结构性优势;与此同时,我们做出了一个艰难的选择,放弃了低利润项目业务的短期收入。

最后,我们向团队传达了一个明确的方向,并通过建立健全激励机制,与他们保持目标一致。我们相信,战略方向的透明度和公司领导人的目标明确,会让团队更高效、更快乐。我们制定了与中长期战略目标相一致的员工激励制度,这样让我们团队的个人财富能根据业务表现有高度匹配的挂钩。

资本管理

2024财年,阿里巴巴集团创造了216亿美元的自由现金流。管理层有责任决定我们如何配置现金,实现股东价值最大化,我们面临了把现金返还给股东与再投资到现有或新业务之间的取舍。在2024财年的资本管理上,我们反映了公司对核心业务的关注。我们没有将资金用于投入开发全新的业务板块,而公司在历史上首次宣布并派发了25亿美元股息,并回购了125亿美元的股票,使流通股净减少5.1%。在2024财年,我们通过返还现金和盈利的增利为股东创造了价值。

投资未来

向股东返还现金并不意味着我们将停止投资。阿里巴巴将继续投资于两大领域: (1)加速核心业务增长;(2)保持基础技术的领先以及包括人工智能在内的创新。

对股东来说,了解我们在AI方面的投资很重要。全球主要科技公司围绕大模型在生成式AI领域的最新发展,在三个方面与阿里巴巴息息相关。

首先,作为技术的探路者,我们有志于探索机器智能实现通用人工智能(AGI)的潜力。最终,人类有可能在某些层面上实现AGI。目前推动AGI的通行方法是使用Transformer架构的大模型。大模型的规模越来越大,并走向多模态,除了文本之外,还包括语音、视频和图像,基础设施和开发所需的投资只能由那些从核心业务中产生大量自由现金流的大型科技公司承担。阿里巴巴拥有市场领先的专有基础模型通义千问,我们将为突破机器智能的极限持续对基础模型和其他AI创新做出投资。

其次,投资大模型有助于发展我们的云计算业务,因为在开发或推理过程中训练和使用大模型将需要算力资源。我们已经将通义千问多种参数规模的版本向全社会开源,这给我们的专有模型带来了增量需求,并带来算力需求。我们还拥有中国最大的AI开源模型社区魔搭,其中包括第三方大模型,供访问我们计算资源的开发人员使用。因此,成为AI发展的领导者,这将为我们的云计算业务带来直接的积极增长。

第三,阿里巴巴是消费经济不可分割的一部分。我们分层消费者的无数场景和应用从消费推荐、虚拟试衣间、到个人助理,都能通过AI锐变。我们对AI驱动用户为先”战略的无限可能性感到兴奋。

最后,我们想说:阿里巴巴永远关注未来。在过去的25年里,阿里巴巴经历了不断成长,也出现了一些大公司病”。在接下来的10年里,我们将再次视自己为一家初创企业,坚守 让天下没有难做的生意”的使命初心,以创业的精神持续创新。我们将秉持长期主义,为今天而取舍,为明天而投资。

蔡崇信

集团主席

吴泳铭

首席执行官

2024年5月23日

举报

  • 相关推荐
  • 大家在看
  • Nemotron-4-340B-Reward:多维奖励模型,助力构建自定义大型语言模型。

    Nemotron-4-340B-Reward是由NVIDIA开发的多维奖励模型,用于合成数据生成管道,帮助研究人员和开发者构建自己的大型语言模型(LLMs)。该模型由Nemotron-4-340B-Base模型和一个线性层组成,能够将响应末尾的标记转换为五个标量值,对应于HelpSteer2属性。它支持最多4096个标记的上下文长度,并能够对每个助手轮次的五个属性进行评分。

  • Nemotron-4-340B-Instruct:NVIDIA的高级语言模型,优化于英文对话场景。

    Nemotron-4-340B-Instruct是由NVIDIA开发的大型语言模型(LLM),专为英文单轮和多轮对话场景优化。该模型支持4096个token的上下文长度,经过监督式微调(SFT)、直接偏好优化(DPO)和奖励感知偏好优化(RPO)等额外的对齐步骤。模型在约20K人工标注数据的基础上,通过合成数据生成管道合成了超过98%的用于监督微调和偏好微调的数据。这使得模型在人类对话偏好、数学推理、编码和指令遵循方面表现良好,并且能够为多种用例生成高质量的合成数据。

  • BookSlice:让阅读更有趣,用游戏化的方式增加阅读量。

    BookSlice是一款面向忙碌人群的游戏化阅读应用,通过心理学原理帮助用户建立阅读习惯,并通过设置每日挑战来维持阅读连续性。它利用实施意图、习惯叠加等心理工具,使阅读变得习惯性和上瘾。此外,BookSlice还提供AI问答功能,帮助用户在阅读过程中获得上下文答案。

  • agentUniverse:基于大型语言模型的多智能体应用开发框架

    agentUniverse 是一个基于大型语言模型的多智能体应用开发框架,提供了构建单一智能体和多智能体协作机制的所有必需组件。通过模式工厂,允许开发者构建和自定义多智能体协作模式,轻松构建多智能体应用,并分享不同技术与业务领域的模式实践。

  • HunyuanDiT Distillation Acceleration:高性能图像生成模型的蒸馏加速版本

    HunyuanDiT Distillation Acceleration 是腾讯 Hunyuan 团队基于 HunyuanDiT 模型开发的蒸馏加速版本。通过渐进式蒸馏方法,在不降低性能的情况下,实现了推理速度的两倍提升。该模型支持多种GPU和推理模式,能够显著减少时间消耗,提高图像生成效率。

  • WonderWorld:从单张图片生成交互式3D场景

    WonderWorld是一个创新的3D场景扩展框架,允许用户基于单张输入图片和用户指定的文本探索和塑造虚拟环境。它通过快速高斯体素和引导扩散的深度估计方法,显著减少了计算时间,生成几何一致的扩展,使3D场景的生成时间少于10秒,支持实时用户交互和探索。这为虚拟现实、游戏和创意设计等领域提供了快速生成和导航沉浸式虚拟世界的可能性。

  • ChatTTS_Speaker:基于ERes2NetV2模型的音色稳定性评分与音色打标。

    ChatTTS_Speaker是一个基于ERes2NetV2说话人识别模型的实验性项目,旨在对音色进行稳定性评分和音色打标,帮助用户选择稳定且符合需求的音色。项目已开源,支持在线试听和下载音色样本。

  • fastc:轻量级文本分类工具,使用大型语言模型嵌入。

    fastc是一个基于大型语言模型嵌入的简单且轻量级的文本分类工具。它专注于CPU执行,使用高效的模型如deepset/tinyroberta-6l-768d生成嵌入。通过余弦相似度分类代替微调,实现文本分类。它还可以在不增加额外开销的情况下,使用相同的模型运行多个分类器。

  • MeshAnything:3D资产的自动生成工具

    MeshAnything是一个利用自回归变换器进行艺术家级网格生成的模型,它可以将任何3D表示形式的资产转换为艺术家创建的网格(AMs),这些网格可以无缝应用于3D行业。它通过较少的面数生成网格,显著提高了存储、渲染和模拟效率,同时实现了与先前方法相当的精度。

  • HunyuanDiT-v1.1:多分辨率扩散变换器,支持中英文理解

    HunyuanDiT-v1.1是由腾讯Hunyuan团队开发的一款多分辨率扩散变换模型,它具备精细的中英文理解能力。该模型通过精心设计的变换器结构、文本编码器和位置编码,结合从头开始构建的完整数据管道,实现数据的迭代优化。HunyuanDiT-v1.1能够执行多轮多模态对话,根据上下文生成和细化图像。经过50多名专业人类评估员的全面评估,HunyuanDiT-v1.1在中文到图像生成方面与其他开源模型相比,达到了新的最先进水平。

  • UniAnimate:高效生成一致性人物视频动画的模型

    UniAnimate是一个用于人物图像动画的统一视频扩散模型框架。它通过将参考图像、姿势指导和噪声视频映射到一个共同的特征空间,以减少优化难度并确保时间上的连贯性。UniAnimate能够处理长序列,支持随机噪声输入和首帧条件输入,显著提高了生成长期视频的能力。此外,它还探索了基于状态空间模型的替代时间建模架构,以替代原始的计算密集型时间Transformer。UniAnimate在定量和定性评估中都取得了优于现有最先进技术的合成结果,并且能够通过迭代使用首帧条件策略生成高度一致的一分钟视频。

  • LVBench:长视频理解基准测试

    LVBench是一个专门设计用于长视频理解的基准测试,旨在推动多模态大型语言模型在理解数小时长视频方面的能力,这对于长期决策制定、深入电影评论和讨论、现场体育解说等实际应用至关重要。

  • Mo:通过卡片式学习,轻松掌握AI科技知识。

    Mo是一款结合超现实主义艺术和堂吉诃德理想主义精神的AI科技学习APP。它通过卡片形式,以图文、动画、视频、语音等多样化内容,使AI和科技知识的学习变得生动有趣。Mo不仅覆盖了AI的基础知识,还包含了元宇宙、大数据、大模型等前沿技术,适合各种背景的学习者,旨在打造一个个性化的学习体验。

  • 开搜AI搜索:面向大众的AI问答搜索引擎

    开搜AI问答搜索引擎是一款面向大众的、直达答案的AI问答搜索引擎,它能够帮助用户从海量的文献资料中筛选出有用的信息,提供直接、精准的答案,并且能够自动总结重点、生成大纲、思维导图并下载。

  • AI Math Notes:一个交互式绘图应用,用于数学方程的绘制和计算。

    AI Math Notes 是一个开源的交互式绘图应用程序,允许用户在画布上绘制数学方程。应用程序利用多模态大型语言模型(LLM)计算并显示结果。该应用程序使用Python开发,利用Tkinter库创建图形用户界面,使用PIL进行图像处理。灵感来源于Apple在2024年全球开发者大会(WWDC)上展示的'Math Notes'。

  • VideoTetris:文本到视频生成的创新框架

    VideoTetris是一个新颖的框架,它实现了文本到视频的生成,特别适用于处理包含多个对象或对象数量动态变化的复杂视频生成场景。该框架通过空间时间组合扩散技术,精确地遵循复杂的文本语义,并通过操作和组合去噪网络的空间和时间注意力图来实现。此外,它还引入了一种新的参考帧注意力机制,以提高自回归视频生成的一致性。VideoTetris在组合文本到视频生成方面取得了令人印象深刻的定性和定量结果。

  • Visual Sketchpad:多模态语言模型的视觉推理工具

    Visual Sketchpad 是一种为多模态大型语言模型(LLMs)提供视觉草图板和绘图工具的框架。它允许模型在进行规划和推理时,根据自己绘制的视觉工件进行操作。与以往使用文本作为推理步骤的方法不同,Visual Sketchpad 使模型能够使用线条、框、标记等更接近人类绘图方式的元素进行绘图,从而更好地促进推理。此外,它还可以在绘图过程中使用专家视觉模型,例如使用目标检测模型绘制边界框,或使用分割模型绘制掩码,以进一步提高视觉感知和推理能力。

  • GoMate:基于RAG框架的可靠输入和可信输出系统

    GoMate是一个基于Retrieval-Augmented Generation (RAG)框架的模型,专注于提供可靠输入和可信输出。它通过结合检索和生成技术,提高信息检索和文本生成的准确性和可靠性。GoMate适用于需要高效、准确信息处理的领域,如自然语言处理、知识问答等。

  • SD3-Controlnet-Canny:一种用于生成图像的深度学习模型。

    SD3-Controlnet-Canny 是一种基于深度学习的图像生成模型,它能够根据用户提供的文本提示生成具有特定风格的图像。该模型利用控制网络技术,可以更精确地控制生成图像的细节和风格,从而提高图像生成的质量和多样性。

  • Tencent EMMA:多模态文本到图像生成模型

    EMMA是一个基于最前沿的文本到图像扩散模型ELLA构建的新型图像生成模型,能够接受多模态提示,通过创新的多模态特征连接器设计,有效整合文本和补充模态信息。该模型通过冻结原始T2I扩散模型的所有参数,并仅调整一些额外层,揭示了预训练的T2I扩散模型可以秘密接受多模态提示的有趣特性。EMMA易于适应不同的现有框架,是生成个性化和上下文感知图像甚至视频的灵活有效工具。

今日大家都在搜的词:

热文

  • 3 天
  • 7天