首页 > 传媒 > 关键词  > 正文

AI落地之夜,聊聊要未来的爆发还是要当下的效果|阿里云创业者社群

2024-02-06 15:58 · 稿源: 站长之家用户

2024年,AI的共识与非共识。

从ChatGPT带着大模型及智能对话引领时代开始,距离现在已经一年有余。这一年来,中国AI也经历了多个阶段:从狂热到质疑到冷静,从大模型之间的竞争变成了模型和应用共赢,从共识遍地到各自开花……

此刻,AI链条中的各方都意识到,单打独斗无法助推AI技术的进一步发展,更无法让先进的技术为人所用。

交流、沟通、共创的需求日益明确,AI产业链条不仅需要代码的开源社区,更需要观点的“开源社区”。

在2024年1月30日,阿里云创业者社群举办了创业者之夜,希望通过不同参与方的思维碰撞,激发创新。50位嘉宾围炉煮茶、坐而论道,其中包括实践AI落地的产业方昆仑万维、中航信、招商银行、同道猎聘等,大模型明星公司智谱AI、百川智能等,投资机构代表元璟资本等,研究机构IDEA,以及行业内众多上下游的创业公司,比如松应科技、Nolibox计算美学、面壁智能等。

在创业者之夜的现场,“落地”“应用”成为高频词汇。历史上每一次技术的发展都离不开场景的落地,如果没有移动互联网,云计算也难以成长,如果没有软件,电脑至今也不会成为必需品。本次AI浪潮的基座大语言模型固然是发展的关键所在,但是能不能找到落地的应用,才决定了技术长久发展的未来。

AI原生还是“+AI”? 产品为王还是技术优先?产品的to B、to C如何选择?不同产业,到底关注AI的什么能力?

相较于上半年闷头向前追赶的技术研发期,关于技术路线和未来愿景的“共识”如此明确。但此刻在技术平稳期,落地成为不得不谈的话题,这个话题下,“非共识”成为了最 大的共识。

从左到右分别是阿里云创业孵化事业部总经理李中雨;智谱AI COO张帆;百川智能联合创始人、总裁洪涛;元璟资本管理合伙人刘毅然;IDEA研究院认知计算与自然语言讲席科学家张家兴、通义实验室对话智能负责人李永彬

AI原生:当前阶段,要革新还是要效果?

人们容易把技术上面临的问题看得太重,把落地时面临的问题看得太轻。正如同互联网时代,如果是产业“+互联网”,那只能在某些角度降本增效,但如果是“互联网+”,则会大范围爆发新的需求。而这“互联网+”,则是考验应用在场景里的落地能力。

但目前技术仍然不够稳定。GPT4仍然存在幻觉问题,GPT5泛化能力、模型解决复杂任务的能力在提升,但尚未确定推出时间。更重要的是,中国大模型还在追赶的路上,目前国内的头部模型,只能在部分性能上比肩GPT4。

如果大模型技术不过关、不稳定,则没有爆发应用的前提条件。通义实验室对话智能负责人李永彬举例:“大模型解决一个问题的水平从20分提高到60分,就能够惊艳所有人,因为之前20分太差了。”但在严格一些的应用层面,“60分和0分差不多,因为没有办法拿60分的产品上线”。

在这样的背景下,中国和美国面临的AI原生问题既相似又不同。

相似的是,中美双方都没有进步应用爆发潮。

阿里云创业孵化事业部总经理李中雨梳理了硅谷一年来的AI进展,他表示虽然出现了大量应用,但是“访问量还是集中在ChatGPT,Create AI,这两者占了百分之七八十”,按照以前移动互联网时代的访问量来算,其他的应用,都只是长尾应用。

不同的是,美国还是出现了几款革新性产品。

目前美国大模型驱动的应用分为两种,一种是通用型的,对原有产品的改造,比如NewBing;另一种是垂直领域的“革命”,比如11个人、0融资、1千万人社区和1亿美金营收的Midjourney。

而中国尚未出现一款足以引发狂热的AI原生应用。

“大模型出现,引领着最前端的技术,发展很快。但是究竟拿它做什么?”元璟资本管理合伙人刘毅然抛出了这个问题。“今天还是拿AI做原来已有生产关系或者原来已有(产品)的加强,虽然做得不错,但是我们更期待看到技术变革之后的新产品出现,推动新一代需求。”

也许在目前的技术条件下,我们需要憧憬AI原生,但不能过度执着于AI原生。“我们不要关注这个技术本身是不是AI原生,而是要关注大模型和哪些传统的技术可以结合起来,最后达到很好的效果。”昆仑万维集团董事长兼CEO方汉提出了这样的观点。他以游戏场景中的3D模型生成举例,AI大模型的方法直接生成的3D模型,会存在面数特别多,规格不对的问题,基本不可用;但如果搭配传统思路,把动画工具介入到AI工作流之后,产品可用性则会大大提高。

百川智能联合创始人、总裁洪涛也表达了类似的观点:“从实用的角度,眼前阶段明确场景,用工程+模型的方式,把它做起来,然后用增长飞轮的方式,无论数据回滚还是用户反馈回滚,还是各种各样的技术条件和系统环境的碰撞,可能才是更可行的路。”

从另外一个角度分析,中国的创新者擅长在后半场发挥产品上的创造力,而非从新技术出现时就进行从0到1的产品创造。

元璟资本刘毅然分享,从移动互联网的后半场就能看到,美国产品技术有特色,但是产品不好,而中国的使用环境和人才结构,在技术创新到一定阶段后,能够打磨出很难相比的产品。“在这个前提下,中国的创业还有很多的机会。”

从模型为王到价值为王

在AI时代,尤其是讨论AI原生应用时,不论to C还是to B,最重要的评判标准是,要对产业本身产生价值。正如阿里云智能副总裁、公共云业务解决方案总经理韩鸿源所说:“应用效果说明一切。”

尽管移动互联网时代也出现了诸如短视频、直播等娱乐消遣向的应用,但是在早期,更容易被C端用户接受并且实现自然裂变的,还是淘宝、微信这种提升效率的产品。

而AI被人们天然寄予了“提升生产力”的诉求。这需要我们从大模型单点技术的“自嗨”中抽离出来,更多关注给行业和社会带来的“价值”。

尽管是大模型头部厂商,百川智能的洪涛也认为:“现阶段做应用,含大模型量不宜过高,如果过高,应用的可靠性会有风险。”并且洪涛还提到,技术不应该闭门造车,而应该与产业界交流:“真正产业的落地,不可能纯靠算法专家、技术同学之间的碰撞,一定与产业界、实际的使用者有互动。”

通义实验室的李永彬补充,如果不是落地产业界,也很难认识到技术的不足在哪。他从自己做to B的经验出发,认为如果聚焦在to B的产品,效果到不了90,客户不会买单:“所以在to B场景下,技术能力需要更大的考验。”

事实上,很多技术上的不足和瓶颈,确实困扰了产业方价值的实现。

同道猎聘集团董事会主席兼CEO戴科彬提出了一个洞察,就是关于大模型的测试成本是目前产业落地的障碍之一。“这家的模型在语言识别理解上做得不错,那家模型在表情图像上做得更好一些。当模型在不同地方调用时,也会产生内部团队评价标准的问题。”市面上通用大模型已经多达几十种,测试各家的模型并且与场景做契合,需要大量的时间、人力、资源上的投入。

这个问题目前尚无法得出答案。智谱AI的COO张帆表示:“在具体的方向上,如果不能落地,不能产生价值,再高的榜单分数价值也是0。”所以,智谱AI在服务产业方时,提供具体的支持和服务,确保模型和场景的结合。“大家要自己去试,在自己的场景里去测。”

除了“通用”的困扰,具体到不同行业,也会有各自的痛点。不同产业的需求差异,更是需要技术和产业一起探索。

以金融为代表的产业,其容错性的问题是AI落地中较具考验性的一环。“一个行业容错性低的话,对大模型一定很谨慎。”昆仑万维集团董事长兼CEO方汉说道,但是并非所有行业都像金融行业一样,有一些行业甚至希望“幻觉”的出现:“做内容做社交的人希望幻觉越多越好。生成内容领域最容易落地的,因为容错性非常高。”

“差异化对所有做大模型的人是最 大的痛。”IDE研究院张家兴在现场分享道。但是对于落地场景来说,越大的差异化,意味着越多的空间和创造更大价值的可能性。

产品人的时代过去了吗?

要满足需求,离不开对产品能力的讨论。但产品能力在AI时代代表着什么?共识也尚未出现。

一些人认为,移动互联网时代的“产品人”创业的逻辑已经改变,在技术更新换代期,即使是从产品的角度切入,也是考验掌握技术核心能力。

元璟资本刘毅然认为:“模型的能力或者理解操控模型的能力,就是今天产品力的一部分。”这是因为,移动互联网时代底层基础设施一致,因此只需要考虑产品本身,但是如今全球有十几个主流模型,每一个模型的底层逻辑都各不相同。“纯产品型的创业很难,至少在大模型上半场,底部模型源源不断变化时,上层应用一定要充分理解下面的模型技术。”

“不是PMF(Product Markrt Fit),而是TPF(Technology-Product Fit)。”百川智能洪涛表示。

但产业方不这么想。

同道猎聘戴科彬从产业方的角度提出了自己实在的需求。“前台大部分的用户是不理解什么叫做大模型,不理解所谓的技术,只知道交互好不好,我能不能理解这个产品。”同道猎聘既是大模型的落地方,又是给招聘企业提供智能产品的服务方,目前已经在招聘环节引入了大模型,具体来说,在大公司做校园招聘时,批量通知、提问是非常大的投入,同道猎聘在这个场景中做了“数字面试官”,可以基于双边的理解生成问题。

在实践中,戴科彬发现,只懂技术、只懂产品都远远不够,“懂人性,懂在交互过程当中如何引导用户很简单实现用户意图的人才能够做好AI产品”。

总结来看,大模型时代,并不是对于创新者的要求“变了”,而是要求“多了”——to C的应用,要有击穿大众认知、更具想象力的未来,更要能洞察人的实际需求;to B的应用则需要更加务实,既要具备极强的技术底座,又要具备能够革新生产力的产品能力。

但对于很多产业方提出的“产品力”诉求,技术方并不是不想解决,而是确实不到时候——应用侧也有技术路线尚未达成共识。百川智能洪涛提到,大模型之所以通用,是因为用了公域公开的数据,而和私域数据结合才是实现产业落地的关键,但是如何更有效结合,目前尚未形成统一的结论。

更多思考和探索,还需要产业再给予一些耐心。

实现先进要与更先进的企业一起

阿里云智能集团资 深副总裁 公共云业务总裁 刘伟光

阿里云在做大模型,并且通义大家族(通义千问、通义听悟、通义智文作为应用代表,同时百炼大模型服务平台,魔搭社区)也已经取得比较好的市场口碑,但是阿里云的视角更为开放。

这是因为,阿里云是从AI产业最 底层的云计算服务切入赛道。云和AI天然融合,从技术和业务逻辑看,“AI 算力基础设施” 的重点是公共云。因为大模型的训练和推理(使用环节)都需要调度弹性算力资源,且要求及时响应,这与在各地建有数据中心、能及时满足算力波峰波谷变化的公共云更契合;云计算能力的提升,包括GPU算力、配套的计算存储、网络能力的演进,也会对AI产生强有力支撑。

在开放的状态下就能吸引到更多怀揣技术和产品理想的企业,先进的企业会合力带领社会走向更先进的未来。

这也是阿里云的初衷。正如阿里云市场部总裁刘湘雯所说,“开源是阿里云坚定的选择,一定会非常确定地走下去。所以我们希望创造像阿里云创业者社群这样的场合,让创业者朋友们可以充分交流,遇到一句顶一万句的知音。”

阿里云市场部总裁 刘湘雯

在众多非共识中,有一点成为了共识——中国未来会在应用层面取得突破。“我非常坚信未来在应用层面会有非常多的沉淀。即使在基础模型上会落后一点,但在应用上,一定能够找到突破口。”刘伟光这样总结。

我们不仅期待先进未来的到来,更是会一起迈步、合力接近。

写在最后:

创业者之夜活动由阿里云创业者社群举办。社群聚集中国最前沿的技术创新者,聚焦云与AI技术方向、以及AI在产业中的落地应用等核心主题,发起各类技术及产业闭门活动与研讨,与社群成员形成长期共创体系,与技术创新者们共同成长。

复制链接bit.ly/tmt-post可快速订阅社群闭门活动。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 大家在看
  • Nabubit:数据库设计助手,简化数据库设计、管理和演化。

    Nabubit是一个旨在帮助用户优化数据库设计、管理和演化的在线工具。它提供了上传数据库架构图、可视化数据库结构、以及使用自然语言提问的功能。用户可以从头开始设计数据库,无需担心命名或记住语法。完成设计后,可以将其导出到自己喜爱的数据库或框架中。

  • Otter Script:文档生成平台,快速创建复杂文档。

    Otter Script是一个文档生成平台,它通过自动化技术帮助用户节省时间,将原本需要几天完成的复杂文档工作缩短到几分钟。它简化了工作流程,让用户可以更高效地完成更多任务。

  • BNA:多功能AI超级应用,涵盖社交、电商、娱乐和教育。

    BNA AI Super App是一款集成了多种智能服务的超级应用,它不仅提供社交功能,如分享帖子、写博客、聊天和视频通话,还涵盖了AI电商和娱乐服务。此外,该应用还提供40种语言的AI教学服务,帮助用户学习不同的语言。BNA AI Super App以其强大的AI功能和多语言支持,满足了不同用户群体的需求。

  • Elisi:高效能自主层级式计划助手

    Elisi 是一款旨在帮助用户实现个人成长的终极组织者和指南。它通过直观的设计和用户友好的说明,帮助用户将梦想转化为清晰的结果,分解成可实现的里程碑,并通过AI技术理解并适应用户的个人需求,确保每一天都更有条理和高效。Elisi 致力于提供便捷服务,主要功能套件完全免费。

  • Omi AI:个性化AI助手,记录每一刻,与AI对话获取反馈。

    OMI APP是一个任务驱动的个性化AI助手,旨在通过语音和音频转录功能帮助用户提高记忆力和沟通效率。它是一个开源的AI记事本,提供提醒、建议等功能,同时注重用户隐私。

  • MeowMail:高送达率的AI电子邮件营销工具

    MeowMail是一款集成在Shopify后台的电子邮件营销应用,利用AI技术自动选择最佳发送时间,提高邮件的送达率至98%以上。它支持拖放编辑、从Klaviyo导入邮件列表、使用Beefree编辑器创建新邮件,并通过设定支出限制来管理邮件营销活动。MeowMail还提供企业级支持和自动翻译文本功能,帮助商家以低成本实现高效的邮件营销。

  • Maia 100:微软定制AI加速器,专为大规模AI工作负载设计。

    Maia 100是微软为Azure设计的首款定制AI加速器,专为大规模AI工作负载而打造,通过软硬件的协同优化,实现了性能、可扩展性和灵活性的最大化。它采用了TSMC N5工艺和COWOS-S互连技术,具备高达1.8TB/s的带宽和64GB的容量,支持高达700W的热设计功耗(TDP),但以500W运行,确保了高效的能效比。Maia 100集成了高速张量单元、向量处理器、DMA引擎和硬件信号量,支持多种数据类型和张量切分方案,并通过以太网互连支持大规模AI模型。此外,Maia SDK提供了丰富的组件,支持快速部署PyTorch和Triton模型,并通过双编程模型确保高效的数据处理和同步。

  • LTM:超长上下文模型,革新软件开发

    Magic团队开发的超长上下文模型(LTM)能够处理高达100M tokens的上下文信息,这在AI领域是一个重大突破。该技术主要针对软件开发领域,通过在推理过程中提供大量代码、文档和库的上下文,极大地提升了代码合成的质量和效率。与传统的循环神经网络和状态空间模型相比,LTM模型在存储和检索大量信息方面具有明显优势,能够构建更复杂的逻辑电路。此外,Magic团队还与Google Cloud合作,利用NVIDIA GB200 NVL72构建下一代AI超级计算机,进一步推动模型的推理和训练效率。

  • EZ-work AI文档翻译:智能AI翻译,高效文档语言转换助手。

    EZ-work AI文档翻译是一款专注于文档翻译的在线服务,支持多种语言的翻译,包括中文、英语、日语、俄语、阿拉伯语和西班牙语等。它使用先进的AI技术,如gpt-4o-mini和deepseek-chat模型,为用户提供快速、准确的翻译服务。该产品适用于需要文档翻译的个人和企业,尤其在国际交流和学术研究领域尤为重要。

  • Watson AI:会议助手,自动记录并总结会议要点。

    Watson AI是一款会议助手应用程序,它通过录制系统音频和麦克风来转录和总结会议内容,自动提取行动项和会议摘要,帮助用户更高效地进行会议记录和回顾。

  • PicTech AI: 免费在线AI图片翻译 助力跨境电商

    PicTech AI是由学以致用科技旗下的智能图像工具品牌,专注于为跨境电商提供AI驱动的图片翻译服务。该产品利用人工智能技术,实现高准确率和高清晰度的图片翻译,支持中文、英语到日语、韩语等多国语言的翻译。PicTech AI的智能抠图功能,能够准确检测图片主体边缘,一键去除背景,无需专业编辑。产品背景信息显示,其团队由来自百度、网易、阿里巴巴等行业巨头的顶尖高科技人才组成,具备强大的技术实力和产品能力。该产品定位于帮助跨境电商从业者简化工作流程,提高效率,无需懂外语或图像处理技能即可使用。

  • AnythingLLM:一站式AI应用,支持多种文档和模型。

    AnythingLLM是一个多功能的桌面客户端,支持多种语言模型(LLM)和文档类型,提供完全私密的使用体验。用户可以根据自己的需求选择企业级模型、自定义模型或开源模型,如GPT-4、Llama、Mistral等。产品支持一键安装,本地运行,无需互联网连接,保护用户隐私。

  • 林哥的大模型野榜:更适合中国宝宝体质的大模型产品排行榜

    林哥的大模型野榜是一个专注于中国用户需求的大模型产品排行榜,提供了多维度的评估和排名,帮助用户更好地了解和选择适合的大模型产品。

  • Fluximg.com:AI文本到图像生成器,支持多尺寸和自动翻译。

    Fluximg.com是一个基于Flux模型的AI图像生成网站,提供从文本到图像的转换服务。它支持多种语言,包括中文和英文,并且具有用户友好的界面。网站提供免费和专业版本,使用户能够根据自己的需求选择不同的服务级别。

  • 现代文转古文:将现代汉语转化为古汉语,提升文采。

    现代文转古文是一款能够将现代汉语自动转换为古汉语的模型,它通过先进的自然语言处理技术,使得用户可以轻松地将现代文本转换成具有古典韵味的古文。这种转换不仅能够增加文本的文学价值,还能在教育、文学创作、文化传承等方面发挥重要作用。

  • Zamba2-mini:先进的小型语言模型,专为设备端应用设计。

    Zamba2-mini是由Zyphra Technologies Inc.发布的小型语言模型,专为设备端应用设计。它在保持极小的内存占用(<700MB)的同时,实现了与更大模型相媲美的评估分数和性能。该模型采用了4bit量化技术,具有7倍参数下降的同时保持相同性能的特点。Zamba2-mini在推理效率上表现出色,与Phi3-3.8B等更大模型相比,具有更快的首令牌生成时间、更低的内存开销和更低的生成延迟。此外,该模型的权重已开源发布(Apache 2.0),允许研究人员、开发者和公司利用其能力,推动高效基础模型的边界。

  • InterTrack:无需对象模板的人体与物体交互跟踪技术

    InterTrack 是一种先进的跟踪技术,能够在单目RGB视频中跟踪人体与物体的交互,即使在遮挡和动态运动下也能保持跟踪的连贯性。该技术无需使用任何对象模板,仅通过合成数据训练即可在真实世界视频中实现良好的泛化。InterTrack 通过分解4D跟踪问题为每帧的姿态跟踪和规范形状优化,显著提高了跟踪的准确性和效率。

  • GenWarp:生成新视角的图像,保持语义信息。

    GenWarp是一个用于从单张图像生成新视角图像的模型,它通过语义保持的生成变形框架,使文本到图像的生成模型能够学习在哪里变形和在哪里生成。该模型通过增强交叉视角注意力与自注意力来解决现有方法的局限性,通过条件化生成模型在源视图图像上,并纳入几何变形信号,提高了在不同领域场景下的性能。

  • Qwen2-VL:新一代视觉语言模型,更清晰地看世界。

    Qwen2-VL是一款基于Qwen2打造的最新一代视觉语言模型,具备多语言支持和强大的视觉理解能力,能够处理不同分辨率和长宽比的图片,理解长视频,并可集成到手机、机器人等设备中进行自动操作。它在多个视觉理解基准测试中取得全球领先的表现,尤其在文档理解方面有明显优势。

  • Dressplay:个性化服装生成器,轻松变换你的装扮。

    Dressplay是一个创新的在线服装生成器,允许用户通过简单的步骤生成个性化的服装。它利用先进的图像处理技术,让用户能够选择服装区域、目标人物以及想要穿戴的服装,从而创造出逼真的服装效果。Dressplay背后的技术不仅提高了服装设计的效率,也为用户提供了一种全新的个性化体验。目前,Dressplay提供免费试用,用户可以通过网页访问并体验其功能。

今日大家都在搜的词: