首页 > 传媒 > 关键词  > 人工智能最新资讯  > 正文

全球前沿科技亮“剑锋”,杭州何以抢滩大模型之争

2024-08-28 11:57 · 稿源: 站长之家用户

撰文/“中国视谷”融媒体中心 苏会会

当前,全球技术创新步入密集活跃期,国内“百模大战”酣战一年格局初显,人工智能大模型整体呈现爆发式发展,逐渐成为产业新型基础设施,加速转动商业化应用齿轮。

大势之下,让我们一起探寻全球大模型生态的发展步伐与涌现了哪些强悍的大模型,崛起了哪些新兴应用?以杭州为代表的国内城市又是如何抢滩大模型阵地,打造新质生产力加速发展的重要“引擎”?

一、溯源进阶:科技巨头引领全球创新潮流

大模型是全球科技竞争的新高地、未来产业的新赛道、经济发展的新引擎。

追溯AI大模型的发展进程,2017年,Google提出基于自注意力机制的神经网络结构——Transformer架构,奠定了大模型预训练算法架构的基础。次年,OpenAI和Google分别发布了GPT-1与BERT大模型,预训练大模型成为自然语言处理领域的主流。

图 大模型技术迭代历程 来源:《人工智能图景展望:跃迁点来临(2023)》报告

2022年,AIGC初步呈现爆发态势,最引发市场关注的是Stable Diffusion和ChatGPT。尤其是ChatGPT惊艳问世,在全球范围里掀起了一轮AIGC创新热潮,开启“人机互生”新阶段。2023年3月15日成为AIGC时代来临的关键节点。OpenAI发布多模态预训练大模型GPT-4,由此引发了全球科技巨头“互掰手腕”、中国市场“百模大战”的连锁反应。随后,OpenAI又在今年打造了现象级“爆款”——视频生成大模型 Sora,60s一镜到底的电影级视频“硬控”了每一位见证者。

图 国内外大模型基座发展示意图 来源:《大模型关键技术与未来发展方向——从 ChatGPT 谈起》报告

从全球范围看,世界各地积极推动大模型研发和应用,美国、中国是主要“玩家”,而英国、加拿大、新加坡等国家和地区尚处于前期尝试阶段,仅个别头部企业开始应用。

现阶段,国外大模型领域主要呈现三大发展模式,包括“龙头大模型+原有业务”、“龙头大模型+外部行业数据”、“开源大模型+自有行业数据搭建行业大模型”,较具代表性的有OpenAI模式、微软模式、谷歌模式等,已在自然语言处理、计算机视觉、智能语音等领域取得了标志性技术突破,在模型精度、通用性和泛化能力等方面实现了跨越式发展。

二、大模型之争:“千模大战”与“四省争霸”

大模型之争在国内产业界日趋“白热化”,“百模大战”逐渐演变为“千模大战”。

相比国外大模型“龙头效应”显著,国内大模型的发展模式主要包括“自有通用大模型+外部行业数据”以及“自有或其他开源大模型+自有行业数据”。

而根据应用场景和目标人群的不同,可分为通用大模型和行业大模型两大类。我国具有代表性的通用大模型主要包含百度“文心一言”、阿里巴巴“通义千问”、科大讯飞“讯飞星火认知”等;行业大模型主要涵盖蜜度“文修”、容联云“赤兔”、用友“YonGPT”等。根据运行载体不同形成了端侧和云侧大模型,如端云结合的有vivo“蓝心”大模型,端侧主要以蔚来“NOMI GPT”大模型为代表。

截至目前,国内AI大模型市场尚未出现爆款级应用,面临着算力限制和高质量训练数据集匮乏两大难题,有望倒逼算力基础设施建设加强,以及数据在大规模、多模态、高质量三大维度上的全面提升,其红利和贡献还远未被发掘。

图 基于大语言模型的多模态大模型通用结构 来源:《大模型关键技术与未来发展方向——从 ChatGPT 谈起》报告

大模型不仅在行业内“争奇斗艳”,也在城市之间“打”得火热,托举中国大模型实力稳居全球首先梯队。

截至2024年3月28日,通过国家互联网信息办公室备案的大模型名单有117个,其中,北京51个,上海24个,广东19个,浙江9个,大模型数量占全国总模型数量的88%。

图 浙江省生成式人工智能服务已备案信息 来源:杭州市“中国视谷”专项工作组

其中,浙江是大模型孕育的繁荣之地、大模型应用的领先之地。截至2024年4月29日,浙江已备案如阿里巴巴“通义千问”、新华三“百业灵犀”、同花顺“问财”等11项生成式人工智能服务。还有一大批垂直类大模型以及处于内测、未开放给公众的大模型不断壮大。

综合来看,浙江省泛人工智能企业主要集中在环杭州湾地区,省内现有大模型也大多数诞生于杭州,来自“中国视谷”产业生态企业,成了杭州助力浙江加快培育新质生产力的强大引擎。

图:“中国视谷”精神堡垒 来源:杭州市“中国视谷”专项工作组

例如,“中国视谷”正前瞻布局一批大模型相关未来产业,培育发展超大模型类脑计算,将推进知识增强、跨模态统一建模、提示学习、持续学习等技术在超大模型中的创新应用,加快超大模型在机器视觉、多模态、人机交互等领域应用。同时,鼓励龙头企业、科研院所开展多模态通用大模型研发并向中小企业开放模型应用,围绕模型开发搭建开源开放平台(社区),构建基于开源开放技术的软件、硬件、数据、应用协同的产业生态。

三、城市案例:杭州打造“模型即服务”新模式

当前,杭州加速引领全省人工智能产业的特色化发展,推进“模型即服务”新模式,支持头部企业开展多模态通用大模型关键技术攻关、中小企业深耕垂直领域做精专用模型,鼓励相关技术和算法开源开放,推动“中国视谷”产业生态企业合力探索大模型的商业化应用进程,形成了“1+N+X”的协同创新、双向赋能产业生态。

图 MaaS模式下的AGI基础业态分析 来源:《人工智能图景展望:跃迁点来临(2023)》报告

例如阿里巴巴“通义千问”已迭代2.5版本,落地应用速度不断加快,赋能天文、PC、文旅、航空、矿业等多个领域。根据阿里云公布的比较新数据,目前通义大模型已经服务超9万家企业,通义开源模型累计下载量突破700万。

图 “通义千问”已迭代2.5版本 来源:阿里巴巴

新华三集团则一直积极推动智能算力的创新与发展,秉持“1+N”大模型策略,以国内首发的私域大模型百业灵犀(LinSeer)为基础,开放合作了N个业界优秀的通用大模型和行业细分大模型,为垂直行业和专属地域客户提供订制、独享、生长的智能化服务。为推动大模型、AIGC等应用与政企丰富场景的深度融合,新华三业已率先推出了AIGC灵犀一体机。

图 灵犀大模型 来源:新华三

再看宇视科技的“梧桐”大模型。2023年,宇视领先AIoT行业率先推出了“梧桐”,并与多家行业龙头联合启动“梧桐大模型种子合作伙伴计划”,探索大模型在交通、教育、零售、体育公共服务等领域的端边云侧的深入落地。经过一年的技术迭代和生态共建,宇视又推出了升级版AIoT行业大模型“梧桐2.0”,并发布“猎光2.0”AI-ISP图像引擎感知终端等一系列大模型产品,打响了AIoT行业“装备大模型化”的首先枪。

宇视科技创始人、总裁张鹏国认为,“大模型技术是AIoT行业当下比较大的技术变量,必定会带来新的市场机会点。一个大的机会点就是大量在网产品的更新迭代。借助于行业大模型技术,边、端产品有望用更低的成本,在某些细分场景下实现更好的应用效果。”

此外,还有海康“观澜”,大华“星汉”、安恒信息“恒脑·安全垂域大模型”、恒生电子“Light-GPT”、实在智能“塔斯”,以及致力于大模型与智能体技术普惠落地的联汇科技,近期全新发布了第二代思考大模型OmChatV2,推出了第二代多模态智能体OmAgent,并完成了与多款国产GPU的适配与性能验证。

由此可见,杭州的大模型生态呈现“百花齐放”的态势,充分发挥了链主作用,并部署集聚更多国内软硬件设备厂商、核心元器件厂商、解决方案应用商协同发展,共同做强做优做大智能物联产业集群。

聚焦大模型的“扼喉之处”的算力层面,根据《关于加快推进人工智能产业创新发展的实施意见》《关于高标准建设“中国视谷”高质量发展视觉智能产业的实施意见》等系列政策显示,杭州一要建设算力中心,创建国家公共算力开放平台,打造算力高地和模型输出高地;二要推进算力供给市政化,全市每年设立总额不超过5000万元的“算力券”,重点支持中小企业购买算力服务。

预计到2025年,杭州将基本形成“高算力+强算法+大数据”的产业生态,打造成为全国算力成本洼地、模型输出源地、数据共享高地,人工智能创新应用水平全国领先、国际先进。

抢滩未来,杭州这座数字之城加快实施“人工智能+”行动推进数字经济二次攀登、五大产业生态圈提能增效,推动以大模型为代表的新技术加速规模化、体系化发展,在“中国视谷”的建设进展中不断孕育发展新质生产力的关键变量。有朝一日,算力或许如水电一般即取即用,AIGC步入新一轮爆发期,人工智能全面赋能新型工业化,推动人类社会快速迈入高度智能化时代。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 大家在看
  • Anon:AI助手,隐私保护

    Anon是一个注重隐私的AI助手,类似于ChatGPT,但默认提供隐私保护。它允许用户在不登录、无追踪的情况下自由使用,所有对话都保留在本地设备上。Anon由先进的技术如Llama 3.1 405B和FLUX提供支持,旨在为用户提供一个安全、私密的AI对话环境。

  • PodcastWorld:AI驱动的播客对话搜索引擎

    PodcastWorld是一个利用人工智能技术,通过分析数百万播客对话来帮助用户找到所需答案的搜索引擎。用户可以询问问题,并直接收听播客中回答该问题的确切片段。这个平台不仅提供了一个与播客内容互动的新方式,还通过聊天功能,使用户能够与播客创作者进行更深入的交流。PodcastWorld通过提供播客摘要、音频片段和完整的对话记录,满足了用户对信息获取和知识分享的需求。

  • Chat with your Database:与数据库对话,用自然语言查询数据。

    Chat with your Database 是一个创新的数据库交互工具,它允许用户通过自然语言与Postgres数据库进行交互。利用AI技术,用户可以轻松地查询、分析和操作数据库,而无需编写复杂的SQL代码。该产品支持开源,鼓励社区参与开发和贡献,代码在GitHub上公开,用户可以自由探索、贡献或定制以满足特定需求。

  • AI Comic Factory.ai:在线AI漫画生成器,快速将创意转化为漫画故事。

    AI Comic Factory是一个创新的在线平台,旨在帮助用户轻松创建独特的漫画。用户可以通过输入描述性的提示或上传图片来生成各种风格的漫画,包括角色、场景和对话的选项。该平台提供定制选项,如版式布局、角色设计和对话生成,以增强漫画的视觉效果。凭借用户友好的步骤和可调设置,实现高质量的结果变得简单。无论是个人娱乐还是创意项目,AI Comic Factory都使得漫画创作过程变得高效且愉快。

  • AutoArena:自动化的生成式AI评估平台

    AutoArena是一个自动化的生成式AI评估平台,专注于评估大型语言模型(LLMs)、检索增强生成(RAG)系统和生成式AI应用。它通过自动化的头对头判断来提供可信的评估,帮助用户快速、准确、经济地找到系统的最佳版本。该平台支持使用来自不同供应商的判断模型,如OpenAI、Anthropic等,也可以使用本地运行的开源权重判断模型。AutoArena还提供了Elo评分和置信区间计算,帮助用户将多次头对头投票转化为排行榜排名。此外,AutoArena支持自定义判断模型的微调,以实现更准确、特定领域的评估,并可以集成到持续集成(CI)流程中,以自动化评估生成式AI系统。

  • GodmodeHQ:销售和市场营销AI,自动增长您的业务。

    GodmodeHQ是一个AI驱动的销售和市场营销平台,旨在通过自动化的方式帮助企业提高销售效率和市场覆盖。它通过集成多个B2B数据库,利用自然语言处理技术,帮助用户寻找和验证潜在客户,生成个性化的营销信息,并管理整个销售流程。产品的主要优点包括节省时间、提高销售团队的工作效率、以及通过个性化的营销信息提高转化率。GodmodeHQ的背景信息显示,它是由一群对销售和市场营销有深刻理解的团队开发的,旨在解决传统销售过程中的痛点,如寻找潜在客户、客户资格审查、个性化营销等。产品的价格策略是免费试用,之后根据功能的不同,提供不同的付费套餐。

  • Echo:使用AI整理和提炼你的想法的语音和文本笔记应用

    Echo是一款结合了人工智能技术的语音和文本笔记应用,它通过AI技术帮助用户组织和提炼思考。Echo利用GPT-4o大型语言模型进行转录、回忆和洞察力生成,能够准确转录用户的语音输入,并根据用户过去的想法提供有意义的答案,使日记体验更具互动性和吸引力。该产品注重隐私和安全性,笔记加密,不查看用户数据,也不使用数据训练AI,遵循行业最佳实践进行数据保护。目前Echo处于免费测试阶段,未来计划引入高级功能。

  • JobJump:个性化AI面试助手,助你在面试中脱颖而出。

    JobJump - AI Interview Copilot是一款专为求职者设计的Chrome插件,它通过人工智能技术提供个性化的面试辅导。这款插件能够识别面试官的问题,并即时生成定制化的答案提示,帮助用户更自信地回答问题。它支持50多种面试语言,并针对200多个行业和角色进行了定制化。JobJump插件易于安装和使用,用户可以通过Google账号注册并免费开始使用。它适用于多种在线面试平台,能够帮助用户在面试中更好地展示自己,提高获得理想工作的机会。

  • Coverr AI Workflows:利用AI技术提升视频创作效率

    Coverr AI Workflows是一个专注于AI视频生成的平台,提供多种AI工具和工作流程,帮助用户通过简单的步骤生成高质量的视频内容。该平台汇集了AI视频专家的智慧,通过社区分享的workflows,用户可以学习如何使用不同的AI工具来创作视频。Coverr AI Workflows的背景是基于人工智能技术在视频制作领域的应用日益广泛,它通过提供易于理解和操作的工作流程,降低了视频创作的技术门槛,使得非专业人士也能创作出专业级别的视频内容。Coverr AI Workflows目前提供免费的视频和音乐资源,定位于满足创意工作者和小型企业的视频制作需求。

  • Emploio:AI驱动的员工成长平台

    Emploio是一个利用人工智能技术来支持个人成长、增强职业发展,并培养一个充满活力的工作场所文化的平台。它通过提供AI驱动的洞察力来最大化团队潜力,帮助企业跟踪员工成长和团队表现,分享跨部门的洞察力,并构建完美的团队。此外,Emploio还提供一对一的协助,确保每个团队成员都能获得成功所需的指导。它还可以与日常使用的工具集成,优化生产力,并通过统一的仪表板与团队保持联系。

  • Handinger:从互联网提取数据的简单且经济的方式

    Handinger是一个提供数据提取服务的网站,它允许用户通过HTTP端点轻松提取网页内容,包括Markdown、截图、元数据和HTML等格式。这种服务对于训练大型语言模型、存储内容或获取网页特定内容非常有用。Handinger的价格非常低廉,每URL的成本仅为0.0005美元,且每月前2000个URL免费,没有前期成本,也无需复杂的API积分。该服务支持所有类型的网站,并且为用户提供了慷慨的速率限制,每分钟可进行1000次请求。

  • 笔灵AI小说生成器:智能AI辅助小说创作工具

    AI小说生成器是一个专为小说创作者设计的智能AI辅助工具,它通过提供各种写作模板、灵感词库、人物设定、剧情生成等功能,帮助作者快速构思和创作小说。该产品背景信息显示,它由上海简办网络科技有限公司开发,旨在解决作者在创作过程中遇到的灵感枯竭、写作效率低下等问题。产品的主要优点包括丰富的写作模板、AI智能生成和改写功能、以及对不同小说类型的全面支持。价格方面,产品提供终身会员服务,每月只需极低的费用,性价比极高。

  • Swarm:多智能体系统构建、编排和部署框架

    Swarm是由OpenAI Solutions团队管理的实验性框架,旨在构建、编排和部署多智能体系统。它通过定义智能体(Agent)和交接(handoffs)的抽象概念,实现了智能体之间的协调和执行。Swarm框架强调轻量级、高可控性和易于测试,适用于需要大量独立功能和指令的场景,允许开发者拥有完全的透明度和对上下文、步骤和工具调用的细粒度控制。Swarm框架目前处于实验阶段,不推荐在生产环境中使用。

  • AI Hairstyle:AI驱动的发型变换和发色更换工具

    AI 发型是一个在线平台,利用人工智能技术为用户提供个性化的发型和发色更换体验。用户可以通过上传自己的照片,尝试不同的发型和颜色,无需实际剪发或染发即可预览效果。该平台的AI技术能够分析用户的面部特征,推荐最适合的发型和颜色,帮助用户在做出实际改变前做出更明智的决定。AI 发型的主要优点包括:个性化推荐、真实预览效果、云端存储生成的图片、用户友好的界面以及多种发型和颜色选择。产品背景信息显示,AI 发型已经拥有超过10K+用户和2M+生成的发型数量,显示了其受欢迎程度。价格方面,AI 发型提供免费计划,同时也提供不同级别的付费计划,以满足不同用户的需求。

  • Enjoy App:AI辅助的英语学习应用,专注发音训练和记忆提升。

    Enjoy App是一款专注于英语学习的应用程序,它通过AI技术帮助用户纠正发音,提供学习记录跟踪,并利用丰富的在线素材进行语言学习。该应用提倡直接上手学习,忽略繁琐的方法论,旨在通过1000小时的专注训练帮助用户掌握英语技能。它支持音频和视频的可视化跟读,AI自然对话,以及记忆增强系统,是学习英语的有力工具。Enjoy App的价格策略是按使用功能计费,新用户有初期余额,之后可以通过充值享受更多服务。

  • AI视频生成神器:利用AI技术快速生成视频内容

    AI视频生成神器是一款利用人工智能技术,将图片或文字转换成视频内容的在线工具。它通过深度学习算法,能够理解图片和文字的含义,自动生成具有吸引力的视频内容。这种技术的应用,极大地降低了视频制作的成本和门槛,使得普通用户也能轻松制作出专业级别的视频。产品背景信息显示,随着社交媒体和视频平台的兴起,用户对视频内容的需求日益增长,而传统的视频制作方式成本高、耗时长,难以满足快速变化的市场需求。AI视频生成神器的出现,正好填补了这一市场空白,为用户提供了一种快速、低成本的视频制作解决方案。目前,该产品提供免费试用,具体价格需要在网站上查询。

  • AI答案生成器:免费无需注册的智能问答系统,为营销人员提供AI驱动的洞察和解决方案。

    AI答案生成器是一个专为营销人员设计的智能问答系统,它利用先进的人工智能技术,为用户提供关于数字营销趋势和策略的最新信息。该产品的主要优点包括免费使用、无需注册、用户友好界面、精确的语言模型、独特和创意的答案以及节省时间的解决方案。它适用于SEO优化、社交媒体内容规划、电子邮件营销等多种营销需求,帮助用户提高工作效率,快速生成营销策略和内容创意。

  • 派欧算力云:AI云端一体化解决方案,提供模型API、Serverless和GPU租赁服务。

    派欧算力云是一个一站式AIGC云服务平台,提供高性价比的GPU基础设施和无缝集成的最前沿AI推理技术。它全面覆盖不同业务阶段的AI需求,加速业务发展。派欧算力云的主要优点包括:高性能的云服务产品、无需管理和运维GPU基础设施、自动弹性扩缩容、全球覆盖的GPU容器实例、7X24小时客户服务。产品背景信息显示,派欧算力云旨在为AI应用开发者提供强大的算力支持,降低开发成本,提高开发效率。

  • FLUX.1-dev-LoRA-One-Click-Creative-Template:一键式创意图像生成模型

    FLUX.1-dev-LoRA-One-Click-Creative-Template 是一个基于 LoRA 训练的图像生成模型,由 Shakker-Labs 提供。该模型专注于创意照片生成,能够将用户的文本提示转化为具有创意性的图像。模型使用了先进的文本到图像的生成技术,特别适合需要快速生成高质量图像的用户。它是基于 Hugging Face 平台,可以方便地进行部署和使用。模型的非商业使用是免费的,但商业使用需要遵守相应的许可协议。

  • rag-chatbot:一个可以本地与多个PDF文件进行对话的聊天机器人。

    rag-chatbot是一个基于人工智能技术的聊天机器人模型,它能够让用户通过自然语言与多个PDF文件进行交互。该模型使用了最新的机器学习技术,如Huggingface和Ollama,来实现对PDF内容的理解和回答生成。它的重要性在于能够处理大量文档信息,为用户提供快速、准确的问答服务。产品背景信息表明,这是一个开源项目,旨在通过技术创新提升文档处理的效率。目前该项目是免费的,主要面向开发者和技术爱好者。

今日大家都在搜的词:

热文

  • 3 天
  • 7天