首页 > 业界 > 关键词  > 生成式AI最新资讯  > 正文

生成式AI开启大航海时代,但不能靠一个模型走天下

2024-05-30 13:46 · 稿源: ​创业邦公众号

声明:本文来自于微信公众号 创业邦(ID:ichuangyebang),作者:创业邦,授权站长之家转载发布。

你看过泰勒·斯威夫特用流利的中文与粉丝互动吗?你用过“史上最丑”的黏土特效吗?你听过“肯德基疯狂星期四”主题的交响音乐吗?

生成式AI正在重新定义商业规则。

仅2024年3月,就有三家由华人创立的AI视频生成初创企业成功获得千万美元级别的融资:位于英国伦敦的Haiper,由前Google DeepMind的工程师创立,专注于短视频生成;爱诗科技,由前字节跳动视觉技术负责人创立,其产品Pixverse已经在海外市场取得了不俗的表现;以及因让泰勒·斯威夫特“说中文”而一夜成名的HeyGen,4个月内估值增长600%。

传统上,企业在考虑“出海”前往往选择先在国内市场做大做强。过去,许多人认为,只有当企业在国内市场站稳脚跟后,才有实力和资源去开拓海外市场。然而,随着生成式AI时代的到来,拓展全球市场不再遥不可及,每一个初创企业都有机会成为下一个全球市场的领导者这段红利期,对于中国的AI创业者来说,该如何把握?

在5月29日的亚马逊云科技中国峰会上,亚马逊云科技全球副总裁,亚马逊云科技大中华区总裁储瑞松的答案是:生成式AI创新,企业要关注五方面的要素:业务场景的选择、模型的选择,如何利用企业自身的私有数据增强模型能力、确保安全负责任,还有要对应用持续迭代提升。

生成式AI正当时

不会有一个模型一统天下

加拿大传播学家马歇尔·麦克卢汉曾经预言,世界将变成一个紧密相连的“地球村”。如今, 生成式AI已把这一概念推向新的高度。

根据IDC最新发布的报告《全球人工智能和生成式人工智能支出指南》,2022年全球人工智能(AI)IT总投资规模为1324.9亿美元,并有望在2027年增至5124.2亿美元,年复合增长率(CAGR)为31.1%。聚焦生成式AI,IDC调查发现,到2027年45%的企业将掌握并使用生成式AI来共同开发数字产品和服务,从而使收入增长比竞争对手翻一番。IDC预测,全球生成式AI市场年复合增长率或达85.7%,到2027年全球生成式AI市场规模将接近1500亿美元。

图片

麦肯锡在《2023年技术趋势展望》表示,生成式AI在业务场景化落地方面非常宽广,适合文案、设计、影视、软件开发、客户服务等。

图片

亚马逊云科技大中华区总裁储瑞松也持有相似观点,他认为,企业需精选适合的应用场景来迅速见效。内部应用如自动会议摘要、代码伴侣等,因风险低而受欢迎;而面向客户的应用,如智能导购和客服问答,发展迅速。B2B也在探索智能设备维护和招聘面试等场景。尽管生成式AI应用还处于初期,但其长期潜力巨大,能有效提升企业的竞争力。

模型选择也是企业利用生成式AI时的一个关键考量。过去一年中,多个优秀的大模型相继涌现,模型能力不断突破新高。“不会有一个模型一统天下。”储瑞松强调,企业现在可以从众多优质大模型中选择最适合自己的。这不仅给企业带来了选择的自由,还因云服务的便捷性,使得所有规模的企业都能轻松地采用和切换不同的大模型。

孚知流(FuzFlo)就是一家充分发挥多模型策略优势的公司。它不仅运用了多种大型模型如Jurassic-2、Claude2、Amazon Titan和Stable Diffusion等,还借助于Amazon Bedrock服务,能够通过API轻松访问和集成这些模型,高效适应不同的业务场景。

Amazon Bedrock是亚马逊云科技为解决客户在生成式AI创新中遇到的挑战而推出的产品,其通过逆向工作法(Working Backwards)从客户需求出发设计,提供最优模型选择和一致的API体验,极大简化了模型切换和升级过程。

通过结合大语言模型,基于其AI翻译服务产品Translai的积累,孚知流最终实现了向企业级生成式AI知识应用的里程碑式的跨越。

选择合适的业务场景和模型只是开始,企业要成功地构建生成式AI的行业应用还有更多因素需要考虑。比如如何用私有数据来增强模型能力,使模型应用与其他系统集成,实现数据驱动的任务执行。

最后,生成式AI的创新要想成功,安全、负责任(Responsible AI)不可或缺。在这一点,亚马逊云科技的Amazon Bedrock平台也能提供全面的企业级数据安全保护,确保企业数据的安全性和隐私。这包括对所有数据传输和存储进行加密,以及将自定义模型数据保留在客户的虚拟私有云(VPC)内,支持符合GDPR和HIPAA等高标准的合规要求。

“未来真正能创造最大价值的将是生成式AI的行业应用。”储瑞松总结说。

Born Global,小步快跑

那么,在这场“生成式AI+出海”的“叠buff”浪潮中,初创企业是如何抓住海外市场机会,利用生成式AI开发出服务于消费者或企业客户的应用?

据创业邦观察,这些初创企业通常采取“生而全球化”的模式,从创立之初就开发面向全球用户的应用,然后不断进行迭代。在这种“小步快跑”的策略下,生成式AI创业者们迅速积累市场竞争力。也就说是,生成式AI作为最热的“新质生产力”,成为了企业创新产品和拓展新客户群的关键工具。

以海外跨境卖家的新宠SHULEX(Voc.ai)为例,这家2021年开始借人工智能技术创业的公司,运用自然语言处理(NLP)挖掘消费者洞察。企业如何有效聆听并解析消费者的声音——这是SHULEX致力于解决的痛点。

在收集声音数据时,SHULEX面临的挑战在于,处理来自电商评论、客服邮件、社交媒体帖子、网络直播反馈和实时聊天等众多分散的数据点。消费者的反馈形式多样,包括文本、语音、视频等。

在此情境下,生成式AI登场。SHULEX借助大模型具有的语言理解生成能力和数据分析能力,改善人机交互体验,同时提升业务决策效率。例如,AI Bot 是 SHULEX智能客服中用于直接与用户沟通、产生回答的工具,能支持10种不同语言的邮件和聊天服务。在服务某充电品牌时,客服机器人不仅能回答消费者问题,还能够对客诉问题进行分类统计,并反向影响产品设计:产品需要提升毫安数,插头接触不够灵敏等。

此外,SHULEX结合生成式AI还能分析社交媒体上竞争产品的口碑,帮助企业不仅关注自身产品的优化,还能在市场竞争中找到优势。

SHULEX为 AI Bot 设计了 “构建框架 - 应用框架 - 强化框架” 三个步骤,并通过亚马逊云科技生成式AI技术栈,将Amazon Bedrock上大模型的能力贯穿于这三个步骤之中:首先,通过对商品介绍、使用手册、过往客服对话记录等进行分析迅速构建出客服框架知识库;然后,针对用户提出的问题做答时,利用大模型对语句进行优化,做出更易理解、更有温度的回答;最后反向优化现有知识库的内容,持续改进应用。

Amazon Bedrock 提供丰富的大语言模型和涵盖100多种语言的 Embedding 模型,支持了SHULEX的全球业务拓展。做为一家初创公司,SHULEX目前已拥有全球注册用户超过15万。SHULEX的算法合伙人潘胜一看到“通过应用 Amazon Bedrock 这一强大的生成式 AI 应用开发平台,用户留存率提高了12.1%。我们认为,无论是企业自研大语言模型还是快速使用商业模型,亚马逊云科技都是我们正确的选择

从SHULEX的发展历程中,我们可以清楚地看到,它之所以能迅速在市场中脱颖而出,主要得益于生成式AI技术带来的显著优势:开发周期快、运营效率高以及一件触达全球化的无门槛。

更为关键的是,初创企业极其擅长抓住技术浪潮的初期市场机遇,也就是市场形成之初的关键时期。在这一阶段,尚未形成充分的市场竞争,企业若能在诸如亚马逊云科技这样的平台型大公司的技术支持下迅速推出创新产品,便能抢占先机,从而构建竞争优势。

AI赋能,按下出海加速键

如果说,初创企业需要在生成式AI变革中“敢为人先”,那更为成熟的企业,已经开始借助生成式AI技术“改革”内部业务流,并推动其业务“出海”,特别是在汽车、游戏和智能制造等领域表现出色。

先拿智能制造领域来说,海尔创新设计中心为海尔智家旗下七大品牌,销往全球的所有产品提供设计创新和模式探索。亚马逊云科技为海尔创新设计中心构建了开箱即用的生成式AI工业设计方案,并应用到产品设计、UI 设计、CMF 设计、品牌设计等环节。例如“AIGC 无限画板”、AI 绘画大模型等,支持设计概念生成、设计融合智能辅助、概念精细化智能调整等功能。

这是一次将生成式AI应用于工业设计概念创意阶段的成功尝试。海尔在设计新产品、升级现有产品以及扩展新型号时显示出了前所未有的灵活性和速度,设计效率得到大幅度提升,设计周期从之前需要几周压缩到了几天内即可完成。

据了解,亚马逊云科技在智造领域还推出了“智能家居及智能产品创新加速计划”,该计划旨在通过技术赋能、资源整合和解决方案指导,加速基于生成式AI的行业应用创新和落地。

再来看游戏领域。在全球游戏行业的舞台上,有越来越多的中国企业创造出了现象级的爆款。亚马逊云科技正在和全球游戏企业利用生成式AI深刻地改变着整个游戏行业价值链的每个环节 :

具体而言,在游戏研发方面,亚马逊云科技提供的无服务器、容器化架构和GameLift服务显著提升了开发效率并降低成本。此外,生成式AI在游戏设计中的应用使得内容创作更加高效,如通过AI辅助设计从原画到游戏动画等环节,同时提升了玩家的个性化体验。在运维领域,生成式AI用于自动后端资源管理、安全数据分析漏洞发现等。在发行和市场增长阶段,生成式AI可以助力游戏社区内容生成、多渠道、多语言玩家UGC的审核和分析,更快地获得市场反馈,大幅提升用户增长效率。全球90%以上的大型游戏公司,和中国头部的游戏公司,都在采用亚马逊云科技的服务。

在5月29日的亚马逊云科技中国峰会上,所思科技CEO罗子雄分享了他和亚马逊云科技合作,最终成功将其多玩家游戏《猛兽派对》推向全球市场的故事。

《猛兽派对》在首发日便吸引了超过10万玩家在线,首周在全球获得了销量第三的成绩。其中,亚马逊云科技的全球基础设施和GameLift服务功不可没。这些服务提供了低延迟的游戏体验和高效的资源扩展能力。此外,所思科技还利用了Amazon FlexMatch进行智能玩家匹配,确保了游戏体验的公平性和连贯性。通过与亚马逊云科技的合作,所思科技不仅优化了游戏的性能,还通过有效的全球数据管理和分析,提升了玩家的整体满意度和参与度。

在当前全球市场中,中国不仅是世界最大的汽车消费国,还成为了最大的汽车出口国。这一地位使中国成为全球汽车创新的竞技场。为了应对国际市场的竞争,降低成本与提升效率成为迫切需求,生成式AI技术也因此成为了关键工具。

亚马逊云科技在这一领域发挥了显著作用,尤其在自动驾驶、智能座舱、数字化用户体验和软件定义汽车等关键技术领域,为企业提供了从数据管理到模型训练的全链条技术支持。这不仅加速了技术迭代和新产品的全球上市,也使企业能在激烈的国际竞争中占得先机。通过这些先进的AI解决方案,中国车企不仅在本土市场保持竞争力,更能有效地拓展国际市场,推动全球业务的增长。

亚马逊云科技深知,真正的创新不仅仅是技术的推进,更在于这些技术如何帮助客户达成其商业目标。在活动峰会现场,储瑞松也同时宣布“亚马逊云科技行业伙伴计划”的启动。“此计划旨在汇聚业界精英,利用我们的云服务和生成式AI技术,共同开发适应未来挑战的行业解决方案,帮助客户引领各自产业的变革。”储瑞松说。

企业构建和应用生成式AI的首选

一项全球调查表明,生成式AI已经经过了各行业、场景的充分验证,进入到飞速扩展和应用的阶段。那该如何将这项技术通过构建企业级应用来发挥它的业务价值?

换句话说,在这场由生成式AI推动的创新浪潮中,亚马逊云科技想要扮演什么角色?

实际上,对于当下这个时代的创业者来说,他们需要的不仅仅是技术支持,更是一种使其快速、低成本地利用生成式AI创新的能力。而诸如亚马逊云科技的Amazon Bedrock服务,能允许创业者灵活选择适合自己业务需求的大模型,如Jurassic-2、Claude3、Amazon Titan、Stable Diffusion等,而不受限于单一模型的局限。同时,亚马逊云科技在安全性方面的严格控制,可以帮助创业者避免因数据泄露或其他安全问题而带来的潜在巨大损失。

此外,亚马逊云科技不仅在基础设施层面提供严格的安全和高可靠性,其平台服务如Amazon SageMaker、EMR和Glue等,更为企业带来了一站式的数据处理和应用开发解决方案。

具体而言,在基础设施层面,亚马逊云科技通过全球分布的数据中心和超低延迟网络确保了服务的高可靠性和安全性;在平台服务层面,亚马逊云科技支持企业从数据整合、处理到分析和模型训练的全过程,使技术实现的复杂度大幅降低,同时加速了产品的上市时间;在应用层面,亚马逊云科技利用其高性能的工具和服务使企业能够发掘数据的潜在价值,快速适应市场变化,并提供定制化的解决方案以满足特定行业需求。例如,通过使用Amazon SageMaker,企业可以不仅仅在建模和训练阶段实现自动化,更能在模型部署和监控过程中享受到持续的优化和支持。

图片

图片来源:5月29日亚马逊云科技中国峰会

说到这里,想必答案已经呼之欲出了:

亚马逊云科技不仅想做一家云服务商,更想扮演中国企业利用生成式AI创新、实现业务出海的战略伙伴,并且在这条关键路径上为主流生成式AI场景提供 “Right tool”(正确的工具),帮助企业降低各环节遇到的门槛。这些场景将涵盖翻译、智能运营、角色扮演、创意写作、智能教辅、智能办公、客户服务、审核风控、智能开发和视频VQA等,可被极广泛的应用于社交、电商、零售、媒体、金融、游戏、制造、汽车等更广泛的行业中。

“凭借过去20年在全球和中国服务众多行业客户的丰富经验,以及生成式AI技术的创新潜力,亚马逊云科技要做的,是成为企业数字化转型和AI创新的加速器。”储瑞松说。

举报

  • 相关推荐
  • 大家在看
  • 麦肯锡全球调查:生成式AI采用开始产生价值

    根据麦肯锡这一领先的管理咨询公司的最新全球调查,投资于GenAI的举措开始为组织创造价值。尽管2023年是GenAI项目投资的一年,但2024年将是从这项新技术中获取商业价值的一年。借鉴这些高绩效者的做法,其他组织也可以学习如何从他们的GenAI投资中获得更多的价值。

  • 中国发布《生成式AI安全基本要求》,涵盖训练数据、生成内容等

    全国网络安全标准化技术委员会在官网发布了,国家标准《网络安全技术生成式人工智能服务安全基本要求》征求意见稿。该意见稿一共分为《网络安全技术生成式人工智能服务安全基本要求-标准文本》、意见汇总处理表和编制说明三大块。我国也是全球为数不多在生成式人工智能领域连续出台安全管理条例的国家,一方面展示了国家对创新变革技术的重视程度,另外保证了�

  • 麻省理工科技评论称:数据是生成式AI的基础

    预训练的大型语言模型如GPT-4和Gemini备受组织关注,他们渴望利用LLM构建聊天机器人、副驾驶等应用。根据麻省理工科技评论的最新报告,名为“C级领导人的AI准备情况”,该报告是代表ETL供应商Fivetran进行的调查发现,将AI或GenAI扩展是82%受访高管的“首要任务”。如果组织不先构建坚实的数据基础,他们的数据科学家将在基本的数据集成和清理工作上浪费时间。

  • 调查显示:生成式AI工具撰写的新闻准确性较低,但更及时

    最近由路透社进行的一项公众意见调查显示,人们对由生成式AI工具撰写的新闻的信任度较低,但这些新闻可能会更及时且成本更低。牛津大学路透新闻研究所委托YouGov在两个主要领域进行调查:确定人们对GenAI的广泛采用情况,以及评估他们对GenAI生成的新闻的看法。”您可以在这里查看完整的调查结果。

  • ChatGPT等生成式AI,在旅游行业非常受欢迎

    5月25日,知名国际管理咨询公司OliverWyman在官网发布了一份,关于ChatGPT、Gemini等生成式AI在旅游行业的应用调查报告。Oliver主要对美国和加拿大的2100名消费者进行了调查,查看他们是如何在旅行过程中使用生成式AI以及满意度。OliverWyman在全球多个国家/地区设有办事处,主要提供战略咨询、企业运营、风险管理、金融投资等服务。

  • ​麦肯锡调查显示:生成式AI应用大中华区增长最快

    据全球顶级咨询公司麦肯锡发布的最新调查报告《hestateofAIinearly2024:GenAIadoptionspikesandstartstogeneratevalue》,显示生成式AI应用正在蓬勃发展。调查结果显示,65%的受访者经常使用生成式AI,这一比例比2023年大幅增长,并且已经开始产生实质性的商业价值,包括降本增效、业务营收增长等。麦肯锡成立于1926年,总部位于美国芝加哥,是全球“管理咨询”的先驱之一,对整个行业的发展产生了深远的影响。

  • 月狐数据发布:2024生成式AI使用趋势报告

    生成式AI技术及产品发展概况人工智能技术奇点降临,搜索成为大模型技术落地的“首站”●过去几十年,人工智能长期鲜有突破性的发展,直至2022年AI大模型技术奇点的出现,使得AI能力发生了颠覆性的变化,人工智能受到了前所未有的关注,用户对大模型技术的兴趣度不断提升。如今AI大模型已进入了企业全面竞争和应用规模化推广的关键时期,各大互联网巨头抢先布局AI产品与生成式AI天然契合的搜索成为了大模型技术最先落地的应用场景●如海外搜索巨头谷歌和微软必应就在今年年初推出基于大模型的AI对话产品,与自身搜索生态融合;国内百度率先通过大模型,对搜索进行重构生成式AI产品普及情况用户渴望拥抱AI但无处可及,需市场推出更多「接地气」的生成式AI产品●用户普遍对于基于大模型技术的AI产品表现出较高的使用兴趣度,但实际生活中有使用AI产品的用户比例仍相对较低,难找到入口、入门流程繁琐、学习成本高是主要的阻碍,反映用户迫切需要企业推出更多使用门槛低、便捷易用的AI产品用户对生成式AI的使用场景需求用户眼中的生成式AI产品:不止是提升效率的工具,更是BUFF叠满的「全能搭子」●见证了AI大模型技术的“神奇魔力”,用户对生成式AI产品的功能和使用场景需求也有了较大的升级,更多用户把生成式AI产品定位为生活管家助手和能聊天交互的亲密伙伴;此外,随着移动互联网的应用场景不断丰富化,用户对于能在泛生活、泛娱乐场景上提供帮助的AI产品表现出了较高的需求度,其中大多数用户最希望AI产品能在日常生活中充当他们的“最强大脑”,能根据用户的问题快速、精准地提供所需的答案和信息用户对生成式AI的使用场景需求用户期望在高频刚需的应用中使用生成式AI功能,AI×搜索存在最广泛的需求综合来看,用户对于搜索应用软件接入生成式AI功能的需求度最高,其次是生活服务、输入法等应用,高频刚需的平台是用户使用生成式AI功能的最重要、最直接的入口;此外,用户对办公商务、教育学习、自媒体等应用接入生成式AI功能的需求度也较高,涉及专业问题解决能力的平台也与生成式AI具备较高的契合度用户对生成式AI的使用场景需求无处不在、全场景覆盖、高度拟人、强创造力等「多边能力」是驱动用户使用生成式AI产品的重要因素调研发现,超85%用户希望能在日常使用较多的应用以及通过多终端设备调用生成式AI功能,80%的用户希望AI产品能够解决生活专业领域问题,75%的用户希望AI产品具备较高的内容创造力,包括生成多种形态、强实时性、创新性、贴合用户个性的内容能力等,70%的用户希望AI产品具备高度拟人化特征,包括支持多形态、多语种对话、提供情感陪伴等互联网巨头生成式AI产品/能力对比各大互联网企业积极搭建AI产品和能力矩阵,百度系AI「使用便捷度」「场景满足度」「拟人化程度」「内容创造力」各项能力相对突出典型企业案例分析百度借移动生态大模型技术落地的完备实力在生成式AI赛道中跑出,引领用户「获取-交互-生产」全场景体验变革典型企业案例分析百度AI产品构建「一站式」「搜创一体」「随身智能」的AI产品矩阵百度系AI产品历经多次迭代,逐渐成为从日常生活到专业领域的全能助手,在生活场景上是能够满足“聊天”“亲子”等娱乐家庭场景需要、提供实时陪伴的亲密伙伴,以更加简短的体验链路为用户提供AI能力;在办公场景上提供“AI办公”“AI兼职赚钱”的一系列能力;在创作场景上,用户可实现绘本、漫画、祝福语等高频刚需的AI生成能力,百度系的AI产品应用矩阵逐渐在场景上实现有效落地典型企业案例分析百度以AI能力赋能搜索,在搜索领域形成智能创作领先优势,为AI搜索概念渗透提供加速度综合国内互联网搜索行业市场占有率在5%以上的主要参与者,我们将各家搜索厂商提供的产品功能进行横向对比,发现百度搜索在智能化方向上形成领跑优势,结合百度搜索的国内市场占有率优势,未来AI能力优势×市占优势或将产生共振,推动AI搜索开启高速增长期典型企业案例分析百度搜索XAI,搜创一体、数字分身大幅度降低AI使用门槛,覆盖用户创作学习场景,极大提升AI技术的传播速度典型企业案例分析百度文库:打通办公学习、家庭教育、兼职赚钱三大场景上的全链路环节,成为一站式AI内容获取与创作平台百度文库正在基于文库本身海量的垂直知识优势,向内容创作全价值链的上下游抢占用户心智,以专业内容获取、跨模态内容生成、自由创作三大优势能力,逐步形成内容创作的“一站式”AI平台典型企业案例分析文心一言APP:从简单问答工具升级为随身全能助手,全面覆盖用户生活和工作场景,兼顾“有用”“有趣”完整体验文心一言APP当前已向智能贴身助手方向持续迭代升级,主打兼具“有求必应”和“专业精深”的助手能力,从用户最为贴近的生活、工作场景出发构建AI能力;当前,文心一言APP月活超过千万,聚集了一批年轻、高线的活跃用户典型企业案例分析百度输入法:AI大模型重构产品体验,打造全场景AI创作助手「超会写」,由“输入工具”转型为“AI创作工具”百度输入法借助文心大模型完成重构,推出的「超会写]功能可以辅助用户在全场景、全平台进行内容创作,拓宽了输入法的能力边界,帮助用户提升沟通、创作的质量和效率,真正实现了“人机共创”。任何未经授权使用本报告的相关商业行为都将违反《中华人民共和国著作权法》和其他法律法规的规定。

  • Google CEO表示,生成式AI对搜索业务不构成威胁

    Alphabet旗下的Google在周二宣布了几项新的生成式人工智能功能,公司表示这项新技术会取代其价值数十亿美元的搜索业务是会增强其功能,提高搜索结果的相关性。Google首执行官SundarPichai表示,目前还不太可能会有任何技术对Google的利润丰厚的现有产品构成胁。Alphabet的股价略有上涨,周二晚上在阿联的交易中,其股价为171.84美元,公司市值达到了2.11万亿美元。

  • 苹果首个生成式AI大模型来了!Apple Intelligence发布

    今天凌晨,苹果首个生成式AI大模型AppleIntelligence正式登场。AppleIntelligence支持自然语言理解,支持在不同应用中分析你的内容和指令,可以自动润色邮件,总结备忘录,也可以实现生成式图片,同时支持文本生图功能,提供素描、插图和动画等多种风格。私有云计算拥有芯片级别的数据保护,所有数据不会被存储,苹果也不可能访问相关数据,保证用户隐私安全。

  • 消息称苹果和OpenAI已达成协议 将生成式AI引入iOS 18

    传闻几个月的苹果与OpenAI洽谈将生成式人工智能功能引入iOS18一事,有了取得进展的消息,长期关注苹果的一名资深记者,透露双方已经达成了协议。根据双方达成的协议,OpenAI将为苹果iOS操作系统的下一次重大更新,提供生成式人工智能聊天机器人功能。苹果官网公布的消息显示,他们2024年度的全球开发者大会,将在当地时间6月10日开始,持续到6月14日,也就是从北京时间6月11日到15日。

  • emo-visual-data:表情包视觉标注数据集

    emo-visual-data 是一个公开的表情包视觉标注数据集,它通过使用 glm-4v 和 step-free-api 项目完成的视觉标注,收集了5329个表情包。这个数据集可以用于训练和测试多模态大模型,对于理解图像内容和文本描述之间的关系具有重要意义。

  • E3Gen:高效、表现力强、可编辑的数字头像生成

    E3Gen是一种新型的数字头像生成方法,能够实时生成高保真度的头像,具有详细的衣物褶皱,并支持多种视角和全身姿势的全面控制,以及属性转移和局部编辑。它通过将3D高斯编码到结构化的2D UV空间中,解决了3D高斯与当前生成流程不兼容的问题,并探索了在涉及多个主体的训练中3D高斯的表现力动画。

  • Surface:使用AI提升表单转化率

    Surface是一个基于AI技术的在线表单构建工具,专为营销和需求生成团队、CRO专家以及领英生成团队设计。它提供了一个无代码表单构建器,能够创建与品牌匹配的多步表单,提升转化率并收集部分响应数据。通过AI技术,Surface可以提高潜在客户的筛选过程,确保用户专注于最有希望的潜在客户。此外,它还提供了强大的入站工作流程自动化,以及2000多个集成选项,帮助用户有效地捕获、培养和转化潜在客户。

  • MotionClone:训练无关的运动克隆,实现可控视频生成

    MotionClone是一个训练无关的框架,允许从参考视频进行运动克隆,以控制文本到视频的生成。它利用时间注意力机制在视频反转中表示参考视频中的运动,并引入了主时间注意力引导来减轻注意力权重中噪声或非常微妙运动的影响。此外,为了协助生成模型合成合理的空间关系并增强其提示跟随能力,提出了一种利用参考视频中的前景粗略位置和原始分类器自由引导特征的位置感知语义引导机制。

  • Leonardo Phoenix:创新的AI基础模型,提供卓越的提示遵循能力。

    Leonardo Phoenix是Leonardo AI平台推出的一款基础模型,它在提示遵循、图像生成清晰度和AI研究方面取得了突破性进展。该模型通过架构创新,提供了更高质量的图像生成,特别是在人像、横幅、海报和标志的文本生成方面表现出色。此外,它还增强了创造性控制,允许用户通过提示增强和AI提示编辑来轻松获取和快速修改生成内容。尽管目前一些功能如图像引导、元素和照片写实尚未集成,但预计将在不久的将来加入。

  • Uizard Autodesigner 2.0:AI驱动的UI设计生成器,快速实现设计和原型制作。

    Autodesigner 2.0是Uizard公司推出的最新版AI UI设计生成器,它结合了ChatGPT的对话流和Uizard的生成设计能力以及拖放编辑器,使用户能够仅通过文本提示实时设计和迭代。该产品通过AI技术简化了UI设计流程,提高了设计效率,尤其适合产品经理、设计师、市场营销人员、初创公司创始人和开发者等不同背景的用户。

  • KREA AI Enhancer:视频和图像增强工具,提升画质清晰度。

    KREA AI - Enhancer 是一款在线视频和图像增强工具,利用AI技术提升视频和图像的清晰度和质量。它通过实时处理,帮助用户改善视觉内容,适用于需要高质量视觉素材的专业人士和爱好者。产品背景信息显示,KREA AI - Enhancer 通过AI算法优化,能够在短时间内提供高质量的输出,是内容创作者和编辑者的理想选择。

  • TwoShot:使用人工智能创作和混音音乐,200,000+样本或自创样本。

    TwoShot是一个在线音乐采样平台,提供超过200,000个音乐样本,用户可以重新想象这些样本或生成自己的音乐样本。它允许音乐制作人和爱好者探索和下载各种风格的音乐样本包,从而丰富他们的音乐创作。TwoShot的背景信息包括其创新的音乐采样技术,以及如何帮助用户在音乐制作中获得灵感和便利。

  • Dream Machine API:使用生成视频的Python脚本。

    Dream Machine API是一个Python脚本,使用Dream Machine API来生成视频,并异步检查视频生成状态,输出最新生成的视频链接。它需要Python 3.7+环境和requests、aiohttp库支持。用户需要登录LumaAI的Dream Machine网站获取access_token以使用该脚本。

  • Captain:自动化内容策略和潜在客户生成工具。

    Captain是一款利用人工智能引擎,无需编码即可创建内容、优化参与度,并实时识别网站访客的商业工具。它通过自动化的方式帮助企业填充销售渠道,提高转化率,从而实现更多的交易。

  • PyjamaHR:AI驱动的招聘软件,简化候选人跟踪流程。

    PyjamaHR是一款AI驱动的招聘软件,旨在简化从候选人源到录用的整个招聘流程。它提供了一个全面的招聘管道和候选人视图,集成了基于LLM的候选人预筛选和评估功能,使人才库更加智能和快速导航。PyjamaHR支持与LinkedIn、Google等20多个平台的集成,确保招聘生态系统的互联互通,提高招聘效率。此外,PyjamaHR还提供了移动应用程序,支持Android和iOS平台,确保用户能够随时随地访问招聘信息。

  • Illustration Generator:AI图像生成器,一键生成专业插图。

    Illustration Generator是Icons8推出的AI图像生成器,由专业艺术家和工程师团队打造。它能够根据用户提供的文本提示或参考图像,生成具有一致艺术风格的插图,满足网页、桌面和移动应用、社交媒体、市场营销等设计需求。AI模型基于Icons8艺术家制作的视觉素材进行训练,确保生成的AI艺术作品具有一致性和专业外观。

  • CoCoClip.AI:一站式AI视频编辑器,为社交媒体视频创作而生。

    CoCoClip.AI是一个专注于社交媒体视频内容创作的AI视频编辑器,提供多种视频生成模板和编辑工具,助力用户快速制作适合YouTube Shorts、TikTok和Instagram Reels的视频内容。它利用先进的AI技术,简化视频制作流程,提高内容的吸引力和传播力,帮助创作者在社交媒体上获得更高的关注度和收益。

  • AI课代表:智能视频学习助手,提升学习效率。

    AI课代表是一款专为视频学习设计的智能插件,利用先进的AI技术,为用户提供视频内容总结、知识问答、字幕搜索等功能。它通过精准的AI分析,帮助用户快速获取视频核心信息,提升学习效率。产品背景基于当前在线教育资源的丰富性以及用户对高效学习工具的需求,定位于辅助用户在B站等视频平台上的学习体验。

  • FontStudio:自适应扩散模型,生成多语言字体效果

    FontStudio是一个创新的字体效果生成模型,它利用自适应扩散技术,能够在不规则的字体形状画布上生成连贯一致的视觉内容。这项技术突破了传统矩形画布的限制,为多语言字体设计提供了新的解决方案。FontStudio系统在用户偏好研究中显示出明显的优势,甚至在与Adobe Firefly等顶尖商业产品比较时,也获得了78%的美学胜出率。

  • Xcode 16: 提供的功能和性能提升助力开发者用比以往更快的速度构建出色的 app,将开发者的生产力标准提升到了全新层次。

    Xcode 16 提供了功能和性能提升,助力开发者以比以往更快的速度构建出色的 app,提升开发者的生产力标准。Xcode 16 带来了全新的预测性代码补齐引擎,使用了专为 Swift 和 Apple SDK 训练的独特模型,为开发者提供编码建议。此外,Xcode 16 还优化了测试环境,让开发者在开始构建 app 的那一刻起,更容易地看到 app 在实际场景中的表现。

  • .NET 9 Preview 5:.NET 9的第五个预览版,包含多项库改进和新功能。

    .NET 9 Preview 5是.NET平台的最新预览版本,它为开发者带来了一系列新的功能和改进。其中包括增强的AI功能、性能优化、对Azure Cosmos DB的增强支持、对Blazor Hybrid模板的更新以及对ASP.NET Core的多项改进。这些更新旨在提高开发效率,增强应用程序的性能和可扩展性。

  • Private Cloud Compute:Apple的云端AI隐私保护技术

    Private Cloud Compute (PCC) 是Apple为保护用户数据隐私而开发的云端智能计算系统。它通过定制的Apple硅芯片和强化的操作系统,为云端AI计算提供了前所未有的安全性架构。PCC的设计满足了无状态计算、可执行保证、无特权运行时访问、不可针对性以及可验证透明度等核心要求,代表了云计算AI安全性的一次重大飞跃。

  • Translation Agent:使用反思工作流的代理翻译模型

    Translation Agent 是一个使用反思工作流的机器翻译演示项目。它由 Andrew Ng 以及合作者开发,主要利用大型语言模型(LLM)进行文本翻译,并反思翻译结果以提出改进建议。该模型的可定制性高,可以调整翻译风格、处理习语和专有名词,以及针对特定地区或方言进行优化。尽管目前该软件还不够成熟,但已经显示出与传统机器翻译系统相比有时更具竞争力的潜力。

  • Moki:美图AI视频短片创作工具,简化视频制作流程。

    Moki是美图公司推出的AI短片创作工具,专注于辅助视频创作者打造动画短片、网文短剧、故事绘本和音乐视频(MV)。基于美图自研的奇想智能大模型(MiracleVision),通过智能剪辑、自动配乐、音效添加和字幕生成等功能,大幅简化视频制作流程,提高创作效率。MOKI深度理解创作者需求,实现内容和成本的双重可控,让视频创作变得更加简单和高效。

今日大家都在搜的词:

热文

  • 3 天
  • 7天