首页 > 业界 > 关键词  > 生成式AI最新资讯  > 正文

麻省理工科技评论称:数据是生成式AI的基础

2024-05-31 09:28 · 稿源:站长之家

划重点:

- 💡 预训练的大型语言模型(LLM)如 GPT-4和 Gemini 很棒,但真正的竞争优势来自将 LLM 与私有数据相结合。

- 💡 组织在连接 GenAI 并在需要时、以适当格式、清洁和准备充分地向 GenAI 应用程序提供数据方面准备得如何,存在疑问。

- 💡82% 的调查对象表示,扩展 AI 或 GenAI 是他们的首要任务,83% 的组织已经确定了要用于 AI 或 GenAI 的数据来源。

站长之家(ChinaZ.com)5月31日 消息:预训练的大型语言模型(LLM)如 GPT-4和 Gemini 备受组织关注,他们渴望利用 LLM 构建聊天机器人、副驾驶等应用。根据麻省理工科技评论的最新报告,名为 “C 级领导人的 AI 准备情况”,该报告是代表 ETL 供应商 Fivetran 进行的调查发现,将 AI 或 GenAI 扩展是82% 受访高管的 “首要任务”。

机器人 人工智能 AI

图源备注:图片由AI生成,图片授权服务商Midjourney

调查发现,83% 的组织已经确定了要用于 AI 或 GenAI 的数据来源。但是,组织在实际连接 GenAI 并在需要时、以适当格式、清洁和准备充分地向 GenAI 应用程序提供数据方面准备得如何,存在疑问。同时还需要确保不会危及隐私或安全。

报告指出,平均来说,组织需要 “超过十几种不同的技术来收集关于其数据的所有智能信息,相同数量的技术来集成、转换和复制数据”,这带来了巨大的困难。由于过去为中心化数据仓库项目开发的数据集成和 ETL 工具可能不适合新的 GenAI 用例,因此获取更好的数据集成和 ETL / 数据管道工具显然是一项重要任务。

此外,调查发现,虽然64% 的调查对象表示数据集成和 ETL / 管道工具是其前两个 GenAI 投资重点之一,但35% 的人将数据湖视为优先事项,而31% 的人将数据转换工具视为优先事项。数据目录和 LLM 投资的份额仅为7%,而矢量数据库和计算层位于中间位置。组织在构建数据基础时面临着许多挑战,包括数据集成和构建数据管道、数据治理和安全以及数据质量等问题。

调查还发现,组织在数据治理、合规和报告方面存在诸多挑战。大量调查对象指出,准备数据供 AI 使用的最大挑战是数据治理和安全(44% 的受访者提到),以及数据集成或管道(45% 的受访者提到)。然而,深入调查数据却显示了一种明显的分歧。特别是,调查显示,对安全和治理的积极关注主要集中在政府和金融服务机构,而在制造业、零售业和其他行业的科技高管中,对安全和治理的担忧并没有同样的比例。

“组织可能无法控制某人在业务应用程序中使用数据并将其发送给生成式 AI 模型。这些都是重要的问题。” 调查报告引述 IDC 的 Bond 在报告中说道。建立强大的数据基础是 GenAI 成功的前提条件。如果组织不先构建坚实的数据基础,他们的数据科学家将在基本的数据集成和清理工作上浪费时间。

举报

  • 相关推荐
  • AI最新资讯在哪里看?AIbase:高效获取国内外AI新闻头条与行业动态

    文章探讨了AI时代信息过载的困境:有价值的前沿动态、重磅模型发布和行业解读分散各处,筛选成本高、效率低下。AIbase资讯导航站应运而生,通过四大核心功能解决痛点:1)聚合主流信源,过滤低质噪音;2)结构化分类呈现大模型动态、行业应用等六大板块;3)提炼核心要点,拒绝标题党;4)高频更新确保信息鲜度。该平台致力于成为AI领域的"信息雷达",帮助用户节省70%信息搜集时间,将精力聚焦于思考与创造。适用于技术负责人快速掌握行业动态、产品经理调研案例、投资人捕捉趋势等多元场景。

  • 客流易AI功能上线!一键生成开店选址和客流统计分析报告!

    客易APP推出AI选址功能,基于海量时空数据与智能算法,为创业者提供精准开店位置评估。该功能通过深度分析客流量、消费能力、周边业态等多维度数据,生成详细选址报告,帮助用户从经验决策升级为智能决策,提升开店成功率与商业价值。

  • 如何用3分钟精准计算AI大模型成本?避免生成一篇万字文章就超支?

    AI大模型成本控制指南:实测三步预算法+企业级避坑方案。文章揭露行业痛点:1)价格迷雾:各厂商计费规则差异大,长文本/多模态存在隐藏溢价;2)团队实测GPT-4生成20篇行业分析(50万字)实际账单超预算4倍。解决方案:通过AIbase计算器实现精准预测:①场景化选择自动加载计费规则;②输入需求实时生成动态成本矩阵;③智能规避四大隐性成本(长文本衰减补偿/区域差价预警等)。跨境电商案例显示,使用工具后成本降低60%。核心观点:在AI时代,成本控制能力已成为企业核心竞争力。

  • B站要变成AI站

    互联网平台都在跟AI结合,B站没有成为例外。从新一季度财报来看,B站的AI味儿也越来越浓了。 8月21日,B站公布第二季度业绩,总营收达73.4亿元人民币,同比增长20%。其中,游戏业务收入为16.1亿元,同比增长60%,广告业务收入为24.5亿元,同比增长20%。由此推动B站毛利率从去年同期的29.9%提升至36.5%,调整后净利润达到5.6亿元,创下历史最好成绩。 从整体来看,B站生态集聚

  • 专家盛赞GEO双引擎系统:生成式引擎优化以旋律诠释自身

    GEO双引擎系统主题曲《GEO双引擎系统之歌》开创了技术主题音乐创作先河,通过独特艺术形式诠释生成式引擎优化技术内核。该作品由汤祎飞创立的GEO系统创新生成,融合科技与艺术边界,获科技界、产业界和学术界广泛关注。多位顶级专家盛赞其开创性价值,认为该曲有效突破技术传播壁垒,为产业生态提供了兼具深度与温度的认知桥梁。歌曲以"双引擎驱动未来"为�

  • AI日报:阿里开源Qwen-Image-Edit;淘宝“AI万能搜”功能灰度测试;小红书发布DynamicFace人脸生成技术

    本期AI日报聚焦多项AI领域创新:1)阿里开源Qwen-Image-Edit图像编辑模型,支持中文渲染与精准文本编辑;2)淘宝测试"AI万能搜"功能,重构电商搜索体验;3)小红书发布DynamicFace人脸生成技术,实现高质量图像视频换脸;4)Gemini API新增URL Context功能,简化网页内容获取流程;5)Nvidia推出小型开放模型Nemotron-Nano-9B-v2,支持智能推理开关;6)马斯克发布Grok Imagine 0.1测试版,进军AI图像生成领域;7)Vercel推出iOS版AI开发工具v0;8)理想汽车发布MindGPT 3.1模型,处理速度提升5倍;9)ToonComposer工具简化动画制作流程;10)ElevenLabs推出视频到音乐生成流程。

  • 将AI大模型费用计算器作为战略工具:企业如何规避AI项目的成本陷阱

    AI项目规模化应用面临不可预测的运营成本挑战,尤其是大模型API调用费用难以精准预测,导致项目ROI计算失效。成本失控源于计费维度复杂、价格变动频繁及用户行为影响。领先企业通过成本管控前移,在项目可行性分析阶段引入AIbase等成本计算工具,实现成本可视化,支持技术选型和预算建模,从被动应对转向主动管理,提升AI应用的经济性和可持续竞争力。

  • AI火花集|AI火花先锋添新力,拆解保险、客服、物联网AI落地实战

    AI正加速渗透产业,2025年全球AI投资预计达2000亿美元,年增长近翻倍。保险、电商客服、智能家居成为落地先锋。暖哇科技、云起未来、蜂助手分别聚焦保险理赔自动化、电商智能客服、5G+AI物联网,通过实战方案推动AI从概念验证走向规模化应用。面临数据价值陷阱、流通壁垒等挑战,企业需构建专业知识库并优化人机协同。未来AI将深入产业毛细血管,汇聚零散创新火花,�

  • 都是做AI应用,为什么「美图」能持续让用户付费

    这是《窄播Weekly》的第65期,本期我们关注的商业动态是:美图抓住AI带来的战略机遇,让付费订阅收入实现了连续增长,超过广告业务成为主要营收支柱。 美团在8月18日发布的最新一份财报显示,其2025年上半年总收入为18亿元,经调整归母净利润为4.7亿元,同比增长71.3%。其中,以付费订阅为主的影像与设计产品业务收入达到13.5亿元,同比增长45.2%,占总收入的74%。 这背后是

  • 400亿美图,靠AI重生了

    今年以来股价暴涨超255%,市值重回400多亿,美图(1357.HK)这家老牌影像工具公司,在被资本市场遗忘多年后,正以一种极为凶猛的姿态重返牌桌。 在AIGC(生成式人工智能)千帆竞发、百模大战仍在烧钱换未来的混沌格局中,美图是将滚烫的AI概念,真正熬成了一碗利润浓汤的企业。半年净赚近4个亿、付费用户突破1500万的业绩,无疑证明它饮到了这波AI应用大爆发的“头啖汤

今日大家都在搜的词: