首页 > 业界 > 关键词  > AI发展最新资讯  > 正文

VC谈2024年AI发展趋势年:多模态模型主导、GPU短缺等

2023-12-28 10:14 · 稿源:站长之家

**划重点:**

1. 🔄 **多模态模型崛起:** 预测AI产品将以多模态检索和推理为中心,覆盖语音、视频、音频、代码等各领域。

2. 🌐 **开源AI民主化:** 预计更多大型科技公司将在2024年发布开源模型,推动AI的民主化进程。

3. 💻 **GPU短缺持续:** VC们认为GPU供应短缺将持续,但存在解决方案,同时预测苹果和谷歌将在2024年推出重大AI创新。

站长之家(ChinaZ.com) 12月28日 消息:随着2023年的结束,VC们对过去一年围绕人工智能的巨大进展和伦理辩论进行了回顾。像Bing Chat和Google Bard这样的聊天机器人展示了令人印象深刻的自然语言能力,而生成式AI模型如DALL-E3和MidJourney V6则以其创造性的图像生成引起了轰动。

然而,人们对AI潜在危害也提出了担忧。欧盟的标志性AI法案试图限制技术的某些用途,拜登政府也发布了有关其发展的指导方针。

AI写作 人工智能

图源备注:图片由AI生成,图片授权服务商Midjourney

多模态模型主导AI产品

在2024年,VC们预测多模态检索和推理将成为AI产品的核心。目前,AI产品主要以文本为主,但用户更希望具有更多表现力的软件,覆盖语音、视频、音频、代码等各个模态。他们认为,如果能在规模上使这些架构运作,将能解锁提供更准确和人性化结果的软件,从绘制答案到以您的语调和声音打电话,甚至通过与其他AI和人类实体的协作实现正确结果。

开源AI的民主化

VC们预测在2024年将发布更多的开源模型,特别是预计大型科技公司将成为主要贡献者之一。这些模型可能涉及公司如特斯拉、优步、Lyft等,甚至可能衍生为独立公司并获得大额融资。

GPU短缺:持续问题还是暂时挫折?

对于GPU供应短缺,VC们存在不同观点。有人认为2024年将是实时扩散应用的一年,而其他人认为GPU供应将持续短缺。有人提出一个反常的看法,认为最终将不再有GPU短缺,市场将趋于几个大买家和供应商,Nvidia等公司将扩大规模以满足预测的需求。

苹果和谷歌:沉睡的巨头?

VC们认为2024年将迎来苹果的重大发布,甚至可能推出他们自己的生成式预训练(GPT)模型。谷歌也备受关注,其在Gemini项目上的巨额投资以及无与伦比的数据和计算资源将为开发人员提供各种规模的GPT-4+能力,推动所有基础模型提供商的前沿。这或许将改变不仅仅是现有模型,还可能影响美国对监管的看法。

为长期AI转变做准备

对于那些在过去一年涉足AI的人来说,他们将在2024年离开时了解什么是芯片组。随着摩尔定律的局限,我们将看到新的架构范例的出现,不仅包括新的核心半导体架构,如芯片组,还包括先进的封装和互连技术。边缘到云或“混合AI”整合了智能手机、笔记本电脑、车辆和物联网设备等云和边缘设备,具有性能、个性化、隐私和安全方面的优势。

调查显示,尽管对于AI的风险和时间表存在不同看法,但大多数人一致认为,2024年将是人工智能的决定性一年。VC们的预测和洞见涵盖了从生成式AI到GPU短缺、AI监管、气候变化应用等各个方面,为AI的未来描绘了一幅丰富多彩的图景。

举报

  • 相关推荐
  • 大家在看
  • 2024年是硅负极电池爆发!徐起:骁龙8 Gen4旗舰升级新趋势

    骁龙8Gen4将成为2024年安卓高端旗舰的标配,今天,realme徐起发微博表示,2024年高端旗舰的三大升级趋势分别是硅负极电池、8TLTPO屏幕、AI大模型。其中最受关注的是新一代硅基负极电池,此前有博主爆料,OPPO、vivo旗下多款高端旗舰都将配备6000mAh以上超大容量硅基负极电池,大幅提升手机续航。接下来登场的真我GT7Pro也将会配备新一代硅基负极电池,续航能力将会有大幅进步。

  • 2024年最建议关注的激光电视品牌

    随着科技不断向前推进,高新尖技术在国家推动下不断走向人们的生活中,“国家队”成员纷纷带着行业顶尖技术,点亮国产本土品牌之光。还记得2022年冬奥会闭幕式上那朵巨大的“雪花”么?作为国家级专精特新“小巨人“企业,从中国科学院理化技术研究所走出来的中科极光,由中国工程院院士许祖彦院士和中科院理化所应用激光研究中心主任毕勇博士带领,带着显示行业的工业级创新技术——三色真激光,投入家用产品研发,推出激光电视,开启全新的电视投影体验。中科极光提供专业的售后团队,工程师免费上门安装调试,让您售后也无忧。

  • 海外VPS招募代理,2024年便宜海外VPS推荐

    对经营Web托管、越南服务器、虚拟主机有兴趣的伙伴,请勿错过TotHost的代理计划。搜索国外独立主机、VPS云主机、海外VPS主机等关键字时,您可能会看到这家TotHost排名非常靠前,TotHost是一家位于越南河内的海外VPS服务商,非常注重中国市场,是本地服务支持非常到位的一家海外VPS服务商。在客户对VPS追求便宜、速度快、稳定的三角时,TotHost试图做到平衡,独具特色的中文客服支持,允许通过telegram和微信等方式与官方进行沟通,支付方式支持usdt和支付宝,这些服务都是海外VPS服务商的天花板,目前,越来越多的代理商选择成为TotHost海外VPS的合作伙伴,若您有兴趣了解更多,可通过官网的邮件、电话、微信与客服进行联系。

  • 多模态模型再进化,已学会看图玩扑克、算“12点”

    在科技领域,多模态模型的决策能力一直是研究的热点。UC伯克利等高校的研究团队提出了一种名为RL4VLM的全新强化学习框架,成功地提升了多模态大模型在决策任务上的表现。这项研究不仅为多模态模型的性能提升提供了新的思路,也为未来人工智能的发展开辟了新的可能性。

  • 2024年了为何还推荐购买特斯拉 博主:纯电里保有量最大

    都2024年了,为何还要推荐购买特斯拉?这是一个非常有趣的话题。值得一提的是,博主本人还是三辆特斯拉的持有者,可以说是特斯拉的忠实粉丝,之所以要买这么多,按照他的说法就是因为特斯拉的单踏板天下第一,是精华中的精华。

  • 爱同在丨重庆百货2024年公益关爱计划

    【爱同在】重庆百货2024年公益关爱计划正式开启。主办单位丨重庆市残疾人福利基金会、重庆市渝中区残疾人联合会、共青团重庆市渝中区委员会承办单位丨重庆百货、兰卓丽共创单位丨旮旯剧场、怪兽部落、光谱公益、重庆市启聪学校、渝中区山城时光文化公益发展中心让爱心不断传递,让温暖陪伴童年成长,我们用真诚的情感连接世界,用爱传递温暖。我们看起来不太一样,但我们都在热爱、探索、感知,并勇敢面对人生大大小小的命题第二次体验-蒙眼探索联合旮旯剧场探索未知活动蒙住双眼,感受肢体让我,走出我之外走出身体,散落在宇宙在黑暗中,寻找自己的光芒用感受丈量世界活动时间:5月23日14:30-17:00活动地点:10F至美生活馆第三次体验共创绘图联合光谱公益,共创6m巨型公益海报城市助力人齐聚,借由绘图所产生的交流是更开放和愉悦的彼此理解、彼此照见,相互拥抱,共同分享,我们邀请现场公益助力人、小朋友共创一幅6米巨型公益海报制作一张惊艳、又富有力量的作品。

  • 2024年国内免费在线AI创作小说网站推荐

    随着人工智能技术的飞速发展,AI创作小说网站如雨后春笋般涌现,为广大文学爱好者提供了一个全新的创作平台。这些平台利用先进的AI算法,帮助作者激发灵感,生成创意,甚至完成整部小说的创作。在2024年,国内涌现出许多优秀的免费在线AI创作小说网站,本文将为您推荐几个值得一试的平台。1. 笔神AI创作笔神AI创作是一个集创意激发、故事生成、角色构建于一体的综合

  • 2024年国际阿尔茨海默病及相关病学术大会在广州召开,诚邀您的加入!

    人口老龄化使痴呆发生率在我国乃至全球范围内快速增长,其中阿尔茨海默病是引起痴呆最常见的病因之一。AD是进行性发展的神经变性疾病,能够导致患者认知损伤和人格改变,严重威胁其寿命和生活质量,早诊、早治对于阻止其病情发展、改善患者生活质量极为重要。现诚挚邀请各大科研服务机构、医院、研究所和高校科研人员共同出席本次大会,届时将会有邀请到100行业知名的学术专家、100企业单位、1500高校学生出席,多场专题论坛共同探讨学术经验和最新科研课题,携手促进阿尔兹海默病的研究和技术发展,推进临床应用研究水平与科技成果转化。

  • 近10低谷 2024年5月票房出炉:《末路狂花钱》夺冠

    据灯塔专业版,截至5月31日21时,2024年5月票房达29.44亿。5月票房前3名分别为:1、《末路狂花钱》7.25亿《末路狂花钱》由乌日娜执导并担任编剧,由贾冰、谭卓、小沈阳、于洋、董宝石领衔主演。讲述了中国维和警察防暴队在海外执行任务的故事。

  • 6款AI大模型2024年高考作文,哪家能拿高分?

    2024年全国高考今日正式拉开大幕,全国有1342万考生奔赴考场,报考人数再创历史新高。今天上午进行语文统考科目的测试,其中高考作文题历年来都是最受瞩目的热点。

  • LibreChat.ai:一站式AI聊天平台,自由定制,支持多种AI服务。

    LibreChat是一个免费、开源的AI聊天平台,提供广泛的定制选项,支持众多AI提供商、服务和集成。它以熟悉的界面,创新的增强功能,服务于所有AI对话,满足您所需的用户数量。

  • Genspark:AI代理引擎,提供个性化信息搜索体验。

    Genspark是一个AI代理引擎,它通过一个多代理框架提供个性化的信息搜索体验。与传统搜索引擎不同,Genspark的AI代理能够实时生成新的、定制的Sparkpages页面,直接满足用户的查询需求,从多个相关来源综合内容,提供高质量、无偏见的信息。

  • ShareGPT4Video:提升视频理解和生成的AI模型。

    ShareGPT4Video系列旨在通过密集且精确的字幕来促进大型视频-语言模型(LVLMs)的视频理解以及文本到视频模型(T2VMs)的视频生成。该系列包括:1) ShareGPT4Video,40K GPT4V注释的密集视频字幕,通过精心设计的数据过滤和注释策略开发而成。2) ShareCaptioner-Video,一个高效且功能强大的任意视频字幕模型,由其注释的4.8M高质量美学视频。3) ShareGPT4Video-8B,一个简单但卓越的LVLM,其在三个先进的视频基准测试中达到了最佳性能。

  • PixelProse:大规模图像描述数据集,提供超过16M的合成图像描述。

    PixelProse是一个由tomg-group-umd创建的大规模数据集,它利用先进的视觉-语言模型Gemini 1.0 Pro Vision生成了超过1600万个详细的图像描述。这个数据集对于开发和改进图像到文本的转换技术具有重要意义,可以用于图像描述生成、视觉问答等任务。

  • GPTCommit:自动化生成Git提交信息的脚本工具。

    GPTCommit是一个利用OpenAI的GPT-4o模型来分析代码变更并自动生成提交信息的自动化Git提交工具。它简化了代码提交流程,通过智能分析代码变更,快速生成合适的提交信息,提高开发效率。

  • DeepFuze:革命性深度学习工具,用于面部转换和视频生成。

    DeepFuze是与ComfyUI无缝集成的先进深度学习工具,用于革新面部转换、lipsyncing、视频生成、声音克隆和lipsync翻译。利用先进的算法,DeepFuze使用户能够以无与伦比的真实性结合音频和视频,确保完美的面部动作同步。这一创新解决方案非常适合内容创作者、动画师、开发者以及任何希望以先进的AI驱动功能提升其视频编辑项目的人士。

  • TikTok Symphony:创意AI套件,简化TikTok内容创作。

    TikTok Symphony是一个由生成性AI驱动的全新创意解决方案套件,旨在简化营销人员和创作者在TikTok上的内容创作旅程。通过将人类想象力与AI驱动的效率相结合,TikTok Symphony使各种规模的企业、创作者和代理机构能够提升内容创作水平,提高生产力,并发现有价值的洞察。

  • Moatless Tools:使用大型语言模型编辑大型代码库的工具。

    Moatless Tools 是一个业余项目,作者在这里尝试一些关于如何使用大型语言模型(LLMs)来编辑大型现有代码库的想法。项目认为,构建好工具以插入正确的上下文到提示中并处理响应,比依赖代理推理解决方案更为关键。

  • CogiDigm:创新AI技术,引领数字艺术未来。

    CogiDigm利用GenAI技术革新娱乐产业的叙事方式,包括电影制片厂、后期制作和广告代理公司。我们拥有尖端技术,成为行业领跑者。我们与FBRC.ai和AILA合作,提供视频生成和操作服务,释放创造力。我们的理念是采用以人为本的集体智能方法,提供广泛的服务,包括创新的GenAI解决方案、道德的AI模型实施、专业的技术指导、战略咨询和无缝部署专业知识。

  • Flash Diffusion:快速生成高质量图像的扩散模型

    Flash Diffusion 是一种高效的图像生成模型,通过少步骤生成高质量的图像,适用于多种图像处理任务,如文本到图像、修复、超分辨率等。该模型在 COCO2014 和 COCO2017 数据集上达到了最先进的性能,同时训练时间少,参数数量少。

  • Pizi:快速将照片转化为产品页面

    Pizi是一个创新的应用程序,它允许用户通过简单的拍照将照片快速转化为产品页面,极大地节省了创建产品页面所需的时间和精力。它通过优化照片和描述,旨在提高转化率,同时无需专业设备或人员,节省成本。Pizi还具备SEO功能,能够提高产品页面的搜索引擎可见性。

  • Seio:快速创建SEO优化文章,提升在线业务影响力

    Seio是一个SEO内容创作工具,它允许用户在几分钟内从关键词创建SEO优化的文章,帮助企业提升在线影响力。它提供了强大的自助产品和增长分析功能,以及团队共享的收件箱,以确保团队协作的高效性。Seio还提供了AI驱动的编辑器和多平台发布功能,以及与Zapier集成的自动化SEO流程。此外,Seio提供全天候的客服支持,帮助用户解决问题。

  • Accorata:AI驱动的早期投资项目发现平台

    Accorata是一个面向早期投资者的AI驱动的项目发现平台,旨在通过快速筛选全球前种子期和种子期初创企业来简化早期项目源的获取。平台通过集成的甲板处理器、AI增强的创始人尽职调查和符合最严格欧洲数据保护标准的主权技术,为投资者提供快速、深入的分析和筛选服务。

  • Callin AI:AI驱动的语音助手,提升企业客户服务效率。

    Callin AI提供一系列AI语音助手,旨在通过自动化客户对话来增强企业的成长。这些助手可以处理来电和去电,提供24/7的客户服务,并且可以根据企业的具体需求进行定制。Callin AI利用最新的语音识别和自然语言处理技术,帮助企业提高客户满意度,减少等待时间,并扩大服务能力。

  • Agent Mode:AI时代的命令行助手

    Agent Mode是Warp AI的一个特性,它允许用户使用自然语言在终端中完成多步骤工作流程。它能够识别和解释自然语言指令,提供环境特定的指导,并引导用户完成多步骤任务。Agent Mode利用OpenAI的API,但不会存储或保留用户的输入或输出数据。

  • Epipheo AI:AI视频生成器,快速创建专业解说视频。

    Epipheo AI是一个强大的通用人工智能工具,能够轻松生成专业的解说视频。它具有直观的界面和先进的算法,使用户能够在几分钟内创建吸引人的视频。Epipheo AI提供多种高质量的语音选项,确保信息传达清晰有效,增强观众参与度和专业性。此外,它还提供AI生成的变体,用于快速迭代和分享,确保视频不仅满足而且超出预期,具有高效率和易用性。

  • ComfyUI-LuminaWrapper:一个用于Lumina模型的Python包装器

    ComfyUI-LuminaWrapper是一个开源的Python包装器,用于简化Lumina模型的加载和使用。它支持自定义节点和工作流,使得开发者能够更便捷地集成Lumina模型到自己的项目中。该插件主要面向希望在Python环境中使用Lumina模型进行深度学习或机器学习的开发者。

  • Safe Superintelligence Inc.:构建安全的超级智能

    Safe Superintelligence Inc. 是一家专注于构建安全超级智能(SSI)的公司,由 OpenAI 联合创始人兼前首席科学家 Ilya Sutskever 创办,其将安全置于“商业压力”之上。该公司认为SSI是当前时代最重要的技术问题,并致力于通过革命性的工程和科学突破来解决这一问题。公司的目标是快速提升智能能力,同时确保安全始终领先。其商业模式确保了安全性、安全性和进步不受短期商业压力的影响。

  • Tele-FLM:52B参数的开源多语言大型语言模型

    Tele-FLM(亦称FLM-2)是一个52亿参数的开源多语言大型语言模型,具有稳定高效的预训练范式和增强的事实判断能力。基于解码器仅变换器架构,已在大约2T的token上进行训练。Tele-FLM在同等规模上展现出优越的性能,有时甚至超越了更大的模型。除了分享模型权重外,我们还提供了核心设计、工程实践和训练细节,期待它们对学术界和工业界社区都有所裨益。

  • ChatFLM:智能聊天助手,提供高效交流体验。

    ChatFLM是一款基于FLM技术的智能聊天模型,旨在为用户提供流畅且智能的对话体验。该模型通过先进的自然语言处理技术,能够理解用户意图并生成合适的回复,适用于多种交流场景。

今日大家都在搜的词: