首页 > 业界 > 关键词  > AI发展最新资讯  > 正文

VC谈2024年AI发展趋势年:多模态模型主导、GPU短缺等

2023-12-28 10:14 · 稿源:站长之家

**划重点:**

1. 🔄 **多模态模型崛起:** 预测AI产品将以多模态检索和推理为中心,覆盖语音、视频、音频、代码等各领域。

2. 🌐 **开源AI民主化:** 预计更多大型科技公司将在2024年发布开源模型,推动AI的民主化进程。

3. 💻 **GPU短缺持续:** VC们认为GPU供应短缺将持续,但存在解决方案,同时预测苹果和谷歌将在2024年推出重大AI创新。

站长之家(ChinaZ.com) 12月28日 消息:随着2023年的结束,VC们对过去一年围绕人工智能的巨大进展和伦理辩论进行了回顾。像Bing Chat和Google Bard这样的聊天机器人展示了令人印象深刻的自然语言能力,而生成式AI模型如DALL-E3和MidJourney V6则以其创造性的图像生成引起了轰动。

然而,人们对AI潜在危害也提出了担忧。欧盟的标志性AI法案试图限制技术的某些用途,拜登政府也发布了有关其发展的指导方针。

AI写作 人工智能

图源备注:图片由AI生成,图片授权服务商Midjourney

多模态模型主导AI产品

在2024年,VC们预测多模态检索和推理将成为AI产品的核心。目前,AI产品主要以文本为主,但用户更希望具有更多表现力的软件,覆盖语音、视频、音频、代码等各个模态。他们认为,如果能在规模上使这些架构运作,将能解锁提供更准确和人性化结果的软件,从绘制答案到以您的语调和声音打电话,甚至通过与其他AI和人类实体的协作实现正确结果。

开源AI的民主化

VC们预测在2024年将发布更多的开源模型,特别是预计大型科技公司将成为主要贡献者之一。这些模型可能涉及公司如特斯拉、优步、Lyft等,甚至可能衍生为独立公司并获得大额融资。

GPU短缺:持续问题还是暂时挫折?

对于GPU供应短缺,VC们存在不同观点。有人认为2024年将是实时扩散应用的一年,而其他人认为GPU供应将持续短缺。有人提出一个反常的看法,认为最终将不再有GPU短缺,市场将趋于几个大买家和供应商,Nvidia等公司将扩大规模以满足预测的需求。

苹果和谷歌:沉睡的巨头?

VC们认为2024年将迎来苹果的重大发布,甚至可能推出他们自己的生成式预训练(GPT)模型。谷歌也备受关注,其在Gemini项目上的巨额投资以及无与伦比的数据和计算资源将为开发人员提供各种规模的GPT-4+能力,推动所有基础模型提供商的前沿。这或许将改变不仅仅是现有模型,还可能影响美国对监管的看法。

为长期AI转变做准备

对于那些在过去一年涉足AI的人来说,他们将在2024年离开时了解什么是芯片组。随着摩尔定律的局限,我们将看到新的架构范例的出现,不仅包括新的核心半导体架构,如芯片组,还包括先进的封装和互连技术。边缘到云或“混合AI”整合了智能手机、笔记本电脑、车辆和物联网设备等云和边缘设备,具有性能、个性化、隐私和安全方面的优势。

调查显示,尽管对于AI的风险和时间表存在不同看法,但大多数人一致认为,2024年将是人工智能的决定性一年。VC们的预测和洞见涵盖了从生成式AI到GPU短缺、AI监管、气候变化应用等各个方面,为AI的未来描绘了一幅丰富多彩的图景。

举报

  • 相关推荐
  • AI日报:阿里推多模态模型Qwen3-Omni;谷歌推出AP2协议;百度推出Qianfan-VL 模型

    本期AI日报聚焦多领域技术突破:阿里云推出全球首个全模态AI模型Qwen3-Omni,支持文本、图像、音频和视频统一处理;百度发布多尺寸视觉理解模型Qianfan-VL,优化企业级应用。苹果扩展Image Playground平台,引入ChatGPT等第三方模型。谷歌与PayPal合作推出AP2协议,推动AI支付安全创新。钉钉上线AI表格助手,支持自然语言生成表格。DeepSeek开源V3.1-Terminus模型,性能显著提升。Kimi推出Agent会员服务,智元机器人开源全球首个通用具身智能模型GO-1,降低技术门槛促进行业创新。

  • 小度发布多模态智能摄像机,AI大模型重塑家庭看护体验

    小度科技推出首款多模态智能摄像机C800,搭载800万像素4K超清摄像头,支持AI大模型技术。该产品不仅能实现高清监控,还具备智能行为识别、语音交互等功能,可自定义看护提醒。结合视觉与语音交互,支持复杂语义查询和家庭设备联动,扩展智能家居应用场景。目前产品已全网发售,年底还将推出三摄版本,持续探索AI硬件创新。

  • 云栖大会智舱黑科技:全球首个全模态端侧大模型解决方案,斑马智行首发

    9月24日,2025云栖大会在杭州开幕,主题为“云智一体·碳硅共生”,汇聚全球50多国2000余位嘉宾探讨AI、云计算与产业应用趋势。阿里云发布7款通义大模型,其中Qwen3-Omni作为行业首个端到端全模态AI大模型,在36项基准测试中实现22项SOTA,性能全面突破。大会聚焦多模态技术,斑马智行宣布率先接入Qwen3-Omni,并与阿里云、高通联合推出端到端全模态端侧大模型方案Auto+Omni,具备主动智能、断网可用、隐私无忧三大特点,推动汽车智能座舱从指令交互向Always-on主动服务升级。首批搭载方案车型将于2026年量产,标志着汽车智能化迈入“自主行动”新阶段。大会将持续至26日,预计更多创新技术将亮相。

  • 复星国际郭广昌:复星已迈进退守平衡新阶段,AI + 创新驱动高质量发展

    复星国际2024年业绩报告显示,总收入1921.42亿元,同比微降3.06%;归母净亏损43.49亿元,主要受菜鸟项目账面价值调整影响,一次性非现金损失51亿元。若剔除该因素,归母净利润为7.5亿元。公司持续优化资产结构,三年退出非核心资产约750亿元,聚焦创新与全球化布局,尤其重视AI技术应用,提升运营效率。未来将深耕核心业务,目标五年内产业运营利润提升至100亿元左右。

  • AI日报:可灵AI发布数字人新功能;腾讯混元新技术给大模型 “去油”;抖音上线AI求真功能

    AI日报今日聚焦多项技术突破:可灵AI推出图片转视频功能,腾讯混元SRPO技术提升图像真实感,IBM开源文档处理模型Granite-Docling-258M。Meta发布带屏AI眼镜Ray-Ban,DeepSeek论文登《Nature》封面。OpenAI新增GPT-5思考时长调节功能,抖音上线“AI求真”辟谣工具,通用DeepResearch开源模型性能超越国际知名模型。

  • 热AI无限,剧力生长:2025北京文化论坛“微短剧专业沙龙”共话科技内容融合的高质量发展

    2025年9月24日,北京文化论坛“热AI无限,剧力生长:微短剧内容与技术创新沙龙”在京举办。论坛聚焦AI赋能微短剧发展,探讨技术如何推动内容创新、产业升级与国际化传播。百度启动“AI星河计划”,通过资源扶持与生态共建,助力创作者成长。行业专家指出,微短剧正从爆发式增长转向高质量“精耕细作”,需平衡商业与艺术价值,突破同质化挑战。活动还围绕内容精品化、跨界融合等议题展开讨论,旨在推动微短剧成为文化与科技融合的重要载体,构建可持续发展新生态。

  • AI日报:接入MJ!夸克发布造点AI;Wan2.5-Preview发布;可灵推最新视频生成模型可灵2.5Turbo

    近日AI领域迎来多项重要更新:阿里夸克发布AI创作平台“造点”,整合通义万相Wan2.5与Midjourney V7,支持音画同步视频生成;Wan2.5-Preview实现多模态输入与电影级视频同步生成,提升视觉创作能力;可灵AI推出视频生成模型2.5Turbo并降价30%,降低使用门槛;阿里通义推出Qwen3-ASR-Toolkit,实现小时级音视频转录;谷歌相册AI编辑功能扩展至安卓用户,支持语音修图;谷歌Mixboard工具助力创意设计,生成情绪板;Qwen发布Qwen3-Max模型,在代码生成与智能体能力表现突出;Figma推出MCP服务器,实现设计到代码的一键转换,提升开发效率。

  • 拓展外贸发展新局面,30余家央媒聚焦雅迪国际发展之路

    中宣部组织调研团队深入高端制造企业,实地考察雅迪科技集团等代表企业,聚焦科技创新、产业升级和国际竞争力。通过参观生产线、座谈交流,全面了解企业在智能制造、海外市场拓展及知识产权保护等方面的实践成果。调研旨在宣传我国稳外贸、稳外资政策成效,推动高水平对外开放,鼓励更多企业走高质量发展道路,增强国际竞争力。

  • AI日报:生数科技推出Vidu Q2;火山引擎推出炉米Lumi;通义千问开源300+模型

    本文汇总了近期AI领域多项重要进展:生数科技推出Vidu Q2模型,显著提升视频生成中细微表情的真实感;火山引擎发布炉米Lumi平台,支持视觉模型LoRA微调以定制独特风格;阿里云通义千问开源超300个模型,下载量突破6亿次;百度开源多模态视觉理解模型Qianfan-VL,适配不同场景需求;微软在Copilot中引入Anthropic模型,拓展AI助手功能;OpenAI计划在美国新建五个数据中心以加速Stargate项目;英伟达开源Audio2Face模型,提升实时面部动画生成效果;Meta发布具备沙箱推演能力的32B代码世界模型CWM,优化代码调试效率。这些动态展示了AI技术在视觉、多模态、开源生态及硬件支持等方面的快速迭代与创新突破。

  • AI日报:美团发布推理大模型LongCat-Flash-Thinking;阿里Wan-Animate开源;字节推豆包翻译大模型

    AI日报栏目聚焦人工智能领域最新动态。美团推出高性能推理大模型LongCat-Flash-Thinking;阿里开源Wan-Animate模型革新AI视频生成;字节跳动发布豆包翻译模型,支持28种语言互译;华为与浙大联合推出安全大模型DeepSeek-R1-Safe;阿里云即将发布跨模态模型Qwen3-Omni;xAI推出计算成本降低98%的Grok4Fast模型;YouTube发布多项AI创作辅助功能;IBM推出轻量级文档处理模型Granite-Docling-258M;中科院发布类脑大模型SpikingBrain实现百倍速度突破;OpenAI将推出仅限Pro用户的计算密集型新功能。

今日大家都在搜的词: