首页 > 业界 > 关键词  > 多模态AI最新资讯  > 正文

2023 年最重要的 3 项人工智能创新:多模态 AI、宪法 AI 和文本转视频技术

2023-12-22 11:39 · 稿源:站长之家

站长之家(ChinaZ.com) 12 月 22 日消息:2023 年,人工智能(AI)领域见证了重大进展,不仅公众对 AI 有了更深的理解,政府也开始认真对待 AI 风险。本年度的发展不仅是新技术和理念的出现,更是长期孕育后的集中爆发。

OpenAI ChatGPT,人工智能,AI

以下是过去一年中人工智能领域最重要的三项创新:

  1. 多模态 AI(Multimodality)多模态 AI 指的是 AI 系统处理各种不同类型数据的能力,不仅包括文本,还包括图像、视频、音频等。今年,公众首次获得了强大的多模态 AI 模型的访问权限。OpenAI 的 GPT-4 是其中的先锋,允许用户上传图像以及文本输入。例如,用户可以基于冰箱内容的照片询问 GPT-4 晚餐应该做什么。9 月,OpenAI 推出了用户通过语音以及文本与 ChatGPT 互动的功能

  2. 宪法 AI(Constitutional AI)宪法 AI 尝试解决如何使 AI 符合人类价值观的难题。2022 年 12 月,顶尖 AI 实验室 Anthropic 的研究人员首次描述了宪法 AI,并在其 2023 年推出的聊天机器人 Claude 中使用了这一技术。该技术的核心是先撰写一份表达期望 AI 遵循的价值观的「宪法」,然后训练 AI 根据宪法评分响应,并激励模型输出得分更高的响应。这是一种 AI 反馈的强化学习方法,与人类反馈的强化学习相比,更精确控制 AI 行为,且需更少的人类标签。

  3. 文本转视频技术文本转视频工具的迅速崛起是今年投入 AI 领域的数十亿美元资金的显著成果。布鲁克林的 AI 视频初创公司 Runway 的最新模型 Gen-2 允许用户不仅根据文本生成视频,还能根据文本提示改变现有视频的风格。此外,另一家初创公司 Pika AI 正在使用其技术每周创建数百万新视频。这些免费工具试图改变用户生成内容的格局,可能在 2024 年发生,但由于文本转视频工具计算成本高,一旦风险资本用尽,它们可能开始收费。

举报

  • 相关推荐
  • 多模态2025:技术路线“神仙打架”,视频生成冲上云霄

    一场大会,聚集了中国多模态大模型的“半壁江山”。 智源大会2025为期两天的论坛中,汇集了学界、创业公司和大厂等三方的热门选手,关于多模态的集中讨论达到了前所未有的热度。其中,创业公司就有爱诗科技、生数科技、Sand.ai、智象未来、Luma AI、智谱等六家公司创始人、CEO分享心得;隶属大厂队的字节、腾讯、百度的多模态技术负责人,以及学术界的人大和MIT(麻省�

  • 寒武纪荣获2025人工智能领域金牛上市公司科创奖

    2025科创金牛奖获奖名单揭晓,寒武纪凭借在人工智能芯片领域的卓越表现,荣获人工智能领域金牛奖。该奖项由中国证券报打造,是中国资本市场最具影响力的奖项之一。寒武纪专注AI芯片研发,提供云边端一体化智能芯片产品和平台化基础系统软件,其通用型智能芯片产品技术壁垒高、应用场景广。2024年公司研发投入达10.72亿元,新增专利授权314项。此次获奖既是对其科技创新成果的肯定,也是对其推动AI技术产业化应用的认可。未来寒武纪将加速产品迭代升级,为我国人工智能产业发展筑牢技术根基。

  • GAITC2025全球人工智能技术大会 | 每日互动方毅:开源大模型+闭源小数据是AI时代的重要路径

    文章探讨了"人工智能"更应称为"人造智能",对应"神造智能"的概念。作者指出AI模拟了神造智慧过程中的规律,人类可从AI身上重新学习"神"的智慧。通过三种棋类游戏分析AI发展:五子棋代表专注规则,深蓝代表深度思考,AlphaGo代表强化学习。数据是AI的重要命脉,需通过可信数据空间转化使用。AI已在交通安全、医疗健康、反诈宣传等领域带来改变,如高速视觉AI检测、脑卒中早筛模型等。未来最重要的是个人知识库和提问能力,人类需学会驾驭AI而非被其取代,2%的人将成为定义问题的深度思考者,98%则是幸福生活者。技术应成为托举大众的方舟而非割裂世界的鸿沟。

  • vivo出席博鳌亚洲论坛国际科技与创新论坛2025年香港会议,让人工智能赋能全民福祉

    6月6日至7日,博鳌亚洲论坛国际科技与创新论坛2025年香港会议在香港会议展览中心举行。vivo副总裁周围出席"从互联网+到人工智能+"分论坛,探讨AI智能化变革趋势。周围指出,AI将成为世界级基础设施,手机作为AI应用的重要载体,是连接技术与普通人的桥梁。vivo将持续深耕手机智能领域,构建大语言模型等核心能力,并推动AI在影像、办公等场景的应用落地。同时vivo将联合汽车、医疗等行业构建智能生态,特别关注无障碍领域的技术普惠。作为论坛战略合作伙伴,vivo将持续分享创新成果,展现中国科技实力与人文温度。

  • “人工智能强化学习可持续发展计划”发布,“教育普惠+标准共建”助力全球人工智能体系构建

    6月11日,第二届"一带一路"科技交流大会人工智能赋能可持续发展论坛在成都举行。腾讯联合多家机构发起"人工智能强化学习可持续发展计划",包含AI教育普惠和强化学习标准共建两大板块。该计划将面向全球高校开放《人工智能通识课》和《人工智能强化学习专业课》教学资源,助力构建高质量AI教学体系。同时,腾讯开悟人工智能全球公开赛颁奖典礼作为"学赛研产"联动的重要环节,吸引了19个国家和地区的近400所高校队伍参赛。2025年赛事将首次联合全国高校计算机能力挑战赛,围绕AI前沿产业真实场景设置赛题。腾讯还通过"青云计划"为全球顶尖AI人才提供就业机会,推动人才与产业高质量发展。北京大学等机构牵头制定了强化学习系统系列技术标准,填补了领域内标准空白。

  • 倍孜网络CEO聂子尧主持虎啸盛典AI论坛并发布《2025中国数字营销行业人工智能应用趋势研究报告》

    本文聚焦AI营销创新,重点呈现了2025虎啸盛典上发布的《中国数字营销行业人工智能应用趋势研究报告》核心内容。报告指出AI营销正从效率工具向价值引擎跃迁,倍孜网络CEO聂子尧提出AI应释放人类潜能而非替代创造力。报告展示了三大趋势:1)技术融合:AIGC+元宇宙+Web3协同创新;2)行业重构:AI深度赋能金融、零售、快消领域;3)战略升级:数据资产化与算法进化。典型案例包括12306智能投放系统提升触达精准度,可口可乐"未来3000年"跨模态营销实现189万次用户互动。报告强调AI营销需警惕"幻觉效应",应通过"模法"建立可持续的智能营销生态。

  • AI触控云台浩瀚V3 Ultra发布,首发AI多模态追踪模块,定义手机云台轻旗舰标准!

    6月6日,浩翰V3 Ultra智能影像稳定器正式发布。作为旗舰级产品,它搭载行业首创AI多模态万物原生跟拍技术,支持10米远程触控彩屏、AI可视化构图、360°无死角跟拍及三轴稳拍等功能。新品采用第九代iSteady增稳系统,折叠后体积小巧便携。配备22英寸触控彩屏,支持5米手势控制和隔空补光功能。售价999元起,同步推出含无线麦克风的创作者套装。浩翰深耕稳定器行业11年,产�

  • 师出有名:华城瑞讯首创人工智能平台 共建数智企服生态

    华城瑞讯创始人高瑞先拜访中国中小企业协会,双方围绕小微企业数智化服务、企服咨询师行业标准建设等议题展开交流。协会成立于2006年,致力于服务中小企业发展。华城瑞讯自主研发的"22°智·企服"Agents系统获高度认可,其融资服务模块可将融资周期缩短60%,成本降低50%。公司计划推出企服咨询师培训计划,建立OMO服务模式,整合银行、律所等专业资源。目前"22°智·融资"Agent已促成近20个千万级融资项目落地,覆盖智能制造、数字科技等领域。未来将共建数智企服新生态,在全国重点城市增设服务空间,助力小微企业在数字经济浪潮中实现跨越式发展。

  • Meta拟百亿美元投资Scale AI,微美全息(WIMI.US)端侧多模态AI加速开启科技新局

    Meta正与AI初创企业Scale AI洽谈数十亿美元投资,估值或超100亿美元,有望创下私营企业融资纪录。Scale AI为微软、OpenAI等提供数据标注服务,是生成式AI热潮主要受益者。这将是Meta史上最大规模外部AI投资,标志其战略转向。Meta CEO扎克伯格宣布将AI确立为战略重心,2024年将投入650亿美元推进相关项目,重点打造Llama模型成为行业标准。同时,谷歌推出Gemini助手"计划操作"新功能,支持任务自动化管理。科技巨头纷纷重金布局AI,微软向OpenAI注资逾130亿美元,亚马逊投资Anthropic数十亿美元。行业观察认为AI技术普及将推动效率革命,微美全息等企业正通过技术创新赋能产业转型,共同探讨人工智能技术突破新动态。AI正以前所未有的速度重塑全球发展格局。

  • 极光GPTBots成功完成“生成式人工智能服务登记”

    极光旗下AI开发平台GPTBots.ai近日在广东省网信部门完成生成式人工智能服务登记,成为合规经营的AI服务提供商。该平台严格遵循国家《互联网信息服务深度合成管理规定》和《生成式人工智能服务管理暂行办法》等法规要求,标志着其在技术创新、服务模式和数据安全等方面获得关键合规认可。此次登记体现了极光对法律法规的严格遵守和对安全责任的高度重视,为区域AI生态发展注入新活力。未来,极光将继续优化技术与服务,保障用户权益,推动生成式AI技术的健康规范发展。