首页 > 业界 > 关键词  > CaptioningAI最新资讯  > 正文

LG 推出 Captioning AI 的生成式 AI 服务:像人类一样为图像生成描述和关键字

2023-06-20 10:07 · 稿源:站长之家

站长之家(ChinaZ.com) 6月20日消息:LG 发布了一款名为 Captioning AI 的生成式 AI 服务,该服务可以识别图像中的元素并生成描述和关键词,引发了对这家韩国企业如何影响市场的期望,因为生成式 AI 服务(如 ChatGPT)正在推动变革。

LG

LG AI 研究部门在周日(当地时间)在加拿大温哥华举行的全球最大计算机视觉会议「计算机视觉与模式识别 2023」上发布了 Captioning AI 服务。

LG 表示,该服务基于 LG AI 研究部门的 Zero-shot Image Captioning 技术,这是一种使 AI 能够通过先前的经验和知识理解和描述它第一次看到的对象或场景的技术,就像人类一样。

该公司解释说,Captioning AI 与 Midjourney 等 AI 服务不同,后者需要用户输入文本或插入图像文件,然后 AI 绘制图片。

LG 公司的一位发言人表示:「字幕看起来很简单,因为这是一个古老的概念,但将生成式 AI 技术应用于字幕的想法是,AI 具有对其以前没有见过的图像进行推理的视觉智能。例如,它可以观察图像中的风景或人物,并推断出位置。

研究人员表示,Captioning AI 可以在不到两天的时间内为 1 万张图像生成文本描述和关键词,这可以提高需要管理大量图像的公司的工作效率和生产力。

该服务是通过与 Shutterstock 的合作实现的,Shutterstock 是包括图像和视频在内的全球最大的视觉内容平台。LG AI 研究与这家总部位于美国的公司合作,后者在图像捕捉方面拥有丰富的专业知识。

双方还在确保版权透明性和验证 AI 伦理方面进行了合作,例如 AI 在学习图像时是否以有偏见的方式收集数据等问题。

LG AI 研究的 Vision Lab 负责人 Kim Seung-hwan 表示:「为了在图像捕捉领域确立全球研究领导地位,我们计划通过与各种合作伙伴建立有机合作关系,持续开发新的度量标准并研究新技术。」

在会议期间,LG 集团旗下的子公司,如 LG AI 研究、LG 电子、LG Innotek、LG Energy Solution 和 LG UPlus,举办了 LG AI Day,这是一次针对研究生的招聘活动。

举报

  • 相关推荐
  • Meta调整薪酬结构:为聚焦人工智能 员工股权激励缩水5%

    为给巨额人工智能投入腾出资金,Meta正推进新一轮成本控制措施,包括将数万名员工的股权激励缩减5%。这是该公司连续第二年削减员工薪酬。去年已削减股票期权分配约10%,此次再下调5%。扎克伯格正加大AI领域投入,希望与OpenAI、谷歌等对手竞逐前沿模型开发,同时安抚尚未看到AI投资回报的投资者。他还在其他业务领域持续裁员,今年1月就在持续亏损的元宇宙部门裁减约1500个岗位。不过知情人士透露,尽管股权激励普遍下调,Meta今年仍在改革绩效考核体系,为业绩优异者提供更丰厚奖励。这意味着公司整体薪酬预算并未下降,而是进行了结构性调整。一名员工表示,考虑到当前科技行业就业市场不景气,而Meta薪酬水平仍然具备竞争力,员工大概率不会因这一变化而选择离职。

  • AI日报:美团Tabbit浏览器开启公测;通义发布语音双模型;Notion 引入首个开源权重模型 MiniMax M2.5

    本期AI日报聚焦多领域AI新动态:美团旗下Tabbit浏览器公测,集成多模型AI Agent,实现网页自动化执行;阿里通义发布语音双模型,支持自然语言控制音色与场景;Notion引入开源模型MiniMax M2.5,打破闭源垄断,提升性价比;谷歌升级Flow AI工具,整合视频、绘画与特效功能;阿里巴巴AI品牌统一更名为“千问”,强化战略聚焦;三星宣布2030年迈向“AI工厂”,以Agentic AI驱动全链路自治;OpenAI疑似收购顶级域名GPT.com,巩固品牌地位;北京大学与OceanBase打造LoVR基准,入选WWW 2026,开启全视频智能检索新模式。

  • 百惠金控:金融创科迎新局 港股人工智能IPO受热捧

    接近农历,港股市场交易气氛依然炽热。百惠金控观察到,科创板块已成为带动大市上行的核心引擎,尤其是人工智能(AI)相关股份持续受资金青睐,板块热度持续攀升。香港特区政府财政司司长近日表示,香港作为国际金融中心,将凭借“金融联动创科”的效应乘势而上,进一步放大香港的制度优势。市场对科创板块的积极情绪,在年初新股表现中得以充分印证。2026年1月2

  • 大厂入局引爆AI漫剧,第一批跳槽的人工资涨10倍?

    十万成本,四天时间,换来亿级曝光。 去年秋天,AI漫剧《洪荒:代管截教,忽悠出了一堆圣人》首播,爆了。89集,没有真人演员,没有实景拍摄,全部由算法逐帧生成,风格在动态漫画与动画之间。 《洪荒》制作方是酱油文化,商务负责人叫颜四海,他觉得”这个行业好像产生了一个风口”。投放开始一天只有20万,2025年底飙到2000万,2026年1月中旬过3000万。 颜四海说,�

  • 微软AI CEO:未来18个月大量白领工作将被人工智能取代 这些职位先遭殃

    在当下这个AI快速普及的时代,每个人或多或少都会有一些AI替代焦虑症。微软AICEO的最新表态,进一步加深了这种焦虑。苏莱曼的核心使命是实现AI超级智能,助力微软实现人工智能自给自足,减少对OpenAI的依赖,优先建设公司的独立基础模型。

  • 华为3月服务日今天开启:手机免费贴膜、维修免人工费

    华为3月服务日今天正式开启,时间为3月6日至3月8日。 据悉,华为的服务日为每月第一个连续的周五至周日(如遇周末跨月,则顺延至下一个周末)。 华为用户在活动期间到店可享免费贴膜、维修免人工费等专属权益。 除此之外,到店购买保障服务产品、个性贴膜等,享建议零售价8.8折优惠。 维修设备未能当日修复,到店取机时可获赠精美礼品或享免费寄回服务。

  • “涨听版”来了:TicNote Pods金融投研版发布

    出门问问发布全球首款4G+AI录音耳机TicNote+Pods中国版。该产品内置4G模块与“Shadow AI”双引擎,摆脱对手机和Wi-Fi的依赖,实现独立联网与AI处理。它支持双通道录音,适用于线上线下混合会议场景,并能通过云端协作构建个人及团队知识库。同时,公司与金融AI应用Alpha派合作推出金融投研版“涨听”,将独立AI能力注入投研场景,开启“独立AI终端”新纪元。

  • 支持普通话、英语和粤语零样本歌声合成,Soul App 联合吉利汽车研究院人工智能中心(AIC)、天津大学及西北工业大学开源SoulX-Singer

    过去一年,生成式AI在音乐行业不断创造新体验,但歌唱语音合成(SVS)领域进展相对缓慢。为拓展这一领域,Soul AI Lab联合吉利汽车研究院人工智能中心、天津大学视听认知计算团队和西北工业大学音频语音与语言处理研究组,正式开源歌声合成模型SoulX-Singer。这是一个面向真实应用场景设计的高质量零样本歌声合成模型,基于超过42000小时训练数据,覆盖多语言、多音色及多种演唱风格,在稳定性、可控性与泛化能力方面均达到当前开源SVS模型中的领先水平。

  • 北电数智“数算模用”:AI破局行业痛点,在政策指引下开启智能医疗新篇

    文章探讨了医疗健康行业向高质量发展转型的关键阶段,指出临床大数据存在“难汇聚、难挖掘、难流通”的痛点,制约了行业从经验驱动向数据驱动的跨越。国家层面出台多项政策支持医疗数智化发展,明确推进临床大数据标准化集成应用,强化医疗数据要素价值释放,鼓励AI技术与医疗行业深度融合。北电数智凭借在可信数据领域的技术积累,以“数算模用”全栈布局为核心,构建了从数据要素激活到应用落地的完整闭环。其“樱智医助”等产品已投入临床并获良好反馈,显著提升诊疗效率与质量。未来,北电数智将持续深化合作,推进医疗AI底座标准化建设与国产化适配,探索临床大数据服务新范式,完善“人机协同”临床决策体系,推动医疗行业从“经验医学”全面迈向“智能医学”。

  • 个人开发者做了年入5000万美元的AI App,今天被同赛道No. 1收购

    全球最大的卡路里追踪平台 MyFitnessPal 正式宣布,已完成对后起之秀 Cal AI 的收购。 CalAI,这个由高中生 Zach Yadegari 发起的创业项目也迎来阶段性的结局,收购后,产品仍将独立运营,Zach Yadegari 在内7名成员均将加入 MyFitnessPal。(可参见我们的置顶文章《17岁高中生做AI App,不到4个月入账百万美元,独立开发者迎来春天?》) 虽然收购金额尚未披露,但结合 Cal AI 的漂亮数据表

今日大家都在搜的词: