首页 > 业界 > 关键词  > 谷歌最新资讯  > 正文

1/10体量达到SOTA!谷歌发布5B参数视觉语言模型PaLI-3,更小更快却更强

2023-10-28 10:01 · 稿源: 新智元公众号

谷歌研究院和DeepMind研究人员推出最新PaLI-3视觉语言模型(VLM),模型以更小、更快、更强的特点获得大部分研究人员青睐,在诸多任务中达到SOTA。最近,堪称改变游戏规则的视觉语言模型(VLM)PaLI-3问世,引得大量科研人员关注。PaLI-3是谷歌最新推出的视觉语言模型,以更小的体

......

本文由站长之家合作伙伴自媒体作者“新智元公众号”授权发布于站长之家平台,本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间,为了保证文章信息的及时性,内容观点的准确性,平台将不提供完全的内容展现,本页面内容仅为平台搜索索引使用。需阅读完整内容的用户,请查看原文,获取内容详情。

举报

  • 相关推荐
  • AI日报:快手推出AI视频制作助手Kwali;字节跳动推出USO模型;OpenAI推出ChatGPT开发者模式

    本文介绍了AI日报栏目,聚焦AI领域最新动态。快手推出Kwali视频助手,简化视频制作流程;字节跳动发布USO模型,解决图像生成中风格与主题的矛盾;微软推出Copilot Audio音频模式,提供个性化语音交互;Stability AI升级Stable Audio 2.5,支持高质量音频生成;阿联酋推出开源大模型K2 Think,拥有320亿参数;微信上线智能回复功能,提升公众号运营效率;OpenAI推出ChatGPT开发者模式,支持AI控制外部工具;字节跳动Seed团队发布AgentGym-RL框架,提升语言模型决策能力;月之暗面开源Checkpoint Engine中间件,优化LLM推理效率;B站开源IndexTTS-2.0文本转语音系统,支持情感与时长控制;Replit推出Agent 3编程助手,自主性提升10倍。

  • 安卓平板性能天花板!荣耀MagicPad3 Pro首发第五代骁龙8至尊版

    日前,数码博主数码闲聊站”爆料称,荣耀MagicPad3 Pro基本确定是平板端首发骁龙8 Elite Gen5处理器(第五代骁龙8至尊版)。 该博主透露,荣耀MagicPad3 Pro将采用13.3英寸LCD超高刷大屏,电池容量将破万,预计将和荣耀Magic8系列一起发布。 从配置来看,荣耀MagicPad3 Pro是要冲击高端的节奏。

  • 从新闻联播点赞到人机大战取胜!时空壶W4Pro硬核功能横扫跨语言场景

    时空壶W4Pro+AI同传耳机通过先进AI技术解决跨语言沟通难题,支持42种语言即时互译,翻译延迟仅3-5秒。在商务谈判、展会等场景中表现出色,具备抗噪能力强、续航持久等特点,显著提升跨国交流效率,成为企业拓展国际市场的可靠工具。

  • 华为MatePad mini今日首销:3299元起

    今日上午10:08,华为年度旗舰平板MatePad Mini正式开启首销,起售价定为3299元。这款被誉为“大手机 小平板”的8.8英寸设备,凭借其独特定位与全能配置,成为今年平板市场中最受瞩目的新品之一。 MatePad Mini的最大亮点在于其突破性支持5G插卡功能,并内置听筒可实现通话,官方在发布会上直言其“手机平板二合一”的跨界属性。整机厚度仅5.1毫米,重量仅255克,轻薄设计便于

  • iPad mini对比完败!华为MatePad Mini明天发布 价格曝光 或3999元起

    明天华为要举行新品发布会,除了新的三折叠屏手机外,还有MatePad Mini。 现在,有博主曝光了华为MatePad Mini不同内存版本的价格,具体来说:12GB 256GB售价为3999元;12GB 512GB售价为4499元;12GB 512GB柔光版售价为4999元。 汇总之前曝光的消息,华为MatePad Mini将推出多个版本,包括标准版、柔光版(配备防眩光屏幕,适合手写笔创作)、插卡版(支持5G网络和通话功能)、read版”(�

  • 2025光博会直击:从AR碳化硅到VR Pancake,歌尔光学13款新品亮相

    歌尔光学在2025年光博会上展示了新一代XR光学技术,重点包括AR衍射光波导和VR/MR Pancake方案。AR方面推出碳化硅光波导F30Se,实现高色彩均匀性和轻薄设计;同时推出0.2cc全彩光引擎+衍射光波导方案,兼顾成本与性能。VR/MR领域推出单眼4K Pancake方案,覆盖高端头显和便携设备需求。此外还展示了三色激光投影仪、车载光学及工业视觉解决方案,体现多领域技术延伸。

  • 视觉中国「灵感拓展」功能完成生成式AI服务上线登记

    视觉中国旗下中华易美视觉科技公司推出的“灵感拓展”功能已通过江苏省网信办生成式人工智能服务上线登记,正式在VCG.com面向用户开放。该功能基于国产大模型,结合丰富内容资源,通过AI技术为创作者提供灵感和方向,提升创意产出效率与质量。用户可在搜索时获得智能拆解的多维度创作建议,帮助精准定位需求,突破创作瓶颈,优化素材匹配效率。该功能是视觉中国在“AI智能+内容数据+应用场景”战略下的重要成果,目前已面向合作客户开放。

  • 时空壶W4Pro:商务跨语言场景的高效沟通解决方案

    时空壶W4Pro+AI同传耳机通过优化技术与功能设计,支持40种语言及93种口音的即时互译,翻译延迟控制在3-5秒,实现类似母语对话的流畅交流。适用于面对面商务洽谈、跨国展会等场景,提供稳定精准的跨语言沟通支持,并具备电话同传、视频会议字幕翻译等功能,成为商务人士打破语言壁垒的核心工具。

  • 小平板元年,华为MatePad Mini创出一片蓝海

    2012年,天才乔布斯去世一年后,接任苹果CEO的库克捧出了两款“很不乔布斯”的产品——大屏手机iPhone6和7英寸的iPad mini。 这两款差异化的产品形态,都是库克希望弥补的市场空白。比如,虽然乔布斯认为10英寸就是平板电脑尺寸的下限,更小的屏幕会让用户难以操控。但库克却觉得,小尺寸平板不仅在硬件配置上超越手机,它还具备易于携带的特点,将成为移动办公的利器�

  • OpenAI发布语音模型GPT-realtim:具备情感感知能力 多语言无缝切换

    OpenAI正式发布语音模型GPT-realtime。 据介绍,GPT-realtime是一款专注于语音AI Agent的多模态模型,能够生成高度自然流畅的语音,精准还原人类语调、情感和语速的丰富变化。该模型支持图像理解,并可结合语音或文本对话使用,非常适合应用于客服、教育、金融、医疗等领域,用于构建高质量的语音智能体。 官方表示,新模型在复杂指令遵循、工具精确调用以及生成更自然、�

今日大家都在搜的词: