首页 > 业界 > 关键词  > OpenGVLab最新资讯  > 正文

OpenGVLab推出新项目Ask-Anything AI可以陪你边看视频边聊天

2023-04-26 10:02 · 稿源:站长之家

站长之家(ChinaZ.com)4月26日 消息:上海人工智能实验室与商汤科技的联合项目 OpenGVLab 推出了一个名为 Ask-Anything 的新项目,该项目允许用户在观看视频的同时与 AI 聊天。

AI 可以回答有关视频内容的问题,包括有关人物、物体和活动的详细信息。比如你给AI看一段熊猫的视频,它可以准确地回答“熊猫为什么举起它的手”、“熊猫感觉怎么样”这种情绪方面的问题。对于人物的性别、做的运动,AI也是可以轻松拿捏。

1.jpg

据了解,Ask-Anything 结合使用 ChatGPT、miniGPT4和 StableLM 来理解和解释视频内容。用户可以将视频上传到平台,然后向 AI 询问有关视频内容的问题。

人工智能可以回答有关视频中的人物、物体和活动的问题,并提供额外的信息和上下文。

目前,Ask-Anything 仍处于早期开发阶段,但它有潜力成为以更具互动性和身临其境的方式参与视频内容的强大工具。

Ask-Anything是一个创新项目,展示了人工智能以更自然和直观的方式与用户互动的潜力。它还展示了人工智能在理解和解释视频内容方面不断增强的能力。

该项目可以有广泛的应用,从娱乐和教育到客户服务和支持。随着AI的不断进步,我们可以期待看到更多像 Ask-Anything这样的项目,它们会突破这项技术的可能性。

体验地址:https://106.14.223.212:7860/

举报

  • 相关推荐
  • 邀Labubu进「中国朋友圈」,库克需要新引擎

    这是《窄播Weekly》的第69期,本期我们关注的商业动态是:苹果公司CEO库克本周的「中国行」,更明确地展示了苹果拥抱新流量、新渠道,更积极争取年轻用户的决心。 从2011年接替乔布斯成为苹果的新一任CEO开始,库克几乎每年都会为自己安排来中国的行程。这些行程的细节变化也成为外界观察和分析苹果公司在华市场策略变化的重要窗口。以往库克的中国行程,都会由门店�

  • Zen7 Labs 开源全球首个去中心化支付智能体(DePA),打造下一代AI Agent 金融基础设施

    随着AI Agent经济崛起,支付成为制约智能体自主交易的关键瓶颈。Zen7Labs提出去中心化支付智能体DePA概念,并开源核心产品Zen7 Payment Agent。该方案具备原生多链兼容、免密授权、零托管安全等六大优势,通过四类Agent角色协同实现全流程自动化支付,有效融合传统跨境支付与加密支付优势。团队计划12个月内推出DePA Chain网络,构建低延迟、高安全的支付基础设施,为万亿美元级A

  • 贝克汉姆为买LABUBU从澳门逛到上海 网友:巨星也得靠运气

    近日,全球知名球星大卫·贝克汉姆因追购潮玩LABUBU引发广泛关注。这位足坛传奇人物被网友目击在澳门与上海两地的泡泡玛特门店频繁现身,只为求购这款身高不足十厘米的潮流玩具。据现场目击者描述,贝克汉姆身着休闲装,在货架前专注翻找的身影与绿茵场上叱咤风云的形象形成鲜明反差。 据悉,贝克汉姆为此次“跨城寻娃”行动颇费周折。他先是在澳门多家门店搜寻�

  • AI日报:OpenAI发布浏览器Atlas;通义Qwen3-VL新增2B、32B两个模型尺寸;百川发布循环证据增强大模型

    本文汇总AI领域最新动态:OpenAI推出集成ChatGPT的Atlas浏览器,实现多任务自主处理;阿里通义千问新增2B/32B视觉语言模型,手机可流畅运行;谷歌AI Studio升级Vibe Coding功能,简化应用开发流程;百川发布医疗大模型M2Plus,通过循证推理降低误诊率;奇瑞墨甲机器人实现L3级技术突破,计划多行业应用;YouTube推出AI肖像识别工具,打击虚假内容;三星宣布2026年推出AI眼镜,融合AR与语音助手;Claude客户端更新,支持截图分析和语音交互功能。

  • 免费AI搜索优化GEO工具:AIBase帮你监控品牌在AI平台的曝光

    朋友公司实验发现:当用户询问AI“推荐项目管理工具”时,其产品在豆包被推荐,但在通义千问未被提及。这揭示AI搜索流量正从Google转移,但品牌难以追踪在AI平台的表现。传统分析工具无法解决此问题,需专门GEO工具。AIBase GEO可同时监控5大主流AI平台,实时反馈品牌曝光数据,并通过可视化图表展示可见度变化。该工具特别适合关注AI搜索流量的ToB企业,建议将监控与内容优化形成闭环,以应对2030年AI搜索预计占总量62.2%的趋势。

  • OpenAI推出AI浏览器ChatGPT Atlas 开启个性化上网新体验

    OpenAI于10月22日推出首款AI驱动浏览器ChatGPT Atlas,以个性化上网体验为核心。用户点击“Ask ChatGPT”即可在侧边栏实时互动,实现网页摘要生成、航班预订、文档编辑等多样化任务。目前仅支持macOS,未来将扩展至Windows和移动端。高级代理功能暂限付费用户使用,其特色包括自动捕捉页面上下文、分屏浏览及记忆用户操作历史,旨在通过自然对话提升网络使用效率。

  • ROBOT PHONE登场:荣耀为AI终端开了自进化的未来新局

    ​十年前,AI还停留在算力、模型与数据此消彼长的层面。如今,技术的发展早已超乎想象。 2025年上半年,Google DeepMind重磅推出的AlphaEvolve揭示了一个重要趋势:AI开始拥有“自我成长”的能力。 AlphaEvolve是一种典型的“自进化系统”,它结合了Gemini模型的创造性问题解决能力,以及自动化评估器(Evaluator)的反馈学习机制,能够判断“什么是好的”,并据此不断自我优化。 �

  • 1.3亿美元!LiblibAI拿下国内最大AI应用融资

    2025年AI应用公司LiblibAI完成1.3亿美元B轮融资,由红杉中国等机构领投,创国内AI应用赛道最大单笔融资。该公司通过“工具集成+社区生态”模式,整合图像、视频、3D等多模态能力,覆盖从灵感到成片的完整AI工作流,已孵化超2000万创作者。平台将加速全球化布局,打造多模态内容生态,标志着AI投资正从底层模型转向应用层落地。

  • 三星Galaxy AI:以用户需求为中心,不断突破移动体验上限

    三星正通过Galaxy AI技术将人工智能深度融入移动体验,以Galaxy S25系列和Z Fold7折叠屏手机为载体,突破智能手机能力边界。核心功能包括:即圈即搜彻底颠覆传统搜索模式,绘图助手实现智能图像创作,生成式编辑简化照片视频处理,转录助手自动生成会议纪要。借助端侧算力保障流畅体验,通过Knox加密技术守护隐私安全,让用户在工作、生活和创作中实现无缝切换。

  • AI日报:LiblibAI 2.0正式上线;通义千问、豆包开启记忆功能;Sora已登陆Google Play

    本期AI日报聚焦多项重要进展:LiblibAI 2.0上线,内置多模型并提供限时免费算力;通义千问和豆包开启记忆功能内测;OpenAI视频生成应用Sora登陆Google Play并开放北美预注册;Qoder推出提示词增强功能提升开发效率;Cherry Studio集成主流AI模型并推出优惠活动;港中文团队推出首个结构化图像生成系统;DeepSeek入选2025全球十大工程成就。这些突破展示了AI技术快速迭代与多领域应用�

今日大家都在搜的词: