首页 > 业界 > 关键词  > 大模型最新资讯  > 正文

字节大模型新进展:引入视觉定位,实现细粒度多模态联合理解,已开源&demo可玩

2023-08-15 20:05 · 稿源: 新智元公众号

字节大模型,BuboGPT来了。支持文本、图像、音频三种模态,做到细粒度的多模态联合理解。答哪指哪,什么讲了什么没讲,一目了然:除了有“慧眼”,还有“聪耳”。人类都注意不到的细节BuboGPT能听到:Audio-1-chime-bird-breeze,量子位,20秒前方高能!三模态联合理解,文字描述+图像

......

本文由站长之家合作伙伴自媒体作者“新智元公众号”授权发布于站长之家平台,本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间,为了保证文章信息的及时性,内容观点的准确性,平台将不提供完全的内容展现,本页面内容仅为平台搜索索引使用。需阅读完整内容的用户,请查看原文,获取内容详情。

举报

  • 相关推荐
  • 字节跳动否认将推手机产品:探索把自己的AI能力开放给硬件厂商

    字节跳动否认年底推出自有手机产品传闻,表示专注于AI大模型技术开发,为手机厂商提供基于大模型的软件解决方案,推动智能交互和个性化推荐功能,旨在改善用户体验并促进行业发展。

  • 三星年底推出XR新品头显,字节跳动/微美全息加速MR眼镜布局卡位争夺先机

    三星确认将于2023年下半年推出三折折叠智能手机与XR头显组合设备,搭载Android XR系统,配备Micro OLED/OLEDoS显示屏,支持90Hz刷新率和眼动追踪功能。字节跳动旗下PICO公司正开发代号"Project P"的MR头显,直接对标Meta计划2027年推出的旗舰产品"Phoenix"。微美全息(WIMI.US)作为AR领域重要参与者,通过技术研发和生态合作持续强化竞争力。行业分析指出,XR设备正朝着轻量化方向发展,分体式设计可能成为未来主流趋势,市场竞争格局正在重塑。

  • 王宁掏出迷你版LABUBU

    “这周就要发布Mini版LABUBU,以前可能大家是挂在包上,可能从下周开始,大家甚至可以挂在手机上,它的使用场景会更多,相信它会是一个超级受欢迎的爆款。” 8月20日,在泡泡玛特2025年中期业绩发布会上,泡泡玛特董事长兼CEO王宁化身“带货博主”,从胸前西装口袋中拿出了一个Mini版LABUBU介绍道。 这款即将登场的 Mini 版 LABUBU 仅有掌心大小,延续了LABUBU标志性的搪胶毛�

  • 印度女子误将Labubu当神明供奉 网友调侃:Labubu正式封神了!

    日,印度一名女子误把中国人气玩偶Labubu当神明供奉,还献上供品,引发网友热议。 据悉,这段视频最初由网友上传至TikTok与X,附文写道:一个印度女孩告诉妈妈,Labubu是中国神明,结果妈妈立刻开始供奉。” 视频中可以看到,女子拿起Labubu玩偶,对着神坛进行传统祈祷仪式,还向玩偶献上水果供品。 有的网友觉得十分搞笑,调侃道:Labubu 正式封神了!”

  • OpenAI的开源模型现已在IBM watsonx.ai上提供

    OpenAI发布两款开源AI模型GPT-OSS-120B和GPT-OSS-20B,允许开发者自由下载、运行和定制。其中120B模型已部署在IBM Watsonx.ai平台,采用专家混合架构,支持本地或云端部署,不受商业用途限制。模型具备高透明度,输出完整推理链,在多项基准测试中表现优异。此次发布标志着OpenAI首次加入开源生态,IBM强调其开放战略,为企业提供灵活、安全的AI开发选择。

  • 泡泡玛特王宁:本周将发布迷你版LABUBU

    昨日,泡泡玛特公布了其2025年中期业绩报告,数据显示,报告期内公司收益高达138.76亿元,与去年同期相比增长了204.4%,业绩表现十分亮眼。 在今日举行的泡泡玛特2025年中期业绩会上,创始人兼CEO王宁对公司未来发展充满信心。他透露,原本公司希望今年营收能够达到200亿,但就目前情况来看,实现300亿的营收目标也颇为轻松。

  • 2025年大模型选型核心指南:Beyond GPT-4,如何理性评估Qwen、DeepSeek等强者?

    大模型选择能力已成为AI时代企业核心竞争力。文章提出“能力-成本-场景”三维评估框架,强调需超越单一指标崇拜,基于客观数据和实际需求进行理性选择。通过Qwen2-Plus与DeepSeek-V3的对比分析,展示不同模型在特定场景下的差异化优势。建议企业建立科学选型流程,采用专业工具进行多维度评估,通过三阶段验证策略确保决策既数据驱动又经实践检验。最终目标是选择最适合业务场景的模型,而非盲目追求流行模型。

  • 大厂盯上AI玩具,你的下一个LABUBU可能出自阿里

    在2025年下半年,大厂的AI争夺战已经卷到了玩具上。 前有OpenAI宣布与玩具巨头美泰合作,后有马斯克推出AI伴侣,如今,京东更是大张旗鼓地要涉足AI玩具赛道。

  • 智检未来 触手可及——CASIVIBOT工业质检机器人震撼发布

    8月19日,中科慧远发布首款工业具身质检机器人CASIVIBOT,以“具身智能”为核心,融合人类质检经验与AI技术,实现灵活操作与高效检测。该机器人采用“手-眼-脑”协同架构,支持多行业复杂场景应用,具备快速部署和持续进化能力,旨在推动工业质检智能化升级,提升检测效率与灵活性。

  • 豆包1.5 Vision Lite 对比 GPT-5-min,谁更适合你?实测AI模型选型利器|AIBase

    文章探讨了企业选择AI大模型时面临的实际决策难题,指出单纯比较学术参数无法满足业务需求。AIBase模型对比平台(https://model.aibase.cn/compare)通过三大核心价值解决痛点:1)聚焦业务场景而非参数堆砌,突出价格、语言支持、上下文长度等实用维度;2)透明化成本计算,标注长文本溢价规则和多模态附加费;3)一键生成对比报告。平台特别强调中文场景的特殊性(如豆包1.5在中文处理成本的优势),并揭示厂商宣传中容易忽略的隐藏成本(如GPT-5-min超5000字符的30%溢价)。典型电商客服案例显示,需综合中文理解、多模态、性价比等维度决策,最终选择取决于具体业务需求而非绝对性能排名。

今日大家都在搜的词: