首页 > 业界 > 关键词  > 字节最新资讯  > 正文

字节发布视觉基础模型ViTamin,多项任务实现SOTA,入选CVPR2024

2024-04-27 12:01 · 稿源: 量子位公众号

视觉语言模型屡屡出现新突破,但ViT仍是图像编码器的首选网络结构。字节提出新基础模型——ViTamin,专为视觉语言时代设计。在使用相同的数据集和训练方案时,ViTamin在ImageNet零样本准确率上比ViT提高了2.0%。此外在分类、检索、开放词汇检测和分割、多模态大语言模型等60个不同

......

本文由站长之家合作伙伴自媒体作者“量子位公众号”授权发布于站长之家平台,本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间,为了保证文章信息的及时性,内容观点的准确性,平台将不提供完全的内容展现,本页面内容仅为平台搜索索引使用。需阅读完整内容的用户,请查看原文,获取内容详情。

举报

  • 相关推荐
  • 中手游发布2024年业绩 2025年多项战略调整谋增长

    3月27日港股上市公司中手游公布了2024年度业绩。截至2024年12月31日,中手游实现了19.3亿元人民币的收入,经调整后的净亏损达到20.8亿元人民币。公司将继续秉承创新、务实、高效的发展理念,为玩家带来更多优质的游戏产品和服务。

  • 2024年全球AR/VR头戴设备市场增长10%:Meta保持领先地位

    根据IDC公布的最新报告显示,2024年全球AR/VR头戴设备市场迎来了久违的增长,整体出货量同比增长了10%。Meta继续在这一领域占据主导地位,市场份额高达74.6%苹果、索尼、字节跳动和XREAL分别以5.2%、4.3%、4.1%和3.3%的市场份额紧随其后。商业出货量增长了14.9%。

  • Soul App实时人像视频生成研究成果获国际学术顶会CVPR2025录用

    IEEE国际计算机视觉与模式识别会议CVPR2025公布论文录用结果,社交平台SoulApp技术论文《Teller:Real-TimeStreamingAudio-DrivenPortraitAnimationwithAutoregressiveMotionGeneration》被接收。SoulApp团队在论文中提出了一个新的面向实时音频驱动人像动画的自回归框架,解决了视频画面生成耗时长的行业挑战外实现了说话时头部生成以及人体各部位运动的自然性和逼真性。Soul将把最新的AI能力尽快落地到站内多元场景中,如即将上线的实时视频通话能力将融入平台的AI虚拟人情感化陪伴体系“虚拟伴侣”、多对多互动场景“群聊派对”等功能中,进一步提升平台AI虚拟人的交互能力,以及人机交互的在场感和情感温度,为用户带来有趣、温暖的社交体验。

  • 2024 年,全球最畅销EV品牌TOP 10:中国占6席、德国占3

    消费者、经销商们似乎已愈发适应了向EV的转型,基础设施的建设也已进一步趋于完善。在这样的情况下,电动汽车市场在2024年再次迎来了爆发式增长,EV厂商们的竞争也变得愈发激烈。在最近公开的“2024年全球最畅销EV品牌排行榜”中,我们得以一窥EV市场的最新局势。

  • WWDC2024Siri演示曝内幕:大部分功能仅为概念

    根据TheInformation最新报道,苹果公司在2024年全球开发者大会上展示的iOS18新版Siri功能大多尚未开发完成,甚至连原型都不存在。报道引用一位前苹果员工的说法,称公司内部团队对WWDC演示内容感到"意外和惊讶"。苹果内部对AI发展进度极为不满,促使CEO蒂姆·库克进行高层调整,任命VisionPro负责人MikeRockwell接管Siri语音助手业务,以期加速相关功能开发。

  • 2024年度村田中国CSR活动圆满收官

    2024年村田中国CSR活动圆满收官,以行动践行责任,共建可持续未来。作为全球居先的综合电子元器件制造商,村田一直以来致力于社会公益项目。村田人将继续携手前行,共同为建设更加美好的社会贡献力量。

  • 新增自主决策推理模型!理想汽车OTA 7.2开启推送

    快科技4月3日消息,我们从理想汽车官方获悉,OTA7.2版本车机系统正式开启推送,预计一周内完成,升级耗时约50分钟。本次更新新增自主决策推理模型,该模型基于车载场景数据及通用推理模型数据打造,可根据问题内容自主决策是否深度思考,面对车控指令等简单问题时,能够保障响应速度。智能座舱方面,新增全能儿童锁功能,支持一键锁定副驾老板键、后排座椅物理按�

  • 苦等一年 Meta终于放大招 正式发布开源大模型Llama 4

    美国科技巨擘Meta重磅推出其迄今最为强大的开源AI模型Llama4,恰逢Llama3上市一周年之际。Llama4系列采用了先进的混合专家架构,这一架构在模型训练及用户查询回答过程中展现出更高效率,通过将模型划分为多个专注于特定任务的专家”子模型,实现精准高效的处理。Meta首席执行官扎克伯格表示:他们的目标是建立世界领先的人工智能,将其开源,并使其普遍可用,以便世界上每个人都能受益。

  • 腾讯发布2024年度ESG报告:以前沿技术持续创造社会价值

    4月8日,腾讯正式发布2024年ESG(即“环境、社会及管治”)报告,全方位披露其在ESG各个领域的举措与成果。腾讯ESG的评级进一步提升,标普全球、万得等ESG评级位于行业前列。截至2024年底,腾讯入选了道琼斯可持续发展、明晟、恒生等主流ESG指数。这些成绩印证了腾讯“用户为本,科技向善”的使命愿景在战略执行中的深化。 科技创新正在成为可持续发展的关键驱动力,�

  • 2024卡萨帝继续高增长,Q4收入增幅超30%

    3月27日晚间,海尔智家发布了2024年报。卡萨帝2024年继续增长,稳居高端TOP1,其中冰箱、洗衣机、空调在1.5W市场份额分别为49%、34%、88%。真正的高端从不在价格标签上是深植于用户心中的那份不可替代性。

热文

  • 3 天
  • 7天