图像识别更准确！尤洋团队研究：全新自适应计算模型AdaTape

2023-08-23 13:49 · 稿源：新智元公众号

【新智元导读】谷歌最新提出的自适应计算模型，能够提升图像识别性能。自适应计算（adaptive computation）是指ML统根据环境变化调整其行为的能力。传统神经网络具有固定的功能和计算能力，即用相同数量的FLOP来处理不同的输入。但具有自适应和动态计算的模型，根据输入的复杂性调

......

本文由站长之家合作伙伴自媒体作者“新智元公众号”授权发布于站长之家平台，本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间，为了保证文章信息的及时性，内容观点的准确性，平台将不提供完全的内容展现，本页面内容仅为平台搜索索引使用。需阅读完整内容的用户，请查看原文，获取内容详情。

即将跳转到外部网站

安全性未知，是否继续

继续前往

（举报）

相关推荐

关键词：

荐AI日报：Kimi全新音频基础模型Kimi-Audio；阶跃星辰开源图像编辑模型Step1X-Edit；夸克AI超级框上线 “拍照问夸克”

本期AI日报聚焦多项AI技术突破与应用：1)Moonshot AI推出开源音频模型Kimi-Audio，基于13亿小时训练数据，支持语音识别等任务；2)阶跃星辰开源图像编辑模型Step1X-Edit，展现强大生成能力；3)夸克AI上线"拍照问夸克"功能，实现视觉问答；4)苹果iOS18.5将在中国推送，带来智能功能；5)谷歌发布601个生成式AI应用案例，覆盖多行业；6)微软推出深度整合Windows的UFO²自动化系统；7)OpenAI升级ChatGPT至GPT-4o版本，提升STEM领域能力；8)Ema公司推出高性价比语言模型EmaFusion；9)Liquid AI发布面向边缘设备的Hyena Edge模型；10)LemonAI推出实时音视频数字人产品Slice Live。此外，国内方面，智谱与生数科技达成战略合作推动大模型发展，宝马中国宣布新车将接入DeepSeek技术。

AI日报音频技术开源模型
腾讯“物种之眼”AI全新升级高效识别数千物种

AI系统“物种类辨”通过少量数据学习，显著提升了对多种生物的识别准确率与召回率，尤其在高精度识别多类生物方面表现出色，推动生态保护与智能技术发展。腾讯开放平台“野生生物多态数据协作”项目助力野生动物监测及保护工作，促进公众科学参与。

雪豹物种保护 AI技术
能理解海豚声音！谷歌开发全新AI模型DolphinGemma

快科技4月15日消息，谷歌公布了一款名为DolphinGemma”的大型语言模型，旨在帮助科学家理解海豚的声音，并生成类似海豚的声音序列。研究人员预计在未来几个月内测试DolphinGemma及其配套的Cetacean Hearing Augmentation Telemetry（CHAT）发声系统，以探索是否能够翻译并模仿海豚的声音，进而实现与海豚的某种对话”。海豚是地球上最聪明且最善于沟通的动物之一，其社交互动极其复杂�

谷歌 DolphinGemma 海豚沟通
“奥迪助手”来了！全新AUDI车型接入豆包大模型

2025年4月24日上海车展期间，上汽奥迪发布全新A5L Sportback和首款量产车型E5 Sportback。同时推出与火山引擎合作开发的"奥迪助手"智能交互系统，基于豆包大模型实现自然对话体验。该系统将搭载于两款新车，并同步部署在车载端和手机APP端，支持跨设备对话记录同步。火山引擎为系统提供大模型技术支持，实现语音指令控制、车辆功能讲解等智能服务，并整合抖音、汽水音乐等内容生态。上汽奥迪表示，该合作将助力品牌打造更智能、个性化的产品矩阵。

上海国际车展上汽奥迪奥迪
百利好环球APP全新升级以科技力量助力投资者

当前金融市场正呈现出复杂多变的局面。以近期黄金市场的走势为例，全球经济格局中，各国之间的政策博弈正深刻影响着金融市场走向，尤其是黄金价格走势，年内冲击 3500 美元并非毫无可能。在这样的市场环境中，投资者面临着诸多痛点。一直以来，百利好专注为全球投资者提供多元的投资产品、稳健可靠的交易平台以及安全高效的金融服务。2025年 3 月，百利好凭借环球

金融市场黄金价格投资策略
字节发布豆包1.5深度思考模型：“实拍级”图像生成

快科技4月17日消息，据报道，今日，在火山引擎AI创新巡展杭州站的现场，字节跳动旗下火山引擎总裁谭待正式发布了备受瞩目的豆包1.5深度思考模型。谭待指出，豆包1.5深度思考模型在多个关键领域展现出卓越性能。在数学、编程、科学推理这类专业领域中，它能够精准高效地处理复杂问题；在创意写作等通用任务方面，同样表现出色。该模型采用MoE架构，总参数为200B，激�

豆包1.5深度思考模型火山引擎AI创新字节跳动技术发布
可灵AI发布全新2.0模型：上线多模态视频编辑功能

快科技4月16日消息，据报道，可灵AI在北京举行灵感成真”2.0模型发布会，正式发布可灵2.0视频生成模型及可图2.0图像生成模型。据介绍，可灵2.0模型在动态质量、语义响应、画面美学等维度保持领先；可图2.0模型在指令遵循、电影质感及艺术风格表现等方面显著提升。3月27日，全球AI基准测试机构Artificial Analysis发布了最新的全球视频生成大模型榜单，快手可灵1.6pro（高品质模

可灵AI 视频生成模型图像生成模型
Aloudata Agent公测开启：NoETL+大模型=好数据驱动真智能，让“万数皆可问”

4月22日，Aloudata大应科技推出自研的Aloudata Agent，这是一款基于NoETL明细语义层的分析决策智能体，旨在通过自然语言实现数据查询、归因诊断、报告生成等功能。该产品解决了企业数据分析面临的五大挑战：语义鸿沟、口径一致性、场景覆盖度、性能优化和数据权限管控。Aloudata Agent采用NL2MQL2SQL技术路径，通过指标语义层实现业务语言与数据语言的精准对齐，显著提升查询准�

Aloudata 大应科技智能BI
AI日报：阿里腾讯全面支持MCP协议；阶跃星辰多模态推理模型Step-R1-V-Mini；美图WHEE图像生成模型Miracle F1

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、阿里巴巴已宣布全面支持MCP协议腾讯紧随其后近日，中国人工智能领域迎来技术标准的变革，ModelContextProtocol成为国内AI生态的事实标准。12.英伟达发布Llama3.1NemotronUltra253B，性能�

人工智能 MCP协议阿里巴巴
首次实现图像思考 OpenAI重磅发布o3/o4-mini：史上最强、最智能模型

快科技4月17日消息，今日，OpenAI新款AI模型o3、o4-mini重磅发布，这是OpenAI迄今最强、最智能的模型。据了解，OpenAI o3/o4-mini首次具备真正的视觉推理能力，看图识图已经是小菜一碟了，现在还会看图思考。OpenAI o3/o4-mini能同时处理文本、图像和音频，并且能作为Agent智能体自动调用网络搜索、图像生成、代码解析等工具以及深度思考模式。通过强化学习，OpenAI训练了o3/o4-mini如何�

OpenAI AI模型视觉推理

热文

3 天
7天

1

累了倦了就找 ChatGPT……AI正在沦为“情绪垃圾桶”！

图像识别更准确！尤洋团队研究：全新自适应计算模型AdaTape

荐AI日报：Kimi全新音频基础模型Kimi-Audio；阶跃星辰开源图像编辑模型Step1X-Edit；夸克AI超级框上线 “拍照问夸克”

腾讯“物种之眼”AI全新升级高效识别数千物种

能理解海豚声音！谷歌开发全新AI模型DolphinGemma

“奥迪助手”来了！全新AUDI车型接入豆包大模型

百利好环球APP全新升级以科技力量助力投资者

字节发布豆包1.5深度思考模型：“实拍级”图像生成

可灵AI发布全新2.0模型：上线多模态视频编辑功能

Aloudata Agent公测开启：NoETL+大模型=好数据驱动真智能，让“万数皆可问”

AI日报：阿里腾讯全面支持MCP协议；阶跃星辰多模态推理模型Step-R1-V-Mini；美图WHEE图像生成模型Miracle F1

首次实现图像思考 OpenAI重磅发布o3/o4-mini：史上最强、最智能模型

热文

累了倦了就找 ChatGPT……AI正在沦为“情绪垃圾桶”！

印度将中国电子投资压股至 10%，且要求“技术转让”

“AI教父”杰弗里·辛顿再次发出警告：AI可能正在“失控”！

“你可能患了血癌……” 医生诊断错误，而 ChatGPT 是对的！

郭明錤：iPhone17有望全系配12GB内存！但，有个前提……

累了倦了就找 ChatGPT……AI正在沦为“情绪垃圾桶”！

Adobe 发布 Firefly 系列产品，涵盖图片、视频、矢量等

美国网购市场动荡，希音、Temu 率先在美开启“涨价潮”！

站长商机