11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
腾讯云
12-20
DeepSeek在GitHub开源新一代OCR模型,采用创新光学二维映射压缩技术,在长文本识别场景实现97%准确率。模型通过动态压缩生成最优视觉特征令牌,较传统方法减少60%计算冗余。实验显示在1:20压缩率下仍保持60%以上准确率,显著优于同类模型。该技术路径为OCR系统小型化提供解决方案,其动态压缩策略对大型语言模型的记忆管理机制具有重要启示。
AI日报栏目汇总近期AI领域重要进展:腾讯元宝接入DeepSeek V3.1提升智能助手能力;即梦AI推出多帧功能简化视频制作;可灵AI首尾帧功能升级效果提升235%;钉钉与通义实验室联合发布Fun-ASR语音识别大模型;腾讯CodeBuddy IDE国内版公测;Vercel发布AI Gateway简化模型调用;Anthropic整合Claude Code强化企业开发;阿里发布Mobile-Agent-v3突破GUI自动化;Qoder平台革新编程模式;清华团队GUAVA框架实现0.1秒3D化身生成;谷歌搜索新增AI Agent功能;VAST推出Tripo 3.0推动3D内容创作。
浙江省肿瘤医院联合阿里巴巴达摩院,发布了全球首个胃癌影像筛查AI模型DAMO GRAPE。 该模型首次利用平扫CT影像识别早期胃癌病灶,并联合全国20家医院,在近10万人的大规模临床研究中大幅提升胃癌检出率。 相关论文在24日登上了国际顶级期刊《自然医学》(Nature Medicine)。 据国家癌症中心统计,我国每年新发胃癌约36万例,死亡26万例,死亡人数在所有恶性肿瘤中位列第�
抖音今日对外公布了其在2024年度针对网络黑色产业链的治理情况。在过去的一年里,该平台持续加大对网络黑产的打击力度,通过一系列技术创新和策略升级,有效提升了识别和治理网络黑产的能力。将继续加大对网络黑产的打击力度,通过技术创新和策略升级,不断提升识别和治理能力,为用户提供更加安全、可靠的社交环境。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、阶跃星辰视频生成大模型Step-Video开启内测可在跃问视频申请阶跃星辰的Step-Video模型正式开启内测,用户可以通过跃问视频官网申请资格。用户可在最新版本的WPSOffice中轻松找到�
无需用户提示,AI就可以识别万物!且精度更高、速度更快。IDEA研究院创院理事长沈向洋官宣IDEA研究院最新成果:通用视觉大模型DINO-X。另一方面结合自研的“视觉提示优化”方法,无需更改模型结构,不用重新训练模型,实现小样本下的场景化定制。
微软AzureAI团队宣布开源视觉模型——Florence-2。Florence-2是一个多功能视觉模型,可提供图像描述、目标检测、视觉定位、图像分割等。尤其是在微调后,Florence-2在公共基准测试中的性能与更大参数的专业模型相媲美。
第八个国际大熊猫日即将到来。为了帮助饲养员更全面地观察和照顾大熊猫,腾讯、中国大熊猫保护研究中心以及广东工业大学联合开发了全球首个大熊猫行为智能识别模型及智慧系统。下一步计划是将这套先进的技术方案应用于各大熊猫保护区和研究机构中,实现对每一只大熊猫日常活动的实时监测、数据统计与分析报告生成,从为科学研究提供强有力的支持。
近日,苹果公司推出了300亿参数的多模态AI大模型MM1.5,该版本是在前代MM1的架构基础上发展来的。该模型继续遵循数据驱动的训练原则,着重探究在不同训练周期中混合各类数据对模型性能产生的影响,相关模型文档已在HuggingFace上发布。尽管MM1.5模型在多项基准测试中表现优异,但苹果团队仍计划通过进一步融合文本、图像和用户交互数据,并设计更复杂的架构,来提升模型对移动设备UI的理解能力,从让苹果牌”AI更强大。
快科技8月7日消息,据媒体报道,我国应急管理领域AI大模型久安”正式发布。久安”大模型,作为应急管理体系中的智慧引擎,深度整合了危险化学品管理、煤矿安全、森林火灾防控及安全生产执法等多领域的深厚专业知识,依托国内领先的大模型技术与应急云平台的强大算力,历经精细化的增强训练,铸就了其卓越的数据处理与分析能力。该模型能够精准高效地从海量视频监控资料中,自动识别并筛选出如危化企业人员异常聚集、工贸企业作业环境粉尘超标、强降雨诱发的城市内涝等高风险隐患,为安全防控提供了前所未有的前瞻性视角。不仅如此,久安”