11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
近日,苹果公司推出了300亿参数的多模态AI大模型MM1.5,该版本是在前代MM1的架构基础上发展来的。该模型继续遵循数据驱动的训练原则,着重探究在不同训练周期中混合各类数据对模型性能产生的影响,相关模型文档已在HuggingFace上发布。尽管MM1.5模型在多项基准测试中表现优异,但苹果团队仍计划通过进一步融合文本、图像和用户交互数据,并设计更复杂的架构,来提升模型对移动设备UI的理解能力,从让苹果牌”AI更强大。
谷歌AI团队最近发布了一项名为MUSCATEL的全新时间感知框架,旨在对抗概念漂移问题,提升图像识别准确率。概念漂移一直是机器学习领域的难题,即数据分布随时间变化,影响模型持续有效性。谷歌发布的MUSCATEL方法为机器学习领域的概念漂移问题提供了一种创新的解决方案,为模型在大规模、动态数据集中持续准确地进行分类提供了新的思路和方法。
Anthropic公司近期宣布计划为其聊天机器人Claude增加图像识别功能,从使其具备分析图像的能力。Anthropic的开发团队正在致力于赋予Claude分析图像的能力,这是Claude相对于竞争对手ChatGPT和Bard所缺乏的特性之一。随着人工智能技术的不断发展,我们可以期待更多类似的创新,推动整个行业不断向前发展。
2024年1月18日凌晨,三星在举办了GalaxyAI全球新品发布会,宣告GalaxyS24系列的登场,应用了谷歌Gemininano大模型共同迎接“GalaxyAI时代”的到来。除了这个模型,GalaxyS24的一些功能还受益于谷歌Imagen2模型,将文本到图像的能力植入手机。S24、S24的起售价为115.5万韩元、135.3万韩元Ultra版则以169.84万韩元起售。
谷歌最新提出的自适应计算模型,能够提升图像识别性能。自适应计算是指ML统根据环境变化调整其行为的能力。他曾获得了清华大学计算机系获得硕士学位获得了美国加利福尼亚大学伯克利分校计算机系获得博士学位。
CIM是一个用于弱监督实例分割的算法,旨在从具有弱标签的数据中挖掘完整的目标实例。该项目提供了CIM算法的代码实现。通过CIM,用户可以在没有完全标注的数据集上进行高效的实例分割任务,提高工作效率并降低成本。
威联通今天宣布推出了新一代AINASTS-AI642。TS-AI642采用了搭载6TOPSNPU的ARM8核处理器,非常适合于AI图像识别和智能监控应用。企业可以实现海量存储容量,以满足长期存储和归档要求,同时实现投资回报率最大化。
微软正在对Bing聊天中的图像识别和视觉搜索功能进行测试。这意味着您可以上传一张图片并在Bing聊天中就该图片向它提问。插件功能则是另一单独的事项,希望几周内开始测试。
相信不少同学生活中都用过OCR技术,小到一张手写笔记、纸质发票、合同条款,大到一堆会议资料、一本书等,无论是手写的文字是印刷的中英文和其他语种,拿起手机相机拍一拍就能轻松识别提取出来,成为可以复制和编辑的文本。OCR,即光学字符识别技术。文字载体为常见的纸质文档、书籍、论文、PPT等。
机器人法务应用 DoNotPay,刚刚推出了一项名为 Photo Ninja 的新功能,旨在通过轻微地修改用户照片,以使人工智能应用程序无法辨识用户的身份。DoNotPay 声称该功能可防止用户在线上传的照片被用于恶意目的,且一切都可自动化完成。只需交纳 3 美元的月费,即可在上传照片给 DoNotPay 后、隐秘地掺入可让面部识别工具产生困惑的信息。作为一种“对抗示例”,其利用了破坏 AI 行为的特殊手段。随着人工智能角色的不断发展、以及潜在