11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
蚂蚁百灵团队开源高性能思考模型Ring-flash-2.0,在多项基准测试中表现优异;阿里通义7款模型登顶Hugging Face榜单,Qwen3-Omni凭借多模态能力全球第一。谷歌Veo3突破视频生成局限,可自动完成视觉任务;特斯拉推进人形机器人量产,马斯克称其为最重要产品。马斯克第六次起诉OpenAI窃取商业机密,苹果内部测试聊天机器人Veritas优化Siri,YouTube推出AI音乐主播增强互动,LiquidAI发布轻量级模型Liquid Nanos优化边缘计算。
9月23日晚,华为发布全新问界M7,提供两个版本智驾系统。高阶版配备舱外192线激光雷达,舱内激光雷达视觉辅助驾驶版为行业首创,结合摄像头实现视觉ADS增强功能,支持高速及快速路智能领航、紧急转向辅助、异形障碍物自动刹车等。余承东表示,华为舱内激光雷达视觉辅助驾驶能力远超行业纯视觉方案。高阶版智驾系统配备前后激光雷达及4D毫米波雷达,拥有全维防撞4.0功能,具备全方位、全目标、全天气和全场景防撞能力。
今天下午华为Pura 80系列正式发布,新机出厂搭载最新的鸿蒙5.1系统,为用户带来前所未有的智能体验。 其中,全新小艺再升级,新増AI视觉识别能力,能够精准捕捉并理解用户需求,识别周边的一切。
OpenAI最近宣布,其AssistantsAPI现在支持视觉能力,这标志着该公司在多模态AI领域的进一步扩展。这项更新使得API能够处理和理解图像内容,为用户提供更加丰富的交互体验。OpenAI持续推动AI技术的边界,AssistantsAPI的这一新功能将进一步促进AI在各个行业中的集成和应用。
在科技领域,类人机器人Ameca的最新进化令人瞩目。通过拥有视觉能力和多模态AI功能,Ameca不仅能够观察周围环境能模拟人类的情感和反应。广泛的传感器系统和底层操作系统的支持,使得Ameca能够精准模拟人类行为和情感反应,展现出令人惊叹的类人化水平。
GPT-4V来做目标检测?网友实测:还没有准备好。虽然检测到的类别没问题,但大多数边界框都错放了。最终这个模型可以完成多种视觉任务,比如目标对象描述、视觉定位、图像说明、视觉问题解答以及从给定的输入文本中直接解析图片对象。