11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
AI日报栏目聚焦人工智能领域最新动态。钉钉发布8.0版本推出AI办公应用钉钉ONE,通过自然语言交互简化工作流程;阿里开源Mobile-Agent-v3跨平台代理框架;微信测试AI播客功能,实现双人对话式新闻播报;钉钉推出首款AI硬件录音笔DingTalk A1;苹果拟为Siri引入谷歌Gemini大模型;苹果发布适配版SlowFast-LLaVA模型提升长视频分析性能;Meta获得Midjourney技术授权加强AI图像生成竞争力;谷歌Drive新增Vids视频编辑功能降低制作门槛;夸克发布健康大模型通过12学科主治医师测评;AI小游戏Draw A Fish凭借极简设计引发全球热潮。
【AI日报】今日AI领域重要动态:1)阿里开源WebAgent项目WebShaper,GAIA评测超越Claude4-Sonnet;2)Moonvalley推出草图转视频功能,支持手绘生成电影级视频;3)腾讯X-Omni模型实现图文理解重大突破;4)百度搜索测试AI应用中心入口;5)Midjourney+新增个性化推荐功能;6)GPT-5或于2025年夏季发布;7)Ollama推出桌面客户端;8)OWL团队开源多智能体协作工具Eigent;9)OpenAI年收入激增至120亿美元;10)英伟达H20芯片因安全风险被约谈;11)万兴科技天幕2.0模型国内排名第四,与华为云共建AI视频实验室。
今天凌晨1点,OpenAI开源了一个全新的AIAgent评测基准——PaperBench。这个基准主要考核智能体的搜索、整合、执行等能力,需要对2024年国际机器学习大会上顶尖论文的复现,包括对论文内容的理解、代码编写以及实验执行等方面的能力。目前智能体的能力还无法超越人类。
据Benzinga、Cointelegraph和CryptoSlate等多家海外知名媒体报道,全球领先的加密货币交易所及Web3公司Bitget,宣布与波场TRON达成战略合作,并收购价值1000万美元的TRX。波场TRON创始人孙宇晨表示:“我对我们与Bitget的战略合作感到兴奋,这将支持生态系统的增长。此次战略合作彰显了双方共同致力于使区块链技术更加普及、为全球用户提供更具成本效益的愿景。
综合多方爆料来看,今年iPhone16全系四款机型标配8GB内存已经是板上钉钉。但需要注意的是,这并不是苹果大发善心要挤爆牙膏是不得已为之。iPhone16系列还有一大变动就是改为电容式触控音量键、电源键,并用TapticEngine马达配合模拟实体键的触感反馈,类似iPhone7/8/SE2等机型上的压感Home键。
Mobile-Agent-v2是一个先进的AI系统,旨在通过自动化操作和视觉感知技术,实现对移动设备的全面控制。这一系统能够模拟真人的各种交互行为,如点击、滑动和输入等,从自动化地完成一系列复杂的任务。这一进步表明,多代理协作的方法在自动化任务执行方面具有明显优势,能够为用户带来更多便利,同时也为AI在移动设备自动化领域的应用开辟了新的可能性。
在Create2024百度AI开发者大会的主题演讲中,百度创始人、董事长兼首席执行官李彦宏向与会者展示了三大引人注目的开发工具:AgentBuilder、AppBuilder和ModelBuilder。这些工具不仅便于开发者们轻松打包带走,更可即刻投入使用,助力他们在AI领域的创新实践。更令人振奋的是,大赛首次设立了“特别大奖”,优秀项目将有机会获得高达5000万人民币的现金及资源支持,这为广大创业者们提供了一个难得的展示自我、实现梦想的舞台。
欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
MobileAgent是由阿里巴巴开发的一个自主多模态AI代理,可以模拟人类操作手机,是一个纯视觉解决方案,不需要任何系统代码,完全通过分析图像来理解和操作手机。项目地址:https://top.aibase.com/tool/mobile-agent特点:依赖于纯视觉解决方案:MobileAgent通过分析图像来理解和操作手机无需任何系统代码。观察、思考和行动是MobileAgent采用的提示格式,要求代理输出三个组成部分。
Mobile-Agent是一款具有视觉感知的自主多模式移动设备代理,由北京交通大学联合阿里巴巴团队共同开发。该代理采用纯视觉解决方案,独立于XML和系统元数据,不需要任何系统代码,完全通过分析图像来理解和操作手机。它能够自动完成各种任务,比如可以在淘宝加购物车车,在APP播放音乐,自主使用导航APP,收发邮件等等。