11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
腾讯云
12-20
本文汇总了AI领域的最新动态:Chrome为Gemini新增“技能库”功能,简化提示词复用;小红书开源大模型训练引擎Relax,提升多模态训练效率;Midjourney V8.1发布,优化渲染速度与成本;阿里千问AI眼镜全球首店开业,加速硬件生态布局;美团推出AI家庭健康管理产品;李飞飞公司发布集成Three.js的3D渲染器Spark2.0;Claude Code推出自动化流程功能Routines;天猫发布新规规范AI软件及商品发布。
近日,谷歌Gemini AI推出最新升级,用户只需输入提示词,就能让聊天机器人生成交互式3D模型和实时模拟。 这一新功能支持多种互动操作,包括旋转模型、拖动滑块调整参数或输入数值改变模拟结果。 例如,用户询问月球绕地球轨道时,Gemini会创建一个3D模型,并提供轨道速度滑块、路径线切换开关以及暂停按钮。
本期AI日报聚焦多领域动态:腾讯发布Agent产品全景图,打造AI时代“全栈引擎”;小米推出全掌触觉仿生手,体积压缩60%并引入仿生汗腺散热技术;谷歌Gemini支持一键导入对话记忆,降低用户迁移成本;维基百科严禁LLM生成内容,确保知识准确性;淘宝集团加速AI原生组织转型,实习生享免费Token额度;谷歌全球上线Search Live,实现摄像头实时AI搜索;首个AI失业补助计划启动,为失业劳工提供每月1000美元支持;Anthropic调整Claude用量限制机制,引入类似电力系统的“峰谷价”逻辑引导用户错峰使用。
本期AI日报聚焦行业动态:OpenAI紧急上线GPT-5.3 Instant,重点解决“爹味说教”问题;Anthropic推出Claude Code语音编程模式,提升开发效率。马云带领阿里与蚂蚁核心层访问云谷学校,探讨AI浪潮下的教育变革。AReaL v1.0框架发布,降低智能体强化学习开发门槛。阶跃星辰开源Step3.5Flash模型,参数达1960亿。阿里通义千问负责人林俊旸离职,反映大模型人才高频流动趋势。谷歌发布Gemini
谷歌家居(Google Home)负责人阿尼什卡图卡兰近日宣布,智能家居平台迎来多项重要更新。 不仅修复了多个长期存在的体验问题,还新增了一项值得关注的功能为摄像头推出实时搜索(Live Search)。 此前,Gemini只能回顾已发生的事件,而现在,它能够理解摄像头实时画面中的内容。 这意味着用户可以直接提问:嘿Google,车道上有车吗?”实时感知能力的加入,让智能家居从�
本期AI日报聚焦行业动态:谷歌将停用Gemini 3 Pro Preview,开发者需迁移至3.1版本;DeepSeek V4发布,支持多模态生成并与华为、寒武纪合作优化硬件;微软计划推出AI软件组合,月费或高达99美元;爱奇艺财报显示利润下滑,将押注AI电影制作与去中心化转型;壁仞智能完成数亿元融资,深化端侧AI布局;英伟达将发布集成Groq技术的推理处理器,巩固市场地位;联想展示模块化AI PC概念,提升用户体验;我国发布首个国家级人形机器人标准体系,推动产业高质量发展。
本期AI日报汇总了人工智能领域的最新动态。谷歌发布Gemini 3.1 Pro,推理能力显著提升,多项基准测试超越GPT-4o。Anthropic为Claude Code推出“远程控制”功能,实现移动设备无缝管理电脑编码任务。OpenAI发布深度融合推理能力的编程模型GPT-5.3-Codex。通义千问Qwen3.5开源家族新增多款模型并上线托管服务。Meta开源GPU集群监控工具GCM,精准定位硬件故障。Anthropic发布企业级插件,将Claude深度集成至Office全家桶。谷歌AI虚拟形象支持24种语言,提升跨语言沟通效率。阿里云Coding Plan推出低价订阅服务,降低开发者使用成本。
谷歌于2月20日宣布,其Gemini应用已集成DeepMind旗下先进音乐生成模型Lyria+3。用户仅需一句文字描述或一张照片,即可在数秒内生成一段30秒的完整音乐片段。该模型创作方式灵活,可根据用户指定的风格、情绪或节奏生成包含人声、歌词和伴奏的歌曲,或分析上传的照片/视频画面氛围,创作契合场景的配乐,并配有自定义封面。此外,YouTube创作者可通过Dream Track功能为Shorts短视频配乐。消息公布后,Spotify股价一度上涨近5%。分析认为,Lyria+3短期内虽不会对Spotify构成致命冲击,但可能倒逼其加快推出AI混音功能。谷歌通过技术手段明确划定边界,试图在创新与保护之间寻求平衡,例如将真实音乐人视为创作灵感来源而非模仿对象,并使用SynthID技术为生成曲目添加水印以便检测AI内容。目前Lyria+3已向全球18岁以上用户开放,支持多国语言。
近日,谷歌官方披露其旗舰AI模型Gemini正遭遇商业化驱动的大规模蒸馏攻击通过重复提问诱导聊天机器人泄露内部机制。攻击者通过系统地、反复地向模型发送精心设计的提示词,试图逆向工程Gemini的内部推理逻辑与决策机制,以实现模型克隆或强化自身AI系统的目的。此类蒸馏攻击属于知识产权盗窃,尽管各大厂商已部署能够识别与阻断蒸馏攻击的机制,但由于主流大模型服务面向所有人开放,所以其本质上仍易受攻击。
今日,蚂蚁集团开源发布全模态大模型 Ming-Flash-Omni 2.0。 在多项公开基准测试中,该模型在视觉语言理解、语音可控生成、图像生成与编辑等关键能力表现突出,部分指标超越 Gemini 2.5 Pro,成为开源全模态大模型性能新标杆。 Ming-Flash-Omni 2.0 也是业界首个全场景音频统一生成模型,可在同一条音轨中同时生成语音、环境音效与音乐。 用户只需用自然语言下指令,即可对音色�