首页 > 原创 > 关键词  > 阿里巴巴最新资讯  > 正文

AI日报:阿里开源Z-Image图像模型;夸克AI眼镜发布;Opera Neon 浏览器升级

2025-11-27 16:09 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://app.aibase.com/zh

1、阿里巴巴开源 Z-Image 图像模型:支持中英双语文字渲染

阿里巴巴通义实验室开源了全新的图像生成模型 Z-Image,凭借仅 6B 参数规模实现了高效的图像生成与编辑,视觉质量接近三倍参数级别的商业模型。其轻量化架构和高效性能使其适用于消费级设备,并在复杂指令理解和双语渲染方面表现出色。

image.png

【AiBase提要:】

🔥 Z-Image 采用单流 DiT 架构,包含 Turbo、Base 和 Edit 三种变体,满足不同需求。

💡 支持中英双语文字渲染,解决传统 AI 模型在文本处理上的痛点。

🚀 显存占用低至 16GB,可在消费级显卡上流畅运行,提升图像生成效率。

详情链接:https://tongyi-mai.github.io/Z-Image-homepage/

2、夸克AI眼镜发布:搭载双旗舰芯片 接入阿里千问

夸克AI眼镜的发布标志着阿里千问首次进入物理世界,通过硬件升级和创新技术,为用户提供更高效、便捷的AI体验。

image.png

【AiBase提要:】

📱搭载双旗舰芯片,提升千问的响应速度和性能表现。

📷引入手机级影像能力,增强暗光环境下的拍摄画质与稳定性。

🔋采用双电池可换电设计,确保长时间在线待命。

3、Opera Neon 浏览器大升级:1分钟出研报+Gemini3一键切+Google Docs秒写

Opera Neon浏览器推出重大更新,新增‘1分钟深度研究’模式,集成Gemini3Pro与Nano Banana Pro双模型,并首次支持自然语言创建与编辑Google Docs。该功能提升了用户在快速查询和全面研究之间的效率,同时为文档编写提供了自动化解决方案。

image.png

【AiBase提要:】

✨ 新增‘1分钟深度研究’模式,提升复杂问题处理效率。

🔄 支持Gemini3Pro与Nano Banana Pro模型切换,灵活应对多阶段任务。

📝 集成Google Docs智能体,实现自然语言操作文档,提高写作效率。

4、清华大学发布 AI 应用指导原则:禁止将 AI 生成内容用作学业成果

清华大学正式发布了《清华大学人工智能教育应用指导原则》,旨在规范校园内人工智能的使用。该指导原则首次系统性地提出了人工智能应用的全局性和分层级的引导规范,涵盖了教学及学术研究的各个核心场景。

【AiBase提要:】

🧠 清华大学发布人工智能教育应用指导原则,规范校园内 AI 使用。

📚 指导原则强调严禁将 AI 生成的内容作为学业成果,确保学术诚信。

🔍 学校鼓励教师与学生积极探索 AI 辅助学习,但需遵循明确的使用规范。

5、DeepMind发布“Gemini 3 Pro系统指令”:Agent任务成功率提升5%,多步骤工作流可靠性工程化

DeepMind公开了Gemini 3 Pro的专属System Instructions,显著提升了大模型在多个基准测试中的表现。该指令强调逻辑推理、风险评估和持久性,标志着大模型从‘黑箱调参’迈向‘工程化指令’阶段。

【AiBase提要:】

📌 Gemini 3 Pro的System Instructions提升了Agent任务成功率约5%。

🔍 指令强调逻辑依赖、风险评估和假设探索,增强模型的可靠性。

🚀 DeepMind计划将指令封装为可配置JSON Schema,并在2026年Q1开放给Vertex AI等平台。

6、Adobe 发布 Project Graph:重塑创意工作流的 AI 工具

Adobe 推出的 Project Graph 是一个基于节点的视觉化编辑器,旨在帮助艺术家和设计师更高效地自定义创作流程。它通过将 AI 模型、工具和效果器连接起来,提升了创作的可控性和精确度,并支持将复杂的工作流打包为可分享的工具,从而提升团队协作效率。

image.png

【AiBase提要:】

🎨 Adobe 推出 Project Graph,旨在重塑 AI 时代的创作工作流。

🛠️ 该系统使用节点编辑器,让用户像搭积木一样自定义创作流程。

📦 用户可将创意工作流打包成可分享的工具,便于团队协作和应用。

详情链接:https://www.adobe.com/express/create/chart/bar

7、新型聊天式提示词工具 YPrompt ,轻松生成专业 Prompt

YPrompt 是一款创新的聊天式提示词工程工具,通过与用户的对话深入挖掘需求,自动生成专业的提示词。它不仅支持多种输出格式,还具备强大的版本管理功能,让用户在创作过程中更加高效和灵活。

image.png

【AiBase提要:】

✨ YPrompt 是一个聊天式提示词生成工具,通过对话挖掘用户需求。

🛠️ 该工具支持多种输出格式,方便用户即时查看效果。

📈 每次修改都会记录版本,用户可随时对比和回滚。

详情链接:https://github.com/fish2018/YPrompt

8、巨人网络发布三大 Muli-Modal 模型:消除视频畸变,歌声转换实现“真实歌曲可用”

巨人网络AI Lab联合清华大学SATLab、西北工业大学推出三项音视频多模态生成技术成果,包括音乐驱动的视频生成模型YingVideo-MV、零样本歌声转换模型YingMusic-SVC与歌声合成模型YingMusic-Singer,展示了团队在音视频多模态生成领域的最新进展,并计划开源这些技术。

【AiBase提要:】

🎥 音乐驱动的视频生成模型 YingVideo-MV 可通过一段音乐和一张人物图像生成高质量的音乐视频片段。

🎤 零样本歌声转换模型 YingMusic-SVC 实现了“真实歌曲可用”的歌声转换能力,有效抑制干扰并降低破音风险。

🎵 歌声合成模型 YingMusic-Singer 支持输入任意歌词生成自然歌声,具备零样本音色克隆功能,提升创作灵活性。

举报

  • 相关推荐
  • 阿里Z-Image登顶开源图像生成模型榜单:1秒生图 千图仅需5美元

    今日,阿里Z-Image登顶开源图像生成模型榜单。 全球权威AI基准测试平台ArtificialAnalysis公布最新的图像模型榜单,阿里6B参数Z-Image Turbo超越32B的FLUX.2,成为最强开源图像生成模型。 目前,该模型已在阿里云百炼上线,生成1千张图片仅需5美元。 Z-Image Turbo的ELO分数达到1152,也刷新了榜单纪录。 业内人士认为,这是业界性能最好、生成速度最快、价格最便宜的图像生成模型之�

  • PS天塌了!阿里开源全新图像模型Qwen-Image-Layered 可实现PS级图层

    阿里开源全新图像生成模型Qwen-Image-Layered,首次在模型内实现PS级的图层理解与图像生成。 千问新模型采用自研创新架构,可将图片拆解”成多个图层,就像个专业设计师用Photoshop分层作图修图,可实现几乎零漂移”的AI图像精准编辑,彻底解决AI生图的一致性难题,加速大模型在专业设计领域的现实落地。 Qwen-Image-Layered打破了主流视觉大模型的扁平式思维”,模型通过分层�

  • 告别参数内卷:前行者Z7以材料与系统融合定义轻量化鼠标新标杆

    电竞外设竞争激烈,参数军备赛曾定义产品优劣。然而,随着性能天花板触手可及,一场以“材料创新”与“体验融合”为核心的深度变革正在发生。前行者(EWEADN)即将推出的Z7复合碳纤维轻量化旗舰鼠标,试图给出新答案:它不再仅仅罗列顶级芯片规格,而是致力于通过前所未有的材质应用与系统性技术整合,重新定义一款旗舰电竞鼠标的体验维度,将轻量化的竞争从克重数字导向材料科学与用户体验的深水区。

  • 名创优品MINISO拓展乐园系店态,MINISO FRIENDS成布局城市潮流核心轻量化先锋

    名创优品旗下创新业态MINISO FRIENDS华南首店在深圳宝安海雅缤纷城开业。该店以“迷你IP乐园”和兴趣消费为定位,通过沉浸式IP场景与商业空间结合,致力于打造深圳青年潮流生活新地标。店内融合全球热门IP与自有IP“YOYO”,覆盖IP系列达70个,SKU超4000种,IP产品占比超80%。开业当天客流密集,展现出其作为潮流消费地标的吸引力。此次开业是名创优品构建“IP平台”的关键举措,也推动了其“乐园系”店态布局的完善与升级。未来,名创优品将继续依托“兴趣消费”战略,推动MINISO FRIENDS等创新店态在全国核心城市的布局。

  • AI日报:电信开源MoE大模型TeleChat3;微信推出AI小程序成长计划;谷歌测试Nano Banana2Flash 图像模型

    本期AI日报聚焦行业动态与产品更新。微信推出AI小程序成长计划,提供免费资源助力开发者。中国电信开源千亿参数MoE大模型TeleChat-3,实现国产算力训练。谷歌测试新图像模型Nano Banana2Flash,主打高性价比。马斯克宣布Grok新版上线,全球用户突破3000万。ChatGPT全面接入主流App,可一键订酒店、点外卖等。此外,高德打车上线“AI服务卫士”提升安全,AI助手“ima”新增PPT生成功能,Plaud推出AI录音笔,智元与MiniMax合作定制个性化机器人语音。

  • 晚一天敲钟,MiniMax 更用力

    AI大模型第一股的悬念,终于揭晓。仅仅一天之隔,MiniMax晚于智谱IPO。 1月9日,MiniMax在港交所敲钟,开盘价235.4港元,较发行价上涨42.6%,市值超过800亿港元; 智谱昨天开盘价为120港元/股,市值为528.28亿港元;当前股价150多港元,市值接近700亿港元。 AI双雄的局面还在持续,他们都需要更用力证明自己。 不过对于同一赛道的同类型选手,资本市场同时容纳的数量有限,且

  • 连投六轮!明势天使项目「MiniMax」正式登陆港交所,成史上IPO规模最大AI大模型公司

    2026年1月9日,AI公司MiniMax在香港联交所主板上市,成为史上IPO规模最大的AI大模型公司。明势资本作为其最早的投资方之一,自2022年3月公司创业初期便参与投资,并连续六轮加注,是参与融资轮次最多的机构。此次IPO定价165港元,盘中大涨97%,市值超千亿港元,市场反响热烈。明势资本通过长期支持,助力中国大模型企业登上全球舞台。

  • 揭密MiniMax不为人知的B面

    第一批AI大模型公司上市潮来了,先冲线的两家公司MiniMax、智谱揭开了自己的底牌。 相比于其他AI公司,MiniMax在国内似乎更加低调和神秘,这家从出生时就在海外市场拓展的公司,到底在怎么赚钱? 从招股书来看,2025年前三季度,MiniMax营收从上年同期的1945万美元激增至5344万美元(约3.8亿人民币),同比增长高达174%。 能看出来,MiniMax的商业化,就像三级火箭般加速上升。

  • AI日报:阿里云推多模态交互开发套件;智谱AI港股首日上市;混元发布 HY-Motion1.0开源3D 角色动画生成模型

    阿里云发布多模态交互开发套件,集成通义千问、万相、百聆三大模型,赋能智能硬件。腾讯混元推出开源3D角色动画生成模型HY-Motion 1.0,助力游戏与动画制作。智谱AI在港上市,募资43亿港元,加速商业化落地。抖音在深圳南山设立第二总部,聚焦AI与泛视频研发。OpenAI推出ChatGPT Health,强化健康数据管理与隐私保护。法拉第未来宣布进军具身智能机器人领域,推动汽车与机器人业务协同。蚂蚁阿福月活超3000万,AI健康赛道进入中美竞速新阶段。MiroThinker 1.5以300亿参数实现媲美万亿模型的性能,显著降低推理成本。

  • AI日报:字节发布Seed Prover1.5;MiniMax M2.1开源;通义开源语音交互大模型Fun-Audio-Chat-8B

    本期AI日报聚焦多项AI领域新进展:字节跳动发布Seed Prover 1.5,在形式化数学推理领域取得突破;阿里通义开源语音交互模型Fun-Audio-Chat-8B,具备超低延迟和情感感知能力;MiniMax开源M2.1编码模型,性能超越闭源巨头;知乎发布2025年度AI产品榜单,豆包位居榜首;Anthropic推出开源Agent Skills知识库,助力Claude模型技能拓展;Lima v2.0发布,从容器工具进化为安全AI工作流平台;讯飞星�

今日大家都在搜的词: