首页 > 原创 > 关键词  > 阿里巴巴最新资讯  > 正文

AI日报:阿里开源Z-Image图像模型;夸克AI眼镜发布;Opera Neon 浏览器升级

2025-11-27 16:09 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://app.aibase.com/zh

1、阿里巴巴开源 Z-Image 图像模型:支持中英双语文字渲染

阿里巴巴通义实验室开源了全新的图像生成模型 Z-Image,凭借仅 6B 参数规模实现了高效的图像生成与编辑,视觉质量接近三倍参数级别的商业模型。其轻量化架构和高效性能使其适用于消费级设备,并在复杂指令理解和双语渲染方面表现出色。

image.png

【AiBase提要:】

🔥 Z-Image 采用单流 DiT 架构,包含 Turbo、Base 和 Edit 三种变体,满足不同需求。

💡 支持中英双语文字渲染,解决传统 AI 模型在文本处理上的痛点。

🚀 显存占用低至 16GB,可在消费级显卡上流畅运行,提升图像生成效率。

详情链接:https://tongyi-mai.github.io/Z-Image-homepage/

2、夸克AI眼镜发布:搭载双旗舰芯片 接入阿里千问

夸克AI眼镜的发布标志着阿里千问首次进入物理世界,通过硬件升级和创新技术,为用户提供更高效、便捷的AI体验。

image.png

【AiBase提要:】

📱搭载双旗舰芯片,提升千问的响应速度和性能表现。

📷引入手机级影像能力,增强暗光环境下的拍摄画质与稳定性。

🔋采用双电池可换电设计,确保长时间在线待命。

3、Opera Neon 浏览器大升级:1分钟出研报+Gemini3一键切+Google Docs秒写

Opera Neon浏览器推出重大更新,新增‘1分钟深度研究’模式,集成Gemini3Pro与Nano Banana Pro双模型,并首次支持自然语言创建与编辑Google Docs。该功能提升了用户在快速查询和全面研究之间的效率,同时为文档编写提供了自动化解决方案。

image.png

【AiBase提要:】

✨ 新增‘1分钟深度研究’模式,提升复杂问题处理效率。

🔄 支持Gemini3Pro与Nano Banana Pro模型切换,灵活应对多阶段任务。

📝 集成Google Docs智能体,实现自然语言操作文档,提高写作效率。

4、清华大学发布 AI 应用指导原则:禁止将 AI 生成内容用作学业成果

清华大学正式发布了《清华大学人工智能教育应用指导原则》,旨在规范校园内人工智能的使用。该指导原则首次系统性地提出了人工智能应用的全局性和分层级的引导规范,涵盖了教学及学术研究的各个核心场景。

【AiBase提要:】

🧠 清华大学发布人工智能教育应用指导原则,规范校园内 AI 使用。

📚 指导原则强调严禁将 AI 生成的内容作为学业成果,确保学术诚信。

🔍 学校鼓励教师与学生积极探索 AI 辅助学习,但需遵循明确的使用规范。

5、DeepMind发布“Gemini 3 Pro系统指令”:Agent任务成功率提升5%,多步骤工作流可靠性工程化

DeepMind公开了Gemini 3 Pro的专属System Instructions,显著提升了大模型在多个基准测试中的表现。该指令强调逻辑推理、风险评估和持久性,标志着大模型从‘黑箱调参’迈向‘工程化指令’阶段。

【AiBase提要:】

📌 Gemini 3 Pro的System Instructions提升了Agent任务成功率约5%。

🔍 指令强调逻辑依赖、风险评估和假设探索,增强模型的可靠性。

🚀 DeepMind计划将指令封装为可配置JSON Schema,并在2026年Q1开放给Vertex AI等平台。

6、Adobe 发布 Project Graph:重塑创意工作流的 AI 工具

Adobe 推出的 Project Graph 是一个基于节点的视觉化编辑器,旨在帮助艺术家和设计师更高效地自定义创作流程。它通过将 AI 模型、工具和效果器连接起来,提升了创作的可控性和精确度,并支持将复杂的工作流打包为可分享的工具,从而提升团队协作效率。

image.png

【AiBase提要:】

🎨 Adobe 推出 Project Graph,旨在重塑 AI 时代的创作工作流。

🛠️ 该系统使用节点编辑器,让用户像搭积木一样自定义创作流程。

📦 用户可将创意工作流打包成可分享的工具,便于团队协作和应用。

详情链接:https://www.adobe.com/express/create/chart/bar

7、新型聊天式提示词工具 YPrompt ,轻松生成专业 Prompt

YPrompt 是一款创新的聊天式提示词工程工具,通过与用户的对话深入挖掘需求,自动生成专业的提示词。它不仅支持多种输出格式,还具备强大的版本管理功能,让用户在创作过程中更加高效和灵活。

image.png

【AiBase提要:】

✨ YPrompt 是一个聊天式提示词生成工具,通过对话挖掘用户需求。

🛠️ 该工具支持多种输出格式,方便用户即时查看效果。

📈 每次修改都会记录版本,用户可随时对比和回滚。

详情链接:https://github.com/fish2018/YPrompt

8、巨人网络发布三大 Muli-Modal 模型:消除视频畸变,歌声转换实现“真实歌曲可用”

巨人网络AI Lab联合清华大学SATLab、西北工业大学推出三项音视频多模态生成技术成果,包括音乐驱动的视频生成模型YingVideo-MV、零样本歌声转换模型YingMusic-SVC与歌声合成模型YingMusic-Singer,展示了团队在音视频多模态生成领域的最新进展,并计划开源这些技术。

【AiBase提要:】

🎥 音乐驱动的视频生成模型 YingVideo-MV 可通过一段音乐和一张人物图像生成高质量的音乐视频片段。

🎤 零样本歌声转换模型 YingMusic-SVC 实现了“真实歌曲可用”的歌声转换能力,有效抑制干扰并降低破音风险。

🎵 歌声合成模型 YingMusic-Singer 支持输入任意歌词生成自然歌声,具备零样本音色克隆功能,提升创作灵活性。

举报

  • 相关推荐
  • 夸克AI眼镜明日发布:首款搭载阿里千问的智能硬件

    阿里千问AI应用推进迅速,已与夸克AI浏览器深度融合,并内置夸克AI眼镜。其APP公测一周下载量破千万,超越ChatGPT等国际应用,成增长最快AI应用。夸克AI眼镜S1搭载双目光机方案,实现低反光、高透视觉效果,配备索尼IMX681传感器、1200万超广角镜头,支持0.6秒抓拍、3K视频。智能化方面支持通话、翻译、备忘等主流功能,集成高德导航、支付宝等,拓展使用场景。

  • 阿里夸克 AI 眼镜 S1 发布 官方补贴价 3999 元起

    阿里首款自研AI眼镜——夸克AI眼镜S1正式发布,并同步开启预售。夸克AI眼镜S1内置了随身超级AI助理“夸克同学”,基于阿里千问模型打造。用户只需说出“夸克同学”即可唤醒,支持各种对话、问答,仿佛为用户配备了一个贴身的智能小秘书。 在价格方面,夸克AI眼镜S1提供了两种套装选择。标准套装官方售价4299元,在官方补贴后仅需3999元;超级续航套装官方售价4599元,补�

  • AI日报:腾讯元宝推视频模型HunyuanVideo1.5;谷歌Nano Banana Pro上线;夸克AI眼镜与高德合作加码

    腾讯元宝推出视频生成新功能,支持一句话或图片生成5-10秒高清视频;谷歌发布Nano Banana Pro模型,具备4K分辨率及联网搜索能力;夸克AI眼镜新增导航投屏等出行功能;豆包输入法上线小米商店主打语音交互;月之暗面计划明年IPO,估值或达40亿美元;复旦团队开源语音对话模型MOSS-Speech;ChatGPT群聊功能上线,支持20人同时讨论;谷歌NotebookLM升级,可一键生成专业PPT。

  • AI日报:豆包输入法正式上线;混元开源HunyuanOCR模型;Claude Opus4.5发布

    本期AI日报聚焦多项技术突破:腾讯开源10亿参数OCR模型HunyuanOCR,在多场景实现SOTA性能;豆包输入法整合AI实现智能预测;Anthropic推出Claude Opus4.5提升推理效率;ChatGPT新增购物推荐功能准确率达64%;全球首款纯AMD训练MoE模型ZAYA1发布;微软推出本地运行助手Fara-7B;谷歌NotebookLM新增幻灯片生成功能;亚马逊Leo卫星网络启动企业测试,实现“卫星+云+AI”一体化通信。

  • AI日报:阿里千问APP公测;Veo 3.1上线多图参考;超级小爱AI大模型“随心修图”上线

    本期AI日报聚焦多项技术突破:阿里千问APP公测,基于Qwen3模型对标ChatGPT;谷歌Veo 3.1支持三图融合生成8秒视频;小米推出"随心修图"功能与7B多模态模型Miloco;谷歌Flow集成Nano Banana模型实现智能抠图;多模态AI工具DeepEyesV2可执行代码与网络搜索;NotebookLM升级支持图像导入检索;JetBrains推出DPAI Arena测试编码AI性能。全球AI竞争持续升温,产品迭代加速。

  • 李想官宣:理想智能AI眼镜要来了

    今晚,理想汽车创始人李想在B站更新了视频。 李想表示,理想不会造手机,但会推出一些生态化的产品,包括智能眼镜。 在李想看来,智能眼镜是理想汽车最好的人工智能的一个附件。

  • AI日报:HeyGen发布AI视频翻译引擎;科大讯飞推星火 X1.5;QQ浏览器推出AI+小窗

    本期AI日报聚焦多项技术突破:HeyGen推出精准唇形同步的视频翻译引擎;科大讯飞发布星火X1.5大模型,提升多语言处理能力;QQ浏览器新增AI助手浮窗;科大讯飞推出软硬一体方案,实现高噪声环境精准识别;谷歌Gemini 3 Pro预览版支持百万级上下文窗口;Comfy Cloud让Stable Diffusion实现零门槛创作;谷歌Gemini新增深度研究功能,可整合邮件生成智能报告;上海AgiBot机器人10分钟完成复杂制造任务,重塑生产效率。

  • AI日报:FLUX.2开源发布;腾讯混元3D创作引擎上线国际站;百度新设立两个大模型研发部门

    本期AI日报聚焦多项技术突破:FLUX.1开源图像模型支持多图参考与4MP编辑;腾讯混元3D引擎国际站上线,简化海外用户创作流程;字节跳动TRAE SOLO模式实现端到端自动化开发;百度新设两大模型研发部门强化AI布局;ChatGPT升级语音交互功能;亚马逊推广自研编程工具Kiro;Character.AI推出互动小说功能并加强未成年人保护;华纳音乐与Suno达成授权协议,推动AI音乐进入付费可控新时代。

  • AI眼镜,潮人新标配

    从ChatGPT的刷屏到Vlog里逐渐增多的POV视角(第一人称视角拍摄),AI早已从科幻片里的黑科技,变成生活中的日常点滴。这也让年轻人升级了对科技的期待,他们不再只为“性能炸裂”买单,也希望科技能懂穿搭、有个性,成为一张低调又高级的“社交名片”。 以时尚潮人必备的眼镜为例,这件日常单品从一开始的视力矫正工具,变成时尚穿搭配饰,如今又搭载了AI功能,能听

  • 阿里夸克AI眼镜S1宣布11月27日发布

    阿里巴巴旗下首款旗舰双显AI眼镜夸克AI眼镜S1将于11月27日上市。产品融合前沿显示、拍摄与交互技术,以双目光机二维衍射波导方案实现低反光率高透性视觉体验,支持环境光智能调节与自定义显示位置。搭载索尼IMX681传感器与1200万超广角镜头,具备极速抓拍、3K视频及超级夜景功能。创新双电池架构与MiniBag换电仓解决续航痛点,支持手势与语音双操作。集成高德导航、支付宝“看一看”支付及办公辅助工具,通过眨眼或语音即可完成路线查询与快捷支付,覆盖生活全场景智能生态。

今日大家都在搜的词: