首页 > 原创 > 关键词  > AI视频最新资讯  > 正文

AI日报:Kling 2.6将发布;千问APP推学习大模型;Z-Image-Turbo-Fun-Controlnet-Union 开源

2025-12-03 16:40 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://app.aibase.com/zh

1、Kling 2.6将发布:原生音频+10秒1080P,AI视频进入有声时代

Kling AI在Omni生态周首日发布了2.6版本,首次内置音频生成功能,支持中英双语对白、歌唱与音效同步输出,实现‘文本⇄视频⇄音频’一键闭环。技术规格方面,保持10秒1080P高清输出,每5秒仅需25积分,较前版降30%。市场层面,Kling 2.6将率先在Artlist等专业平台上线,提供场景扩展与多元素编辑API,面向影视、短剧、广告及MV制作。

image.png

【AiBase提要:】

首次内置音频生成,支持中英双语对白、歌唱与音效同步输出。

⚡ 技术规格优化,每5秒仅需25积分,较前版降30%。

🎥 市场层面,Kling 2.6将率先在Artlist等专业平台上线,面向影视、短剧、广告及MV制作。

2、千问APP推出强大学习大模型,拍照答疑更智能!

千问APP推出了基于Qwen3训练的全新学习大模型Qwen3-Learning,具备多语言解题、跨文化考试体系以及智能化作业批改功能。同时,APP还引入了Qwen-Image模型和万相视频生成模型,进一步提升学习体验。自公测以来,下载量迅速突破1000万,展现了其在教育领域的强大竞争力。

【AiBase提要:】

🧠 Qwen3-Learning 模型支持多语言解题和跨文化考试体系

📝 作业批改功能覆盖小学到高中所有学科,兼容印刷体与手写体

📱 千问APP推出Qwen-Image模型,提供智能拍照答疑功能

3、阿里通义实验室再出王炸!Z-Image-Turbo-Fun-Controlnet-Union 开源,6B 参数秒杀 Flux

阿里通义实验室推出的 Z-Image-Turbo-Fun-Controlnet-Union 模型,通过集成 ControlNet 结构,实现了对图像生成的精准控制,同时具备高效的推理性能和广泛的兼容性,为开发者和创作者提供了强大的工具支持。

image.png

【AiBase提要:】

🧠 集成 ControlNet 结构,支持多模态控制条件如边缘检测和深度映射。

⚡ 优化推理效率,仅需6GB VRAM即可运行,适合低端设备部署。

🌐 开源生态赋能,兼容多种工具并提升图像生成的精确度与创意性。

详情链接:https://huggingface.co/alibaba-pai/Z-Image-Turbo-Fun-Controlnet-Union

4、豆包手机助手遭遇微信登录异常,官方回应或触发安全风控

文章报道了豆包手机助手在使用过程中出现的微信登录异常问题,以及由此引发的安全风控讨论。同时提到该AI手机助手的市场热度和价格飙升现象,凸显了其在实际应用中的生态兼容性挑战。

image.png

【AiBase提要:】

📱 豆包手机助手与中兴合作的nubia M153工程机用户反馈无法登录微信,微信页面显示异常。

🚫 微信方面回应称可能是安全风控措施,豆包团队表示正在核实。

💰 中兴商城显示售价3499元的豆包助手手机已售罄,闲鱼平台报价高达7999~9999元,溢价超6500元。

5、米哈游联创蔡浩宇推出不正经AI:会说话带喵的AnuNeko上线

文章介绍了米哈游联创蔡浩宇推出的AI聊天大模型AnuNeko,其独特的定位和人格设定引发了关注,并展示了其在游戏开发领域的潜在野心。

image.png

【AiBase提要:】

🐱 AnuNeko以黑猫形象呈现,强调个性化和情绪化交互体验。

🍊 提供两种人格模式,分别展现温和与犀利的对话风格。

🎮 蔡浩宇希望利用AI技术打造游戏开发的AI引擎平台。

6、亚马逊云科技发布三款新AI智能体,Kiro可持续自主编程数日

亚马逊云科技(AWS)近日推出三款新型AI智能体,旨在提高软件开发和运维效率。其中最引人注目的是名为“Kiro”的自主智能体,它能够连续工作数天,学习用户的偏好并独立完成复杂任务。此外,AWS还推出了两款智能体:AWS安全智能体和DevOps智能体,分别负责自动识别安全隐患和进行性能测试与兼容性检查。这些智能体的推出标志着AWS在AI技术应用上的进一步深化。

【AiBase提要:】

✨ Kiro 智能体可连续自主工作数日,能够学习用户偏好并独立完成复杂任务。

🔒 AWS 安全智能体自动识别编码过程中的安全隐患并提供修复建议。

⚙️ DevOps 智能体专注于新代码的性能测试和兼容性检查。

详情链接:https://kiro.dev/

7、IDC 发布全球具身智能机器人创新者榜单,微亿智造上榜

文章介绍了IDC发布的《IDC Innovators: 具身智能机器人创新者》报告,预测到2030年具身智能机器人将在整体机器人用户支出市场中占据超过30%的份额。报告指出,随着人工智能、感知技术和计算能力的发展,具身智能机器人将在多个领域迅速扩展应用。文章还提到了四家具有代表性的创新企业,展示了它们在推动具身智能机器人技术落地与商业化方面的卓越表现。

image.png

【AiBase提要:】

🤖 全球具身智能机器人市场到2030年预计占比超30%。

💡 IDC 发布创新者榜单,四家企业入选推动行业发展。

🚀 创新企业利用智能技术提高任务效率,助力企业智能化转型。

8、杭州瞳行科技发布国内首款AI助盲眼镜,3000元内实现300毫秒路况播报

瞳行科技发布了国内首款AI助盲眼镜,搭载阿里通义千问大模型,为视障人士提供实时出行指引。该产品通过眼镜本体、手机、遥控指环及盲杖四端协同,实现超低延迟和精准的路况播报,预计2026年一季度正式开售,售价低于3000元。

image.png

【AiBase提要:】

✨ 眼镜搭载阿里通义千问大模型,提升视障人士出行体验。

🔍 121度超广角双摄像头实现300毫秒超低延迟,精准识别路况。

💰 售价低于3000元,有望大规模进入康复辅具采购目录。

举报

  • 相关推荐
  • 北京大上科技发布6.7英寸60Hz墨水屏手机同屏器Link(超高刷版)

    2025年12月31日,北京大上科技发布全球首款6.7英寸60Hz刷新率的墨水屏手机同屏器Link(超高刷无线版)。该产品采用独家60Hz超高刷专利技术,刷新速度媲美液晶屏,解决了传统墨水屏“卡、慢、闪”问题。Link通过无线连接手机,直接投射画面,实现超低延迟反向触控,支持微信聊天、刷视频等高流畅场景。其6.7英寸E Ink屏幕分辨率达1800×900,像素密度300PPI,显示细腻。作为专业墨水屏手机显示器,Link让用户获得类纸质护眼体验,无需频繁更换设备,性价比较高。产品将于2026年1月5日在电商平台现货开售。

  • NVIDIA RTX 加速 PC 端 4K AI 视频生成,LTX-2 与 ComfyUI全面升级

    2025年是PC端AI发展的突破之年,小语言模型(SLM)准确率相比2024年提升近2倍,显著缩小了与云端大语言模型(LLM)的差距。NVIDIA在CES上宣布了一系列针对RTX设备的AI升级,以解锁PC上的生成式AI性能。通过优化ComfyUI、开源LTX-2视频生成模型、加速Ollama和llama.cpp等工具,实现了视频/图像生成性能最高提升3倍、显存占用最多降低60%,以及SLM推理性能最高提升35%。这些改进让用户能在本地RTX AI PC上无缝运行先进的工作流,同时享受隐私、安全和低延迟优势。全新的视频生成工作流和由Nexa.ai推出的Hyperlink本地智能搜索工具,将进一步推动生成式AI在2026年全面走向大众创作者、游戏玩家和生产力用户。

  • 即构推出AI音视频能力矩阵 助力应用突围增长

    如今,移动应用市场竞争进入了存量博弈新阶段,应用内的新玩法复制成本低,单靠独创模式难以吸引用户留存。Sensor Tower数据显示,全球应用商店双寡头垄断格局稳固,头部应用占据超60%用户时长,中小应用突围愈发艰难。行业增长逻辑已转向内容质量与优质体验,音视频质量低下可能导致用户留存与转化显著下滑。尤其是在直播语聊、网课、电商、音视频创作工具等高频�

  • AI日报:千问发布分层图像编辑模型Qwen-Image-Layered;Kling2.6新增语音控制和动作控制功能;谷歌推出A2UI开放标准

    本期AI日报涵盖多项重要进展:阿里通义千问发布分层图像编辑模型Qwen-Image-Layered,实现类似Photoshop的图层操作;Claude Chrome插件全面开放,提升AI与网页交互体验;快手Kling 2.6通过语音与动作控制提升视频生成质量;MiniMax通过港交所上市聆讯,展现AI领域实力;三星与谷歌合作推出全球首款搭载Gemini的AI冰箱,实现食材识别与红酒管理;北京人形机器人推出国内首个符合国标的VLA大模型XR-1,具备复杂操作能力;谷歌推出A2UI开放标准,让AI代理即时创建图形界面;以及开源提示词工具PromptFill上线,降低AI绘画门槛。

  • 每日2.6亿用户追热点,老铁捧出新“十大顶流”

    “318国道至今还没听说有鸵鸟走,我一会坐下来帮你规划一条线路。” 在2026新年访谈中,主持人大冰对鸵鸟养殖者心雨说道。318国道(川藏线)是中国著名的景观大道,以路途艰险、风景壮丽著称。作为2024年快手热点人物,大冰切换回“老本行”,和2025年的热点人物对谈,并让对话进入了“脑洞时刻”。目前,《这一刻是主角》的先导片点赞超过100万,话题播放量达到2.3亿

  • AI日报:实时世界模型 PixVerse R1发布;Vidu发布AI一键生成MV功能;可灵AI ARR达2.4亿美元

    本期AI日报聚焦多项AI领域突破:爱诗科技发布全球首个通用实时世界模型PixVerse R1,实现虚拟世界实时交互;Vidu推出AI一键生成MV功能,打造“虚拟制片厂”;MiniMax发布编程智能体基准测试OctoCodingBench;快手可灵AI年化收入达2.4亿美元;智谱联合华为开源多模态模型GLM-Image,全链路跑通国产芯片;百川智能发布医疗大模型Baichuan-M3;谷歌重构电商未来,推出Agentic AI购物系统;谷歌开源医疗AI模型MedGemma 1.5与语音识别模型MedASR。

  • 短视频刷多了会脑雾:记不住事

    你是否遇到过这种情况,正准备说话,突然忘了刚才想要说什么?明明是一个比较熟悉的人,却怎么也想不起对方的名字?这就好比人的大脑被蒙上了一层雾”,不够清醒、敏锐,被称之为脑雾”。 医学专家指出,脑雾”并非医学诊断,而是患者对自身注意力涣散、精神难以集中、伴随疲惫感的生动客观描述,就像大脑中笼罩着一团雾气,清晰的思维通路被堵塞。 这种状态�

  • 在中东遇见东方声学智慧!IndoorLink无线讲解器入驻阿联酋国家博物馆

    2025年12月,扎耶德国家博物馆在阿布扎比萨迪亚特文化区开放,成为展示阿联酋历史与全球视野的文化地标。馆内汇集珍贵文物,并引入中国智慧科技——IndoorLink无线讲解器,以头戴式设计解放双手,支持多方式佩戴,具备高保真音质、超远距稳定通讯及智能抗干扰能力,助力博物馆向世界生动讲述自身故事。此次合作标志着中国智慧导览科技获得世界顶级文化机构的认可。

  • 关于长视频忠粉养成记,优酷SVIP亮出一套「多很多」秘籍

    12月底,一波剧粉涌进了上海豫园。 有人兴致勃勃与所追剧集的剧集场景、角色立牌合照;有人一袭古风造型,主打一个沉浸式游园;有人在社交平台再次安利一下自己的心头好;也有人遗憾未能到场,只好在评论区询问是否有人能帮忙购买周边…… 当一批批如《藏海传》《凡人修仙传》《暗河传》等年度爆款剧集近距离走进用户,优酷SVIP超酷会员日(以下简称超酷会员日)举�

  • 带80岁爷爷搞抽象,“隔辈整活”成短视频新赛道?

    ​穿着夸张战袍的八旬姥爷变身“大力水手”,喊着“风鹰铠甲”合体成铠甲勇士,戴着假发cos拳皇八神庵……临近春节,社交平台上出现大批“隔代整活”视频。 年轻人返乡后,拉着家中老人拍摄各种抽象、搞怪内容,播放量动辄百万,甚至火到海外。

今日大家都在搜的词: