11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
腾讯云
12-20
如今,移动应用市场竞争进入了存量博弈新阶段,应用内的新玩法复制成本低,单靠独创模式难以吸引用户留存。Sensor Tower数据显示,全球应用商店双寡头垄断格局稳固,头部应用占据超60%用户时长,中小应用突围愈发艰难。行业增长逻辑已转向内容质量与优质体验,音视频质量低下可能导致用户留存与转化显著下滑。尤其是在直播语聊、网课、电商、音视频创作工具等高频�
2025年是PC端AI发展的突破之年,小语言模型(SLM)准确率相比2024年提升近2倍,显著缩小了与云端大语言模型(LLM)的差距。NVIDIA在CES上宣布了一系列针对RTX设备的AI升级,以解锁PC上的生成式AI性能。通过优化ComfyUI、开源LTX-2视频生成模型、加速Ollama和llama.cpp等工具,实现了视频/图像生成性能最高提升3倍、显存占用最多降低60%,以及SLM推理性能最高提升35%。这些改进让用户能在本地RTX AI PC上无缝运行先进的工作流,同时享受隐私、安全和低延迟优势。全新的视频生成工作流和由Nexa.ai推出的Hyperlink本地智能搜索工具,将进一步推动生成式AI在2026年全面走向大众创作者、游戏玩家和生产力用户。
本期AI日报聚焦多项AI领域新动态:火山引擎成为2026年春晚独家AI云伙伴,将提升互动体验;元宝AI上线任务提醒功能,支持一句话设定循环定时任务;B站开源神器ClipSketch AI可将视频一键转为手绘分镜;阶跃星辰推出高性价比深度研究模型Step-DeepResearch;广州海珠区成立全国首个区级人工智能发展局,每年投入3.1亿支持产业发展;AI编程工具Windsurf Wave13发布,集成SWE-1.5模型;Meta AI推出Pixio图像模型,凭借像素重建刷新3D重建纪录;开源框架VideoPipe简化视频AI应用开发,降低CV门槛。
“拍我+AI”App(海外版PixVerse)提供AI视频生成功能,用户上传家人照片即可快速生成年轻或年老样貌的合拍视频。PixVerse持续迭代,V5.5版本支持智能分镜、多角色音视频一键生成完整故事。其背后机器学习平台MLP通过灵活调配CPU/GPU资源,提升30%利用率,支撑用户规模数倍增长。数据分析平台DataFinder助力精准优化产品,提升用户粘性。未来,爱诗科技将继续携手BytePlus提升模型性能,让AI视频成为娱乐创作的重要部分。
本期AI日报聚焦多项技术突破与应用创新。清华开源TurboDiffusion框架,将AI视频生成速度提升200倍,消费级显卡也能秒出大片。腾讯混元推出ETC领域首款AI智能体,通过多模态交互提升出行体验。阿里通义千问发布新一代图像编辑模型Qwen-Image-Edit-2511,大幅提升人物一致性编辑能力。京东物流在英国启用首个“智羚仓”,近200台自研机器人提升分拣效率。1min.AI推出终身全能计划,
本期AI日报汇总了多项AI领域重要进展:Google Gemini应用新增视频AI生成检测功能;GPT-5.2-Codex发布,在代码重构与安全方面表现卓越;美团推出SOTA级虚拟人视频生成模型LongCat-Video-Avatar;苹果发布多模态AI模型UniGen 1.5,集成图像理解、生成与编辑;ElevenLabs的AI语音助手集成至WhatsApp,提升客服效率;字节跳动与硬件厂商合作推出AI手机方案;Claude AI上线新“任务模式”,增强复杂任务处理能力;Luma发布Ray3 Modify,实现高保真视频AI编辑;QQ音乐推出本地化AI作曲功能,保障隐私;微信元宝AI助手新增一句话设置提醒及多内容解析能力。
本期AI日报聚焦多款AI产品更新:Medeo AI新版视频Agent支持自然语言一键改剧本,降低创作门槛;钉钉8.1.10将AI融入职场沟通,提升效率;OpenAI低调上线GPT-5.2,延迟显著降低,逻辑一致性提升,并推出支持私有化部署的成人模式;迪士尼投资100亿美元与OpenAI合作,推动IP在生成式AI中的创新应用;谷歌Gemini Deep Research开放API,供开发者构建研究应用;Cohere推出Rerank 4,上下文窗口扩展至32K,提升企业搜索精度;拓竹科技推出3D手办生成器“印你”,依托腾讯混元3D模型,简化3D建模流程;谷歌NotebookLM升级,为Ultra会员提供更高权限,优化智能笔记体验。
可灵视频生成2.6模型推出“音画同出”功能,彻底改变了传统AI视频“先无声画面、后人工配音”的工作流程。它能在单次生成中,输出包含自然语言、动作音效及环境氛围的完整视频,重构了AI视频创作工作流,极大提升创作效率。该模型在中文语音生成效果上保持全球领先,支持生成最长10秒的视频,可广泛应用于广告营销、自媒体、电商等内容创作场景。
本文汇总了AI领域的最新动态:可灵AI发布O1视频大模型,支持多模态输入一键生成视频;千问APP接入万相Wan2.5,提升视频创作能力;PixVerse V5.5实现音画同步,简化视频制作;深度求索推出DeepSeek-V3.2,引入稀疏注意力机制降低成本;Runway发布Gen-4.5模型,增强视觉质量;谷歌优化AI搜索体验,Gemini 3 Pro扩展国际市场;Lovart推出Touch Edit功能,实现零门槛图像编辑;蚂蚁数科Agentar入选中国智能体开发赛道第一梯队,展现技术实力。
可灵AI正式发布全新O1视频大模型,被誉为全球首个统一多模态视频大模型。该模型基于创新的多模态视觉语言交互架构,用户可在单一输入框内无缝融合文字、图像、视频等多种指令,实现跨模态内容的高效创作。其技术突破解决了传统视频生成工具功能割裂、操作复杂的痛点,并攻克了视频中主体特征漂移的行业难题,支持长达310秒的自由生成时长。目前用户可通过可灵App及官网体验。