11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
腾讯云
12-20
本期AI日报聚焦多领域进展:可灵AI 3.0发布,开启15秒视频AI导演时代;阿里AI品牌统一为“千问”,战略升级;Mistral AI推出低延迟语音转文字模型;上海AI实验室发布全球最大开源科学多模态模型“书生Intern-S1-Pro”;谷歌Gemini月活用户突破7.5亿,并推出低价订阅方案;华为Mate 80系列新增AI消除屏幕摩尔纹功能;米兰冬奥会将启用阿里“千问”大模型;我国生成式AI用户规模破6亿,普及率超四成,算力水平全球领先。
随着数字化生活深入,网络安全关乎个人隐私、财产安全和清朗网络空间建设。互联网平台承担着重要安全责任。面对日益隐蔽复杂的网络黑产与诈骗,构建以平台技术为基础、用户广泛参与的多方共治模式已成行业共识。QQ安全中心发布的《2025年工作报告》显示,平台通过AI大模型等技术强化安全治理,在内容管理、黑产打击、账号防护等方面成效显著。例如,全年处置恶意低俗内容及涉未成年人风险信息数亿条,有效抵御黑产攻击,处置恶意账号百余万个,并向警方报送有效线索。同时,平台推出“QQ反诈助手”等工具,日均下发安全提醒超300万次,累计服务用户超770万人次,帮助用户识别风险。在未成年人保护方面,推出主题关怀卡提供安全提示。用户参与度持续提升,全年数千万用户主动举报违规内容,举报意愿同比增长12%。未来,QQ将持续加大技术投入,深化人工智能、大数据在安全防护中的应用,优化用户反馈流程,强化与用户及社会各界的协同合作,共同营造更安全可信的网络环境。
本期AI日报聚焦多项AI领域新进展:字节跳动发布Seed Prover 1.5,在形式化数学推理领域取得突破;阿里通义开源语音交互模型Fun-Audio-Chat-8B,具备超低延迟和情感感知能力;MiniMax开源M2.1编码模型,性能超越闭源巨头;知乎发布2025年度AI产品榜单,豆包位居榜首;Anthropic推出开源Agent Skills知识库,助力Claude模型技能拓展;Lima v2.0发布,从容器工具进化为安全AI工作流平台;讯飞星�
微信输入法iOS版迎来3.0.0大版本更新,聚焦语音功能优化。升级后语音识别准确率与速度显著提升,并新增15种方言语音输入,覆盖粤语、四川话等。新版支持不限时长的语音输入,方便记录会议等内容,同时具备离线语音输入功能,保障网络不佳时顺畅使用。官方强调严格遵循隐私政策,仅收集必要信息,保障用户数据安全。
苹果因自研大模型项目遇瓶颈,决定引入谷歌Gemini大模型升级Siri,计划每年支付约10亿美元获取定制化Gemini 2.5 Pro使用权。该模型拥有1.2万亿参数,将全面负责Siri的信息摘要、任务规划及复杂指令执行等核心功能,支持多模态交互和超长文本处理。升级版Siri预计2026年春季随iOS 26.4推送,后续将在WWDC大会展示进一步整合。苹果选择谷歌主要因成本优势、长期合作基础及Gemini领先性能。
京东在双11期间升级直播技术,推出“立体3D技术”和“JoyAI大模型”等创新。立体3D技术实现裸眼360度商品展示,用户无需额外设备即可旋转查看产品细节;JoyAI生成虚拟偶像Aura,与真人明星跨次元互动,提升趣味性。AI工具还简化直播运营,支持智能脚本和选品。这些技术打破传统直播边界,增强沉浸感和互动效率,引领电商直播创新方向。
京东在11.11大促期间升级直播技术,推出“立体3D技术”和“JoyAI大模型”等创新,打破传统直播边界。立体3D技术实现裸眼360度商品展示,用户无需额外设备即可旋转查看产品细节;虚拟偶像Aura等跨次元互动增强趣味性。AI全链路工具简化主播运营,提升内容创作效率。这些举措为用户带来沉浸式购物体验,引领直播电商技术革新方向。
良好的软件环境能降低AI应用开发门槛,增强用户粘性,对AI芯片发展至关重要。寒武纪专注AI芯片研发,掌握处理器架构、SoC设计等硬件技术及编程框架、编译器、驱动等软件技术。通过芯片、硬件板卡、基础软件三大团队协同,为产品提供全链条技术支持,并构建开发者生态。未来将通过开放生态推动云计算、金融、医疗等行业的智能化升级,以市场为导向保持技术领先。
AI日报今日聚焦多项技术突破:小米开源首个端到端语音大模型Xiaomi-MiMo-Audio;通义万相推出全新动作生成模型Wan2.2-Animate;Suno即将发布革命性音乐模型v5;生数科技获数亿融资,视频生成技术商业化加速。同时关注OpenAI修复ChatGPT安全漏洞,谷歌将Gemini集成至Chrome浏览器,Luma AI发布支持16位色的Ray3视频生成模型,法国Mistral推出开源推理模型Magistral Small 1.2,Notion发布AI智能体,腾讯混元3D Studio提升3D创作效率。
小米发布首款开源端到端语音大模型Xiaomi-MiMo-Audio,拥有12亿参数,在智能性、情感表达和交互适配方面接近人类水平。该模型最大技术突破在于少样本学习能力,通过创新预训练架构和超一亿小时训练数据,成功突破传统语音模型依赖大规模标注数据的技术瓶颈。基于Transformer架构,支持音频重建和音频转文本等多任务处理。小米已在Huggingface平台发布预训练和指令微调版本,并在Github开源Tokenizer模型,为研究者和开发者提供完整工具链。