11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
腾讯云
12-20
小红书科技与Red++ Academy在1024程序员节举办直播,技术副总裁凯奇、语音模型负责人风龙与Hugging Face联合创始人Thomas Wolf围绕三大核心观点展开AMA对话:AI编程正成为基础能力;开源是技术发展的核心引擎;实现有"人味"的AGI路径清晰但仍需攻克创造力、复杂环境感知等难题。讨论覆盖开源价值、AGI发展瓶颈、AI人味化实践,强调技术人需提升问题定义与框架性解决能力,并分享了AI编码提效、学习新技术的方法。直播展现小红书从文本模型到语音模型的开源布局,旨在降低技术使用门槛,推动社区共进。
SoulX-Podcast语音生成模型在开源社区Hugging Face发布次日登顶TTS趋势榜。该模型由Soul AI Lab联合高校团队开发,专为多轮对话场景设计,支持中英川粤等多语言/方言与副语言风格,能生成超60分钟流畅自然、角色切换准确、韵律丰富的语音。它解决了传统语音系统在多轮对话中上下文衔接不自然、缺乏副语言控制能力等痛点,在播客、语音合成等场景表现突出,获开发者广泛关注。Hugging Face CEO也转发相关内容,团队未来将持续优化语音对话、拟人化表达等核心交互能力,深化开源生态建设。
蚂蚁百灵团队开源高性能思考模型Ring-flash-2.0,在多项基准测试中表现优异;阿里通义7款模型登顶Hugging Face榜单,Qwen3-Omni凭借多模态能力全球第一。谷歌Veo3突破视频生成局限,可自动完成视觉任务;特斯拉推进人形机器人量产,马斯克称其为最重要产品。马斯克第六次起诉OpenAI窃取商业机密,苹果内部测试聊天机器人Veritas优化Siri,YouTube推出AI音乐主播增强互动,LiquidAI发布轻量级模型Liquid Nanos优化边缘计算。
百度发布超轻量级文字识别模型PP-OCRv5,仅0.07B参数却实现媲美700亿参数大模型的OCR精度。在多项测试中超越GPT-4o等通用视觉大模型,尤其在文本定位和边界框精度上表现优异。该模型支持5种文字类型识别,适用于教育、医疗、法律等多行业数字化需求,累计下载量超900万,是GitHub上唯一Star数超5万的中国OCR项目。
AI日报今日聚焦七大热点:小红书发布FireRedTTS-2语音合成模型,显著提升自然度;百度文心ERNIE-4.5登顶Hugging Face榜单;谷歌Gemini应用登顶美国免费榜;马斯克xAI裁员500人并战略转型;OpenAI拟大幅降低与微软分成比例;DeepMCPAgent开源框架提升AI代理生产力;蚂蚁发布AI开源全景图2.0;北京1400多所中小学推行人工智能通识课程。
本期AI日报聚焦多项AI领域创新:1)阿里开源Qwen-Image-Edit图像编辑模型,支持中文渲染与精准文本编辑;2)淘宝测试"AI万能搜"功能,重构电商搜索体验;3)小红书发布DynamicFace人脸生成技术,实现高质量图像视频换脸;4)Gemini API新增URL Context功能,简化网页内容获取流程;5)Nvidia推出小型开放模型Nemotron-Nano-9B-v2,支持智能推理开关;6)马斯克发布Grok Imagine 0.1测试版,进军AI图像生成领域;7)Vercel推出iOS版AI开发工具v0;8)理想汽车发布MindGPT 3.1模型,处理速度提升5倍;9)ToonComposer工具简化动画制作流程;10)ElevenLabs推出视频到音乐生成流程。
2025年8月1日,上汽奥迪A5L Sportback正式上市,推出六款配置车型,售价25.99万元起。该车是全球首款搭载华为乾崑智驾技术的燃油车,配备32个高性能传感器和激光雷达,支持高速、城区、泊车全场景智能驾驶。动力方面搭载第五代EA888发动机,百公里加速5.6秒,并配备quattro智能四驱系统。新车延续奥迪经典掀背造型,轴距加长提升实用性,内饰采用新一代智能豪华座舱设计。此次上市标志着传统豪华品牌在智能化浪潮下的创新突破,为燃油车市场注入新活力。
8月1日,上汽奥迪A5L Sportback正式上市,成为全球首款搭载华为乾崑智驾技术的燃油车。该车融合德系机械底蕴与中国智能科技,配备32个高性能传感器和华为ADS 2.0系统,实现高速、城区、泊车全场景智能驾驶。动力方面搭载第五代EA888发动机(200kW)和quattro四驱系统,百公里加速5.6秒。设计上延续奥迪经典溜背造型,提供六款配置车型,售价25.99万元起。华为乾崑智驾系统已累计辅助驾驶35.41亿公里,泊车辅助超2.3亿次,用户人均辅助驾驶里程达524公里。此次合作标志着传统豪华品牌与智能科技的深度融合,为燃油车智能化发展开辟新路径。
近日,苹果在最新推送的iOS26测试版系统中,对FaceTime功能进行了重要安全升级,新增实时内容检测机制以保障视频通话安全。据测试用户反馈,当系统通过AI算法识别到通话画面中出现裸露行为时,将立即暂停音视频传输,同时冻结通话画面并弹出警告窗口,要求用户终止不当行为。 该技术源于苹果此前推出的通信安全功能,此前主要应用于未成年人保护场景。例如,系统会
南京钢铁集团与华为合作推进"AI+钢铁"数字化转型,打造"元冶·钢铁大模型"平台。该平台已覆盖研发设计、生产制造等四大业务方向20个智能场景应用,实现从经验炼钢到科技炼钢的转变。在峰谷发电、碳锰低温钢研发等场景中,AI技术显著提升能效与研发效率,如峰谷发电效益提升4.24倍,吨焦成本降低5-10元。通过"双模智能"融合知识库与数据引擎,南钢实现精准质检与智能问答。2024年成为全国首批数字资产入表上市企业,全年数据资产入表超1000万元。双方构建的工业智能新范式,正引领中国钢铁行业智能化升级。