11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
腾讯云
12-20
苹果首款折叠屏手机iPhone Fold已经明确,将在今年9月与iPhone 18 Pro系列一起发布,将是苹果最贵手机产品。 这是苹果历经多年技术打磨后的首款折叠屏机型,采用更宽的屏幕设计,旨在解决目前折叠屏手机折痕明显等行业痛点。
此前有传闻称,iPhone 18 Pro将把部分Face ID组件移至屏下。这一技术突破能让灵动岛的面积缩小约35%,从而大幅优化视觉观感,提升手机的正面屏占比。 具体来说,苹果原本计划将Face ID系统中的泛光感应元件隐藏到屏幕下方。这种做法可以有效减少前置挖孔的区域面积,让饱受争议的灵动岛成功瘦身,为用户带来更开阔的视野。 然而,最新的供应链消息却给期待已久的粉丝们�
iPhone Air机身厚度仅有5.6毫米,是苹果卓越工程设计的一次集中体现。 但不可否认的是,iPhone Air为了极致轻薄设计,在影像、续航和外放上做了妥协,该机配备4800万单摄以及单扬声器,电池仅有3149mAh。 展望下一代,iPhone Air 2将会弥补影像上的短板,加入一颗超广角摄像头。据爆料,为了在iPhone Air 2超轻薄机身里塞进两颗摄像头,苹果和供应链合作研发定制超薄Face ID组件,�
据博主透露,iPhone 18系列正测试屏下3D人脸识别技术,有望实现Face ID组件隐藏。苹果研发该技术多年,原计划用于iPhone 16 Pro,但因测试效果未达预期而推迟。若成功应用于iPhone 18系列,将显著缩小灵动岛尺寸,提升屏占比,成为史上屏占比最高的iPhone机型,并改善游戏和观影的视觉体验。不过,该技术可能仅限iPhone 18 Pro系列独享,标准版或将无缘。
小红书科技与Red++ Academy在1024程序员节举办直播,技术副总裁凯奇、语音模型负责人风龙与Hugging Face联合创始人Thomas Wolf围绕三大核心观点展开AMA对话:AI编程正成为基础能力;开源是技术发展的核心引擎;实现有"人味"的AGI路径清晰但仍需攻克创造力、复杂环境感知等难题。讨论覆盖开源价值、AGI发展瓶颈、AI人味化实践,强调技术人需提升问题定义与框架性解决能力,并分享了AI编码提效、学习新技术的方法。直播展现小红书从文本模型到语音模型的开源布局,旨在降低技术使用门槛,推动社区共进。
SoulX-Podcast语音生成模型在开源社区Hugging Face发布次日登顶TTS趋势榜。该模型由Soul AI Lab联合高校团队开发,专为多轮对话场景设计,支持中英川粤等多语言/方言与副语言风格,能生成超60分钟流畅自然、角色切换准确、韵律丰富的语音。它解决了传统语音系统在多轮对话中上下文衔接不自然、缺乏副语言控制能力等痛点,在播客、语音合成等场景表现突出,获开发者广泛关注。Hugging Face CEO也转发相关内容,团队未来将持续优化语音对话、拟人化表达等核心交互能力,深化开源生态建设。
蚂蚁百灵团队开源高性能思考模型Ring-flash-2.0,在多项基准测试中表现优异;阿里通义7款模型登顶Hugging Face榜单,Qwen3-Omni凭借多模态能力全球第一。谷歌Veo3突破视频生成局限,可自动完成视觉任务;特斯拉推进人形机器人量产,马斯克称其为最重要产品。马斯克第六次起诉OpenAI窃取商业机密,苹果内部测试聊天机器人Veritas优化Siri,YouTube推出AI音乐主播增强互动,LiquidAI发布轻量级模型Liquid Nanos优化边缘计算。
百度发布超轻量级文字识别模型PP-OCRv5,仅0.07B参数却实现媲美700亿参数大模型的OCR精度。在多项测试中超越GPT-4o等通用视觉大模型,尤其在文本定位和边界框精度上表现优异。该模型支持5种文字类型识别,适用于教育、医疗、法律等多行业数字化需求,累计下载量超900万,是GitHub上唯一Star数超5万的中国OCR项目。
AI日报今日聚焦七大热点:小红书发布FireRedTTS-2语音合成模型,显著提升自然度;百度文心ERNIE-4.5登顶Hugging Face榜单;谷歌Gemini应用登顶美国免费榜;马斯克xAI裁员500人并战略转型;OpenAI拟大幅降低与微软分成比例;DeepMCPAgent开源框架提升AI代理生产力;蚂蚁发布AI开源全景图2.0;北京1400多所中小学推行人工智能通识课程。
本期AI日报聚焦多项AI领域创新:1)阿里开源Qwen-Image-Edit图像编辑模型,支持中文渲染与精准文本编辑;2)淘宝测试"AI万能搜"功能,重构电商搜索体验;3)小红书发布DynamicFace人脸生成技术,实现高质量图像视频换脸;4)Gemini API新增URL Context功能,简化网页内容获取流程;5)Nvidia推出小型开放模型Nemotron-Nano-9B-v2,支持智能推理开关;6)马斯克发布Grok Imagine 0.1测试版,进军AI图像生成领域;7)Vercel推出iOS版AI开发工具v0;8)理想汽车发布MindGPT 3.1模型,处理速度提升5倍;9)ToonComposer工具简化动画制作流程;10)ElevenLabs推出视频到音乐生成流程。