11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
本期AI日报聚焦多领域技术突破:阿里云推出全球首个全模态AI模型Qwen3-Omni,支持文本、图像、音频和视频统一处理;百度发布多尺寸视觉理解模型Qianfan-VL,优化企业级应用。苹果扩展Image Playground平台,引入ChatGPT等第三方模型。谷歌与PayPal合作推出AP2协议,推动AI支付安全创新。钉钉上线AI表格助手,支持自然语言生成表格。DeepSeek开源V3.1-Terminus模型,性能显著提升。Kimi推出Agent会员服务,智元机器人开源全球首个通用具身智能模型GO-1,降低技术门槛促进行业创新。
百度智能云千帆正式推出全新视觉理解模型Qianfan-VL并全面开源。该系列模型包含3B、8B和70B三个版本,面向企业级多模态应用场景,具备出色的基础通用能力,并针对OCR、教育等高频需求进行专项强化。模型基于昆仑芯P800芯片实现高效计算,支持5000卡并行,在通用和垂直任务评测中达到SOTA水平。Qianfan-VL具备多尺寸模型、思维链推理和OCR增强三大特点,可广泛应用于文档识别、数学解题、图表分析等场景,为企业提供高精度视觉理解解决方案。
9月22日,百度网盘海外版全面开放海外手机号注册,并针对海外华人、留学生等用户升级AI功能。iOS用户可在当地App Store直接下载,安卓版即将上线Google Play。海外版针对学习、工作、娱乐场景优化,如AI笔记可一键生成英文视频摘要,AI相机支持拍照解题、实时翻译,AI听记可智能总结线上会议,并全面兼容Teams、Zoom等应用。此外还提供数十种AIGC创意视频玩法,深受海外用户欢迎。
国家工信安全中心发布《大模型赋能智慧办公评测报告》,对8款主流AI生成PPT产品进行综合评估。百度文库在生成质量、排版美化等六项指标中全部位列第一,持续领跑智能PPT行业。报告显示当前产品已基本满足日常需求,但专业度和时效性仍有提升空间。百度文库依托海量专业文档资源,在产业研究、教育培训等场景表现突出,月活用户超9700万,智能PPT功能月访问量全球第一。
百度发布超轻量级文字识别模型PP-OCRv5,仅0.07B参数却实现媲美700亿参数大模型的OCR精度。在多项测试中超越GPT-4o等通用视觉大模型,尤其在文本定位和边界框精度上表现优异。该模型支持5种文字类型识别,适用于教育、医疗、法律等多行业数字化需求,累计下载量超900万,是GitHub上唯一Star数超5万的中国OCR项目。
9月19日,百度百科与中航环球在2025长春航空展上达成独家合作,重点围绕航空科幻IP“南天门计划”开展内容创作与科普共建。双方将联合打造权威词条、沉浸式视频等多元内容,并推出“筑梦航天+航展见证”科普专题,系统梳理航展亮点。百度百科2025年发力富媒体化建设,优化用户编辑体验,已累计超千万级媒体资源,提升航空知识传播效果。
微信上线实况图发送功能,目前仅限iOS用户使用。用户需在相册选择实况照片发送,默认关闭需手动激活。好友查看时需点击左下角按钮触发动态效果,支持保存至手机相册。iPhone 6s/6s Plus/SE系列因硬件限制暂无法使用。建议用户更新微信至8.0.61及以上版本,功能正逐步推送中。
百度智能云千帆大模型平台4.0发布《千帆大模型平台安全白皮书》,系统阐述企业级AI安全框架。白皮书聚焦平台安全、模型安全、数据安全、内容合规等六大维度,提出覆盖全生命周期的防护方案,包括混合云部署、数据加密传输、模型防窃取及内容过滤机制,助力企业安全使用大模型技术,推动AI在合规可信环境下赋能业务创新。
AI日报今日聚焦七大热点:小红书发布FireRedTTS-2语音合成模型,显著提升自然度;百度文心ERNIE-4.5登顶Hugging Face榜单;谷歌Gemini应用登顶美国免费榜;马斯克xAI裁员500人并战略转型;OpenAI拟大幅降低与微软分成比例;DeepMCPAgent开源框架提升AI代理生产力;蚂蚁发布AI开源全景图2.0;北京1400多所中小学推行人工智能通识课程。
百度学术在AI Day宣布AI重构升级,推出AI学术搜索、文献总结、AI阅读、论文图谱等数十项新功能,打造行业首个一站式AI学术平台。平台收录6.9亿文献资源,覆盖超104万学术站点,日更新文献量超42万,中文文献覆盖率达97%。通过AI技术实现“搜、读、创、编”全链路服务,并与SPSSPRO等平台打通,提供一站式学术研究体验。未来将建设学术身份系统,启动全域流量赋能计划,打造全球学术交流平台,推动学术价值创新。