站长之家 2 月 16 日讯:IDC发布《2022 中国大模型发展白皮书》指出,百度旗下文心大模型在市场格局中处于第一梯队,产品能力、生态能力、应用能力皆位列前茅。
(举报)
站长之家 2 月 16 日讯:IDC发布《2022 中国大模型发展白皮书》指出,百度旗下文心大模型在市场格局中处于第一梯队,产品能力、生态能力、应用能力皆位列前茅。
(举报)
本期AI日报聚焦多项AI技术突破与应用进展。生数科技推出Vidu Q1参考生图功能,支持多图输入与一致性生成;字节跳动发布Seedream4.0多模态图像创作模型,推理速度提升10倍;腾讯推出国内首款全形态AI编程工具CodeBuddy,编码效率提升40%;百度文心大模型X1.1升级深度学习能力;OpenAI支持AI动画长片《Critterz》制作;上海AI实验室发布XTuner V1训练引擎提升效率20%;谷歌AI搜索新增5种语言支持;我国发布30项人工智能和15项人形机器人国家标准,推动行业规范化发展。
今天,在WAVE SUMMIT深度学习开发者大会2025上,百度文心大模型X1.1正式发布,在事实性、指令遵循、智能体等能力上均提升显著。 百度王海峰介绍,文心大模型X1是基于文心大模型4.5训练而来的深度思考模型,升级后的X1.1主要采用了迭代式混合强化学习训练框架。 一方面通过混合强化学习,同时提升通用任务和智能体任务的效果;另一方面通过自蒸馏数据的迭代式生产及训练
百度发布超轻量级文字识别模型PP-OCRv5,仅0.07B参数却实现媲美700亿参数大模型的OCR精度。在多项测试中超越GPT-4o等通用视觉大模型,尤其在文本定位和边界框精度上表现优异。该模型支持5种文字类型识别,适用于教育、医疗、法律等多行业数字化需求,累计下载量超900万,是GitHub上唯一Star数超5万的中国OCR项目。
AI日报今日聚焦七大热点:小红书发布FireRedTTS-2语音合成模型,显著提升自然度;百度文心ERNIE-4.5登顶Hugging Face榜单;谷歌Gemini应用登顶美国免费榜;马斯克xAI裁员500人并战略转型;OpenAI拟大幅降低与微软分成比例;DeepMCPAgent开源框架提升AI代理生产力;蚂蚁发布AI开源全景图2.0;北京1400多所中小学推行人工智能通识课程。
百度智能云千帆大模型平台4.0发布《千帆大模型平台安全白皮书》,系统阐述企业级AI安全框架。白皮书聚焦平台安全、模型安全、数据安全、内容合规等六大维度,提出覆盖全生命周期的防护方案,包括混合云部署、数据加密传输、模型防窃取及内容过滤机制,助力企业安全使用大模型技术,推动AI在合规可信环境下赋能业务创新。
2025年腾讯全球数字生态大会于9月16-17日在深圳召开。在Infra+Agent专场,腾讯云与IDC联合发布《AI+Infra:加速智能体落地的基础架构、发展趋势与产业实践》报告。报告指出,随着AI应用规模化落地,AI云基础设施正向核心智算设施演进,涵盖分布式底座、异构硬件、高性能软件和场景化方案四大维度。报告还提出六大演进趋势:架构重构、行业垂直化、算力智能化、安全能力提升、研发范式创新和服务化转型,并解析了腾讯云在交通、制造、医疗等领域的落地案例,为企业智能化转型提供实践指南。
9月19日,百度百科与中航环球在2025长春航空展上达成独家合作,重点围绕航空科幻IP“南天门计划”开展内容创作与科普共建。双方将联合打造权威词条、沉浸式视频等多元内容,并推出“筑梦航天+航展见证”科普专题,系统梳理航展亮点。百度百科2025年发力富媒体化建设,优化用户编辑体验,已累计超千万级媒体资源,提升航空知识传播效果。
2025年全球经济格局深度变革,中国作为世界第二大经济体地位愈发关键。一方面凭借庞大市场规模、完备产业体系及持续优化的营商环境,吸引国际企业加大布局;另一方面受国内市场竞争加剧、增长空间收窄,叠加移动互联网爆发式发展与经济全球化深化驱动,中国企业“出海”已成不可逆趋势。出海企业普遍面临海外服务商筛选、复杂网络难题破解等核心挑战。恒创科技依托香港及亚太地区数据中心优势,启动全球化战略布局,为个人开发者及企业提供有力支撑,携手推进全球化发展。
作为国内AI云首倡者,百度智能云又有了大动作。 2025年8月28日,2025百度云智大会在北京如期拉开帷幕,发布了新一见、百舸5.0、千帆4.0等AI全栈产品,迭代了AI全栈能力,包括雅识教育、心影随形、千寻智能等在内的客户也纷纷展示了合作成果,其中“吴彦祖数字口语陪练”被互联网津津乐道。 当下,AI掀起一场“生产力革命”,持续引领智能涌现,而百度智能云是这场革命
不难发现,近几个月,开源频频成为 AI 社区热议的焦点。尤其是对于国内科技公司来说,开源成为主旋律。根据 Hugging Face 中文 AI 模型与资源社区的数据显示,国内厂商在七八月接连开源33款、31款各类型大模型。 这些开源成果大多落在了文本、图像、视频、推理、智能体以及世界模型领域,而音频生成占比很小。