11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
本文介绍了AI领域多项最新进展:1)即梦灰测图片3.1模型增强电影感和艺术风格;2)ElevenLabs推出语音助手11ai;3)文心快码发布多模态AI开发工具Comate AI IDE;4)苹果采用"归一化流"技术开发新型AI生图模型;5)Grok将推出整合多类型文件管理功能;6)OmniGen2开源多模态模型重塑AI应用场景;7)ScholAI革新学术研究工具;8)豆包推出可视化AI编程功能;9)饿了么推出骑手AI助手"小饿";10)张雪峰认为AI可替代部分教育工作;11)微软发布3.3亿参数小模型Mu。这些创新展示了AI技术在各领域的快速发展和应用潜力。
2025年6月20日,慧点科技在中国电科太极信息科技产业园成功举办年度用户大会。大会以"模型驱动,AI赋能"为主题,探讨人工智能在企业管理和数字化转型中的应用。太极股份副总裁韩建国分析了数据要素在数字经济发展中的关键作用,多位专家分享了AI在审计、办公等领域的创新实践。慧点科技推出"慧珠"信创私域智能体平台,覆盖OA、风控等核心场景,助力企业构建智能化运营生态。会议还设置专题培训,深入讲解大模型技术、数字员工构建等前沿话题,为政企客户提供从理论到实践的数字化转型路径参考。
网易有道6月23日开源国内首个专注数学教育的"子诳3"大模型系列数学模型(Confucius3-Math)。该模型在单块消费级GPU上高效运行,在多项数学推理任务中性能超越更大规模的通用模型,高考数学题测试得分达98.5分。其训练成本仅2.6万美元,推理性能是DeepSeek+R1的15倍,服务成本低至每百万token0.15美元,大幅降低教育AI应用门槛。该开源模型为教育公平提供低成本、高性能的AI�
6月21日,东信云与华为云在HDC2025大会上签署合作协议,双方将基于昇腾AI云服务深化合作,重点布局多模态大模型应用与数字人技术。合作内容包括:1)构建智能营销系统,整合文本、图像、视频等多元数据,提升市场分析和消费者行为预测能力;2)通过大模型实现营销内容自动化生成,包括新闻稿、社交媒体帖子和广告文案;3)优化大模型架构,提升训练和推理效率。东信云6月发布的"数字人智能引擎"已实现分钟级生成逼真数字人,显著提升推荐转化率。双方还将联合行业伙伴共建营销大模型生态系统,推动营销行业智能化升级。
小鹏G7官宣搭载车端VLA VLM”模型,该模型能够识别广告牌和地标等视觉信息,即使没有具体定位也能精准找到目的地。 这一技术的应用,使得小鹏G7在导航和定位方面有了显著提升。
华为开发者大会2025期间,AI专家李良基与华为团队围绕预测大模型展开深度对话。华为提出"数据原子级表征体系"理念,旨在通过统一数据编码解决跨场景迁移难题。预测大模型已在钢铁行业成功应用,温度预测准确率远超传统方案。专家指出,AGI发展的核心在于构建知识迁移能力,未来将聚焦To B场景落地,通过统一架构实现跨领域泛化应用。华为云首创Triplet Transformer
微云全息(NASDAQ:HOLO)开发了新型区块链治理博弈模型(BGGM),通过去中心化网络设计有效防御攻击。该模型结合随机博弈理论和波动理论,分析攻击者行为模式,优化网络防护策略。研究显示,BGGM能提升区块链安全性和稳定性,为首次代币发行(ICO)和新链服务提供安全保障。微云全息将持续优化该模型,推动区块链技术发展,为用户带来更安全可靠的体验。
华为开发者大会2025(HDC2025)在东莞篮球中心开幕,发布多项AI创新成果:1)推出基于CloudMatrix384超节点的新一代昇腾AI云服务,单卡推理吞吐量提升4倍;2)发布盘古大模型5.5,NLP、CV等五大基础模型全面升级,其中718B深度思考模型采用256专家MoE架构;3)推出行业首个统一预测架构Triplet Transformer,覆盖钢铁、水泥等多个工业场景;4)发布300亿参数视觉大模型,支持多维感知分析;5)升级盘古助手Doer,新增6大开发领域专业Agent。华为云宣布开发者突破800万,将构建昇腾、鸿蒙、鲲鹏等技术生态。
6月20日,华为发布盘古大模型5.5,五大基础模型全面升级。该模型采用业界首创的Triplet+Transformer统一预训练架构,能跨行业处理表格数据、时间序列数据和图片数据,显著提升预测精度和泛化能力。已在水泥、钢铁、电解铝、供热等多个工业场景落地应用:海螺水泥实现熟料强度预测,宝武钢铁高炉出铁温度合格率超90%,云南铝业年省电2600万度,天津供热能耗降低10%。模型聚焦工业领域,通过工艺优化和系统寻优,助力企业降本增效,推动行业智能化转型。
当前辅助驾驶已实现全国覆盖,但用户从"能用"到"爱用"仍有明显鸿沟。核心痛点在于"安心感不足"——系统决策缺乏解释性、盲区预判能力薄弱、人机交互机械化等问题。理想汽车押注的VLA(视觉-语言-动作)模型通过语言模型增强系统推理能力,能更全面理解交通场景。该模型具备三大功能:空间语义理解可预判盲区风险;异形障碍物识别能应对极端路况;文字类引导牌理解可精准执行车道选择。VLA技术有望解决智驾系统"最后一公里"的信任难题,推动行业从功能覆盖转向体验升级。