首页 > 业界 > 关键词  > 文心大模型最新资讯  > 正文

AI视野:文心大模型4.0发布;OpenAI计划发布Stateful API;GPT-4V被曝离谱bug;简单搜索升级为AI互动式搜索引擎

2023-10-17 13:51 · 稿源:站长之家

文头.jpg

🤖📈💻💡大模型动态

百度世界2023大会召开 正式发布文心大模型4.0

百度世界大会2023年,百度创始人李彦宏宣布文心大模型4.0正式发布,该模型在理解、生成、逻辑、记忆等核心能力上不逊于GPT-4。

【AiBase提要】

🚀 文心大模型4.0发布:李彦宏宣布升级,与GPT-4媲美。

🧠 百度发布首个生成式商业智能产品“百度GBI”,支持自然语言交互、跨数据库分析和专业知识学习三方面能力

💡 百度网盘、百度文库等产品已完成 AI 重构,实现一键总结视频内容等功能

💡百度地图App发布19.0.0版本 上线AI向导功能

📰🤖📢AI新鲜事

百度简单搜索升级为AI互动式搜索引擎

今日,百度旗下简单搜索宣布升级,成为百度通过大模型重构的第一个AI互动式搜索,提供智能答案和个性化搜索体验。

微信截图_20231017082942.png

体验网址:https://jiandan.baidu.com/

【AiBase提要】

🔍 简单搜索升级,成为首个AI互动式搜索引擎,能提供智能答案和多媒体内容。

🤖 用户可以自由对话,获取答案、视频、图文等多样信息,满足多种需求。

🌐 百度旨在重新定义搜索引擎,让每次搜索更加简单和个性化。

GPT-4V被曝离谱bug:突然执行神秘代码,暴露用户聊天记录

GPT-4V出现严重漏洞,原本只是让它分析一张图片,结果它完全没回答图片内容,而是直接开始执行“神秘”代码,然后用户的ChatGPT聊天记录就被暴露了。

image.png

【AiBase提要】

😱 GPT-4V受攻击注入漏洞,曝出聊天记录。

🤔 漏洞原因在于模型未经重新训练添加图像识别功能。

🔒 提出解决方案是双LLM模式,区分可信和不可信内容。

OpenAI计划发布Stateful API降低开发成本

OpenAI计划通过Stateful API降低应用程序的开发成本,允许开发者更便宜地创建基于AI模型的应用,同时推出新的视觉开发工具。

【AiBase提要】

📉 OpenAI发布Stateful API,记住对话历史,降低应用开发成本。

👁️ 新视觉开发工具将帮助应用程序分析和描述图像。

🤖 OpenAI或考虑发展GPT-5,但引发数据安全和隐私担忧。

王小川旗下百川智能完成3亿美元A1轮融资

王小川旗下的百川智能公司宣布成功完成了3亿美元的A1轮战略融资,得到了阿里、腾讯、小米等科技巨头和多家顶级投资机构的支持。

【AiBase提要】:

🚀 百川智能是王小川创立的公司,不到100天就发布了免费商用的中文大模型,并吸引了数百万的下载量。

🤝 这次融资吸引了包括阿里、腾讯、小米等科技巨头以及多家顶级投资机构的参与,展示了市场对其潜力的信心。

🗓️ 百川智能成立于2023年4月10日,由来自知名科技公司的AI顶尖人才组成,展现了快速发展和创新的能力。

谷歌云推出专为制造和医疗领域的生成式AI解决方案

Google Cloud发布生成式AI,旨在提高生产率和数字时代应对,包括制造业和医疗领域的多个应用。

【AiBase提要:】

🏭 生成式AI在制造领域可用于事件监测、客户服务自动化、文档搜索、产品目录发现和供应链顾问。

🏥 在医疗领域,生成式AI可改善临床数据搜索和提供个性化医疗体验。

🚀 生成式AI应用领域不断扩展,将引领数字时代的创新,提供更多机会。

IDC预测:到2027年,生成式AI支出将达到1430亿美元

IDC预测生成式AI支出将在2027年达到1,430亿美元,增速高于综合AI支出,并相较于全球IT支出的CAGR高出13倍。

【AiBase提要】

📈 到2027年,生成式AI支出将达到1,430亿美元,增速超过综合AI支出,并较全球IT支出的CAGR高出13倍。

🌐 全球主要企业积极投资于生成式AI模型的建设和采用,预计趋势将持续增长。

💼 IDC表示生成式AI是一项变革性技术,具有深远影响和商业价值。

🤖📱💼AI应用

淘宝AI大模型应用“淘宝问问”将上线双11大促模式

淘宝的AI大模型应用“淘宝问问”即将在双11大促期间上线,将为用户提供购买建议,降低挑选决策成本。

【AiBase提要:】

🛒 淘宝的AI大模型应用“淘宝问问”将在双11大促期间提供购买建议,增强用户购物体验。

📊 自9月内测以来,已有超过500万人次尝试该应用,展现了高用户活跃度。

📉 应用将综合各类大促信息,生成最具价格力的购买建议,帮助用户更智能地进行购物决策。

商汤科技秒画SenseMirage上线移动端版本

商汤科技的图像生成平台“秒画SenseMirage”正式推出移动端版本,用户可以通过手机登录官网进行文生图创作,并享受美学引导、高效工具和API接口支持。

微信截图_20231017144033.png

体验网址:https://miaohua.sensetime.com

【AiBase提要:】

🎨 秒画SenseMirage移动端版本正式上线,开放免费创作,提供用户文生图创作体验。

📐 更新的3.5版本引入全新美学引导系统和ControlNet工具,提高创作效率和质量。

🏢 商汤将向企业客户提供API接口,助力高效服务和创意构建。

英伟达文本转3D AI工具Masterpiece X首次亮相

英伟达与Masterpiece Studio合作发布Masterpiece X,利用生成式AI简化3D建模,虽然测试效果不佳,但显示出巨大潜力。

📌 AiBase提要:

1. 英伟达与3D软件开发商Masterpiece Studio合作发布了Masterpiece X,旨在通过生成式AI简化3D建模,使之像创建二维图像一样简单。

2. Masterpiece Studio表示其解决方案无需本地硬件或软件,一切在云端实现,仅需键盘、浏览器和想象力。

3. 尽管测试中的效果不尽如人意,但这一技术显示出从现有模型开始更容易获得所需结果的潜力。

YouTube推出AI广告工具“Spotlight Moments”助广告商瞄准文化时刻

YouTube宣布推出名为“Spotlight Moments”的AI广告套餐,利用Google人工智能,帮助广告商在特定文化时刻投放相关广告,提高广告效果。

🚀 【AiBase提要:】

👉 YouTube推出“Spotlight Moments”广告套餐,利用AI自动识别热门视频。

👉 广告商可在特定文化时刻投放广告,提高品牌曝光。

👉 Google致力于改进广告销售和投放方式,推出多项AI驱动的工具。

3D领域的Midjourney?Luma AI助您捕捉真实之美

Luma AI是一款引人入胜的3D捕捉技术,以其无与伦比的光线和反射效果,将未来的视觉效果技术带给每个人,从专业人士到普通用户,彻底改变了创意产业。

image.png

体验地址:https://lumalabs.ai/

【AiBase提要】:

🌟 Luma AI引领革命性3D捕捉技术,以前所未有的逼真度和细节捕捉世界,超越传统摄影和渲染的视觉效果。

🌟 具备无与伦比的光线和反射效果,让3D场景看起来就像是真实的一样,无论是室内还是室外。

🌟 Luma AI的愿景是将未来的视觉效果技术普及给每个人,支持多平台,轻松捕捉逼真的3D图像,改变游戏开发、虚拟现实和影视制作的方式。

AI漫画创作工具Dashtoon 支持移除背景、修整脸部

Dashtoon Studio是一款强大的AI漫画创作平台,基于AI技术,支持用户移除背景、修整脸部,以轻松创作具有创意的漫画作品。

image.png

体验地址:https://www.dashtoon.ai/

【AiBase提要:】

1. 🎨 Dashtoon Studio是引人注目的AI漫画创作平台,为创作者提供更大的创作力量和规模。

2. ✂️ 用户可以选择漫画角色,定制角色,并使用工具移除背景、修整脸部,提升图像质量。

3. 💬 平台鼓励用户积极参与社区,分享经验和技巧,无论专业还是新手,都能轻松创作出卓越的漫画作品。

视频编辑器CapCut扩展业务版块 ☁️

CapCut是字节跳动旗下的视频编辑应用,现在正在扩展到商业工具领域。其中新增人工智能驱动的脚本生成等功能,可帮助广告商和创作者制作广告和品牌内容。📲

6383313146957928013497826.jpg

【AiBase提要:】

😊 CapCut推出CapCut for Business,面向广告商和创作者提供视频制作工具

📈 新增人工智能驱动的脚本生成等功能,可快速制作视频广告

🎬 提供虚拟演示者和虚拟试穿等AI功能,方便营销产品

👨‍💻💡🎯聚焦开发者

香港中文大学发布全面中文大语言模型评测CLEVA

香港中文大学发布了全面中文大语言模型评测方法CLEVA,覆盖31个任务和多维度评测指标,旨在提供更准确的模型认知。

image.png

论文地址:https://arxiv.org/pdf/2308.04813.pdf

【AiBase提要】

📊 香港中文大学发布全面中文大语言模型评测方法CLEVA,已被EMNLP2023System Demonstrations录取。

🎯 评测方法包含31个任务和多种评测指标,覆盖了84个数据集,关注准确性、鲁棒性、公平性等多维度。

🖥️ CLEVA提供提示模板,降低数据污染风险,为研究团队提供清晰的操作界面,促进模型认知和评测。

举报

  • 相关推荐
  • 登榜LMArena!文心大模型5.0-Preview文本能力国内第一

    11月8日,文心全新模型ERNIE-5.0-Preview-1022在LMArena大模型竞技场排名中位列全球第二、中国第一。该模型在创意写作、复杂长问题理解和指令遵循方面表现突出,超越多款国内外主流模型。创意写作可高效生成文章、营销文案等内容;复杂长问题理解适用于学术问答、报告分析等任务;指令遵循能力支持智能助理、代码生成等场景,为多领域内容生产提供高效支撑。

  • 突破大模型对齐瓶颈,北大团队携手昇腾打通产业应用通路

    北大杨耀东团队研发Align-Anything多模态对齐框架,以RLHF为核心解决传统反馈信息有限问题,覆盖文本、图像、音频等全模态数据。该框架集成专用评估工具Eval-Anything,已在昇腾平台实现智慧医疗、网络安全等领域规模化落地。通过构建安全治理体系,显著提升大模型安全水位,同时保持通用能力。团队联合推出课程培养人才,深化产学研协同,为多模态大模型发展提供关键技术支撑。

  • AI日报:百度发布文心5.0;可灵2.5Turbo模型上线“首尾帧”功能;微博推出 VibeThinker-1.5B

    本期AI日报聚焦多项技术突破:OpenAI推出GPT-5.1,提升对话自然度与响应速度;百度发布原生全模态大模型文心5.0,支持跨文本图像生成;微博开源VibeThinker-1.5B模型,以低成本实现高效推理;可控视频生成模型新增首尾帧控制功能;李飞飞团队推出商用3D世界生成工具Marble;东北大学开源多语言翻译模型支持60种语言;谷歌Gemini语音功能升级实现更自然交互;阿里启动“千问”项目对标ChatGPT,全面布局C端AI应用竞争。

  • 机器人“全能导航大脑”来了!银河通用发布NavFoM大模型

    银河通用发布全球首个跨本体全域环视导航基座大模型NavFoM,实现机器人从“学会完成导航任务”到“真正理解移动”的跨越。该模型支持全场景、多任务、跨本体应用,通过统一“视频流+文本指令→动作轨迹”范式,融合800万条跨任务导航数据,在真实机器人上实现零样本自主避障、路径规划等复杂任务。其技术突破将推动具身智能从单一功能进化为基础设施,为规模化商业落地奠定关键基础。

  • 易鑫正式发布汽车金融行业首个Agentic大模型

    易鑫在2025世界互联网大会乌镇峰会上发布汽车金融行业首个Agentic大模型XinMM-AM1。该模型参数量约300亿,响应延迟低于200毫秒,支持语音实时交互,单卡吞吐达370 tokens/秒,可提升获客、风控与运营效率,解决行业周期长、交互多、决策复杂等难题。易鑫作为AI驱动的金融科技平台,研发投入超20亿元,率先实现AI全场景应用,将持续推动智能汽车金融生态建设。

  • 大模型+反诈+算力三重突破 腾讯云三项成果闪耀金融科技应用场景大赛

    10月30日,2025金融街论坛年会金融科技大会公布“金融科技应用场景大赛”终评结果。腾讯云“金融反电诈治理方案”与“基于TCS的AI异构算力管理平台”凭借技术创新性与场景落地能力,从全国89家机构的280个项目中脱颖而出,双双荣获“十佳应用奖”。腾讯混元大模型信贷助手方案获“探索实践奖”。三大方案在金融风控、算力基座及大模型应用三个关键领域展现突出优势,获专家团高度认可。大赛自2021年启动,已成为金融科技领域极具影响力的赛事平台。

  • 国内大模型GEO优化全攻略:免费工具教你监测品牌在文心一言、通义千问等AI平台的可见度

    AI搜索时代,品牌若未出现在AI回答中就等于"不存在"。GEO(生成引擎优化)成为新战场,核心是让AI在回答用户问题时优先引用企业内容。文章详解国内主流AI模型特点:文心一言整合百度生态、通义千问依托阿里电商数据、小众模型在垂直领域更易被引用。提出三大优化策略:内容结构化呈现、建立行业权威背书、布局高权重平台。推荐使用AIBase免费工具实时监测品牌在各大AI平台的曝光情况,通过数据驱动优化策略。

  • 何小鹏首次披露物理AI巨大进展 发布第二代VLA大模型

    小鹏汽车在2025科技日发布第二代VLA大模型,颠覆传统“视觉-语言-动作”架构,实现端到端直接输出动作指令,开创物理模型新范式。该模型具备动作生成与物理世界理解能力,参数规模达数十亿级,训练数据近1亿clips。基于2250TOPS算力的Ultra车型成功搭载,推动智驾技术显著进化,同步发布“小径NGP”功能,复杂小路接管里程提升13倍。行业首发的无导航辅助驾驶Super+LCC实现全球覆盖。何小鹏表示,大模型将成为物理AI世界的操作系统,并宣布与大众汽车达成战略合作,共同推进智能出行发展。

  • 寒武纪:构建大模型开发到部署的全流程开放服务能力

    华鑫证券研报显示,寒武纪2025年上半年业绩亮眼,营收28.81亿元,同比增长4347.82%;归母净利润10.38亿元,增长295.82%。公司募资39.85亿元,重点投向大模型芯片及软件平台建设,以增强AI算力芯片综合实力。凭借云边端一体、软硬协同等技术优势,其产品已获多领域客户认可,覆盖金融、互联网等行业。未来随着技术迭代与生态完善,业绩有望持续提升。

  • 新Siri或明年春季发布 苹果公司或引入谷歌Gemini大模型 AI技术

    苹果因自研大模型项目遇瓶颈,决定引入谷歌Gemini大模型升级Siri,计划每年支付约10亿美元获取定制化Gemini 2.5 Pro使用权。该模型拥有1.2万亿参数,将全面负责Siri的信息摘要、任务规划及复杂指令执行等核心功能,支持多模态交互和超长文本处理。升级版Siri预计2026年春季随iOS 26.4推送,后续将在WWDC大会展示进一步整合。苹果选择谷歌主要因成本优势、长期合作基础及Gemini领先性能。

今日大家都在搜的词: