首页 > 业界 > 关键词  > 文心大模型最新资讯  > 正文

AI视野:文心大模型4.0发布;OpenAI计划发布Stateful API;GPT-4V被曝离谱bug;简单搜索升级为AI互动式搜索引擎

2023-10-17 13:51 · 稿源:站长之家

文头.jpg

🤖📈💻💡大模型动态

百度世界2023大会召开 正式发布文心大模型4.0

百度世界大会2023年,百度创始人李彦宏宣布文心大模型4.0正式发布,该模型在理解、生成、逻辑、记忆等核心能力上不逊于GPT-4。

【AiBase提要】

🚀 文心大模型4.0发布:李彦宏宣布升级,与GPT-4媲美。

🧠 百度发布首个生成式商业智能产品“百度GBI”,支持自然语言交互、跨数据库分析和专业知识学习三方面能力

💡 百度网盘、百度文库等产品已完成 AI 重构,实现一键总结视频内容等功能

💡百度地图App发布19.0.0版本 上线AI向导功能

📰🤖📢AI新鲜事

百度简单搜索升级为AI互动式搜索引擎

今日,百度旗下简单搜索宣布升级,成为百度通过大模型重构的第一个AI互动式搜索,提供智能答案和个性化搜索体验。

微信截图_20231017082942.png

体验网址:https://jiandan.baidu.com/

【AiBase提要】

🔍 简单搜索升级,成为首个AI互动式搜索引擎,能提供智能答案和多媒体内容。

🤖 用户可以自由对话,获取答案、视频、图文等多样信息,满足多种需求。

🌐 百度旨在重新定义搜索引擎,让每次搜索更加简单和个性化。

GPT-4V被曝离谱bug:突然执行神秘代码,暴露用户聊天记录

GPT-4V出现严重漏洞,原本只是让它分析一张图片,结果它完全没回答图片内容,而是直接开始执行“神秘”代码,然后用户的ChatGPT聊天记录就被暴露了。

image.png

【AiBase提要】

😱 GPT-4V受攻击注入漏洞,曝出聊天记录。

🤔 漏洞原因在于模型未经重新训练添加图像识别功能。

🔒 提出解决方案是双LLM模式,区分可信和不可信内容。

OpenAI计划发布Stateful API降低开发成本

OpenAI计划通过Stateful API降低应用程序的开发成本,允许开发者更便宜地创建基于AI模型的应用,同时推出新的视觉开发工具。

【AiBase提要】

📉 OpenAI发布Stateful API,记住对话历史,降低应用开发成本。

👁️ 新视觉开发工具将帮助应用程序分析和描述图像。

🤖 OpenAI或考虑发展GPT-5,但引发数据安全和隐私担忧。

王小川旗下百川智能完成3亿美元A1轮融资

王小川旗下的百川智能公司宣布成功完成了3亿美元的A1轮战略融资,得到了阿里、腾讯、小米等科技巨头和多家顶级投资机构的支持。

【AiBase提要】:

🚀 百川智能是王小川创立的公司,不到100天就发布了免费商用的中文大模型,并吸引了数百万的下载量。

🤝 这次融资吸引了包括阿里、腾讯、小米等科技巨头以及多家顶级投资机构的参与,展示了市场对其潜力的信心。

🗓️ 百川智能成立于2023年4月10日,由来自知名科技公司的AI顶尖人才组成,展现了快速发展和创新的能力。

谷歌云推出专为制造和医疗领域的生成式AI解决方案

Google Cloud发布生成式AI,旨在提高生产率和数字时代应对,包括制造业和医疗领域的多个应用。

【AiBase提要:】

🏭 生成式AI在制造领域可用于事件监测、客户服务自动化、文档搜索、产品目录发现和供应链顾问。

🏥 在医疗领域,生成式AI可改善临床数据搜索和提供个性化医疗体验。

🚀 生成式AI应用领域不断扩展,将引领数字时代的创新,提供更多机会。

IDC预测:到2027年,生成式AI支出将达到1430亿美元

IDC预测生成式AI支出将在2027年达到1,430亿美元,增速高于综合AI支出,并相较于全球IT支出的CAGR高出13倍。

【AiBase提要】

📈 到2027年,生成式AI支出将达到1,430亿美元,增速超过综合AI支出,并较全球IT支出的CAGR高出13倍。

🌐 全球主要企业积极投资于生成式AI模型的建设和采用,预计趋势将持续增长。

💼 IDC表示生成式AI是一项变革性技术,具有深远影响和商业价值。

🤖📱💼AI应用

淘宝AI大模型应用“淘宝问问”将上线双11大促模式

淘宝的AI大模型应用“淘宝问问”即将在双11大促期间上线,将为用户提供购买建议,降低挑选决策成本。

【AiBase提要:】

🛒 淘宝的AI大模型应用“淘宝问问”将在双11大促期间提供购买建议,增强用户购物体验。

📊 自9月内测以来,已有超过500万人次尝试该应用,展现了高用户活跃度。

📉 应用将综合各类大促信息,生成最具价格力的购买建议,帮助用户更智能地进行购物决策。

商汤科技秒画SenseMirage上线移动端版本

商汤科技的图像生成平台“秒画SenseMirage”正式推出移动端版本,用户可以通过手机登录官网进行文生图创作,并享受美学引导、高效工具和API接口支持。

微信截图_20231017144033.png

体验网址:https://miaohua.sensetime.com

【AiBase提要:】

🎨 秒画SenseMirage移动端版本正式上线,开放免费创作,提供用户文生图创作体验。

📐 更新的3.5版本引入全新美学引导系统和ControlNet工具,提高创作效率和质量。

🏢 商汤将向企业客户提供API接口,助力高效服务和创意构建。

英伟达文本转3D AI工具Masterpiece X首次亮相

英伟达与Masterpiece Studio合作发布Masterpiece X,利用生成式AI简化3D建模,虽然测试效果不佳,但显示出巨大潜力。

📌 AiBase提要:

1. 英伟达与3D软件开发商Masterpiece Studio合作发布了Masterpiece X,旨在通过生成式AI简化3D建模,使之像创建二维图像一样简单。

2. Masterpiece Studio表示其解决方案无需本地硬件或软件,一切在云端实现,仅需键盘、浏览器和想象力。

3. 尽管测试中的效果不尽如人意,但这一技术显示出从现有模型开始更容易获得所需结果的潜力。

YouTube推出AI广告工具“Spotlight Moments”助广告商瞄准文化时刻

YouTube宣布推出名为“Spotlight Moments”的AI广告套餐,利用Google人工智能,帮助广告商在特定文化时刻投放相关广告,提高广告效果。

🚀 【AiBase提要:】

👉 YouTube推出“Spotlight Moments”广告套餐,利用AI自动识别热门视频。

👉 广告商可在特定文化时刻投放广告,提高品牌曝光。

👉 Google致力于改进广告销售和投放方式,推出多项AI驱动的工具。

3D领域的Midjourney?Luma AI助您捕捉真实之美

Luma AI是一款引人入胜的3D捕捉技术,以其无与伦比的光线和反射效果,将未来的视觉效果技术带给每个人,从专业人士到普通用户,彻底改变了创意产业。

image.png

体验地址:https://lumalabs.ai/

【AiBase提要】:

🌟 Luma AI引领革命性3D捕捉技术,以前所未有的逼真度和细节捕捉世界,超越传统摄影和渲染的视觉效果。

🌟 具备无与伦比的光线和反射效果,让3D场景看起来就像是真实的一样,无论是室内还是室外。

🌟 Luma AI的愿景是将未来的视觉效果技术普及给每个人,支持多平台,轻松捕捉逼真的3D图像,改变游戏开发、虚拟现实和影视制作的方式。

AI漫画创作工具Dashtoon 支持移除背景、修整脸部

Dashtoon Studio是一款强大的AI漫画创作平台,基于AI技术,支持用户移除背景、修整脸部,以轻松创作具有创意的漫画作品。

image.png

体验地址:https://www.dashtoon.ai/

【AiBase提要:】

1. 🎨 Dashtoon Studio是引人注目的AI漫画创作平台,为创作者提供更大的创作力量和规模。

2. ✂️ 用户可以选择漫画角色,定制角色,并使用工具移除背景、修整脸部,提升图像质量。

3. 💬 平台鼓励用户积极参与社区,分享经验和技巧,无论专业还是新手,都能轻松创作出卓越的漫画作品。

视频编辑器CapCut扩展业务版块 ☁️

CapCut是字节跳动旗下的视频编辑应用,现在正在扩展到商业工具领域。其中新增人工智能驱动的脚本生成等功能,可帮助广告商和创作者制作广告和品牌内容。📲

6383313146957928013497826.jpg

【AiBase提要:】

😊 CapCut推出CapCut for Business,面向广告商和创作者提供视频制作工具

📈 新增人工智能驱动的脚本生成等功能,可快速制作视频广告

🎬 提供虚拟演示者和虚拟试穿等AI功能,方便营销产品

👨‍💻💡🎯聚焦开发者

香港中文大学发布全面中文大语言模型评测CLEVA

香港中文大学发布了全面中文大语言模型评测方法CLEVA,覆盖31个任务和多维度评测指标,旨在提供更准确的模型认知。

image.png

论文地址:https://arxiv.org/pdf/2308.04813.pdf

【AiBase提要】

📊 香港中文大学发布全面中文大语言模型评测方法CLEVA,已被EMNLP2023System Demonstrations录取。

🎯 评测方法包含31个任务和多种评测指标,覆盖了84个数据集,关注准确性、鲁棒性、公平性等多维度。

🖥️ CLEVA提供提示模板,降低数据污染风险,为研究团队提供清晰的操作界面,促进模型认知和评测。

举报

  • 相关推荐
  • AI不再健忘!红熊AI发布“记忆熊”,给大模型装上“海马体”

    当前大模型虽能力惊人,却普遍存在“记忆缺失”问题,制约了AI应用的深度与用户体验。红熊AI推出的开源记忆系统“记忆熊”,旨在突破这一瓶颈。它基于认知科学原理,构建了包含存储层、编排层和应用层的三层架构,模拟人类记忆的感知、提炼、关联与遗忘全周期,为智能体提供长期记忆框架。该系统不仅显著提升了任务性能与效率,降低了幻觉生成,更标志着AI设计从“即时响应”向“持续认知”的关键转变。记忆系统的完善,将驱动AI在医疗、教育、企业服务等领域实现更深度的智能化升级,开启人机协作的新时代。

  • 拒绝做“套金属壳”的伪AI:看“大模型国家队”如何啃下硬骨头

    人工智能成为资本市场热点,随之而来的是鱼龙混杂的乱象。简单包装、打着AI旗号卖高价的“套壳”现象层出不穷。科大讯飞董事长刘庆峰强调,发展人工智能要有长期主义精神,告别“虚火”,把根扎在国产算力的土壤里。下半场比拼的不再是概念堆砌,而是全栈自主可控的硬实力与赋能千行百业的真本事。可靠与安全才是基石,算力是最大瓶颈。企业需构建安全底座并解决真实痛点,才能穿越周期。科大讯飞坚持“顶天立地”战略,既要在源头技术上领先,又要在产业应用上解决民生刚需,展示了AI技术“落地”的正确姿态。

  • 中国太原煤炭交易中心与腾讯云深化合作 共建煤炭价格指数大模型

    12月11日,中国太原煤炭交易中心与腾讯云签署深化合作协议,双方将聚焦人工智能、大数据等数字技术与煤炭产业的深度融合,共同探索产业数字化升级新路径。合作将重点推进价格指数智能化升级、数据要素价值释放、客服体系提质增效及产业生态共建,通过技术创新与场景融合,推动煤炭产业数字化转型迈向新阶段。

  • 腾讯星脉网络摘得广东省XAIR科技进步奖一等奖,十万卡级算力“高速路”打破大模型困局

    腾讯“星脉网络”获2025年广东省人工智能与机器人奖一等奖。该网络专为AI大模型训练设计,解决传统网络带宽瓶颈、延迟高等问题,提升大规模GPU/NPU集群协同效率。已成功赋能开源生态,并为行业落地十万卡级GPU集群,具备高稳定性和扩展性。作为腾讯云智算矩阵核心,星脉网络与自研AI基础设施深度整合,覆盖大模型全生命周期,提供高效稳定服务。目前腾讯云智算已服务国内90%大模型厂商及行业客户,未来将持续投入,推动大模型技术落地与产业智能化。

  • 京东自研AI毛绒玩具上架:支持情绪感知 搭载JoyAI大模型

    京东近日推出首款自研AI毛绒玩具,主打无屏幕实体交互,旨在减少儿童对电子屏幕的依赖。该玩具基于京东JoyAI大模型技术,具备讲故事、知识问答和互动沟通功能,内置280本有声书资源,并能识别儿童情绪变化。此次共推出13款AI产品,覆盖多个品类,其中AI毛绒玩具系列凭借个性化设计受到市场欢迎,部分款式迅速售罄。

  • 易鑫开源汽车金融业首个Agentic大模型,加速AI生态共建

    易鑫集团(02858.HK)宣布开源其自主研发的Agentic大模型YiXin-Agentic-Qwen3-14B,成为汽车金融行业首个开源此类模型的企业。该模型基于通义千问Qwen3-14B深度优化,具备卓越推理、复杂任务处理及多方协作的智能体能力,在多项性能测试中位列榜首,推理成本较行业平均水平降低三分之一。模型搭载金融领域专属知识体系与工具集,覆盖语音交互、车辆评估、风控、欺诈识别等功能,形成全链路智能支撑体系。易鑫提出“底座开放-社区共建-能力迭代-企业部署-生态繁荣”的开源共建模式,通过提供低代码私有化模板,帮助企业快速落地AI应用。此次开源与之前发布的行业首个开源推理大模型YiXin-Distill-Qwen-72B形成“垂直底座+Agentic大脑”双轮技术矩阵,填补了汽车金融领域专业开源AI工具链的空白。

  • AI日报:可灵AI全量上线O1视频大模型;千问APP接入万相Wan2.5

    本文汇总了AI领域的最新动态:可灵AI发布O1视频大模型,支持多模态输入一键生成视频;千问APP接入万相Wan2.5,提升视频创作能力;PixVerse V5.5实现音画同步,简化视频制作;深度求索推出DeepSeek-V3.2,引入稀疏注意力机制降低成本;Runway发布Gen-4.5模型,增强视觉质量;谷歌优化AI搜索体验,Gemini 3 Pro扩展国际市场;Lovart推出Touch Edit功能,实现零门槛图像编辑;蚂蚁数科Agentar入选中国智能体开发赛道第一梯队,展现技术实力。

  • 逗哥配音ai软件|创新升级:自研大模型引领声音创作新浪潮

    在短视频蓬勃发展的当下,AI配音软件“逗哥配音”凭借自主研发的大模型技术引发关注。该软件拥有近千种风格的发声人资源,覆盖多语言及方言,通过精准的节奏控制和情感表达优化,显著降低高质量音频制作门槛。其创新的声音克隆技术仅需少量数据即可生成高度相似的人工语音,结合人声分离、文案提取等实用工具,为创作者提供跨领域音频解决方案,推动数字内容生态向多元化、个性化发展。

  • AI日报:Kling 2.6将发布;千问APP推学习大模型;Z-Image-Turbo-Fun-Controlnet-Union 开源

    本期AI日报聚焦多领域AI进展:Kling 2.6发布,支持音频同步生成,AI视频进入有声时代;千问APP推出学习大模型,提升拍照答疑与作业批改能力;阿里通义实验室开源图像生成模型,实现精准控制;豆包手机助手遭遇微信登录异常,凸显生态兼容挑战;米哈游推出带猫语特色的AI聊天模型AnuNeko;亚马逊云科技发布三款新型AI智能体,其中Kiro可自主编程数日;IDC报告预测具身智能�

  • 可灵AI O1正式上线:号称全球首个统一多模态视频大模型

    可灵AI正式发布全新O1视频大模型,被誉为全球首个统一多模态视频大模型。该模型基于创新的多模态视觉语言交互架构,用户可在单一输入框内无缝融合文字、图像、视频等多种指令,实现跨模态内容的高效创作。其技术突破解决了传统视频生成工具功能割裂、操作复杂的痛点,并攻克了视频中主体特征漂移的行业难题,支持长达310秒的自由生成时长。目前用户可通过可灵App及官网体验。

今日大家都在搜的词: