首页 > 业界 > 关键词  > 浦语灵笔最新资讯  > 正文

上海AI实验室开源图文混合创作大模型浦语灵笔

2023-10-10 11:51 · 稿源:站长之家

要点:

  1. 浦语灵笔是基于书生·浦语大语言模型的多模态创作模型,能够接受视觉和语言输入,生成图文并茂的文章。

  2. 浦语灵笔具有强大的多模态理解能力,能够进行流利的中英文图文对话,准确识别图像内容,尤其是中国文化相关的知识。

  3. 浦语灵笔已开源其中的智能创作和对话及多任务预训练版本,并提供免费商用,支持多种类型文章的图文生成。

站长之家(ChinaZ.com)10月10日 消息:上海人工智能实验室(上海AI实验室)近日推出了首个图文混合创作大模型书生·浦语灵笔(InternLM-XComposer),该模型能够根据用户提供的主题或图片,自动创作出图文并茂的文章,为大模型落地应用提供更多可能。

浦语灵笔是基于书生·浦语大语言模型(InternLM)的多模态扩展,书生·浦语是上海AI实验室今年7月以来陆续开源的7B(InterLM-7B)及20B(InternLM-20B)版本的大语言模型,为业界提供了完整的大模型研发与应用基座,以及全链条工具体系。

image.png

项目地址:https://github.com/InternLM/InternLM-XComposer

浦语灵笔不仅能够进行流利的中英文图文对话,准确理解图像内容,还具备了图文并茂文章创作的全新能力。

用户仅需提供主题或图片,便可一键生成涵盖历史沿革、主要景点文物介绍等方面的长篇文章,并在适当位置自动插入与文字信息对应的图片。除自动配图能力外,浦语灵笔还提供了配图推荐和更换功能,根据用户实际需求定制图文内容。

目前,浦语灵笔已支持科普文稿、营销广告、新闻稿件、影视评论、生活指南等类型文章的图文并茂生成,并将逐渐开放更多能力,适应更多样化任务需求。

浦语灵笔为图文文章创作设计了“三步走”的算法流程。首先,根据用户输入的主题或图片,浦语灵笔利用其强大的写作能力,创作出文采斐然的文章。其次,浦语灵笔自动分析文章内容和段落布局,规划需要插图图片的位置,并生成对图片内容需求的描述。最后,采用从粗筛到精选的配图策略,利用多模态大模型强大的图像理解能力,从海量图库中选择出最符合文章上下文内容和整体图像风格的图片,完成文章的自动配图。

浦语灵笔出色的图文创作效果,得益于其多任务预训练模型(InternLM-XComposer-VL-7B)强大的多模态理解能力。

研究人员采用5个主流的多模态大模型评测对InternLM-XComposer-VL-7B进行了详细测试,包括MME Benchmark、MMBench、MMBench-CN、Seed-Bench和CCBench等中英文评测。

评测结果显示,在上述5项评测中,浦语灵笔均体现出卓越性能,尤其是在中国文化理解方面,表现出深厚的知识积淀。

浦语灵笔现已开源,同时上线GitHub、Hugging Face及魔搭社区(ModelScope),欢迎开发者下载试用。

举报

  • 相关推荐
  • AI日报:阿里云通义灵码AI IDE上线;小米多模态大模型Xiaomi MiMo-VL开源;黑森林实验室推出FLUX.1Kontext

    【AI日报】今日AI领域重要动态:1)阿里云推出通义灵码AI IDE,集成千问3模型,显著提升编程效率;2)小米开源多模态大模型MiMo-VL-7B,性能超越更大规模闭源模型;3)黑森林实验室发布FLUX.1Kontext图像生成模型,支持文本和参考图像多次编辑;4)Midjourney V7渲染速度提升40%,新增用户投票功能;5)DeepSeek R1-0528大模型在AGI领域取得突破,性能超越xAI等公司;6)Hugging Face进军机器人市场,推出开源人形机器人HopeJR;7)字节跳动火山方舟接入DeepSeek最新大模型;8)Anthropic开源"电路追踪"工具,揭示大模型决策过程;9)阿里巴巴开源自主搜索AI智能体WebAgent;10)Hume发布低延迟语音语言模型EVI3;11)Manus Slides支持一键生成专业幻灯片;12)Runway Gen-4 References支持手机照片艺术化处理。

  • 大模型联络中心+混合云,九四智能重塑银行用户运营新范式

    文章探讨了银行业在数字化转型中面临的运营难题:个性化需求增长与私有云资源不足的矛盾。传统运营模式在信用卡营销、理财服务等场景面临效率瓶颈,而私有云架构响应慢、扩展能力受限。解决方案提出"大模型联络中心+混合云"的智能运营体系:1)AI大模型电话可处理80%标准化场景,降低人工压力;2)混合云部署实现数据安全与弹性资源调配;3)智能风控系统通过�

  • 高校科研实验室集体“退烧”?亿万克液冷攻克散热难题

    随着高校科研对高性能计算(HPC)、人工智能(AI)和大数据分析需求的激增,传统风冷散热面临四大挑战:1)散热效率接近物理极限;2)空间利用率低;3)噪音污染严重;4)温控精度不足。液冷技术尤其是冷板式液冷方案凭借高效、节能、静音等优势成为新选择。某公司推出的冷板式液冷解决方案包含冷块模组、循环系统等核心组件,支持从单台设备到整个机房的灵活配置。该方案可提升计算性能8-15%,机架功率密度达30kW以上,PUE降至1.2以下,年省电费数十万元,噪音从70dB降至45dB以下,并释放25%以上机架空间。该技术不仅解决当前散热难题,更为未来设备升级预留空间。

  • 一场文心大模型的「AI马拉松」

    对于百度而言,既要保持长期主义的战略定力,也要在技术路径上灵活应变,这种「变与不变」的平衡或许正是其在这轮科技革命中的制胜之道。 2025年,模型能力的重要性依然无需多言。 从预训练的角度来看,虽然连 OpenAI 前首席科学家 Ilya Sutskever 都说,预训练数据即将用尽,但海量的图像、视频等多模态数据资源依然有待挖掘。 从后训练的角度来看,强化学习新范式正�

  • 广电视听人工智能联合共建实验室成立,共筑智慧媒体发展新引擎

    5月22日,国家广播电视总局广播电视规划院、贵州多彩新媒体股份有限公司与腾讯云等联合成立"广电视听人工智能联合共建实验室",旨在推动AI技术与广电视听产业深度融合。实验室汇聚全国十余家省级广电新媒体单位及头部科技企业,聚焦机器学习、自然语言处理、计算机视觉等前沿技术领域,致力于技术突破、人才培养和产业升级。该实验室将作为"智慧广电"建设的重要创新平台,通过跨领域资源整合,构建开放创新生态,推动从内容生产到终端服务的全链条智能化升级,助力广电行业构建更高效、更智能的传播生态。

  • 海尔希望小学首届科技节暨首个科技实验室落成 开启教育公益新生态

    5月29日,海尔在陕西延安洛川县菩提镇中心小学举办首届科技节暨全国首个"海尔小科学家"科技实验室落成仪式。该实验室作为"海尔小科学家计划"重要组成部分,标志着海尔公益实践从硬件援建向科技赋能的跨越升级。活动现场展示了学生们的科技创意作品,包括净水装置、太阳能小车等。实验室配备智能教学设备,融合编程、音乐等多学科资源,通过虚拟研学等创新模式培养青少年科学思维。海尔集团表示将持续深化教育公益实践,2024年计划在全国建设10个科技实验室,打造"沉浸式学习+实践展示"的创新培育体系,激发青少年科技潜能。

  • 携手湖南省质检院共建婴幼儿辅食创新实验室 赋能行业品质未来

    5月23日,英氏控股集团与湖南省质检院联合筹建的"国家农副产品质量检验检测中心(湖南)婴幼儿辅食联合研发实验室"在英氏婴童营养与健康科学产业基地揭牌成立。该实验室将聚焦婴幼儿辅食领域,围绕检验检测、标准制定、科研开发等方向开展合作,建立覆盖原料筛选、生产工艺优化、成品质量管控的全链条研发检测体系。双方表示,此次合作将推动行业从"制造"向"智造"升级,为婴幼儿提供更安全、营养的辅食产品。英氏集团强调将始终把科研创新与品质安全视为生命线,此次合作是产学研深度融合的典范。

  • 大模型都能冲清北了?首个AI高考总分评测结果出炉

    7家国产大模型参加2025年辽宁高考模拟测试,结果显示:腾讯元宝在文科考试中以667.5分夺冠,接近清北录取线;豆包、讯飞星火分别以655分和652分紧随其后,均达985高校水平。理科方面,豆包以635分领先,元宝和Kimi分别获得632.5分和629分。测试发现大模型在文科表现优于理科,尤其在语文作文和数学解题能力突出,元宝数学获得149分高分。但在理科综合科目存在短板,物理化学的解题过程和知识点推导不够完整,图像符号理解不足。相比去年,今年大模型整体能力显著提升,已从"文科一本、理科二本"水平进步到冲击顶尖高校的水平,展现了国产AI的快速发展。

  • 从实验室严测到家庭信赖:友望(UWANT)洗地机以技术透明赢得用户深度信任

    友望携手知乎实验室推出云鲸2.0洗地机测评视频,通过五大极限场景测试验证产品性能:除臭测试中分层除味棒实现99.9%杀菌率;IPX6级防水设计解决机身清洁难题;低矮空间测试展现灵活清洁能力;双排悬浮恒压鲨鱼齿配合23000Pa吸力轻松解决毛发缠绕;AI基站实现自动清洁闭环。该测评创新采用用户全程监督的公开测试模式,以可视化数据验证产品实力,突破行业参数内卷困局。友望通过可浸泡式主机、推入式基站等创新设计重新定义洗地机标准,展现技术领导力。这场硬核测评不仅体现产品解决用户痛点的能力,更以"共情共创"理念建立用户信任,视频发布即获上万播放量,印证了科技产品用用户语言讲故事的沟通有效性。

  • AI日报:腾讯混元3D 2.1大模型开源;字节跳动AI Lab负责人李航卸任;OpenAI Codex 全新升级

    本文介绍了AI领域最新动态:1)腾讯开源混元3D2.1大模型,提升3D生成质量;2)OpenAI Codex升级,优化代码生成功能;3)字节跳动AI Lab负责人李航卸任;4)微软发布700个AI应用案例;5)微软推出Code Researcher工具,解决58%系统崩溃问题;6)Observer AI实现屏幕操作自动化;7)Genspark发布AI浏览器;8)麻省理工用AI技术3.5小时修复15世纪名画;9)蚂蚁集团推出开源多模态GPT-4o模型Ming-Omni;10)MagicTryOn视频换衣框架;11)字节跳动发布实时互动AI视频生成模型Seaweed APT2;12)ChatGPT搜索功能升级;13)字节跳动与老凤祥合作开发AI智能眼镜。