首页 > 业界 > 关键词  > 浦语灵笔最新资讯  > 正文

上海AI实验室开源图文混合创作大模型浦语灵笔

2023-10-10 11:51 · 稿源:站长之家

要点:

  1. 浦语灵笔是基于书生·浦语大语言模型的多模态创作模型,能够接受视觉和语言输入,生成图文并茂的文章。

  2. 浦语灵笔具有强大的多模态理解能力,能够进行流利的中英文图文对话,准确识别图像内容,尤其是中国文化相关的知识。

  3. 浦语灵笔已开源其中的智能创作和对话及多任务预训练版本,并提供免费商用,支持多种类型文章的图文生成。

站长之家(ChinaZ.com)10月10日 消息:上海人工智能实验室(上海AI实验室)近日推出了首个图文混合创作大模型书生·浦语灵笔(InternLM-XComposer),该模型能够根据用户提供的主题或图片,自动创作出图文并茂的文章,为大模型落地应用提供更多可能。

浦语灵笔是基于书生·浦语大语言模型(InternLM)的多模态扩展,书生·浦语是上海AI实验室今年7月以来陆续开源的7B(InterLM-7B)及20B(InternLM-20B)版本的大语言模型,为业界提供了完整的大模型研发与应用基座,以及全链条工具体系。

image.png

项目地址:https://github.com/InternLM/InternLM-XComposer

浦语灵笔不仅能够进行流利的中英文图文对话,准确理解图像内容,还具备了图文并茂文章创作的全新能力。

用户仅需提供主题或图片,便可一键生成涵盖历史沿革、主要景点文物介绍等方面的长篇文章,并在适当位置自动插入与文字信息对应的图片。除自动配图能力外,浦语灵笔还提供了配图推荐和更换功能,根据用户实际需求定制图文内容。

目前,浦语灵笔已支持科普文稿、营销广告、新闻稿件、影视评论、生活指南等类型文章的图文并茂生成,并将逐渐开放更多能力,适应更多样化任务需求。

浦语灵笔为图文文章创作设计了“三步走”的算法流程。首先,根据用户输入的主题或图片,浦语灵笔利用其强大的写作能力,创作出文采斐然的文章。其次,浦语灵笔自动分析文章内容和段落布局,规划需要插图图片的位置,并生成对图片内容需求的描述。最后,采用从粗筛到精选的配图策略,利用多模态大模型强大的图像理解能力,从海量图库中选择出最符合文章上下文内容和整体图像风格的图片,完成文章的自动配图。

浦语灵笔出色的图文创作效果,得益于其多任务预训练模型(InternLM-XComposer-VL-7B)强大的多模态理解能力。

研究人员采用5个主流的多模态大模型评测对InternLM-XComposer-VL-7B进行了详细测试,包括MME Benchmark、MMBench、MMBench-CN、Seed-Bench和CCBench等中英文评测。

评测结果显示,在上述5项评测中,浦语灵笔均体现出卓越性能,尤其是在中国文化理解方面,表现出深厚的知识积淀。

浦语灵笔现已开源,同时上线GitHub、Hugging Face及魔搭社区(ModelScope),欢迎开发者下载试用。

举报

  • 相关推荐
  • 从游戏出海到AI应用出海 世纪华通建树海外AI市场

    世纪华通凭借成熟产品矩阵与全球化运营能力,成为中国游戏企业出海标杆。随着国内AI技术突破,公司加速拓展全球化赛道,推动AI应用落地海外市场。旗下极测信息与日本信华信合作,将核心产品“AI自主检测系统”引入日本自动化测试市场。该系统突破传统工具局限,实现测试用例自动生成与智能优化,效率提升超50%,已获行业权威认可。此次合作印证中国AI技术在垂直领域的全球价值,并凸显公司“ALL IN AI”战略——通过多元化产品覆盖产业需求,让AI成为全球化竞争核心势能。

  • 纳米 AI 创作者赴疆支教 让AI火种扎根边疆点亮学生科技梦

    近日,纳米AI创作者赴新疆基层学校开展公益支教,将纳米AI视频制作功能带给学生。这场跨越千里的科技支教,让当地学生首次接触前沿AI技术,在西部课堂播下科技探索的种子。学生们通过简单文字描述即可生成专属AI短视频,直观体验科技魅力。创作者表示,希望通过低门槛的AI工具,在边疆播撒科技火种,让学生们看见更广阔的世界,未来不仅能使用科技,更可能成为科技创造者。纳米AI团队将持续推动AI普及,让更多边疆课堂感受科技力量。

  • “AI家教”火了,哪家大厂领跑?

    各大应用榜单刚刚公布的9月数据,揭示出一个AI应用新风向——教育类AI应用正加速崛起。 多家机构的数据显示,这一赛道的月活用户(MAU)与下载量双双上涨,部分产品涨幅甚至逼近1000%。 以非凡产研的数据为例,好课帮助教育旗下的“光速写作”凭借场景定位与功能体验,月环比下载增速高达926.59%,科大讯飞旗下的“E听说中学”依托校园教学场景的产品设计,月活跃用�

  • 星环科技AI Infra平台:重构企业AI基础设施

    星环科技AI基础设施平台通过四层架构实现全面升级:资源平台统一调度异构资源;AI就绪数据平台支持11种数据模型统一处理;AI平台覆盖机器学习到大模型全生命周期;知识平台实现知识抽取与服务化。该平台具备多模型统一架构、全流程实时数据处理、高性能时序数据库等九大核心优势,形成从数据到知识、模型到应用的完整智能化支撑体系,助力企业规模化落地AI应用。

  • AI +游戏,何以撑起百亿市场?

    今年以来,生成式AI技术在游戏领域的应用步伐显著加快。在Steam平台上,使用生成式AI技术的游戏数量呈现出惊人增长,激增了800%。行业预测显示,在今年新上市的游戏中,这一应用比例预计将达到20%。 游戏厂商的布局也明显提速。头部公司正持续加码技术中台与垂类模型的构建:腾讯搭建了混元与GiiNEX协同的双引擎生态;网易则着力构建AIUGC地图系统并升级游戏内的AI对手模�

  • 向AI构建能力,用模型产出价值,让金融优质发展

    2025年云栖大会在杭州举行,聚焦“云智一体+碳硅共生”主题,展现中国前沿科技生命力。阿里云智能集团副总裁张鹰介绍,“通义点金”平台全新升级,致力于构建金融行业垂直模型,打造具备业务洞察力的“专家级智能体”。核心突破包括:通过飞轮平台实现模型与业务双向螺旋上升,构建可观测、可评测、可迭代能力;赋予模型“自知之明”,精准调用工具并内化人类逻辑思维;建立多层次交叉验证测评体系,确保金融级严谨性。未来将持续推动通用模型与金融专业知识的有机结合,助力金融业务核心效能提升。

  • 飞书再进化:会议纪要,AI直接“画”出来了

    一场90分钟的季度复盘会,信息密度极高。销售总监在第27分钟报出了Q3的关键增长数据,产品经理在第58分钟提到了下个季度的核心留存率目标,设计师则在屏幕上快速切换了五个版本的App首页设计稿。 会议结束,你的邮箱里收到了一份两万字的会议纪要全文。那些闪光的、高价值的数字和洞察,像金子一样被埋没在浩瀚的文字沙滩里,除非有人愿意再花一个小时重读一遍,�

  • 荣耀亲选KUMI AI Note发布:支持AI通话录音智能转换 699元

    荣耀发布KUMI AI Note智能记事本,售价699元。产品采用磁吸卡片设计,厚度仅2.89mm,重量30g,便于携带。具备五大AI功能:语音转逻辑图、133种语言翻译、断句排版、人物识别及信息整理,转写准确率98%。内置高品质电池,支持24小时连续录音,配备Wi-Fi快传技术(5小时录音30秒传完)。适合会议记录、内容创作等场景,是便携的AI办公助手。

  • AI玩具,再造一个泡泡玛特?

    2025年最时髦的遛娃神器,AI玩具必须拥有姓名。 国庆假期回老家的小小发现,家里小朋友们的玩具库里突然多了一类新玩意。它们不仅外形呆萌可爱,还搭载了AI功能,能和小朋友对话、讲睡前故事,还拥有记忆力,总之,不再是只会唱歌的老古董。 AI玩具赛道火于去年,但当时大部分产品的AI功能主要来源于外置挂件,且智能化程度不高,一度被质疑为蹭热度的套壳产品。�

  • AI为他们圆了导演梦

    “我们这么小团队做的‘小东西’真的可以吗?” 当得知自己作品《小怪物》入围釜山电影节时,黎晓薇的第一反应是“难以置信”,因为就在几个月前她才开始正式接触AI工具。 和黎晓薇一样幸运的,还有徐文君、小文和MANYMANY团队,这些来自中国的AI创作者们分别带来了《一目五先生》《权利童话》和《九宵》三部作品。 “未来影像计划”由即梦AI联合火山引擎、上海电�

今日大家都在搜的词:

热文

  • 3 天
  • 7天