首页 > 业界 > 关键词  > 零一万物最新资讯  > 正文

零一万物API开放 多模态中文图表体验超越GPT-4V

2024-03-22 14:08 · 稿源:站长之家

要点:

1、零一万物API正式开放,提供三款模型,支持通用聊天、多文档阅读理解、多模态输入等功能。

2、多模态模型Yi-VL-Plus在中文图表体验上超越GPT-4V,支持图表识别、信息提取、问答和推理。

3、Yi-34B-Chat-200K模型开放,准确率高达99.8%,可用于长文本理解、小说内容总结和论文要点提取。

站长之家(ChinaZ.com)3月22日 消息:近日,零一万物API正式向开发者开放,其中包含三款强大的模型。首先是Yi-34B-Chat-0205,支持通用聊天、问答、对话、写作和翻译等功能;其次是Yi-34B-Chat-200K,能处理多文档阅读理解和构建超长知识库;最后是Yi-VL-Plus多模态模型,支持文本、视觉多模态输入,中文图表体验超越GPT-4V。这些模型的开放将促进更广泛的应用场景落地,形成更加繁荣的生态。

QQ截图20240322140834.png

地址:https://platform.lingyiwanwu.com/playground

Yi-VL-Plus作为多模态模型,在中文图表体验上展现出优异的性能,能够识别复杂图表、提取信息并进行推理。相比之下,GPT-4V在这方面表现不佳,例如在处理折线图和饼状图时准确度较低。Yi-VL-Plus不仅可以准确识别图表内容,还能将其转换成其他格式,如markdown。这种多模态能力为用户提供了更加便捷和准确的图表分析体验。

另一款模型Yi-34B-Chat-200K的开放,让大模型应用进入了长文本时代。该模型具有极高的准确率,可用于理解多篇文档内容、分析海量数据和提取关键信息。文学爱好者可以通过该模型快速掌握几十万字小说的精髓,科研人员也可以高效提取论文要点。这种上下文能力的提升,将在各个领域带来更多可能性和便利。

零一万物API的开放为开发者们带来了丰富的宝藏,Yi大模型的强大功能将有助于各种应用场景的优化和提升。无论是在图表识别、文本理解还是长篇文本分析方面,这些模型都展现出了令人惊叹的性能。开发者们赶快来寻宝吧,探索这些API带来的无限可能!

举报

  • 相关推荐
  • 主流AI多模态大模型有哪些?超全的多模态大模型指南分享

    2024年多模态大模型成为AI领域最具前景的技术方向之一。文章全面分析了主流多模态大模型的特点、应用场景和发展趋势。多模态大模型能同时处理文本、图像、音频、视频等多种数据,实现更智能的人机交互。重点介绍了GPT-4V、Claude3.5、Gemini、通义千问等代表性模型,对比了它们在视觉理解、编程能力、中文处理等方面的优势。应用场景涵盖智能客服、内容创作、教育医疗等领域。未来发展趋势包括模型规模扩大、支持更多模态、实时交互能力提升等。选择模型需考虑应用需求、语言支持、性能成本等因素。

  • AI重构社交生态 Soul以多模态技术赋能社交

    社交平台Soul正通过AI技术重塑社交生态:1)2016年推出智能推荐系统"灵犀引擎",2020年启动AIGC算法研发,2023年推出自研大模型Soul+X,开发AI虚拟人、智能聊天等应用;2)升级多模态大模型,支持文字对话、语音通话、多语言理解等功能,提供拟人化情感陪伴;3)围绕Z世代需求,促成超10万对情侣步入婚姻,并联合开展心理健康公益活动;4)以"技术+人文"双轮驱动,致力于打造更智能舒适的社交环境,重新定义人机关系。

  • AI日报:腾讯混元推3D生成大模型Hunyuan3D-PolyGen;钉钉AI表格重磅来袭;阿里推多模态大语言模型HumanOmniV2

    本文介绍了AI领域多项重要进展:1)腾讯推出首个美术3D生成大模型Hunyuan3D-PolyGen,显著提升建模效率;2)阿里发布多模态大模型HumanOmniV2,准确率达69.33%;3)钉钉AI表格实现1小时处理千项任务;4)百度PaddleOCR3.1版本在多语种识别和文档翻译方面升级;5)微软推出Deep Research智能体,自动化研究流程;6)香港理工与OPPO联合开源视频超清框架DLoRAL;7)谷歌开源MCP工具箱简化AI与数据库集成;8)Win11将推出AI动态壁纸功能。这些创新展示了AI在3D生成、多模态理解、办公效率、视觉处理等领域的突破性进展。

  • ChatGPT们重塑了对话框,钉钉今天要重塑表格

    ​自从1979年,丹·布里克林(Dan Bricklin)和鲍勃·弗兰克斯顿(Bob Frankston)在苹果当时划时代的 Apple II 电脑上做出了第一张可以自动计算和更新的电子表格 VisiCalc 后,表格就成为了计算机用数据方式理解人类世界的基座。不过,在更多的时候,没人这样讨论它。横横竖竖几个格子,表格无处不在,它看起来太普通了。 然而计算机诸多繁荣的根基,都建立在一张张表格之上,无�

  • 「6月30日AI日报」百度开源文心大模型4.5系列;通义千问发布多模态生成模型Qwen VLo

    AI日报精选:1)百度开源文心大模型4.5系列,含10款新模型,性能优异;2)通义千问发布多模态模型Qwen-VL,支持图文交互;3)阿里开源3亿参数多模态模型Ovis-U1;4)华为开源盘古7B稠密和72B混合专家模型;5)美图MOKI推出AI创意广告功能,一键生成专业视频;6)谷歌Gemini 2.5 Pro API重新免费开放;7)豆瓣上线"深入研究"AI功能;8)小米"AI百宝箱"结束内测;9)北京智研院开源多模态系统OmniGen2;10)知乎升级"直答"知识库功能。

  • AI日报:智谱上线PPT生成功能AI Slides;可灵 AI 发布可图2.1模型

    本文介绍了AI日报栏目及近期AI领域多项突破性进展:1)智谱推出免费AI Slides工具,基于GLM模型快速生成高质量PPT;2)可灵AI发布可图2.1模型,支持180多种风格图像生成;3)NVIDIA推出DiffusionRenderer技术,实现视频到可编辑3D场景转换;4)墨刀AI新增30秒生成高保真原型功能;5)Higgsfield推出Soul ID工具,10张照片即可生成虚拟形象;6)谷歌DeepMind开源GenAI Processors工具库;7)谷歌Veo新增图像转视频功能;8)Mistral AI发布专为代码建模的Devstral2507系列模型。这些创新展示了AI在内容生成、3D建模、产品设计等领域的快速发展。

  • 通了!小米汽车APP横扫140万根充电桩 23家品牌互联互通

    小米汽车宣布,为了持续提升小米汽车车主充电体验,小米与23家第三方品牌合作实现互联互通,总计接入140万根公用充电桩。 这140万根充电桩均可以通过小米汽车APP扫码充电,其中16万根充电桩支持即插即充功能,充电便利性得到了大幅度提升。 截至目前,小米充电网络已覆盖2743个大陆区县,6856个高速服务区充电站。 小米汽车方面表示,小米YU7在三方充电桩兼容性实测�

  • 抖音爆红神曲、排名超越周杰伦 《大展鸿图》原唱回应赚了1.2亿

    继歌曲《八方来财》后,歌手揽佬的《大展鸿图》又在抖音等短视频平台爆火,掀起一股改编二创热潮,别墅里面唱K,水池里面银龙鱼”等歌词也火出圈。 截稿前,话题大展宏图”在抖音的播放量高达28.5亿次,大战宏图舞蹈挑战”也有1.5亿次播放,其他相关话题也有几十万到几百万。 日前,全球最大流媒体音乐播放平台之一的Spotify更新华语歌手榜单,揽佬的月听众数飙升�

  • 苹果用户最好购车选择!小米YU7深度兼容:iPhone、Apple Watch都能控车

    小米YU7已开启交付,首批车主都已经提车回家了。 今天小米汽车官方介绍,YU7延续了SU7的设计理念,充分针对苹果用户优化用车体验,打造让苹果用户也能轻松上手的车型。 首先是iPhone控车更加便捷高效: 支持UWB近场控车与iOS小组件远程控车,比如携带激活了UWB钥匙的苹果手机站在车前3秒,就能打开前备箱; 也可以通过iPhone上的Action Button自定义车控功能,比如一键控车�

  • 算力赋能营销革新,东信云与华为云签约共建多模态大模型应用标杆

    6月21日,东信云与华为云在HDC2025大会上签署合作协议,双方将基于昇腾AI云服务深化合作,重点布局多模态大模型应用与数字人技术。合作内容包括:1)构建智能营销系统,整合文本、图像、视频等多元数据,提升市场分析和消费者行为预测能力;2)通过大模型实现营销内容自动化生成,包括新闻稿、社交媒体帖子和广告文案;3)优化大模型架构,提升训练和推理效率。东信云6月发布的"数字人智能引擎"已实现分钟级生成逼真数字人,显著提升推荐转化率。双方还将联合行业伙伴共建营销大模型生态系统,推动营销行业智能化升级。