首页 > 业界 > 关键词  > 腾讯最新资讯  > 正文

腾讯混元T1-Vision上线元宝:一张图片就能分析出产品研发成本

2025-05-12 20:56 · 稿源: 快科技

快科技5月12日消息,腾讯混元今日宣布T1-Vision上线元宝,融合了多模态原生长思维链,可深度理解图片内容

腾讯混元T1-Vision上线元宝:一张图片就能分析出产品研发成本

据腾讯介绍,T1-Vision支持多模态原生长思维链,轻松边看图边思考”,反应时间比之前更快,完答速度提升1.5倍。

据官方演示,当我们在图中遇到疑问时,可以试试切换到Hunyuan(混元),并开启深度思考T1”。背后的Hunyuan T1-Vision模型,能深度理解图片内容,精确捕捉信息背后的关键。

腾讯混元T1-Vision上线元宝:一张图片就能分析出产品研发成本

例如当我们传入一张未知芯片产品时,我们可以点击深度思考T1”,并在搜索框里输入试着详细分析它的研发成本,以表格方式输出。”

腾讯混元T1-Vision上线元宝:一张图片就能分析出产品研发成本

随后,它就可以在几秒内识别,并详细分析出该芯片是赛灵思XC7Z045芯片,其研发成本也会用表格形式输出。

腾讯混元T1-Vision上线元宝:一张图片就能分析出产品研发成本

除此之外,腾讯还介绍了元宝目前可以识别花的品种;可以提示在围棋赛局中下一步如何走;同时,给它一张定期存款利率表,还会帮你出谋划策。

在评论区,不少网友表示,元宝还能识别茶叶、化石、宠物、景观等。

更令人惊讶的是,患者将医院的各种检查报告、病理报告让其识别,元宝会提炼图片中的信息并生成专业的医学建议,也会对专业术语做出解释,并且检查结果如果有问题会对下一步需要的检查进行建议。

举报

  • 相关推荐
  • 多模态训练提速45% 百度智能云推出开源全模态训练框架

    多模态大模型时代,训练基础设施正面临结构性错位。传统框架基于“数据同质、结构单一、平台固定”设计,难以应对多模态异构数据、模型组件协同及跨平台算力需求。百度百舸开源的全模态训练框架LoongForge,以Megatron为核心引擎,通过统一模型抽象、系统层优化和硬件插件化设计,实现“一套代码多平台运行”。其CCT通算传并行、ChunkPipe流水线并行、自适应FP8等技术,在主流模型上实现15%-45%端到端训练加速,在DeepSeek等前沿架构上实现倍级性能提升,并在5000+卡昆仑P800集群上达到90%+线性扩展效率。

  • 迭代大幅放缓!苹果新款Vision Pro被曝最快2028年推出

    知名爆料人古尔曼透露,苹果下一代Vision Pro头显预计最快推迟至2028年发布,产品更新周期大幅拉长,现有机型将在较长时间内维持现状。 消息称,苹果目前的研发重心已全面转移,优先推进AI智能吊坠、支持摄像功能的AirPods两款新品,同时秘密研发AR智能眼镜,高端混合现实头显的迭代工作暂时被搁置。 尽管新款产品迟迟未能更新,苹果官方承诺将持续为在售的Vision Pro提�

  • 能看懂、听懂!豆包Seed 2.0 Lite升级:首款全模态理解模型

    火山引擎宣布Doubao-Seed-2.0-lite升级,成为豆包大模型家族首款全模态理解模型。新版支持视频、图像、音频、文本原生统一理解,并同步升级Agent、Coding与GUI能力,增强多模态推理。在视觉理解上,该模型在物理HiPhO、医疗MedXpertQA等高阶学科推理任务中大幅超越2月发布的Doubao-Seed-2.0-pro,并在BabyVision、WorldVQA等领域达SOTA水平。升级重点融入语音理解,可同时处理多种输入模态并完成跨模态联合推理,支持19语种语音转写及中英等互译,捕捉情绪、环境声等细节。该模型还深度适配OpenClaw等框架,强化深度搜索与Skill动态调用,实现越用越聪明。

  • 满血版DeepSeek V4要来了:补上缺失的多模态关键一环

    DeepSeek V4刚发布还不到5天,光是降价就来了三轮,然而他们的后续动作还很多,马上就要推出满血DeepSeek V4,补上多模态支持。 DeepSeek负责多模态开发的研究员陈小康(xiaokang_chen)今天下午在X上预告新版DeepSeek V4,不出意外就是多模态版的DeepSeek V4了。 此前发布的DeepSeek V4不论Flash还是Pro,都还是纯文本大模型,未免有些遗憾,不是说纯文本没有用,而是多模态支持能力是当�

  • AI日报:Kimi K3将于第三季度推出;英伟达发布多模态“全能模型”;Claude深度集成Adobe、Blender

    本期AI日报聚焦八大热点:月之暗面将推2.5万亿参数Kimi K3大模型,长文本处理能力突破;英伟达发布多模态模型Nemotron-3 Nano Omni,推理效率提升9倍;蚂蚁集团开源百灵Ling-2.6-flash模型;商汤推出原生多模态统一模型SenseNova U1;Claude深度集成Adobe等八大软件;字节TRAE SOLO上线语音输入;科大讯飞发布星火X2-Flash模型;ima上线知识Agent copilot,内置记忆系统。

  • 中国正在成为世界内容工厂

    「目前海外短剧市场存到9-10倍的增长空间。」 在今年4月的网络视听大会AI论坛上,NetShort CEO王利在演讲中用数据推论出短剧出海的巨大潜力:据主流媒体统计,海外短视频用户已达20亿。参照国内短剧到短视频的用户渗透率,海外短剧潜在用户可以达到9亿规模,而目前海外短剧月活用户仅为8000万。 面对有十倍增长潜力的全球市场,从业者普遍相信,中国短剧与AI内容产业正�

  • 豆包收费,千问和元宝都不应该笑醒

    ​豆包给3.45亿月活用户送上的青年节礼物,是一份三档涨价通知。 严格来说不是涨价,以前免费现在有了三档付费方案:68元、200元、500元,按月交租。 反对和质疑扑面而来,还在休假的网民也不忘挤出时间把“豆包型人格”捧成热梗:积极认错,死不悔改,永远在道歉,永远不改错。 但稍微留意一下同日发生的另一件事,就会发现这片舆论场的愤怒里藏着一个反直觉的逻辑

  • 越来越多爆款AI短片涌现背后,谁在为好内容铺路?

    ​越来越多爆款AI短片正在涌现。 今年,一部名为《北境行者》的作品上线不久,播放量便突破3500万;另一部在清明节期间刷屏的《纸手机》,不仅感动无数网友,更获得人民日报等主流媒体的转发。 细看其创作源头,许多爆款短片背后并没有大机构,只有几个怀揣热情和故事的创作者。 更多案例则进一步揭示:大平台们正在为好内容铺一条更长的路,从资金补贴到电影节奖

  • 告别爬楼!微信上线群聊记录一键总结功能:转发元宝即可生成摘要

    99 ”的群聊消息不用再一条条翻,AI替你读完了。 近日,腾讯旗下AI助手元宝与微信深度打通,上线了群聊一键总结”功能。 只需将聊天记录转发给元宝,它便能在几秒内提炼出讨论要点,这波更新,算是切中了无数群聊困难户”的真实痛点。 操作路径并不复杂,用户选中微信群聊聊天记录转发其他应用-选择元宝-复制粘贴给元宝,就能让它帮你总结。

  • 小米Vision GT合金车模开售 售价199元

    今日上午10点,小米官方正式上架开售了一款备受瞩目的新品——小米Vision GT合金车模,定价亲民,仅为199元,将概念超跑的魅力浓缩于掌心之中。 这款车模严格遵循实车1:43的比例进行复刻,精准捕捉了Vision GT“由风塑形”的独特设计理念,将其精髓完美呈现。从侧面观赏,水滴形座舱与镂空车身结构精致入微,车身线条经拆件还原后显得干净利落,尽显未来超跑之风范。

今日大家都在搜的词: