首页 > 热点 > 关键词  > 正文

美图吴欣鸿:自研视觉大模型MiracleVision已迭代至1.5版本

2023-08-04 08:05 · 稿源:站长之家

站长之家(ChinaZ.com)8月4日 消息:8月3日,美图创始人、董事长兼CEO吴欣鸿参加第四届中国人工智能大赛成果发布会。在会上,吴欣鸿透露,目前美图自研视觉大模型已迭代到1.5版本,并应用于美图旗下多款产品。

吴欣鸿认为,垂直大模型+应用场景+商业模式是大趋势。美图拥有深厚的计算机视觉技术沉淀,针对视觉领域搭建了完善的模型算法架构。美图在图片、视频、设计、数字人等领域具有丰富的应用场景和落地经验。此外,美图拥有清晰商业模式,可以让视觉大模型快速变现。

微信截图_20230804080527.png

据悉,目前,美图在AI层面有多个成功实践案例。“AI绘画”系列涵盖文生图、文字融合、图生图、涂鸦生图、线稿上色、头像制作、宠物头像等功能。“AI写真”可以帮助训练用户专属的AI模型,革新传统影楼拍摄方式。“AI扩图”能大幅提高图片素材利用率,拓展图片边界,同时用于生活与商业场景。

此外,美图设计室推出“AI潮鞋”功能,联合华为云发布SaaS应用“AI模特试衣”,为服装电商提供一站式AI解决方案。

吴欣鸿表示,美图自研视觉大模型可以帮助用户提高生产力、助力产业数字化升级。同时,也能在“深化社会美学素养”、“提升全民数字技能”上发挥重要作用。

举报

  • 相关推荐
  • 中文大模型忠实性幻觉评测:豆包大模型幻觉率仅4%,位居全球收之首

    SuperCLUE+最新评测显示,豆包大模型1.5Pro以仅4%的幻觉率和96%的准确率位居全球榜首,超越DeepSeek、Gemini-2.5-pro和GPT-4o等主流模型。该模型在文本摘要、多文本问答等关键任务中表现优异,尤其在中文理解任务上国内领先。基于MoE架构设计,其综合性能超过多款超大规模预训练模型,推理成本显著降低。截至2025年3月,豆包大模型日均调用量达12.7万亿tokens,是一年前的106倍。IDC报告指出火山引擎以46.4%市场份额领跑中国公有云大模型市场。据悉,6月11日将发布豆包大模型最新升级进展。

  • “淘宝Vision”今年将进军线下 未来旗舰项目已在阿里总部试运行

    淘宝空间购物应用淘宝Vision”今年将进军线下。 目前,淘宝正在酝酿一个未来旗舰店项目,把线上沉浸式购物体验和线下商业模式做进一步融合。 据业内人士透露:淘宝Vision未来旗舰店首家概念店已经在阿里巴巴总部试运行,首批展示了小米SU7虚拟试车、智能家居等场景,接受邀约制体验。” 他还表示:淘宝最新的3D人工智能数字人也会亮相,主要应用于电商导购场景,首

  • 智能体时代,还得看豆包大模型

    火山引擎,又有大动作了。 2025年6月11日,火山引擎Force原动力大会发布豆包大模型1.6、视频生成模型Seedance1.0pro等重磅新模型,以及迭代了一站式AI云原生全栈服务。 对此,字节跳动CEO梁汝波表示:“做好火山引擎对字节跳动成为一家优秀的科技公司、保持技术竞争力很重要。未来,字节跳动会坚定长期投入,追求智能突破,服务产业应用。通过火山引擎,持续把新模型、新�

  • 一场文心大模型的「AI马拉松」

    对于百度而言,既要保持长期主义的战略定力,也要在技术路径上灵活应变,这种「变与不变」的平衡或许正是其在这轮科技革命中的制胜之道。 2025年,模型能力的重要性依然无需多言。 从预训练的角度来看,虽然连 OpenAI 前首席科学家 Ilya Sutskever 都说,预训练数据即将用尽,但海量的图像、视频等多模态数据资源依然有待挖掘。 从后训练的角度来看,强化学习新范式正�

  • 月流水百万美元、跻身赛道前列,美图做出了视频版“美图秀秀”?

    3月份,我们曾经对美图2024全年财报进行了详细解读,在面向 C 端生活场景的产品线中,收入主要还是靠早年上线的图片产品+AI 来撑住场面,但进入2025年,C 端却出现了月流水超过百万美元的“新星”,且是美图新探索的视频方向。

  • 无缘自研芯片!REDMI暂时没有玄戒SoC机型规划

    据博主数码闲聊站爆料,REDMI暂时没有玄戒SoC机型规划,短期内只有在小米机型才能看到了。 玄戒O1前不久突然横空出世,采用业界量产最先进的第二代3nm工艺,在仅109mm的狭小空间内,成功集成了190亿晶体管。

  • 小米首次证实!REDMI Watch 5也有自研玄戒T1芯片

    小米官方回应15S Pro采用外挂基带问题,承认基带研发仍有长路要走。玄戒T1芯片已集成完整4G基带,此前已搭载于Redmi Watch 5 eSIM版和小米手表S4 15周年纪念版。该4G基带模块由小米完全自主研发,包含调制解调器、射频模块和视频编解码模块,支持4G eSIM独立通信,网络性能提升35%,数据功耗降低27%,语音功耗降低46%。Redmi Watch 5标准版售价599元,eSIM版799元。

  • 一年过去了,苹果Vision Pro用户表示:后悔买这款3500美元的头显了

    它确实像是未来的预览,但我们距离那个未来还很远。现在你得把一台重若 500 磅的 MacBook Pro 绑在脸上,还要忍受旁人的嘲笑……

  • 大模型时代:内容产业智变新浪潮

    腾讯研究院院长司晓在第15届中国(深圳)国际文化产业博览交易会上发表演讲,指出大模型技术正推动文化内容生产从"专业主导"转向"全民共创"。大模型已从工具赋能升级为生态重构,显著提升内容生产效率和质量,如腾讯混元模型支持实时图像生成与调整。AI技术加速影视、音乐等内容创作,如上海民族乐团与腾讯音乐合作的AI音乐会《零·壹 | 中国色》。同时,大模型在理解与交互能力上取得突破,如GPT-4o能准确识别物体细节。腾讯通过"探元计划"推动科技与文化融合,如"云游敦煌"等项目。未来,AI将实现"智力即服务",大幅提升创作效率和质量,推动文化内容产业进入"千人千面"新时代。

  • 华为发布首款鸿蒙折叠屏电脑,花瓣地图 PC 版本适配上线

    2025年5月19日,华为在成都举办新品发布会,推出全新鸿蒙电脑HUAWEI MateBook Pro和非凡大师家族新成员HUAWEI MateBook Fold。其中MateBook Fold是全球最大商用折叠屏电脑,搭载HarmonyOS系统,展开为18英寸大屏,折叠后仅13英寸,厚度7.3mm,重量1.16kg,完美解决大屏与便携难以兼得的难题。同时发布的花瓣地图PC版适配折叠形态,支持3D地球模式、多窗口操作等功能,实现跨设备无缝协同。华为还推出WATCH FIT 4 PRO智能手表,支持离线地图和15000+高尔夫球场导航。花瓣地图已覆盖全球160+国家和地区,提供70+种语言服务,持续升级全球出行体验。