首页 > AI头条  > 正文

字节新模型 SeedEdit开启测试:一句话轻松 P 图

2024-11-11 14:33 · 来源: AIbase基地

字节跳动于11月11日推出了其最新图像编辑模型 SeedEdit,成为国内首个产品化的通用图像编辑工具。用户只需输入一句简单的自然语言指令,即可实现对图片的背景更换、风格转换以及元素的增删替换,无需繁琐的描边和涂抹。

SeedEdit 在识别指令方面表现出色,能够精准理解中文和英文提示,包括成语及专有名词。例如,用户只需输入 “把西瓜换成葡萄”,SeedEdit 便能快速完成上个与水果替换。

此外,模型在处理细节时也保持了原图的完整性,例如移除玻璃裂纹或改变图像中的特定元素。

QQ20241111-141528.png

作为一款通用图像编辑模型,SeedEdit 不仅支持单次编辑,还允许多轮创意操作。用户可以对同一图像进行连续编辑,创造出多样化的效果。

报告显示,SeedEdit 依然采用了 Diffusion 架构,但在不引入新参数的情况下将图像生成模型转换成了图像编辑模型。其秘诀是在保持原始图像和生成新内容之间寻找平衡,最终得以在图像编辑的通用性、可控性和高质量上实现新的突破。解决了传统 AI 图像编辑中存在的多个痛点。

据了解,SeedEdit 已在豆包 PC 端和即梦AI上线网页端开始测试,用户可以通过简单的指令实现高效的图像编辑。与 Dall・E3和 Midjourney 等竞争对手相比,SeedEdit 在编辑的便捷性和响应精准度上更具优势。

可见,SeedEdit 的发布标志着 AI 图像编辑技术的一个新突破,为用户提供了全新的创作体验。

体验地址:

豆包 :https://www.doubao.com/chat/create-image

即梦 :https://jimeng.jianying.com/ai-tool/image/generate

  • 相关推荐
  • 101岁奶奶的长寿秘诀就一句话:开心最重要

    ​在温州永嘉,有这样一位令人称羡的百岁老人——101岁的陈阿菊奶奶。当被问及长寿秘诀时,她爽朗一笑,道出那句质朴却蕴含智慧的话语:“想吃就吃、想睡就睡,开心最重要。”在她看来,不多管闲事,一辈子不与任何人红脸,便是把生活过成了从容惬意的风景线。 陈阿菊奶奶的长寿,背后有着诸多值得探寻的深层缘由。首先,她拥有一种独特的心态“钝感力”。在生�

  • 全新开源的DeepSeek-OCR,可能是最近最惊喜的模型。

    ​AI圈虽然天天卷,但是很多的模型,真的越来越无聊了。 每天就是跑分又多了几个点。 直到昨天,DeepSeek久违的发了一个新模型。 DeepSeek-OCR。 这玩意,是真的有点酷。

  • 体坛明星邂逅太二酸菜鱼,一句话瞬间点燃发布会现场气氛

    在2025年别克LPGA锦标赛发布会上,泰国高尔夫名将吉诺·提提库与中国冠军殷若宁这对“铁杆闺蜜”分享了美食趣事。吉诺兴奋透露在殷若宁家乡品尝地道川菜,特别强调“我喜欢太二!”,点燃现场气氛。殷若宁则俏皮“抱怨”只带对方吃过一次饭。这场跨界对话聚焦太二酸菜鱼对传统泡菜技艺的坚守与创新——采用四川彭州非遗泡菜技艺或由东坡泡菜技艺传承人全程监制,让每道菜品承载时间沉淀的价值。在餐饮行业成本攀升背景下,这种对非遗文化的投入尤为珍贵,让消费者感受“时间成本”的独特魅力。

  • DeepSeek开源3B OCR模型:长文本识别达97%精度

    DeepSeek在GitHub开源新一代OCR模型,采用创新光学二维映射压缩技术,在长文本识别场景实现97%准确率。模型通过动态压缩生成最优视觉特征令牌,较传统方法减少60%计算冗余。实验显示在1:20压缩率下仍保持60%以上准确率,显著优于同类模型。该技术路径为OCR系统小型化提供解决方案,其动态压缩策略对大型语言模型的记忆管理机制具有重要启示。

  • 双十一 Vlog 相机新手小白选购秘籍:佳能 PowerShotV1 开启创作轻松路

    佳能PowerShot V1专为Vlog新手设计,定位“新手神器”。它配备1.4英寸CMOS传感器与DIGIC X处理器,支持5.7K超采样4K视频,画质清晰细腻。相机操作简单,配备直觉式拨杆和智能场景识别系统,可自动优化参数,新手也能一键拍出高质量画面。其一体化超广角变焦镜头覆盖常用焦段,自带光学防抖,并针对对焦模糊、画面抖动问题提供解决方案。双十一优惠套餐包含补光灯、三脚架等配件,满足新手全程拍摄需求,是入门Vlog创作的理想选择。

  • “大模型应用”新风口:“无人测试”趋势,CIO/CTO如何应对

    当前CIO面临的核心挑战是如何在有限IT预算下加速企业数字化转型。传统软件测试环节因人力密集、周期冗长成为效率瓶颈,而AI技术正推动测试模式从"辅助"向"无人化"演进。通过AI Agent实现全流程自主测试,可提升测试效率300%、降低成本30%,并将产品发布周期从"月"压缩至"周"。这不仅是技术升级,更是重构IT成本结构、实现降本增效的战略支点,助力IT部门从成本中心转型为价值创造中心。

  • 品牌在deepseek、豆包里排第几?免费GEO排名查询工具帮你一键看清

    随着AI搜索普及,传统SEO正被GEO(生成式引擎优化)取代。GEO核心是提升品牌在AI生成答案中的可见度,而非获取点击流量。数据显示超60%用户已使用AI搜索,若品牌未被AI提及将失去流量入口。文章推荐免费工具AIBase,支持多平台一键检测品牌在主流AI助手的曝光排名、竞品对比及可视化报告,并提供内容权威性、语义化表达等GEO优化策略,帮助品牌在AI时代建立竞争优势。

  • 海尔空调双11多产品登TOP1!众测收官开启制热季

    双11期间,海尔空调多款产品表现强势,麦浪舒适风空调包揽京东“万单品质空调榜”与“舒适风趋势空调榜”双榜TOP1,并拿下天猫“空调新品榜”TOP1。这得益于持续20天的“千人众测”活动,吸引超14.9亿人次关注,通过真实体验验证产品优势。针对冬季取暖需求,海尔推出云溪空调超低温强热、暖阳Pro地暖中央空调等产品,精准解决用户痛点,展现从制冷到制热的全场景舒适体验升级,持续以创新产品力满足用户需求。

  • 百度智能云这项开源,让 DeepSeek-V3.2 推理服务吞吐提升 2 倍

    10月28日,百度智能云联合SGLang社区开源针对DeepSeek-V3.2优化的多token预测(MTP)技术代码。该技术通过批量生成和集中验证机制,使模型解码吞吐量提升超2倍,突破传统自回归解码的序列化瓶颈。此次开源的MTP方案已完成与DeepSeek-V3.2稀疏注意力架构的深度适配,并经过百度内部业务验证,开发者可"开箱即用"获得稳定可靠的推理加速能力。

  • Soul App开源模型SoulX-Podcast登顶Hugging Face TTS趋势榜,AI语音对话再升级

    SoulX-Podcast语音生成模型在开源社区Hugging Face发布次日登顶TTS趋势榜。该模型由Soul AI Lab联合高校团队开发,专为多轮对话场景设计,支持中英川粤等多语言/方言与副语言风格,能生成超60分钟流畅自然、角色切换准确、韵律丰富的语音。它解决了传统语音系统在多轮对话中上下文衔接不自然、缺乏副语言控制能力等痛点,在播客、语音合成等场景表现突出,获开发者广泛关注。Hugging Face CEO也转发相关内容,团队未来将持续优化语音对话、拟人化表达等核心交互能力,深化开源生态建设。

今日大家都在搜的词: