首页 > 业界 > 关键词  > AI绘图最新资讯  > 正文

AI绘图模型不会写字的难题,被阿里AnyText破解了

2024-01-01 15:04 · 稿源: 量子位公众号

能准确写汉字的AI绘图工具,终于登场了!包括中文在内一共支持四种语言,而且还能文字的位置还能任意指定。从此,人们终于可以和AI绘图模型的“鬼画符”说再见了。这款名为AnyText的绘图工具来自阿里巴巴,可以按照指定位置精准地向图中加入文字。此前的绘图模型普遍无法准确地向图

......

本文由站长之家合作伙伴自媒体作者“量子位公众号”授权发布于站长之家平台,本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间,为了保证文章信息的及时性,内容观点的准确性,平台将不提供完全的内容展现,本页面内容仅为平台搜索索引使用。需阅读完整内容的用户,请查看原文,获取内容详情。

举报

  • 相关推荐
  • HTTP 402与微支付:一段沉睡三十年的代码,在AI时代觉醒

    30年前HTTP 402协议因交易成本高、体验割裂和技术缺失而失败,如今AI时代带来消费原子化、决策流线化和主体去人化三大变革,使微支付成为可能。AI代理通过钱包身份、风控机制和无缝支付协议实现高频小额交易,重构互联网经济逻辑,让HTTP 402从理想变为AI经济的支付基石。

  • 魅族发布Flyme Auto 2车载系统:全新小窗模式 支持AI读心术

    今日下午,魅族召开发布会,正式推出Flyme Auto 2车载系统,全面升级AI交互体验。 据介绍,Flyme Auto 2车载系统设计美学再度升级,新增实况桌面3D质感、全场景一镜到底、Alive壁纸、自定义桌面插件等等视觉与交互功能。 该系统强化Aicy大卡片、全新小窗模式,提供了更轻量更高效的交互方式。

  • 从“能导航”到“会思考”,腾讯地图AI新品即将发布

    2025年腾讯全球数字生态大会将于9月16-17日在深圳举办。大会重点包括腾讯地图将发布时空智能开放平台GAIA,聚焦AI+地图战略价值,通过开放生态连接政企资源,推动行业数字化转型。平台结合LBS技术与AI大模型,深度挖掘时空数据价值,为企业提供决策支持。小红书、麦当劳等企业代表将分享实战案例,展示地图技术在零售、出行等领域的应用潜力。

  • 真我Neo7 Turbo AI版发布 首款动感地带AI手机

    日前,真我Neo7TurboAI版发布,这是真我联合中国移动打造的首款动感地带AI手机。 与真我Neo7Turbo标准版相比,新机后盖多了中国移动Logo。 官方表示,真我Neo7TurboAI版将带来极速性能、偶像陪伴、运动竞技、云端空间、社交潮流五大专属体验。 真我Neo7TurboAI版负一屏植入芒果卡俱乐部,集成芒果TV、咪咕视频等App,自带咪咕体育、咪咕快游会员,支持中国移动云盘等服务。 据�

  • 三登MIT“50家聪明公司”榜单,科大讯飞给出AI的“中国式解法”

    科大讯飞第三次入选MIT“50家聪明公司”榜单,其星火X1大模型以更少参数实现顶尖效果,显著领先行业同行。讯飞不仅技术实力过硬,更注重AI落地应用,赋能教育、医疗、办公等领域,服务超5万所学校、7.5万家基层机构。其全栈自主可控技术打通“任督二脉”,产品出海日韩市场受青睐,推动中文学习覆盖全球194个国家和地区。讯飞证明,真正的“聪明”在于让技术解决具体问题,而不仅是追求参数竞赛。

  • AI日报:腾讯发布混元3D 3.0模型;昆仑万维上线Agent Studio功能;阿里Qoder推出付费订阅服务

    AI日报汇总最新行业动态:腾讯发布混元3D+3.0模型,建模精度提升3倍;昆仑万维Mureka上线音乐创作功能;阿里Qoder推出付费订阅服务;VEED Fabric 1.0实现图片转视频;OpenAI发布GPT-5-Codex革新编程;全国发布AI安全治理框架2.0;Mini-o3实现超长视觉推理;上海AI Lab推出多模态模型Lumina-DiMOO;腾讯微调技术提升图像美感300%;Meta推出轻量级MobileLLM-R1;腾讯启动AI应用繁荣计划;谷歌DeepMind�

  • AI日报:快手推出AI视频制作助手Kwali;字节跳动推出USO模型;OpenAI推出ChatGPT开发者模式

    本文介绍了AI日报栏目,聚焦AI领域最新动态。快手推出Kwali视频助手,简化视频制作流程;字节跳动发布USO模型,解决图像生成中风格与主题的矛盾;微软推出Copilot Audio音频模式,提供个性化语音交互;Stability AI升级Stable Audio 2.5,支持高质量音频生成;阿联酋推出开源大模型K2 Think,拥有320亿参数;微信上线智能回复功能,提升公众号运营效率;OpenAI推出ChatGPT开发者模式,支持AI控制外部工具;字节跳动Seed团队发布AgentGym-RL框架,提升语言模型决策能力;月之暗面开源Checkpoint Engine中间件,优化LLM推理效率;B站开源IndexTTS-2.0文本转语音系统,支持情感与时长控制;Replit推出Agent 3编程助手,自主性提升10倍。

  • AI日报:抖音打击AI技术滥用行为;OpenAI 收购开发数据分析平台 Statsig;ElevenLabs 音效模型更新

    抖音打击AI技术滥用行为,对违规商家和达人采取下架、清退等措施。ElevenLabs音效模型升级至版本2,支持长音频和无缝循环。OpenAI收购数据分析平台Statsig,增强产品迭代能力。亚马逊推出Lens Live AI功能,实时扫描购物。谷歌AI推出Stax工具,帮助开发者评估大语言模型。WordPress推出AI工具Telex简化网站构建。Liquid AI发布LFM2-VL模型,提升手机视觉语言处理。苹果开源FastVLM与MobileCLIP2模型,优化边缘设备AI应用。MetaGPT推出自动化测试工具RealDevWorld,精准率达92%。瑞士发布开源大模型Apertus,提供多语言处理能力。

  • 魅族StarV Snap AI拍照眼镜发布:售价1999 元起

    今日下午魅族22新品发布会上,一款名为StarV Snap的AI拍摄眼镜成为全场焦点。这款突破传统智能眼镜形态的产品以39克超轻人因工学设计惊艳亮相,通过50项人体工程学优化实现重量均匀分散,彻底解决"丑、重、硌"的行业痛点,鼻梁、耳部无压迫感的设计支持全天候舒适佩戴。 外观采用经典框型设计,磨砂质感镜框不仅时尚百搭适配多种脸型,更具备防指纹沾染特性,

  • AI能力再进阶,华为Mate XTs 非凡大师首发小艺知识库功能

    华为Mate XTs非凡大师于9月4日发布,搭载升级版小艺AI助手,具备知识库管理、出行规划、连续翻译等功能。支持多平台知识整合与个性化定制,提升办公与生活效率。新增旅行智能规划、实时翻译及作业辅导能力,通过智能交互提供便捷服务。小艺导航条常驻界面,支持拖拽操作与语音唤醒,实现全场景智慧体验。

今日大家都在搜的词: