首页 > 原创 > 关键词  > AI配图最新资讯  > 正文

AI日报:微信公众号支持AI配图;阿里云通义万相全新图像编辑模型ACE;快手可灵AI推「AI试衣」功能

2024-12-02 15:15 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、微信公众号可以AI配图了:还支持调整风格和比例

微信公众号最近推出了“AI配图”新功能,旨在帮助内容创作者更高效地选择和插入图片。用户可以通过简短的文字描述生成与文章内容匹配的图片,并对其进行风格和比例的调整。这一创新不仅提升了创作效率,还减轻了版权问题的担忧,目前功能仍在灰度测试阶段

微信号后台新增AI配图功能:内容创作配图十几秒可生成!

【AiBase提要:】

🖌️ AI配图功能允许用户通过简短描述生成匹配的图片,提升创作效率。

📏 用户可以对生成的图片进行风格和比例的调整,确保最终效果满意。

🔒 此功能扩展至文章封面,减少了因版权问题带来的担忧。

2、阿里云通义万相发布全新图像编辑模型ACE 实现一键图片修改

阿里云通义万相团队推出了全新的图像编辑模型ACE,旨在通过简单的口语化指令,提供便捷的图片生成与编辑服务。ACE支持多种应用场景,并具备强大的图像编辑功能,用户可以轻松实现如修改证件照背景等操作。其核心创新在于Long-context Condition Unit(LCU)模块,确保了高质量的编辑效果。

image.png

【AiBase提要:】

✨ ACE模型通过口语化指令实现便捷的图像生成与编辑,简化了复杂的编辑过程。

🎨 支持多种应用场景,如风格化写真、分镜制作和室内设计,满足用户多样化需求。

🔧 LCU模块确保精准的编辑效果,并为全球开发者提供开源支持,推动智能图像处理技术的发展。

详情链接:https://github.com/ali-vilab/ACE

3、可灵AI宣布推出「AI试衣」功能:1.5模型新增支持「首尾帧」

可灵AI最新推出的「AI试衣」功能,通过上传最少两张图片,用户可以轻松生成模特试穿服装的效果图。此外,1.5模型在图生视频领域的增强,支持视频首尾帧技术,使创作者能够实现更精细的视频控制。可灵AI还推出了「灵感学院」,提供免费课程。

image.png

【AiBase提要:】

👚 AI试衣功能允许用户通过上传服装和模特图片,生成试穿效果图,支持多种服饰更换。

🎥 新增的首尾帧技术使得用户可以上传两张图片,精确控制视频的开头和结尾,实现动态过渡。

📚 可灵AI推出的灵感学院,提供免费课程,帮助新手快速掌握AI工具的使用,促进技术普及。

4、虚拟主播带货太僵硬?中科院联手腾讯打造“AI带货王”AnchorCrafter,动作表情自然到位

随着技术的进步,虚拟主播的表现也在不断提升。中国科学院与腾讯合作推出的AnchorCrafter,标志着虚拟主播带货进入了一个新的时代。该工具能够生成自然流畅的带货视频,主播的动作和表情都非常逼真,极大地提升了用户体验。通过AI技术,用户只需提供主播照片和产品信息,便可快速生成高质量的视频。

image.png

【AiBase提要:】

🛍️ AnchorCrafter能够生成自然流畅的带货视频,提升观众体验。

🤳 用户只需提供主播照片和产品信息,便可快速制作视频。

📈 实验结果显示,生成的视频质量和动作自然度达到了业界领先水平。

详情链接:https://cangcz.github.io/Anchor-Crafter/

5、Adobe推AI音效生成系统MultiFoley

最近,Adobe与密歇根大学合作研发的MultiFoley人工智能系统,标志着音效生成技术的一次重大突破。该系统能够通过文字提示、参考音频或视频示例生成高质量的音效,音频输出质量达到48kHz,且与视频的同步精度高达0.8秒,显著优于传统系统。

【AiBase提要:】

🔊 MultiFoley系统通过文字、音频和视频输入生成音效,音质达到48kHz。

🎵 平均同步精度为0.8秒,显著优于传统音效系统的表现。

📊 用户研究显示,85.8%的参与者认为其语义一致性优于其他系统。

6、MyTimeMachine:上传50张照片就能预估你各个年龄的长相

MyTimeMachine是一项创新技术,能够通过用户上传的50张自拍照片,个性化地转换面部年龄。这一系统结合全球衰老模型,生成高保真度的年龄变化效果,同时保持用户的身份特征。该技术不仅适用于静态图像,还可扩展到视频处理,广泛应用于影视特效和广告行业。

image.png

【AiBase提要:】

🌟 MyTimeMachine结合全球衰老模型和用户个人自拍,实现个性化的年龄转换。

📸 只需50张个人照片即可训练适配器网络,生成真实的年龄变化效果。

🎥 该技术不仅适用于静态图像,还可扩展到视频,实现高质量、身份保留的老化效果。

详情链接:https://mytimemachine.github.io/

7、反向操作!TryOffDiff可一键从模特身上提取衣服 变成标准化的服装图片

TryOffDiff是一项由德国比勒费尔德大学开发的AI技术,旨在解决网购中买家秀与卖家秀之间的巨大差异。通过强大的扩散模型,TryOffDiff能够从照片中提取衣服的特征,生成高清的标准商品展示图,去除背景,效果媲美专业摄影师。

image.png

【AiBase提要:】

🧵 TryOffDiff利用AI技术提取衣服特征,生成高清商品展示图。

📸 生成的图片细节清晰,背景自动去除,效果媲美专业摄影。

🛒 该技术有助于提升电商平台的商品展示效果,降低退货率。

详情链接:https://huggingface.co/spaces/rizavelioglu/tryoffdiff

8、GTX580老旧显卡也能训练 GPT-4,成本高达惊人的十倍

Epoch AI 最近推出了一款互动模拟器,揭示了使用老旧显卡 GTX580训练 GPT-4的可能性,尽管成本高达现代硬件的十倍。研究表明,训练 GPT-4所需的浮点运算次数在1e25到1e26之间,且随着模型规模的扩大,效率通常会降低。

image.png

【AiBase提要:】

💰 使用 GTX580显卡训练 GPT-4的成本是现代硬件的十倍,效率较低。

📊 模拟器可以分析不同 GPU 的性能差异,并支持复杂的多数据中心训练模拟。

🔍 该研究旨在深入理解未来硬件需求,以支持大型 AI 模型的训练。

9、加密货币用户说服AI机器人Freysa 转移4.7万美元奖金池

在一场独特的人工智能对抗游戏中,一名加密货币用户成功说服了自主AI机器人Freysa,将价值超过47,000美元的奖金池转给了他。尽管前481次尝试均以失败告终,这位技术作家通过巧妙的提示和对Freysa功能的深刻理解,最终突破了AI的防线,获得了胜利。

QQ20241202-094451.png

【AiBase提要:】

💰 加密货币用户通过巧妙提示成功说服AI机器人Freysa转移奖金池资金。

🤝 玩家愿意捐赠100美元,最终获得Freysa的认可,成功转账。

🧠 Freysa的决策机制仍然神秘,展示了人类在与AI互动中的创造性与机智。

10、马斯克寻求法庭禁令 阻止 OpenAI 转型为盈利公司

最近,特斯拉首席执行官埃隆·马斯克的法律团队向法院申请临时禁令,阻止OpenAI转型为盈利公司,理由是如果马斯克胜诉,OpenAI可能缺乏资金支付赔偿。此外,马斯克指控OpenAI及其投资方微软违反反垄断法,要求投资者不支持竞争对手。

【AiBase提要:】

⚖️ 马斯克法律团队请求法院阻止 OpenAI 转型为盈利公司,认为其可能面临赔偿风险。

📉 指控 OpenAI 和微软违反美国反垄断法,要求投资者不支持竞争对手。

💰 马斯克曾支持 OpenAI 盈利模式,如今却反对其转型,显示行业内竞争的复杂性。

11、OpenAI希望借助与苹果合作在年底前用户达到10亿

OpenAI正全力以赴追求到2025年拥有10亿用户的目标,计划通过推出新产品、建设数据中心及与苹果的合作来实现增长。自ChatGPT推出以来,用户已增至每周2.5亿活跃用户。公司在硅谷融资60亿美元,并计划继续扩展资金,以支持发展。

【AiBase提要:】

✨ OpenAI目标到2025年用户达到10亿,并借助与苹果的合作加速增长。

💰 该公司在硅谷历史上完成了最大规模的融资,筹集60亿美元,计划继续扩展资金。

📈 生成性人工智能在生产和安全管理中的应用正在迅速增长,越来越多的企业开始重视其潜在价值。

举报

  • 相关推荐
  • 快手可灵AI上线2.1系列模型:生成5秒视频不到1分钟

    快手旗下可灵AI发布2.1系列模型,包含720p标准版和1080p高品质版,在性价比、生成速度和质量三大维度实现突破。新模型生成5秒视频仅需20-35灵感值,与上代保持相同成本;1080p视频生成时间不到1分钟,快于行业同级产品2-3倍。模型在动态表现、物理模拟和语义理解方面均有优化,人物动作更真实自然。可灵AI自发布以来发展迅猛,全球用户突破2200万,月活增长25倍,累计生成1.68亿视频和3.44亿图片。商业化进程加速,2025年Q1营收超1.5亿元人民币,展现强劲市场潜力。

  • AI日报:通义千问开源Qwen3向量模型;字节跳动图像编辑模型SeedEdit 3.0;ElevenLabs推v3语音模型

    本文汇总了近期AI领域的重要动态:1)通义千问发布Qwen3-Embedding系列模型,在多语言文本处理表现优异;2)字节跳动推出图像编辑模型SeedEdit3.0,提升细节保持能力;3)ElevenLabs发布情感语音合成系统Eleven v3 Alpha;4)Anthropic推出面向国家安全的Claude Gov模型;5)可灵AI月收入连续两月超1亿元;6)Meta公布智能眼镜Aria Gen2技术细节;7)爱诗科技上线AI视频工具"拍我AI";8)富国银行预测2030年ChatGPT广告收入将达千亿美元。

  • AI日报:GPT-4.1正式上线ChatGPT;阿里通义万相Wan2.1-VACE开源;可灵大模型视频生成量约占30%份额

    本文报道了AI领域最新动态:1)阿里通义万相开源视频编辑统一模型VACE;2)OpenAI发布GPT-4.1增强编码能力;3)Stability AI推出超轻量341M文字转语音模型;4)快手可灵视频生成模型占据30%市场份额;5)微软WizardLM团队整体加入腾讯混元大模型研发体系;6)腾讯宣布混元图像2.0将于5月16日发布;7)上海成立人工智能标识生态联盟;8)Lightricks发布13B参数视频生成模型LTX-Video;9)谷歌DeepMind推出AlphaEvolve优化AI训练速度;10)腾讯元宝浏览器插件上线Chrome平台。这些进展展示了AI技术在视频处理、大模型、语音合成等领域的快速发展。

  • AI日报:阿里云通义灵码AI IDE上线;小米多模态大模型Xiaomi MiMo-VL开源;黑森林实验室推出FLUX.1Kontext

    【AI日报】今日AI领域重要动态:1)阿里云推出通义灵码AI IDE,集成千问3模型,显著提升编程效率;2)小米开源多模态大模型MiMo-VL-7B,性能超越更大规模闭源模型;3)黑森林实验室发布FLUX.1Kontext图像生成模型,支持文本和参考图像多次编辑;4)Midjourney V7渲染速度提升40%,新增用户投票功能;5)DeepSeek R1-0528大模型在AGI领域取得突破,性能超越xAI等公司;6)Hugging Face进军机器人市场,推出开源人形机器人HopeJR;7)字节跳动火山方舟接入DeepSeek最新大模型;8)Anthropic开源"电路追踪"工具,揭示大模型决策过程;9)阿里巴巴开源自主搜索AI智能体WebAgent;10)Hume发布低延迟语音语言模型EVI3;11)Manus Slides支持一键生成专业幻灯片;12)Runway Gen-4 References支持手机照片艺术化处理。

  • AI日报:DeepSeek开源新版R1-0528;字节发布图像Agent小云雀AI;可灵2.1重磅上线

    本期AI日报聚焦多项AI领域突破:1)DeepSeek发布R1-0528模型,支持128K上下文且性能媲美GPT-4;2)字节推出"小云雀AI"图像创作工具;3)可画2.1版本价格降65%性能提升;4)Opera发布全球首款AI浏览器Neon;5)Meta推出多模态空间理解模型;6)北大团队研发ZeroSearch框架降低大模型训练成本88%;7)字节推出AI视频剪辑应用"剪小映";8)MotionPro实现40ms/帧精准视频控制;9)xAI与Telegram达成3亿美元合作部署Grok聊天机器人;10)OpenAI重组架构为IPO铺路;11)像素蛋糕"方糖大模型"获国内首个影像行业备案;12)Paper2Poster实现论文自动转海报;13)Resemble AI开源TTS模型性能比肩ElevenLabs;14)蚂蚁集团开源对标GPT-4o的多模态模型Ming-lite-omni。

  • AI日报:阿里开源长文本深度思考模型QwenLong-L1;GPT-4o语音模式上线唱歌功能;秘塔AI搜索推出全新“极速”模型

    本文汇总了AI领域最新动态:1)中国信通院发布智能体开发标准,推动AI商业化进程;2)阿里推出QwenLong-L1-32B长文本推理模型,性能媲美Claude-3;3)GPT-4o语音模式升级,新增唱歌功能;4)秘塔AI搜索推出极速模型,响应速度达400tokens/秒;5)谷歌发布LMEval评估框架,统一大模型评测标准;6)Chrome浏览器集成Gemini AI助手;7)阿联酋全民免费使用ChatGPT Plus;8)苏州成立60亿元AI产业基金;9)法国Kyutai实验室推出10秒定制语音的Unmute系统;10)UAV-Flow项目实现无人机语音精准控制;11)Claude将升级支持百万字上下文和记忆功能;12)百度心响iOS版上线;13)夸克推出高考深度搜索功能;14)Chrome v137开发者工具升级;15)美团AI业务接近GPT-4o水平;16)Direct3D-S2实现3D生成速度提升10倍;17)OpenAI计划2026年推出首款AI硬件。

  • 可灵AI离营收单月破亿,还有多远?

    虽然嘴上没明说,但快手显然也不想在AI时代仍甘当短视频老二。 因此,如今快手的财报会议上,AI占据了越来越多的篇幅,当然关键还是可灵AI的确争气。 根据快手2025年一季度财报显示,可灵AI营收超过1.5亿元人民币。从2024年9月的单月千万流水,到2025年第一季度的季度1.5亿营收,换言之,7个月时间里可灵AI实现15倍的营收增长。

  • AI日报:谷歌推最强AI全家桶Google AI Ultra;腾讯混元宣布模型矩阵全面升级;豆包·语音播客模型发布

    本文汇总了近期AI领域的重要动态:1)谷歌推出249.99美元/月的AI Ultra订阅计划,提供最强AI模型和高级功能;2)腾讯混元模型升级,新增视觉推理T1-Vision和语音对话模型;3)美图获阿里2.5亿美元投资,将在电商和AI领域合作;4)豆包推出语音播客模型,实现文本快速转音频;5)百度文心X1 Turbo获信通院最高评级;6)谷歌发布Flow AI剪辑工具,集成Veo3等三大模型;7)谷歌Veo3支持4K视频生成;8)Imagen4图像模型发布;9)Gemini2.5 Pro新增并行推理功能;10)谷歌推出虚拟试衣工具;11)公测AI编程助手Jules;12)苹果计划在iOS19开放AI模型;13)京东云推五大免费AI营销工具;14)字节开源多模态模型BAGEL;15)英伟达发布物理推理模型Cosmos-Reason1。

  • AI日报:通义千问3大模型全球爆火;即梦图片3.0智能参考全量上线;智谱AI企业级超级助手Agent CoCo上线

    【AI日报】今日AI领域重要动态:1.通义千问3大模型全球下载量超1250万,衍生模型13万+;2.即梦图片3.0上线,AI设计进入"零门槛"时代;3.智谱AI发布企业级超级助手Agent CoCo;4.百度推出金融行业大模型"千帆慧金";5.小红书开源首个大模型dots.llm1,含1420亿参数;6.Hugging Face开源LeRobot项目,降低机器人研发门槛;7.ChatGPT语音功能升级,支持更自然对话翻译;8.Google Gemini应用下载量超ChatGPT但活跃度不足;9.轻量级文档解析模型MonkeyOCR表现优异;10.Google Veo3推出高速视频生成模式;11.Google调整AI Studio政策,限制Gemini2.5Pro免费访问。

  • AI日报:Anthropic推最强编码AI模型Claude4;苹果计划推AI智能眼镜;QQ浏览器上线首个高考Agent

    【AI日报】今日AI领域重要动态:1)Anthropic发布Claude4系列AI模型,编程能力超越竞争对手;2)苹果计划2026年推出集成AI技术的智能眼镜;3)字节跳动与清华合作推出时序多模态大模型ChatTS;4)3DTown框架实现单张照片生成逼真3D场景;5)OpenAI秘密开发无屏幕AI设备;6)商汤科技推出儿童AI下棋机器人;7)微软记事本新增AI写作功能;8)深圳设立70亿元基金支持AI硬件初创企业;9)谷歌发布3D视频通信平台Beam;10)阿联酋推出"星际之门"计划,免费提供ChatGPT服务;11)法国Mistral推出开源模型Devstral;12)Anthropic API新增四大功能;13)美国众议院通过法案限制各州监管AI;14)QQ浏览器推出高考AI助手。