AI日报：微信公众号支持AI配图；阿里云通义万相全新图像编辑模型ACE；快手可灵AI推「AI试衣」功能

2024-12-02 15:15 · 稿源：站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、微信公众号可以AI配图了:还支持调整风格和比例

微信公众号最近推出了“AI配图”新功能，旨在帮助内容创作者更高效地选择和插入图片。用户可以通过简短的文字描述生成与文章内容匹配的图片，并对其进行风格和比例的调整。这一创新不仅提升了创作效率，还减轻了版权问题的担忧，目前功能仍在灰度测试阶段

微信号后台新增AI配图功能：内容创作配图十几秒可生成！

【AiBase提要:】
🖌️ AI配图功能允许用户通过简短描述生成匹配的图片，提升创作效率。
📏 用户可以对生成的图片进行风格和比例的调整，确保最终效果满意。
🔒 此功能扩展至文章封面，减少了因版权问题带来的担忧。

2、阿里云通义万相发布全新图像编辑模型ACE 实现一键图片修改

阿里云通义万相团队推出了全新的图像编辑模型ACE，旨在通过简单的口语化指令，提供便捷的图片生成与编辑服务。ACE支持多种应用场景，并具备强大的图像编辑功能，用户可以轻松实现如修改证件照背景等操作。其核心创新在于Long-context Condition Unit（LCU）模块，确保了高质量的编辑效果。

【AiBase提要:】
✨ ACE模型通过口语化指令实现便捷的图像生成与编辑，简化了复杂的编辑过程。
🎨 支持多种应用场景，如风格化写真、分镜制作和室内设计，满足用户多样化需求。
🔧 LCU模块确保精准的编辑效果，并为全球开发者提供开源支持，推动智能图像处理技术的发展。
详情链接:https://github.com/ali-vilab/ACE

3、可灵AI宣布推出「AI试衣」功能:1.5模型新增支持「首尾帧」

可灵AI最新推出的「AI试衣」功能，通过上传最少两张图片，用户可以轻松生成模特试穿服装的效果图。此外，1.5模型在图生视频领域的增强，支持视频首尾帧技术，使创作者能够实现更精细的视频控制。可灵AI还推出了「灵感学院」，提供免费课程。

【AiBase提要:】
👚 AI试衣功能允许用户通过上传服装和模特图片，生成试穿效果图，支持多种服饰更换。
🎥 新增的首尾帧技术使得用户可以上传两张图片，精确控制视频的开头和结尾，实现动态过渡。
📚 可灵AI推出的灵感学院，提供免费课程，帮助新手快速掌握AI工具的使用，促进技术普及。

4、虚拟主播带货太僵硬?中科院联手腾讯打造“AI带货王”AnchorCrafter，动作表情自然到位

随着技术的进步，虚拟主播的表现也在不断提升。中国科学院与腾讯合作推出的AnchorCrafter，标志着虚拟主播带货进入了一个新的时代。该工具能够生成自然流畅的带货视频，主播的动作和表情都非常逼真，极大地提升了用户体验。通过AI技术，用户只需提供主播照片和产品信息，便可快速生成高质量的视频。

【AiBase提要:】
🛍️ AnchorCrafter能够生成自然流畅的带货视频，提升观众体验。
🤳 用户只需提供主播照片和产品信息，便可快速制作视频。
📈 实验结果显示，生成的视频质量和动作自然度达到了业界领先水平。
详情链接:https://cangcz.github.io/Anchor-Crafter/

5、Adobe推AI音效生成系统MultiFoley

最近，Adobe与密歇根大学合作研发的MultiFoley人工智能系统，标志着音效生成技术的一次重大突破。该系统能够通过文字提示、参考音频或视频示例生成高质量的音效，音频输出质量达到48kHz，且与视频的同步精度高达0.8秒，显著优于传统系统。

【AiBase提要:】
🔊 MultiFoley系统通过文字、音频和视频输入生成音效，音质达到48kHz。
🎵 平均同步精度为0.8秒，显著优于传统音效系统的表现。
📊 用户研究显示，85.8%的参与者认为其语义一致性优于其他系统。

6、MyTimeMachine:上传50张照片就能预估你各个年龄的长相

MyTimeMachine是一项创新技术，能够通过用户上传的50张自拍照片，个性化地转换面部年龄。这一系统结合全球衰老模型，生成高保真度的年龄变化效果，同时保持用户的身份特征。该技术不仅适用于静态图像，还可扩展到视频处理，广泛应用于影视特效和广告行业。

【AiBase提要:】
🌟 MyTimeMachine结合全球衰老模型和用户个人自拍，实现个性化的年龄转换。
📸 只需50张个人照片即可训练适配器网络，生成真实的年龄变化效果。
🎥 该技术不仅适用于静态图像，还可扩展到视频，实现高质量、身份保留的老化效果。
详情链接:https://mytimemachine.github.io/

7、反向操作!TryOffDiff可一键从模特身上提取衣服变成标准化的服装图片

TryOffDiff是一项由德国比勒费尔德大学开发的AI技术，旨在解决网购中买家秀与卖家秀之间的巨大差异。通过强大的扩散模型，TryOffDiff能够从照片中提取衣服的特征，生成高清的标准商品展示图，去除背景，效果媲美专业摄影师。

【AiBase提要:】
🧵 TryOffDiff利用AI技术提取衣服特征，生成高清商品展示图。
📸 生成的图片细节清晰，背景自动去除，效果媲美专业摄影。
🛒 该技术有助于提升电商平台的商品展示效果，降低退货率。
详情链接:https://huggingface.co/spaces/rizavelioglu/tryoffdiff

8、GTX580老旧显卡也能训练 GPT-4，成本高达惊人的十倍

Epoch AI 最近推出了一款互动模拟器，揭示了使用老旧显卡 GTX580训练 GPT-4的可能性，尽管成本高达现代硬件的十倍。研究表明，训练 GPT-4所需的浮点运算次数在1e25到1e26之间，且随着模型规模的扩大，效率通常会降低。

【AiBase提要:】
💰 使用 GTX580显卡训练 GPT-4的成本是现代硬件的十倍，效率较低。
📊 模拟器可以分析不同 GPU 的性能差异，并支持复杂的多数据中心训练模拟。
🔍 该研究旨在深入理解未来硬件需求，以支持大型 AI 模型的训练。

9、加密货币用户说服AI机器人Freysa 转移4.7万美元奖金池

在一场独特的人工智能对抗游戏中，一名加密货币用户成功说服了自主AI机器人Freysa，将价值超过47，000美元的奖金池转给了他。尽管前481次尝试均以失败告终，这位技术作家通过巧妙的提示和对Freysa功能的深刻理解，最终突破了AI的防线，获得了胜利。

【AiBase提要:】
💰 加密货币用户通过巧妙提示成功说服AI机器人Freysa转移奖金池资金。
🤝 玩家愿意捐赠100美元，最终获得Freysa的认可，成功转账。
🧠 Freysa的决策机制仍然神秘，展示了人类在与AI互动中的创造性与机智。

10、马斯克寻求法庭禁令阻止 OpenAI 转型为盈利公司

最近，特斯拉首席执行官埃隆·马斯克的法律团队向法院申请临时禁令，阻止OpenAI转型为盈利公司，理由是如果马斯克胜诉，OpenAI可能缺乏资金支付赔偿。此外，马斯克指控OpenAI及其投资方微软违反反垄断法，要求投资者不支持竞争对手。

【AiBase提要:】
⚖️ 马斯克法律团队请求法院阻止 OpenAI 转型为盈利公司，认为其可能面临赔偿风险。
📉 指控 OpenAI 和微软违反美国反垄断法，要求投资者不支持竞争对手。
💰 马斯克曾支持 OpenAI 盈利模式，如今却反对其转型，显示行业内竞争的复杂性。

11、OpenAI希望借助与苹果合作在年底前用户达到10亿

OpenAI正全力以赴追求到2025年拥有10亿用户的目标，计划通过推出新产品、建设数据中心及与苹果的合作来实现增长。自ChatGPT推出以来，用户已增至每周2.5亿活跃用户。公司在硅谷融资60亿美元，并计划继续扩展资金，以支持发展。

【AiBase提要:】
✨ OpenAI目标到2025年用户达到10亿，并借助与苹果的合作加速增长。
💰 该公司在硅谷历史上完成了最大规模的融资，筹集60亿美元，计划继续扩展资金。
📈 生成性人工智能在生产和安全管理中的应用正在迅速增长，越来越多的企业开始重视其潜在价值。

（举报）

相关推荐

关键词：

快手可灵AI上线2.1系列模型：生成5秒视频不到1分钟

快手旗下可灵AI发布2.1系列模型，包含720p标准版和1080p高品质版，在性价比、生成速度和质量三大维度实现突破。新模型生成5秒视频仅需20-35灵感值，与上代保持相同成本；1080p视频生成时间不到1分钟，快于行业同级产品2-3倍。模型在动态表现、物理模拟和语义理解方面均有优化，人物动作更真实自然。可灵AI自发布以来发展迅猛，全球用户突破2200万，月活增长25倍，累计生成1.68亿视频和3.44亿图片。商业化进程加速，2025年Q1营收超1.5亿元人民币，展现强劲市场潜力。

可灵AI 可灵2.1 AI视频创作
荐AI日报：通义千问开源Qwen3向量模型；字节跳动图像编辑模型SeedEdit 3.0；ElevenLabs推v3语音模型

本文汇总了近期AI领域的重要动态：1)通义千问发布Qwen3-Embedding系列模型，在多语言文本处理表现优异；2)字节跳动推出图像编辑模型SeedEdit3.0，提升细节保持能力；3)ElevenLabs发布情感语音合成系统Eleven v3 Alpha；4)Anthropic推出面向国家安全的Claude Gov模型；5)可灵AI月收入连续两月超1亿元；6)Meta公布智能眼镜Aria Gen2技术细节；7)爱诗科技上线AI视频工具"拍我AI"；8)富国银行预测2030年ChatGPT广告收入将达千亿美元。

人工智能深度学习文本处理
荐AI日报：GPT-4.1正式上线ChatGPT；阿里通义万相Wan2.1-VACE开源；可灵大模型视频生成量约占30%份额

本文报道了AI领域最新动态：1)阿里通义万相开源视频编辑统一模型VACE；2)OpenAI发布GPT-4.1增强编码能力；3)Stability AI推出超轻量341M文字转语音模型；4)快手可灵视频生成模型占据30%市场份额；5)微软WizardLM团队整体加入腾讯混元大模型研发体系；6)腾讯宣布混元图像2.0将于5月16日发布；7)上海成立人工智能标识生态联盟；8)Lightricks发布13B参数视频生成模型LTX-Video；9)谷歌DeepMind推出AlphaEvolve优化AI训练速度；10)腾讯元宝浏览器插件上线Chrome平台。这些进展展示了AI技术在视频处理、大模型、语音合成等领域的快速发展。

人工智能视频编辑开源项目
荐AI日报：阿里云通义灵码AI IDE上线；小米多模态大模型Xiaomi MiMo-VL开源；黑森林实验室推出FLUX.1Kontext

【AI日报】今日AI领域重要动态：1)阿里云推出通义灵码AI IDE，集成千问3模型，显著提升编程效率；2)小米开源多模态大模型MiMo-VL-7B，性能超越更大规模闭源模型；3)黑森林实验室发布FLUX.1Kontext图像生成模型，支持文本和参考图像多次编辑；4)Midjourney V7渲染速度提升40%，新增用户投票功能；5)DeepSeek R1-0528大模型在AGI领域取得突破，性能超越xAI等公司；6)Hugging Face进军机器人市场，推出开源人形机器人HopeJR；7)字节跳动火山方舟接入DeepSeek最新大模型；8)Anthropic开源"电路追踪"工具，揭示大模型决策过程；9)阿里巴巴开源自主搜索AI智能体WebAgent；10)Hume发布低延迟语音语言模型EVI3；11)Manus Slides支持一键生成专业幻灯片；12)Runway Gen-4 References支持手机照片艺术化处理。

人工智能 AI开发工具编程效率
荐AI日报：DeepSeek开源新版R1-0528；字节发布图像Agent小云雀AI；可灵2.1重磅上线

本期AI日报聚焦多项AI领域突破：1)DeepSeek发布R1-0528模型，支持128K上下文且性能媲美GPT-4；2)字节推出"小云雀AI"图像创作工具；3)可画2.1版本价格降65%性能提升；4)Opera发布全球首款AI浏览器Neon；5)Meta推出多模态空间理解模型；6)北大团队研发ZeroSearch框架降低大模型训练成本88%；7)字节推出AI视频剪辑应用"剪小映"；8)MotionPro实现40ms/帧精准视频控制；9)xAI与Telegram达成3亿美元合作部署Grok聊天机器人；10)OpenAI重组架构为IPO铺路；11)像素蛋糕"方糖大模型"获国内首个影像行业备案；12)Paper2Poster实现论文自动转海报；13)Resemble AI开源TTS模型性能比肩ElevenLabs；14)蚂蚁集团开源对标GPT-4o的多模态模型Ming-lite-omni。

人工智能 AI产品技术趋势
荐AI日报：阿里开源长文本深度思考模型QwenLong-L1；GPT-4o语音模式上线唱歌功能；秘塔AI搜索推出全新“极速”模型

本文汇总了AI领域最新动态：1)中国信通院发布智能体开发标准，推动AI商业化进程；2)阿里推出QwenLong-L1-32B长文本推理模型，性能媲美Claude-3；3)GPT-4o语音模式升级，新增唱歌功能；4)秘塔AI搜索推出极速模型，响应速度达400tokens/秒；5)谷歌发布LMEval评估框架，统一大模型评测标准；6)Chrome浏览器集成Gemini AI助手；7)阿联酋全民免费使用ChatGPT Plus；8)苏州成立60亿元AI产业基金；9)法国Kyutai实验室推出10秒定制语音的Unmute系统；10)UAV-Flow项目实现无人机语音精准控制；11)Claude将升级支持百万字上下文和记忆功能；12)百度心响iOS版上线；13)夸克推出高考深度搜索功能；14)Chrome v137开发者工具升级；15)美团AI业务接近GPT-4o水平；16)Direct3D-S2实现3D生成速度提升10倍；17)OpenAI计划2026年推出首款AI硬件。

人工智能软件开发 AI标准
荐可灵AI离营收单月破亿，还有多远？

虽然嘴上没明说，但快手显然也不想在AI时代仍甘当短视频老二。因此，如今快手的财报会议上，AI占据了越来越多的篇幅，当然关键还是可灵AI的确争气。根据快手2025年一季度财报显示，可灵AI营收超过1.5亿元人民币。从2024年9月的单月千万流水，到2025年第一季度的季度1.5亿营收，换言之，7个月时间里可灵AI实现15倍的营收增长。

快手 AI 可灵AI
荐AI日报：谷歌推最强AI全家桶Google AI Ultra；腾讯混元宣布模型矩阵全面升级；豆包·语音播客模型发布

本文汇总了近期AI领域的重要动态：1)谷歌推出249.99美元/月的AI Ultra订阅计划，提供最强AI模型和高级功能；2)腾讯混元模型升级，新增视觉推理T1-Vision和语音对话模型；3)美图获阿里2.5亿美元投资，将在电商和AI领域合作；4)豆包推出语音播客模型，实现文本快速转音频；5)百度文心X1 Turbo获信通院最高评级；6)谷歌发布Flow AI剪辑工具，集成Veo3等三大模型；7)谷歌Veo3支持4K视频生成；8)Imagen4图像模型发布；9)Gemini2.5 Pro新增并行推理功能；10)谷歌推出虚拟试衣工具；11)公测AI编程助手Jules；12)苹果计划在iOS19开放AI模型；13)京东云推五大免费AI营销工具；14)字节开源多模态模型BAGEL；15)英伟达发布物理推理模型Cosmos-Reason1。

人工智能 AI产品技术趋势
荐AI日报：通义千问3大模型全球爆火；即梦图片3.0智能参考全量上线；智谱AI企业级超级助手Agent CoCo上线

【AI日报】今日AI领域重要动态：1.通义千问3大模型全球下载量超1250万，衍生模型13万+；2.即梦图片3.0上线，AI设计进入"零门槛"时代；3.智谱AI发布企业级超级助手Agent CoCo；4.百度推出金融行业大模型"千帆慧金"；5.小红书开源首个大模型dots.llm1，含1420亿参数；6.Hugging Face开源LeRobot项目，降低机器人研发门槛；7.ChatGPT语音功能升级，支持更自然对话翻译；8.Google Gemini应用下载量超ChatGPT但活跃度不足；9.轻量级文档解析模型MonkeyOCR表现优异；10.Google Veo3推出高速视频生成模式；11.Google调整AI Studio政策，限制Gemini2.5Pro免费访问。

AI日报通义千问 AI产品应用
荐AI日报：Anthropic推最强编码AI模型Claude4；苹果计划推AI智能眼镜；QQ浏览器上线首个高考Agent

【AI日报】今日AI领域重要动态：1)Anthropic发布Claude4系列AI模型，编程能力超越竞争对手；2)苹果计划2026年推出集成AI技术的智能眼镜；3)字节跳动与清华合作推出时序多模态大模型ChatTS；4)3DTown框架实现单张照片生成逼真3D场景；5)OpenAI秘密开发无屏幕AI设备；6)商汤科技推出儿童AI下棋机器人；7)微软记事本新增AI写作功能；8)深圳设立70亿元基金支持AI硬件初创企业；9)谷歌发布3D视频通信平台Beam；10)阿联酋推出"星际之门"计划，免费提供ChatGPT服务；11)法国Mistral推出开源模型Devstral；12)Anthropic API新增四大功能；13)美国众议院通过法案限制各州监管AI；14)QQ浏览器推出高考AI助手。

Claude4 人工智能 AI模型

热文

3 天
7天

AI日报：微信公众号支持AI配图；阿里云通义万相全新图像编辑模型ACE；快手可灵AI推「AI试衣」功能

快手可灵AI上线2.1系列模型：生成5秒视频不到1分钟

荐AI日报：通义千问开源Qwen3向量模型；字节跳动图像编辑模型SeedEdit 3.0；ElevenLabs推v3语音模型

荐AI日报：GPT-4.1正式上线ChatGPT；阿里通义万相Wan2.1-VACE开源；可灵大模型视频生成量约占30%份额

荐AI日报：阿里云通义灵码AI IDE上线；小米多模态大模型Xiaomi MiMo-VL开源；黑森林实验室推出FLUX.1Kontext

荐AI日报：DeepSeek开源新版R1-0528；字节发布图像Agent小云雀AI；可灵2.1重磅上线

荐AI日报：阿里开源长文本深度思考模型QwenLong-L1；GPT-4o语音模式上线唱歌功能；秘塔AI搜索推出全新“极速”模型

荐可灵AI离营收单月破亿，还有多远？

荐AI日报：谷歌推最强AI全家桶Google AI Ultra；腾讯混元宣布模型矩阵全面升级；豆包·语音播客模型发布

荐AI日报：通义千问3大模型全球爆火；即梦图片3.0智能参考全量上线；智谱AI企业级超级助手Agent CoCo上线

荐AI日报：Anthropic推最强编码AI模型Claude4；苹果计划推AI智能眼镜；QQ浏览器上线首个高考Agent

热文

前OpenAI研究员：有时，ChatGPT为了“自救”，会选择牺牲用户

从心脏、到血管……3D打印开启“器官替换”时代

无缝且安全的密钥导入、导出功能将登陆苹果系统

点击已死？“AI引用”才是流量未来，SEO正在被SAO、AEO取代

苹果研究发现：AI 模型在遇到复杂难题时会“崩溃放弃”

王自如：在格力工资是以前几分之一有公开资料可查

苹果举行WWDC 25开发者大会 iOS 26更新汇总

李世石：AI不会“解读”……直觉依然属于人类！

iOS26的这五大“新功能”，我在安卓机上已经用了好几年！

苹果公布 Intel Mac 支持终止时间表，Rosetta 2 也将逐步淘汰

苹果全新AirTag即将推出：将有这几点提升

前OpenAI研究员：有时，ChatGPT为了“自救”，会选择牺牲用户

格力否认董明珠孟羽童直播是策划：就是一次很自然的会面

站长商机