11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
【AI日报】今日AI领域重要动态:1)阿里开源支持链式推理的音频生成模型ThinkSound,实现高保真空间音频生成;2)谷歌Veo3升级,支持静态图片生成生动视频;3)Hugging Face发布30亿参数小模型SmolLM3,性能优于Llama-3.2-3B;4)阿里开源网络智能体WebSailor,展现强大推理和检索能力;5)Moonvalley发布原生1080P视频生成模型Marey Realism v1.5;6)Vidu Q1支持最多七张参考图像生成一致性视频;7)苹果�
除此之外,腾讯还介绍了元宝目前可以识别花的品种;可以提示在围棋赛局中下一步如何走;同时,给它一张定期存款利率表,还会帮你出谋划策。
SNS上出现了售卖吉卜力风格图片的“交易”,一些二手交易平台上声称收到钱后就会帮忙制作吉卜力风格图片的帖子也层出不穷。吉卜力风格的图片转化功能在全球备受欢迎,近一周时间,通过ChatGPT制作的相关图片数量就超过了7亿张。想想他们为了打造某种独特风格所付出的努力,如今却遭遇这种无法受到著作权法保护的情况,无疑会极大地打击创作者们的积极性。
近日,Adobe发布新生成式AI工具,可以自动执行劳动密集型生产任务,例如编辑大批量图片、翻译视频演示文稿等。最引人注目的是FireflyBulkCreate”,该应用程序允许用户一键快速调整多达10,000张图像的大小或替换所有背景,无需频繁操作,让工作变得更加轻松。但考虑到处理大量图片的运算资源,用户需付费购买AdobeFirefly高级方案并消耗积分才能使用新功能。
由微软亚洲研究院开发的VASA-1项目,是一项前沿的人工智能技术,它能够将单一静态图像和一段语音音频转换为逼真的对话面部动画。这项技术不仅能够实现音频与唇部动作的精确同步能够捕捉并再现丰富的面部表情和自然的头部动作,极大地增强了生成视频的真实感和生动性。所有在演示中使用的肖像图像,除了蒙娜丽莎外,都是由StyleGAN2或DALL-E-3生成的虚拟、不存在的身份
阿里巴巴智能计算研究所提出了一种新的生成式框架EMO,只需输入图片和音频即可生成具有表现力的视频视频中的嘴型还可以与声音匹配。这项技术支持多语言、对话、唱歌以及快速语速的适配,但也可能成为造假的利器,因此一些名人可能需要警惕了。需要注意的是,该框架目前仅用于学术研究和效果演示有待进一步优化和扩展其应用范围。
FaceChain-FACT是阿里推出的一项人工智能生成个性化肖像的技术,通过DeformableNeuralRadianceFields技术从普通视频中创造自由视点的肖像。使用FaceChainAI照片生成模型,不需要提供多张照片训练LoRA,仅需一张用户照片即可生成高度定制的肖像,生成速度更是快过商业应用100倍,达到秒级。这对于人工智能生成内容的发展具有积极的推动作用。
著名开源生成式AI平台Stability.ai发布了,全新文生图模型SDXLTurbo。该模型只需1秒甚至更少的时间就能生成高精准图片,可将通常50个生成步降至1—4步。哎~~万万没想到现实中的高压学习、生活方法也适用于大模型界,看来开发灵感真的无处不在啊,真是名师出高徒,严父出孝子。
11月29日,著名开源生成式AI平台Stability.ai在官网发布了,开源文生图模型SDXLTurbo。根据使用体验,SDXLTurbo的生成图像效率非常快,可以做到实时响应。但SDXLTurbo对扩散模型的生成效率、质量实现了重大技术突破,可以帮助中小型企业以更低的成本来进行部署使用。
“我不敢出镜,也不会拍视频,在抖音上卖货赚钱这碗饭,我是吃不上了,诶!”“小美不是也都不会吗,听说她最近在抖音带货赚得很不错啊~”“骗人的吧?”是真的!不用直播,不拍视频,两张图片,就能带货!从蝉妈妈最近新上线的「图文带货榜」日榜中可以看到,前10名中,有6位的粉丝都不到5w,如低粉达人@海菲好物仅用一条图文,1天就卖出了10w-25w的销售额,勇夺10月9�