11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
凤凰科技讯 4月27日消息,今日车载导航软件图吧宣布获得四维图新2.96亿元融资。投资完成之后,四维图新总经理程鹏将可能担任新图吧公司的董事长,图吧CEO景慕寒将继续出任新图吧CEO。 根据《北京四维图新科技股份有限公司第...
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、谷歌急了,终极杀器对打GPT-4o视频模型Veo硬刚Sora谷歌近日发布了一系列强大的AI工具,包括ProjectAstra、Veo视频模型和Gemini1.5Pro,旨在彻底颠覆谷歌搜索并挑战OpenAI。这一举措在�
标题:🎥划重点:1.🌐AtomoVideo介绍:阿里技术团队推出的文本图片生成高保真视频模型,通过简单的文本提示和高清图片即可生成逼真高清视频。2.🚀技术创新:AtomoVideo融合多粒度图片注入和时间建模,利用VAE编码器和CLIP编码器提高细节信息和文本语义的一致性,同时在时间维度上进行创新以学习时序动态模式。这一创新性的视频生成模型将为AIGC领域带来更多可能性,引领视频�
阿里巴巴在人工智能领域再次取得突破,推出了一款名为AtomoVideo的高保真图像到视频生成框架。这一技术的问世,标志着基于文本到图像生成技术的视频生成领域取得了显著的快速发展。不过从AK大神发布的演示来看,AtomoVideo生成的视频质量和sora相比差距较大,和SVD相比也有一些差距,希望后续会有更大的提升吧。
阿里巴巴智能计算研究所提出了一种新的生成式框架EMO,只需输入图片和音频即可生成具有表现力的视频视频中的嘴型还可以与声音匹配。这项技术支持多语言、对话、唱歌以及快速语速的适配,但也可能成为造假的利器,因此一些名人可能需要警惕了。需要注意的是,该框架目前仅用于学术研究和效果演示有待进一步优化和扩展其应用范围。
【新智元导读】多模态大模型将是AI下一个爆点。通义千问VLM模型换新升级,超大杯性能堪比GPT-4V。阿里正在走一条非常正确的路。
SCEPTER是由阿里巴巴开发的一个专为生成模型设计的开源框架。它用于训练、微调和推理生成模型,涵盖诸如图像生成、转换和编辑等下游任务。这些方法特别适用于生成高质量、细节丰富的图像。
摩尔线程的单图跳舞项目已经复原,并且已经开源训练代码。这意味着你现在可以使用自己的AnimateAnyone模型进行训练。通过这个项目,用户可以轻松地获取Moore-AnimateAnyone的实现,并在ComfyUI中使用。
StabilityAI公司发布了其首个新型人工智能模型,商业许可的StableCode3B。字节复旦团队提出metaprompts扩散模型图像理解力刷新SOTA过去一年,扩散模型逐渐在文生图领域扩展,能否处理视觉感知任务呢?字节跳动和复旦大学技术团队提出了简单有效方案,旨在提高模型在视觉识别任务中的性能。
PicCopilot是一款专为电商设计的AI驱动图片优化工具。利用图像生成模型,PicCopilot能够通过分析大量图片点击量数据,有效提高图片的点击转化率。要了解更多信息并开始使用PicCopilot,请访问PicCopilot网站更多介绍。
阿里推ReplaceAnything框架可通过AI替换万物阿里智能计算研究院提出的ReplaceAnything框架通过AI技术,实现对服装、证件照背景、人脸等的替换,引发社区热议�
FaceChain-FACT是阿里推出的一项人工智能生成个性化肖像的技术,通过DeformableNeuralRadianceFields技术从普通视频中创造自由视点的肖像。使用FaceChainAI照片生成模型,不需要提供多张照片训练LoRA,仅需一张用户照片即可生成高度定制的肖像,生成速度更是快过商业应用100倍,达到秒级。这对于人工智能生成内容的发展具有积极的推动作用。
阿里开源多语言视觉文字生成与编辑模型——AnyText,AnyText对生成文字的把控可媲美专业PS,用户可自定义规划文字出现的位置,图片的强度、力度、种子数等,目前在Github超2,400颗星非常受欢迎。英伟达推新AI语音识别模型ParakeetNVIDIANeMo宣布推出ParakeetASR模型系列,这是一系列先进的自动语音识别模型,与Suno.ai合作开发。只要四行代码就能让大模型窗口长度暴增,最高可增加3
随着Midjourney、StableDifusion等产品的出现,文生图像领域获得了巨大突破。但是想在图像中生成/嵌入精准的文本却比较困难。AnyWord-3M吸取了多个数据集的精华中的精华,也是AnyText能力非常强悍的重要原因之一。
SCEdit是一个高效的生成式微调框架,由阿里巴巴通义实验室基础视觉智能团队提出。该框架可以用于图像生成任务的微调,并支持快速迁移到特定的生成场景中。在可控生成任务中,SCEdit可以实现对生成结果的精准控制,并节省30%的内存使用。
美图公司的AI视觉大模型MiracleVision于2023年6月内测,已升级至4.0版本并通过备案,成为国内唯一专注视觉领域的大模型,将在电商、广告、游戏、动漫、影视等行业开放服务。Meta推全新视频生成模型FlowVidMeta与清华校友合作开发的FlowVid视频生成模型利用V2V技术,在短短1.5分钟内生成4秒视频,突破了时间连贯性难题,通过光流技术实现视频帧之间的高度一致性。项目地址:https://t
能准确写汉字的AI绘图工具,终于登场了!包括中文在内一共支持四种语言还能文字的位置还能任意指定。人们终于可以和AI绘图模型的“鬼画符”说再见了。AnyText还支持嵌入其他扩散模型,为之提供文本生成支持。
今日,词条#阿里被判赔京东10亿#登上微博热搜,引起关注。事件起因是京东黑板报”发布《关于京东诉阿里巴巴二选一”案一审胜诉的声明》。京东汽车还将联合特斯拉带来7辆Model3焕新版累计最高10年使用权、10辆特斯拉Cybertruck儿童车等互动大奖。
上海AI实验室升级发布“浦医2.0”上海人工智能实验室与上海交通大学医学院附属瑞金医院等在“2023健康中国思南峰会”上发布了医疗多模态基础模型群“浦医2.0”,为跨领域、跨疾病、跨模态的AI医疗应用提供全面支持。用户可定制图�
阿里巴巴的新项目SCEdit是一个AI画图框架,可以显著减少训练参数、内存使用率和计算开销。在训练阶段,它减少了52%的内存消耗,仅利用ControlNet所需参数的7.9%,并实现内存使用量减少30%。该项目也宣布了开源,尽管还没有提供具体的代码,但已经有开发者表示愿意帮助实现。
视频合成最近取得了显著的进步,这得益于扩散模型的快速发展。它在语义准确性、清晰度和时空连续性方面仍然存在挑战。研究人员还对人脸、3D卡通、动漫、中国画、小动物等多种图像进行了定性分析,展示了该模型的泛化能力。
阿里在11月份发布了论文,宣布将开源I2VGen-XL图像生成视频模型。他们终于发布了具体的代码和模型。通过这些数据,I2VGen-XL模型可以提高生成视频的语义准确性、细节的连续性和清晰度。
谷歌GeminiPro大模型在研究基准测试中表现优异,支持32K上下文窗口的文本输入和生成功能,向VertexAI云计算客户和AIStudio开发人员开放,提供多种功能和SDK,为构建AI应用程序提供更多可能性。文心一言插件商城上线百度文心一言插件商城正式上线,提供多功能插件,包括PPT生成、音视频提取、思维导图等,用户可通过简单指令满足多场景需求。库提供开放访问,支持Unity和Unreal
阿里巴巴、香港大学、蚂蚁集团的研究人员提出了一种全新图片生成动态视频模型——LivePhoto。用户通过LivePhoto,可将一张静态图片快速生成高精准的动态视频。用户还可以通过简单调节运动强度的数值,自由定制视频中运动的方式。
DreaMoving由阿里巴巴集团的一组研究人员倾力打造,一种基于扩散模型的可控视频生成框架,。该框架的核心目标基于图文就能生成高质量、定制化的人类舞蹈视频。值得一提的是,目前DreaMoving项目并没有开源代码。
11月29日,在拼多多发布超预期财报、市值逼近阿里之后,马云在阿里内网发言,回应阿里员工关于拼多多财报数据以及阿里运营建议等帖子的讨论,并表示“AI电商时代刚刚开始,对谁都是机会,也是挑战。”事实上,阿里早已开始进行电商领域的AI布局,并已初见成效。从人货场三维度,在AI技术的不断发展下,电商行业一切都值得用AI重做一遍。
OpenAI宣布将定制化GPT商店的发布时间推迟至2024年初,此举发生在公司首席执行官更迭、员工威胁罢工后,公司继续改进GPT以提高性能和功能。OpenAI在中国申请GPT-6、GPT-7商标OpenAI近日在中国积极申请GPT-6和GPT-7商标,显示其对全球人工智能行业的远见,同时展示GPT-4超过1万亿参数的强大性能,预示着GPT-6和GPT-7的创新。项目网址:https://daveredrum.github.io/SceneTex/Meta推出家庭机器人学习
阿里推出了一项名为AnimateAnyone的研究,该研究通过引入扩散模型,克服当前图像到视频合成中的一些挑战,特别是在角色动画领域。论文提出了一种全新的框架,通过巧妙设计的ReferenceNet、姿势引导器和时间建模方法,解决了维持细节一致性和运动连贯性的问题。带来的技术突破和实证结果表明,这一方法在角色动画领域具有巨大的潜力,为数字媒体和创意产业注入了新的活�
变动,是阿里今年的主旋律。伴随着最新一季财报的发布,阿里巴巴抛出两项新的业务战略调整,一是“决定不再推进云智能集团的完全分拆”,二是“盒马的首次公开募股计划暂缓”。9个月时间,阿里员工减少14785人,月均减员1642人。
10月17日,在“2023百度世界大会”上,李彦宏正式发布了最新的文心大模型4.0版本。各种测评纷涌至,各大科技媒体从理解、生成、逻辑和记忆能力等方面,对模型进行了全方位测评。谁若率先实现了这样与应用相互促进,相辅相成的生态,谁就将有可能在AI时代率先竖立起自身的生态的壁垒。