11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
腾讯开源了混元DiT图像生成模型,对英语和中文都有着精细的理解能力。Hunyuan-DiT能够进行多轮多模态对话,根据对话上下文生成并细化图像。它通过结合Transformer结构、文本编码和位置编码,以及训练一个多模态大型语言型,实现了对中英文的细粒度理解,并在图像生成等任务中取得了显著的效果。
腾讯旗下引人注目的混元文生图大模型宣布全面开源,这一重要举措标志着人工智能领域的又一里程碑。该模型已在HuggingFace和Github平台上发布,包含完整的模型权重、推理代码和算法,面向全球的企业与个人开发者免费开放商用。我们期待这一技术的进一步发展和应用,为人工智能领域带来更多的惊喜和突破。
前RedditCEOYishanWong指出,科技巨头对人工智能的过度迷恋已经开始影响他们推出的产品质量。在周三的一篇文章中,Wong表示:“大型互联网巨头正陷入AI的模因竞争中Google对OpenAI的生存恐惧则处于中心。Facebook、WhatsApp和Instagram用户现在被迫使用无法关闭的聊天机器人不是常规的搜索栏。
巴黎矿业大学和以色列理工学院的研究人员联合推出了一款创新视频模型——Slicedit。这款模型能够在不改变视频背景的情况下,对视频中的主要对象进行修改。这项技术的发展可能会对视频编辑领域产生重大影响,使得视频编辑变得更加容易和可访问,同时也为内容创作者提供了更多创新的可能性。
Reddit与OpenAI宣布战略合作,旨在整合先进的AI功能和用户生成的独特内容,彻底改变在线社区互动体验和推动AI创新。这一合作是Reddit近期与谷歌达成每年6000万美元内容许可协议之后的又一重要举措,旨在充分发挥双方的优势,提供无与伦比的用户体验,并推动人工智能领域的创新。Reddit的庞大用户生成内容与Open的先进人工智能能力相结合,创新和增强用户体验的潜力巨大,�
特斯拉和SpaceX首席执行官埃隆·马斯克现在指责OpenAI虚伪,此前该公司据报道对Reddit子版块使用其logo提出版权投诉。ChatGPT的母公司对ChatGPTsubreddit使用其logo提出了版权投诉。OpenAI对诉讼的回应导致马斯克进一步批评该公司,建议如果不开源其人工智能技术,就应该更改名称。
OpenAI正在与另一家出版商合作,以授权获得培训数据。People和BetterHomes&Gardens等品牌的所有者DotdashMeredith将向OpenAI授权其内容来训练ChatGPT出版商将使用AI公司的模型来增强其内部广告定位工具。该出版商表示,其广告系统“根据消费内容的上下文将广告商直接与消费者联系起来不使用cookie等个人标识符。
Meditron是一个基于Llama的大型医学语言模型,由Meta公司更新并发布。Meditron项目是完全开源的,包括数据、模型权重和配置,这意味着全球的研究人员和开发者都可以自由地访问、使用、修改和改进这一技术。在紧急情况下快速提供医疗响应,或在基础设施不足的地区辅助医疗工作,Meditron可以发挥重要作用。
北大和字节联手搞了个大的:提出图像生成新范式,从预测下一个token变成预测下一级分辨率,效果超越Sora核心组件DiffusionTransformer。并且代码开源,短短几天已经揽下1.3k标星,登上GitHub趋势榜。他硕士毕业于浙江大学,目前的研究重点是视觉基础模型、深度生成模型和大语言模型。
北大与字节跳动AILab联合提出了一种图像生成新范式——VAR,这一新方法的核心在于预测下一级分辨率非传统的预测下一个token。VAR的提出不仅在图像生成质量上超越了Sora的核心组件DiffusionTransformer在推理速度上也实现了20倍以上的提升。VAR的开源也体现了学术界与工业界合作的积极成果,有助于推动整个AI领域的发展和创新。
在生成式人工智能蓬勃发展的时代,数据被称为新的"石油"。数据的创造者和所有者往往无法从中获益。尽管Reddit对此表示不满,但Vana认为这是让用户收回对数据的控制权的重要一步。
2023年10月4日,谷歌宣布将从5月15日起向所有谷歌相册用户免费提供三款生成式AI图像编辑工具:MagicEditor、PhotoUnblur和MagicEraser。MagicEditor能够轻松实现一键PS、调色和光影效果,让用户更加便捷地编辑图片。这也意味着用户无需再局限于专业的图片编辑软件,通过谷歌的AI工具,即可轻松实现多样化的编辑需求。
Freditor是一种基于频域分解的NeRF编辑方法。它可以实现高保真的NeRF场景编辑,并且可迁移到其他场景。想要了解更多关于Freditor的信息,欢迎访问官方网站。
DesignEdit是一款突破性的图像编辑软件,它采用了设计领域中常见的图层概念,为用户带来了一种全新的空间感知图像编辑体验。通过将复杂的图像编辑任务分解为多层潜在的编辑操作,DesignEdit实现了对象移除、多对象编辑、镜头平移和缩放、排版编辑以及跨图像合成等一系列高级编辑功能。这不仅为创意设计提供了无限的可能性,也为图像合成和视觉特效制作带来了新的解决方案。
DesignEdit是一款集成了各种空间感知图像编辑功能的统一框架。它通过将空间感知图像编辑任务分解为多层潜在表征的分解和融合两个子任务来实现。立即访问DesignEdit官网,体验最先进的空间感知图像编辑工具!
近日,美版贴吧”Reddit在纽约证券交易所上市,首日收盘市值市值80亿美元,涨了近50%。Reddit成立于2005年,是一个专业度很高的用户论坛,目前拥有约4亿月活跃用户、10万个子版块,几乎覆盖了从娱乐、科技到个人财务等所有领域的讨论。根据谷歌去年年底的趋势报告,在其他社交媒体平台用户有所下降的情况下,Reddit在美国的搜索热度却连续五年稳步上升,从这来讲,奥特曼和腾讯的眼光确实精准。
RedditInc.的股价比首次公开募股价格飙升了48%,因为投资者接受了这家社交媒体公司从人工智能的增长中获利的愿景。受到投资者欢迎的同时,比特币价格下跌至两周低点,主要原因是美国专用交易基金需求减少,投资者开始对美联储快速降息的可能性表示怀疑。在这一轮涨跌中,投资者们对不同市场的反应和预期都呈现出多样性,市场的变化也让人们对数字货币、社交媒体和投资市场的未来充满了期待和疑虑。
随着人工智能和主要是生成式AI领域的进展,已经展示了大型语言模型生成文本以响应输入或提示的能力。这些模型能够像人类一样生成文本,回答问题,总结长篇文本段落等。GENAUDIT是一款优秀的工具,有助于改善具有强大文档基础的任务中的事实核查程序,并提高LLM生成的信息在重要应用中的可靠性。
由颜水成和程明明领衔的研究团队在Sora核心技术上进行了重要的升级,推出了MaskedDiffusionTransformerV2。该模型在ImageNetbenchmark上取得了惊人的成绩,FIDscore达到1.58,刷新了State-of-the-Art。这一工作符合Sora的期望,通过生成模型构建物理世界模拟器的理念,为未来的表征学习和生成学习研究提供了有力的启示。
开发顶级的文生图模型需要大量资源,因此资源有限的个人研究者基本都不可能承担得起,这也成为了AIGC社区创新的一大阻碍。同时随着时间的推移,AIGC社区又能获得持续更新的、更高质量的数据集和更先进的算法。
在Reddit上,一个帖子引起了广泛的关注。这个帖子展示了一种利用简陋的3D模型动画和Animatediff生成高度自定义的2D动画的方法。这种创新的处理方式,不仅提高了动画制作的效率,也为动画创作提供了更多的可能性。
HeyEditor是一款易于使用的AI视频编辑器和照片编辑器,用户可以上传视频或照片进行人脸交换,将视频或图像转换为动漫风格,并增强照片的分辨率和细节。定位于为用户提供简单强大的视觉编辑工具。点击前往HeyEditor官网体验入口需求人群:"用户可以通过HeyEditor进行视频和照片的创意编辑,快速实现人脸交换、动漫风格转换以及照片增强等操作。
随着Sora的爆火,人们看到了AI视频生成的巨大潜力,对这一领域的关注度也越来越高。除了视频生成,在现实生活中,如何对视频进行编辑同样是一个重要的问题,且应用场景更为广泛。如下表所示,UniEdit的表现大幅超过基线方法。
新加坡国立大学尤洋团队最近发布的开源项目OpenDiT,为训练和部署DiT模型提供了新思路。OpenDiT是一个易于使用、快速且内存高效的系统,专门用于提高DiT应用程序的训练和推理效率,包括文本到视频生成和文本到图像生成。易于使用:-通过几行更改实现巨大的性能提升-用户无需了解分布式训练的实现。
Reddit最近宣布与一家未透露的公司签署了一份价值6000万美元的合作协议,允许对Reddit用户内容进行访问以训练AI模型。揭晓这家神秘公司正是谷歌。Reddit与谷歌的合作将为AI发展和数据资源利用提供新的契机,也展现出社交媒体平台在AI时代的重要性。
OpenDiT是一个针对DiT训练和推断的高性能系统,它通过Colossal-AI提供支持,并以提高效率为目标。该系统通过优化内核、采用混合并行方法以及引入FastSeq等技术,能够显著提高GPU计算速度并降低内存占用,为DiT应用带来了巨大的性能提升。OpenDiT的出现为DiT应用的训练和推断提供了便利,其高效的实现方式和简单易用的接口使得用户可以更加专注于应用场景和算法的研究无需过多
Reddit宣布与谷歌达成合作,允许这家搜索引擎公司使用其用户生成的内容来训练其人工智能模型。这项合作被估价为每年6千万美元,有望为Reddit在上市前提供财务助益。这一合作引发了对人工智能公司如何使用和从用户生成内容中获利的担忧,同时也突显了这一趋势在数据许可交易领域的不断发展。
萨姆・奥尔特曼,OpenAI的首席执行官,可能是Reddit首次公开股票发行中最大的赢家之一。根据Reddit周四发布的IPO招股说明书,奥尔特曼是这家在线讨论网站的第三大股东,持有8.7%的股份。目前尚不清楚奥尔特曼的OpenAI是否与Reddit有类似的协议,尽管像《纽约时报》等出版商已经起诉OpenAI未经允许使用他们的数据。
在Reddi最新的IPO文件中,OpenAI首席执行官SamAltman成为RedditInc.的一位重要股东,持有Reddit8.7%的股份,包括789,456股A类股和11.4百万股B类股。Altman与Reddit有着长期的紧密联系,曾与Reddit的联合创始人SteveHuffman和AlexisOhanian一同参加了2005年YCombinator加速器的首届班级,并曾在前首席执行官YishanWong辞职后短暂担任公司的临时首席执行官。Altman作为Reddit的重要股东,将为公司的IPO带来更多关注,尤其是在人工智能和社交媒体领域的交汇点上,Reddit计划通过与人工智能公司合作进一步发展业务,这一战略将引发业界的密切关注。