11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
如今大多数在两年多的技术开发之后,位于纽约的Dispel终于“浮出水面“了,它的目标在于保护用户的上网隐私及安全。
Reddit 周四宣布,该公司将以未公开的架构,收购机器学习(ML)实验平台 Spell...Spell 在官网上写道,其使命是为任何希望使用机器学习(ML)和人工智智能(AI)人们,打造强大、可靠、安全的最佳平台...在 Reddit 收购过程中,Spell 将停掉新商业客户的访问...完成收购后,Reddit 会坚持现有的目标 —— 确保该公司从事的任何 AI 工作都是透明且不涉及长期的偏见...
据Factorial基金估计,OpenAI的Sora每小时在NVIDIAH100上生成5分钟的视频,相当于每天能生成120分钟的视频。报告进一步指出,为支持TikTok和YouTube的创作者社区,大约需要89,000个NVIDIAH100GPU。ChatGPT的创造者将于下周在洛杉矶与好莱坞制片厂、媒体高管和人才代理商会面,以在娱乐行业建立伙伴关系,并鼓励电影制作人将其新的AI视频生成器整合到他们的工作中。
欢迎来到【今日AI】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
RedditInc.的股价比首次公开募股价格飙升了48%,因为投资者接受了这家社交媒体公司从人工智能的增长中获利的愿景。受到投资者欢迎的同时,比特币价格下跌至两周低点,主要原因是美国专用交易基金需求减少,投资者开始对美联储快速降息的可能性表示怀疑。在这一轮涨跌中,投资者们对不同市场的反应和预期都呈现出多样性,市场的变化也让人们对数字货币、社交媒体和投资市场的未来充满了期待和疑虑。
一款名为IPCompositionAdapter的新型适配器引起了广泛关注。该适配器专为StableDiffusion1.5模型设计,其独特之处在于能够在新生成的图像中同步构图忽略风格和内容。随着SDXL变种的研发进展,我们有理由相信,这款适配器将为用户带来更加丰富的创意体验。
CerebrasSystems发布了他们的第三代晶圆级AI加速芯片WSE-3”,规格参数更加疯狂在功耗、价格不变的前提下性能翻了一番。2019年的第一代WSE-1基于台积电16nm工艺,面积46225平方毫米,晶体管1.2万亿个,拥有40万个AI核心、18GBSRAM缓存,支持9PB/s内存带宽、100Pb/s互连带宽,功耗高达15千瓦。WSE-3的具体功耗、价格没公布,根据上代的情况看应该在200多万美元。
开发顶级的文生图模型需要大量资源,因此资源有限的个人研究者基本都不可能承担得起,这也成为了AIGC社区创新的一大阻碍。同时随着时间的推移,AIGC社区又能获得持续更新的、更高质量的数据集和更先进的算法。
ResAdapter是一个为扩散模型设计的分辨率适配器,它能够在保持风格域一致性的同时,生成任意分辨率和宽高比的图像。与处理静态分辨率图像的多分辨率生成方法不同,ResAdapter直接生成动态分辨率的图像,提高了推理效率并减少了额外的推理时间。如何使用ResAdapter想要了解更多关于ResAdapter的信息以及开始使用分辨率适配器的工具,请访问官方网站:ResAdapter官方网站。
字节发布了一款名为ResAdapter的新型工具,该工具可以解决StableDiffusion在生成超大图片以及非训练分辨率图片时出现的肢体异常和画面崩坏问题。ResAdapter还可以与现有的IPadapter以及Controlnet模型兼容。ResAdapter的推出,无疑为图像生成领域带来了新的可能性,期待它在未来的应用中能够带来更多的惊喜。
划重点:-🔥Nvidia计划推出功耗高达1000W的B100AI加速器,比之前的产品多出42%的功耗。-💧Dell高管表示,虽然GPU的功耗将持续增加,但直接液冷可能不再是必需的解决方案。Nvidia拒绝置评,这是可以理解的,因为其年度GTC大会仅几周后就要举行。
北大团队联合兔展启动了复现Sora的计划,该项目名为OpenSora。这一举措的背后是资源有限的情况下,团队希望汇集开源社区的力量,以尽可能完成复现工作。这个问题的答案还有待时间的揭晓。
根据各方信息和路线图,NVIDIA预计会在今年第二季度发布Blackwell架构的新一代GPU加速器B100”,官方称可轻松搞定1730亿参数大语言模型,是现在H200的两倍甚至更多。B100之后有更强大的升级版B200,一如现在H100、H200的关系。NVIDIAGTC2024图形技术大会将于3月18-21日举行,必然会披露新一代GPU加速器的情况,甚至有可能正式宣布。
MorphStudio是一个基于人工智能的文本到视频生成平台。它使用先进的算法,可以通过用户提供的文本提示,自动生成高质量的视频。希望您通过体验MorphStudio,发现更多创意和乐趣!
新加坡国立大学尤洋团队最近发布的开源项目OpenDiT,为训练和部署DiT模型提供了新思路。OpenDiT是一个易于使用、快速且内存高效的系统,专门用于提高DiT应用程序的训练和推理效率,包括文本到视频生成和文本到图像生成。易于使用:-通过几行更改实现巨大的性能提升-用户无需了解分布式训练的实现。
MorphStudio是一个新兴的AI电影制作平台,它与StabilityAI合作,为用户提供了一种全新的电影制作方式。这个平台利用自己的文本到视频模型,使用户能够通过输入文本提示来创建和编辑不同场景的镜头,并将它们组合成一个完整的故事。MorphStudio的出现为电影制作带来了新的可能性,通过AI技术,使电影制作变得更加简单和创新。
用于生成图像的大规模模型已经成为计算机视觉的基础图形,令人惊讶的是,很少有研究关注分层内容生成或透明图像生成。这种情况与巨大的市场需求形成鲜明对比。用户还表示,生成的透明图像在质量上可媲美真实的商业级透明素材,例如AdobeStock提供的素材,展现出技术的强大和实用性。
OpenDiT是一个针对DiT训练和推断的高性能系统,它通过Colossal-AI提供支持,并以提高效率为目标。该系统通过优化内核、采用混合并行方法以及引入FastSeq等技术,能够显著提高GPU计算速度并降低内存占用,为DiT应用带来了巨大的性能提升。OpenDiT的出现为DiT应用的训练和推断提供了便利,其高效的实现方式和简单易用的接口使得用户可以更加专注于应用场景和算法的研究无需过多
欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
新加坡国立大学尤洋教授团队联合其他机构开发的p-diff扩散模型在AI领域引起热议。这项模型能以44倍的速度生成神经网络参数,得到了深度学习领域的重要人物LeCun的点赞。其高效、准确且具有泛化能力的特点将为未来的AI应用提供更多可能性,同时也促进了AI领域知识的共享与交流。
萨姆・奥尔特曼,OpenAI的首席执行官,可能是Reddit首次公开股票发行中最大的赢家之一。根据Reddit周四发布的IPO招股说明书,奥尔特曼是这家在线讨论网站的第三大股东,持有8.7%的股份。目前尚不清楚奥尔特曼的OpenAI是否与Reddit有类似的协议,尽管像《纽约时报》等出版商已经起诉OpenAI未经允许使用他们的数据。
欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
在Reddi最新的IPO文件中,OpenAI首席执行官SamAltman成为RedditInc.的一位重要股东,持有Reddit8.7%的股份,包括789,456股A类股和11.4百万股B类股。Altman与Reddit有着长期的紧密联系,曾与Reddit的联合创始人SteveHuffman和AlexisOhanian一同参加了2005年YCombinator加速器的首届班级,并曾在前首席执行官YishanWong辞职后短暂担任公司的临时首席执行官。Altman作为Reddit的重要股东,将为公司的IPO带来更多关注,尤其是在人工智能和社交媒体领域的交汇点上,Reddit计划通过与人工智能公司合作进一步发展业务,这一战略将引发业界的密切关注。
Reddit在今天向美国证券交易委员会提交的IPO招股说明书中披露,该公司预计将从与人工智能供应商签订的数据许可协议中获得巨额收益。招股说明书显示,Reddit已于2024年1月签订了总价值2.03亿美元的数据许可协议,期限为两到三年。分析人士认为,Reddit的数据许可业务可能会成为其未来收入的重要来源。
HuggingFace推出了Cosmopediav0.1,这是最大的开放合成数据集,由Mixtral7b生成,包含超过3000万个样本,总共约250亿个标记tokens。数据集旨在通过映射来自网页数据集如RefinedWeb和RedPajama的信息来汇编全球知识,包括教科书、博客文章、故事和WikiHow文章等各种内容类型。其目标是通过量身定制提示风格和受众,最大程度地提高多样性,从显著减少重复内容。
Meta的研究人员在对抗合成语音的挑战中取得了一项重大突破。他们提出了一种名为AudioSeal的技术,该技术能够在人工智能生成的语音中嵌入隐形水印,用于主动检测AI生成的言论,同时还能够识别生成它的具体模型。随着威胁形势的变化,更好的解决方案仍需要不断发展,以识别操纵风险并在人工智能能力不断增强的背景下建立对语音界面的信任。
coze-discord-proxy是一个专为Discord机器人设计的插件,通过API接口调用由coze托管的Discord机器人,实现与chatGPT等AI进行对话。这强大的插件支持流式对话返回、对话文生成图和图生成文功能。了解更多详细信息,请访问coze-discord-proxy网站。
社交媒体巨头Meta计划于今年在其数据中心部署一款定制的第二代AI芯片,代码名为"Artemis"。新芯片将用于Meta的数据中心中的"推断",即运行AI模型的过程。"这一举措将为Meta带来更大的灵活性和自主性,同时也有望降低AI工作负载的成本。
欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
GRUPMEDIAPRO在ISE展会的框架内,宣布与微软合作,启动了一个人工智能和合成媒体实验室。这是两家公司为了为音像行业开发解决方案共享技术和商业知识的一个重要步骤。“有许多使用场景,可以让行业成员的任务变得更容易,让他们有更多的时间发挥创造力。