11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
6月7日凌晨,OpenAI在官网开源了GPT-4的稀疏自动编码器。虽然现在大模型的功能越来越强,能生成文本、图片、视频、音频等内容,但是你无法控制神经网络生成的内容,例如,你问ChatGPT多个相同的问题,可能每一次回答的内容都不相同。如果想通过SAE完整捕捉大模型的行为,大概需要10亿或数万亿个特征才可以。
12月15日,OpenAI在官网公布了最新研究论文和开源项目——如何用小模型监督大模型,实现更好的新型对齐方法。大模型的主流对齐方法是RLHF。研究人员在NLP等测试任务中进行了实验,结果显示,使用GPT-2作为监督来微调GPT-4模型,并在上述增强功能的帮助下,性能差距仅有20%左右,达到了GPT-3和GPT-3.5之间的能力。
在11月7日OpenAI的首届开发者大会上,除了推出一系列重磅产品之外开源了两款产品,全新解码器ConsistencyDecoder和最新语音识别模型Whisperv3。ConsistencyDecoder可以替代StableDiffusionVAE解码器。该模型支持进行零样本图像编辑,可实现图像去噪、插值、上色、超分辨率生成、笔触生成等多种任务无需专门训练。
在很长一段时间内,OpenAI都是互联网开源精神的践行者,GPT人工智能模型也在很长一段时间内保持开源,最多也不过是在推出一段时间后,再进行开源。但从ChatGPT采用的GPT-3.5开始,这一情况发生了改变,无论是GPT-3.5还是最新的GPT-4,OpenAI都表示不会进行开源。从官方回应来看,对于AI滥用可能导致的风险与严重后果,或许是OpenAI选择不进行模型开源的主要原因之一。
北京时间9月13日午夜,OpenAI发布了推理性能强大的ο1系列模型。各路研究者一直在尝试挖掘ο1卓越性能背后的技术并尝试复现它。下面展示了另一个示例:0.9和0.11哪个更大?详细的安装过程和代码请参阅原项目。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、OpenAI推出全新的模型系列OpenAIo1OpenAI推出了全新的模型系列OpenAIo1,这个新模型在推理能力上表现得更加出色,为解决复杂问题提供了更强的推理能力。结果显示了AI在处理复杂数�
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、全球最快AI推理架构CerebrasInference速度提升20倍!CerebrasSystems推出的CerebrasInference将彻底改变AI推理,提供极低成本下20倍速度,为AI计算树立新标杆。报告强调企业需清晰展示生成式A
OpenAI向美国加州参议员ScottWiener写了一封反对SB1047法案的信。SB1047是美国加州在今年2月7日拟定的一项针对开源大模型的法案,其中有非常多不合理的条款,例如,如果有人微调了Meta最新发布的Llama-3.1模型,去开发一些恶意、非法的生成式AI产品,那么Meta就会受到很重的处罚。开源大模型倒下了受益最大的便是闭源模型,但他们依然站出来反对这个法案,可见SB-1047的很多条例是有多么的不合理。
阿里巴巴在Qwen-Audio基础之上,开源了最新语音模型Qwen2-Audio。Qwen2-Audio一共有基础和指令微调两个版本,支持使用语音向音频模型进行提问并识别内容以及语音分析。在SER和VSC测试中,Qwen2-Audio同样以显著成绩胜出。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、智谱AI宣布开源「清影」同源视频生成模型——CogVideoX智谱AI宣布开源了CogVideoX视频生成模型,旨在推动视频生成技术的发展和应用。零一万物持续推出新工具,如RAG和FunctionCall,提供更易用、更深入、更安全稳定的解决方案。
生成式AI初创公司aiOla在官网开源了最新语音模型Whisper-Medusa,推理效率比OpenAI开源的Whisper快50%。aiOla在Whisper的架构之上进行了修改采用了“多头注意力”机制的并行计算方法,允许模型在每个推理步骤中预测多个token,同时不会损失性能和识别准确率。aiOla表示,未来会将Whisper-Medusa的多注意力机制扩展至20个头,其推理效率将再次获得大幅度提升。
【新智元导读】小模型时代来了?OpenAI带着GPT-4omini首次入局小模型战场,MistralAI、HuggingFace本周接连发布了小模型。苹果也发布了70亿参数小模型DCLM,性能碾压Mistral-7B。毕竟通往终极AGI/ASI,参数规模的扩大和智能的增长成正比。
在本周的谷歌I/O204开发者大会上,谷歌发布了Gemini1.5Flash、文生图工具Imagen3以及视频生成模型Veo等一系列创新产品。这场技术盛宴并未得到360集团创始人周鸿祎的完全认可。通过用户数据的反馈,产品改进的飞轮才能真正推动起来。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、干翻所有语音助手!制造复杂性增加,2024年内存供应将持续紧张。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、OpenAI预告将直播ChatGPT升级内容OpenAI将在5月13日在线直播展示ChatGPT的一系列升级特性,其中不包括GPT-5和AI搜索引擎。Autodesk计划推出一系列适用于不同行业的生成式AI模型。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、清华团队发布视频大模型Vidu可生成16秒、1080P视频清华大学与生数科技在中关村论坛未来人工智能先锋论坛上发布了中国首个长时长、高一致性、高动态性视频大模型Vidu,标志�
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
欢迎来到【今日AI】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/📰🤖📢AI新鲜事马斯克开源Grok-1:3140亿参数迄今最大,权重架构全开放【AiBase提要:】🚀马斯克旗下xAI公司开源了3140亿参数的混合专家模型「Grok-1」及权重和网络架构。⭐OpenRouter�
不久前OpenAISora以其惊人的视频生成效果迅速走红,在一众文生视频模型中突出重围,成为全球瞩目的焦点。继2周前推出成本直降46%的Sora训练推理复现流程后,Colossal-AI团队全面开源全球首个类Sora架构视频生成模型「Open-Sora1.0」,涵盖了整个训练流程,包括数据处理、所有训练细节和模型权重,携手全球AI热爱者共同推进视频创作的新纪元。欢迎持续关注Open-Sora开源项目:https://github.com/hpcaitech/Open-Sora作者团队表示,他们将会继续维护和优化Open-Sora项目,预计将使用更多的视频训练数据,以生成更高质量、更长时长的视频内容,并支持多分辨率特性,切实推进AI技术在电影、游戏、广告等领域的落地。
欢迎来到【今日AI】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
【新智元导读】刚刚,OpenAI超级对齐团队负责人官宣开源Transformer调试器。研究人员不用写代码,就能快速探索LLM的内部构造了!AGI真的越来越近了!为了确保人类不被AI杀死,在解密神经网络/Transfomer黑箱这一方面,OpenAI从未停下脚步。研究人员使用了了几个附加指标的组合:不过研究人员也表示,希望从Transformer上训练的稀疏自动编码器中,为字典学习解决方案确定更好的指标。
就在Sora疯狂刷屏那天有两款重磅产品发布:一个是谷歌的Gemini1.5,首个支持100万tokens上下文的大模型;另外一个便是全球科技、社交巨头Meta的V-JEPA。在功能方面V-JEPA与Sora有很多相似之处,例如,都具备让AI学会如何通过自我监督学习认识、模拟世界,以提升生成视频的质量、表示学习方法和扩大视频训练数据范围。但Meta表示,下一步,将会把V-JEPA与音频相结合使用,并且可以充
欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
在自然语言处理领域不断发展的背景下,理解和处理广泛的文本内容至关重要。最近的一些进展显著提升了语言模型的能力,特别是通过文本嵌入的发展。它打破了在长文本嵌入领域的准入壁垒,承诺一个未来,其中对话的深度与人类讨论的广度相匹配。
欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
OpenAI给广大用户发放福利,在下场修复GPT-4变懒的问题后顺道上新了5个新模型,其中就包括更小且高效的text-embedding-3-small嵌入模型。嵌入是表示自然语言或代码等内容中概念的数字序列。要获得访问权限,用户需要先创建NomicAtlas帐户并按照contrastors存储库中的说明进行操作。
这几天引发了AI社区大讨论的逼近GPT-4性能的泄漏模型「miqu」,的确是Mistral公司训练的一个旧模型的量化版。冲上各大榜单的这个开源模型引发开发者热议,开源AI或已进入关键时刻。靠着GPT-4Turbo和GPT-4V,OpenAI已经竭尽全力保持优势,但开源AI社区的迅速追赶,已经不容忽视了。
NomicAI最新发布的开源嵌入模型NomicEmbed正式亮相,以卓越的性能超越了OpenAI的Ada-002和text-embedding-3-small模型。这一消息是由THEDECODER的在线记者MatthiasBastian于2024年2月1日发布的。NomicAI的这一突破性开源项目是对人工智能领域的一项重要贡献。
正值圣诞节热闹气氛的OpenAI写下了2024年的发展清单。OpenAI联合创始人兼首席执行官SamAltman在社交平台公布,AGI、GPT-5、更好的语音模型、更高的费率限制;更好的GPTs;更好的推理能力;对唤醒/行为程度的控制;视频模型;个性化;更好的浏览;开源,将是OpenAI在2024年要实现的目标。OpenAI迫于开源界的巨大压力,2024年所指的开源,很可能就是ChatGPT使用的GPT系列大语言模型。
OpenAI数百名员工集体威胁辞职,指责董事会解职Altman处理不当,要求董事会辞职,或将跟随Altman加入微软。Runway正式发布运动画笔和Gen-2风格预设Runway近日发布了一系列新功能和更新,其中包括运动画笔、Gen-2风格预设、更新的相机控制以及图像模型的改进。模型在13个基准测试上表现出色,无需配对数据训练,且通过预先对齐视觉输入,提高了对视频问答任务的性能。