11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
OpenAI近期发布了ChatGPTEdu版本,这是一款专为大学教育环境打造的AI工具,旨在服务学生、教职员工、研究人员以及校园运营人员。值得一提的是,ChatGPTEdu的用户交互数据不会用于OpenAI其他模型的训练。OpenAI特别推出了ChatGPTEdu版本,旨在让更多学生受益于这一先进技术,缩短学习差距,并抓住教育领域的发展机遇。
OpenAI宣布推出ChatGPTEdu,ChatGPTEdu是为大学设计的版本,旨在负责地向学生、教职员工、研究人员和校园运营部署人工智能。搭载GPT-4o,ChatGPTEdu可以跨文本和视觉进行推理,使用先进工具如数据分析。ChatGPTEdu特点包括了:ChatGPTEdu旨在为希望向学生和校园社区更广泛部署人工智能的学校提供。
全球首位AI软件工程师Devin诞生了,它掌握全栈技能,云端部署、底层代码、改bug、训练和微调AI模型都不在话下。最可怕的是,它完全不怕996,老黄的预言是彻底成真了!就在刚刚,世界上第一位AI程序员Devin诞生。CEOWu并没有详细说明他们的智能体背后使用的AI技术,只是笼统地解释说,团队找到了将大语言模型与强化学习技术相结合的独特方法。
智源研究院提出了首个用于自然语言理解任务的1bit轻量化预训练模型BiPFT。与传统的FP32模型相比,BiPFT模型在推理阶段显著减少了操作数量和内存使用。该模型在不同超参数设定下都能取得更好的效果,具有较好的独立学习能力和超参数鲁棒性。
开源大模型社区HuggingFace公布了最新的开源大模型排行榜,通义千问在预训练模型类别中脱颖出,占据榜首位置。HuggingFace开源大模型排行榜涵盖了全球上百个顶尖的开源大模型,并从阅读理解、逻辑推理、数学计算、事实问答等六个维度进行了全面评估。阿里云开源通义千问720亿参数模型。
清华开源通用智能体XAgent,登上GitHub热榜,狂揽1400🌟各种任务都能做,让它使用python来分析给定的数据,分分钟搞定:数学题也难不倒它:编制最有影响力的心理学读书清单,并对每本书做简要总结这种操作就更不在话下:通过展示可以看到,XAgent在回答问题时会分条缕析,逐步给出回答,这是开发专门为其设计的双循环机制。这种设计下,XAgent的自主性非常高,处理复杂任务也“得心应手”,关键安全性也很高。结果XAgent全面取胜,不仅在传统的AI基准测试中表现出色还在处理复杂指令方面表现出卓越的适应性、效率和精度。
科技公司戴尔发布了一款名为“DellValidatedDesignforGenerativeAIwithNVIDIAforModelCustomization”的生成式人工智能工具,旨在帮助企业从数据中提取智能。这一工具的特点在于提供了预训练的模型,用户无需从头开始构建模型,即可快速提取数据中的智能信息。生成式AI模型的定制和微调可以帮助企业更好地利用其数据资源,实现更高效的工作流程和更准确的决策。
微软研究人员最近在一篇论文中提出了一个新的语言模型Phi-1.5,该模型的参数量仅有13亿。研究人员主要关注Phi-1.5在常识推理方面的表现,因为这是对语言模型能力的重要考验。本研究表明,相比单纯追求模型规模,如何获取高质量训练数据可能更为重要,这为未来语言模型研究提供了新的思路。
随着StableDiffusion模型的普及,各种基于该模型的创意应用也层出不穷。FaceChain开发团队推出了一款名为EasyPhoto的StableDiffusion插件,实现了快速智能写真生成的功能。注意:上传的照片最好是半身照,请勿戴眼镜。
人工智能科技公司HuggingFace推出了一项新服务TrainingCluster,用户仅需一键即可对模型进行训练,无需处理复杂的内部过程。这项创新服务将极大地减少用户在深度学习项目中进行模型训练所需的时间和精力。HuggingFace的这一举措有望进一步推动AI技术的普及和发展,降低AI技术应用的门槛。
Roboflow推理服务器是一个易于使用的、面向生产环境的推理服务器,支持多种流行的计算机视觉模型架构和微调后的模型部署。它可以在各种设备和环境上部署,无需机器学习的先验知识。它是一个部署和管理视觉AI模型非常方便的工具。
图库网站Shutterstock将与OpenAI的合作伙伴关系再延长六年,允许OpenAI在此期间使用Shutterstock庞大的图库来训练其模型。Shutterstock首次与OpenAI合作始于2021年,当时Shutterstock允许OpenAI使用其图像来训练文本生成图像模型DALL-E,这对模型的训练至关重要。尽管通过与DALL-E的整合使图库得以增长,但Shutterstock可能仍面临AI生成内容相关法律灰色地带的挑战。
当地时间5月5日,美国人工智能公司OpenAI的CEO阿尔特曼表示,已经有一段时间不再使用付费客户的数据来训练人工智能大语言模型。阿尔特曼表示:“用户希望我们不要使用他们的数据进行训练,因此我们已经改变了计划,并将来不再这样做。ChatGPT+Business计划在未来几个月内推出。
11月8日,阿里巴巴达摩院公布了多模态大模型M6”的最新进展,其参数已从万亿跃迁至10万亿,成为全球最大的AI预训练模型。作为通用性AI大模型,M6拥有多模态、多任务能力,尤其擅长设计、写作、问答,在电商、制造业、文学艺术、科学研究等领域有广泛应用前景。与传统AI相比,大模型拥有成百上千倍神经元”数量,认知和创造能力也更胜一筹,被普遍认为是未来的基础模型”。但是,大模型的算力成本相当高昂,比如训练1750亿参数语言?
阿里巴巴达摩院公布多模态大模型M6最新进展,其参数已从万亿跃迁至10万亿,规模远超谷歌、微软此前发布的万亿级模型,成为全球最大的AI预训练模型。
2018 年以来,以BERT、GPT等为代表的大规模预训练模型,带来了人工智能领域新的突破,由于其强大的通用性和卓越的迁移能力,掀起了预训练模型往大规模参数化发展的浪潮。其中微软、谷歌、Facebook、NVIDIA等诸多公司在预训练算法上持续大量投入。国内如百度、华为、阿里等公司也相继投入到大规模预训练模型算法的研究中。现阶段,在中文自然语言处理方向上,预训练也如雨后春笋一样涌现。现有算法主要依赖纯文本学习,缺少知识指导
苹果最新杀入开源大模型战场比其他公司更开放。推出7B模型,不仅效果与Llama38B相当一次性开源了全部训练过程和资源。就像他提供的这张图,以GPT-4omini为代表的小模型整体比右侧价格更低。
只需激活60%的参数,就能实现与全激活稠密模型相当的性能。微软亚洲研究院的一项新研究,实现了模型的完全稀疏激活,让推理成本大幅下降。在极大规模下,稀疏激活模型有可能达到与密集模型相当的性能,为设计和训练大规模稀疏激活模型提供了一个有用的参考。
随着大模型的火热持续迭代,AI基础设施愈发成为云厂商的核心竞争力之一。7月1日,腾讯宣布其自研星脉高性能计算网络全面升级,升级后的星脉网络2.0搭载全自研的网络设备与AI算力网卡,支持超10万卡大规模组网,网络通信效率比上一代提升60%,让大模型训练效率提升20%。大模型时代的来临,将开创下一代云服务,腾讯云致力于打造“最适合大模型的云”,也将持续升级底
OpenAI公布了一个基于GPT-4训练的模型CriticGPT,主要用于捕捉ChatGPT代码输出中的错误。通过这一模型,人类训练者可以利用GPT-4查找并改进GPT-4自身的不足,OpenAI的实验显示,在CriticGPT的辅助下,训练师发现错误的能力提升了60%。CriticGPT的发布也引发了热烈讨论,有网友用左脚踩右脚上天”来形容这一自我改进的过程。
AI发展科研机构Epochai在官网发布了一项,关于大模型消耗训练数据的研究报告。人类公开的高质量文本训练数据集大约有300万亿tokens。不要等着枯竭的那一天,望着荒漠干流泪。
谷歌发布了一项名为HyperDreamBooth的革命性模型训练方法,该方法在生成AI领域取得了显著的进步,尤其是在个性化模型训练方面。尽管这一技术具有突破性,谷歌并没有计划将其开源。谷歌的这一贡献为AI领域提供了新的可能性,同时也为未来的研究和应用设定了新的标准。
最近的一系列研究表明,纯解码器生成模型可以通过训练利用下一个token预测生成有用的表征,从成功地生成多种模态的新序列,从文本、蛋白质、音频到图像,甚至是状态序列。能够同时生成多种模态输出的多模态模型一般是通过某种形式的词汇扩展来实现的,即在预训练阶段或在后期微调阶段进行跨模态对齐。更多研究细节,可参考原论文。
OpenAI宣布,董事会成立了一个由董事BretTaylor、AdamD’Angelo、NicoleSeligman和SamAltman领导的安全和安全委员会。该委员会将负责就OpenAI项目和运营的关键安全和安全决策向全体董事提出建议。虽然我们自豪地构建和发布了在能力和安全性方面领先行业的模型,但我们欢迎在这一重要时刻展开广泛的辩论。
全球社交巨头Meta最近因使用用户照片训练AI模型Emu引发了一场隐私争议。Meta正在利用Instagram和Facebook上的用户照片进行训练,同时还会使用用户对图片的描述、标题等文本数据。在数据隐私和保护方面,企业应该加强合规措施,确保用户的个人信息得到妥善处理和保护。
索尼音乐集团发出警告,禁止未经许可的公司使用其音乐数据训练大型AI模型。这一警告涉及到700多家公司,索尼明确表示未经许可不得使用其音乐数据进行文本挖掘、网络爬取以及其他形式的数据搜集,包括录音、音乐作品、封面艺术作品和元数据等。索尼的警告表明了对知识产权的重视,以及对AI模型在音乐数据使用上的监管和控制。
【新智元导读】为训练AI模型,纽约州立大学的一名教授BrendenLake,竟让自己不到2岁女儿头戴相机收集数据!要知道,Meta训Llama3直接用了15万亿个token,如果Lake真能让AI模型学习人类幼崽,从有限的输入中学习,那LLM的全球数据荒岂不是解决了?绝了,为了训练AI模型,一位纽约州立大学的教授,竟然把类似GoPro的相机绑在了自己女儿头上!虽然听起来不可思议,但这位教授的行为,
VILA是英伟达发布的模型,使用大规模的交织图像文本数据进行预训练,为视频理解和多图像理解提供了新的能力,涵盖3.5B到40B多个大小的模型。最近发布的VILA-1.5版本具备视频理解功能,并提供了四种模型规模选择,为用户提供更多灵活性。通过Token压缩技术,VILA能够扩展视频帧数量,提高了模型的性能和应用范围。
柏林照片分享社区EyeEm在去年被西班牙公司Freepik收购后,正在采取一项引发争议的举措-将用户上传的照片用于训练人工智能模型。EyeEm最近通过电子邮件通知用户,它正在其条款和条件中添加一项新条款,授予其"训练、开发和改进软件、算法和机器学习模型"的权利。开放社交网络Pixelfed已明确表示,它永远不会使用用户图像来训练AI模型,并以此吸引EyeEm的用户。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、BlockadeLabs发布全新模型Model3本文介绍了知名生成式AI平台BlockadeLabs发布的全新模型Model3,该模型实现了生成效果的质的提升,支持超高清8192x4096分辨率,提升了文本提示器描述生