11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
HuggingFace推出了Cosmopediav0.1,这是最大的开放合成数据集,由Mixtral7b生成,包含超过3000万个样本,总共约250亿个标记tokens。数据集旨在通过映射来自网页数据集如RefinedWeb和RedPajama的信息来汇编全球知识,包括教科书、博客文章、故事和WikiHow文章等各种内容类型。其目标是通过量身定制提示风格和受众,最大程度地提高多样性,从显著减少重复内容。
深度学习领域的新技术近日在HuggingFace的大模型排行榜中崭露头角,由UpstageAI提出的深度扩展方法在SOLAR10.7B大模型上取得了令人瞩目的成绩。该技术通过创新性地拼接两个7B羊驼,并采用DUS方法删除中间层次,使得新模型不仅超越了传统扩展方法如MoE能与基础大模型相同的基础设施高效集成。这一实际应用的反馈证明了该技术在处理实际数据时的优越性。
HuggingFace的diffusers轻量快速推理引擎已经在GitHub上发布。这个引擎通过一系列小幅改进,已经实现了显著提高推理速度的目标,宣称每秒可达到60步,较之前的23步有了显著提升。stable-fast准备为深度学习从业者的推理优化带来革命性的速度和效率。
AI教育解决方案领导者Riiid宣布,其最新生成式AI模型在知名机器学习模型平台HuggingFace上获得第一名。HuggingFace开放式大语言模型排名中,Riiid10月提交的最新模型“Sheep-duck-llama-2”获得了74.07分的高分,在全球500多个开源生成式AI模型中位居榜首。Riiid研究人员将继续开发新的模型架构,提升AI模型性能,并以实际数据验证学习影响,在国际AI会议上发表论文。
始智AI团队打造的中立开放AI开源社区平台正式上线,旨在打造中国版“HuggingFace”。该社区汇聚了清华/智谱chatglm2-6B、StableDiffusionV1.5、alphafold2、seamlessm4tlarge等模型,以及shareGPT、ultrachat、moss-sft等数据集等资源。始智AI表示,wisemodel.cn平台目前已经完成了基础的社区功能,注册完成之后,在“用户中心-我的组织”模块创建组织,可以邀请成员加入到组织内,之后组织内成员都�
要点:鸭嘴兽-70B使用优化过的数据集Open-Platypus训练,删除相似和重复问题。应用LoRA和PEFT对模型进行微调,重点优化非注意力模块。如果社会各界能坚持开放创新、合作共赢的理念,我们离强人工智能的到来就不会太远了。
HuggingFace推出了面向企业的代码助手SafeCoder,旨在通过安全的自托管双人编程解决方案来提高软件开发效率。SafeCoder声称是一套全面以安全为导向的商业产品,在模型训练和推理全过程代码始终保持在VPC内。HuggingFace通过SafeCoder为企业带来安全可控的代码生成解决方案。
HuggingFace最近发布了一款新颖的小型RustML框架|——candle,运行速度极快,支持多种强大模型。它提供了对GPU的支持,并且具有优化的CPU后端,可以在浏览器中运行。5.轻量级部署:Candle的目标是实现无服务器推理,生成轻量级二进制文件,可快速部署和执行。
【新智元导读】打「排位赛」的大模型们背后秘密武器曝光!UC伯克利重磅开源神级LLM推理系统——vLLM,利用PagedAttention,比HuggingFace/Transformers快24倍,GPU数量减半。过去2个月,来自UC伯克利的研究人员给大语言模型们安排了一个擂台——ChatbotArena。团队的大部分成员同时也是LMSYS成员。