站长之家(ChinaZ.com)7月20日 消息:AI创业公司潞晨科技宣布,旗下Colossal-AI 首个开源了650亿参数 LLaMA 低成本预训练方案。
据介绍,相比业界其他主流选择,该预训练方案可提升预训练速度38%,仅需32张 A100/A800即可使用,并且不限制商业使用。
开源地址:https://github.com/hpcaitech/ColossalAI
(举报)
站长之家(ChinaZ.com)7月20日 消息:AI创业公司潞晨科技宣布,旗下Colossal-AI 首个开源了650亿参数 LLaMA 低成本预训练方案。
据介绍,相比业界其他主流选择,该预训练方案可提升预训练速度38%,仅需32张 A100/A800即可使用,并且不限制商业使用。
开源地址:https://github.com/hpcaitech/ColossalAI
(举报)
11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
360公司自主研发的7B参数大模型——360智脑,现已正式上线开源社区,并提供了基础模型以及4K、32K、360K三种不同文本长度的版本。这一大模型在支持文本长度方面表现出色,最长可处理360K长文本,相当于约50万字的输入内容。在中英文360K大海捞针效果测试中,也取得了超过98%的高分。
据昆仑万维官微发文,天工大模型3.0将于4月17日正式发布,并同步开源4000亿参数MoE超级模型。这一模型采用了4千亿级参数MoE混合专家模型,是全球模型参数最大、性能最强的MoE模型之一。天工大模型3.0的发布和开源,无疑将推动人工智能领域的技术进步和应用创新,为产业界和学术界带来全新的机遇和挑战。
4月23日晚,微软在官网开源了小参数的大语言模型——Phi-3-mini。Phi-3-mini是微软Phi家族的第4代,有预训练和指令微调多种模型,参数只有38亿训练数据却高达3.3Ttokens,比很多数百亿参数的模型训练数据都要多,这也是其性能超强的主要原因之一。Phi-3-medium的性能可媲美Mixtral8x7B和GPT-3.5,资源消耗却更少。
在即将到来的2024年4月17日,也就是「天工」大模型一周年之际,昆仑万维宣布「天工3.0」正式开启公测!这一版本采用了4千亿级参数的MoE混合专家模型,并将选择开源,是全球模型参数最大、性能最强的MoE模型之一。「天工3.0」相较于上一代的「天工2.0」MoE大模型,在模型语义理解、逻辑推理、通用性、泛化性、不确定性知识、学习能力等方面都有惊人的性能提升。用户可以在4月17日下载新版的“天工AI助手”App,来体验超级模型的震撼AI功能。
快科技4月3日消息,NVIDIA GTX 16系列GPU已经全部停产,最后一根独苗独苗GTX 1650也将在本月内完成库存清理,成为历史,GTX也就此消失。据业内人士,GTX 16全系列目前只剩下了GTX 1650尚有库存,其他的都已经卖完。如果AIC品牌厂商不刻意控制节奏,GTX 1650预计在4月中旬就能全部清空库存,哪怕是厂商收紧出货,也能在4月底完成库存清理。未来一段时间,GTX 1650还会在渠道市场内存�
商汤科技与金山办公达成商业合作,共同打造办公新质生产力平台WPS365。全新升级的WPS365已接入商汤“日日新”大模型,提升办公场景应用的理科能力。商汤大模型和WPS365的深度融合使得办公任务自动化、提供智能操作建议,提高了办公效率和体验。
4月24日,苹果开源了大语言模型OpenELM。这与微软刚开源的Phi-3Mini类似,是一款专门针对手机等移动设备的模型。这次苹果真的是很有诚意的开源,一开到底所有内容都贡献出来了,家大业大就是敢玩。
aiXcoder-7B是一个拥有70亿参数的代码大模型,专为企业级软件开发设计。其性能超越340亿参数的Codellama模型,在真实开发场景下表现卓越。提升您的软件开发效率,优化代码质量,尽在aiXcoder-7B。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
AutoGPT的出现让我们见识到了AI代理强大的自动化能力,并开创了一个全新的AI代理赛道。但在子任务调度、资源分配以及AI之间协作还有不少的难题。AIOS会引入更复杂的内存共享机制和层级缓存策略,以进一步优化AI代理的整体性能。
Chat With Llama 3 是一个开源的聊天机器人,由Meta AI开发。它能够进行多种智能对话,包括解释复杂概念、创作诗歌、编写代码、解决逻辑谜题,甚至帮助用户给宠物起名。这个聊天机器人的主要优点在于它的多功能性和开源性,使其可以被广泛地应用于各种场景,并且可以根据需要进行定制和改进。
AI图片生成与搜索是一个在线平台,利用先进的人工智能技术,允许用户快速生成或搜索各种风格的AI图片。该技术的重要性在于它能够极大提高设计和创意工作的效率,同时降低成本。产品的主要优点包括丰富的图片资源、高效的生成速度、以及用户友好的界面。产品背景信息显示,这是一个面向广大创意工作者和设计师的工具,旨在帮助他们快速实现创意构想。目前,该产品提供免费试用,但具体价格和定位信息未在页面中提供。
OpenPerplex是一个提供广泛知识资源的在线平台,它通过整合多种信息源,为用户提供了一个便捷的知识获取渠道。该产品以其丰富的信息量、高效的检索能力和友好的用户界面而受到用户的青睐。它不仅适用于个人学习,也适合专业人士进行深入研究。
JavaVision是一个基于Java开发的全能视觉智能识别项目,它不仅实现了PaddleOCR-V4、YoloV8物体识别、人脸识别、以图搜图等核心功能,还可以轻松扩展到其他领域,如语音识别、动物识别、安防检查等。项目特点包括使用SpringBoot框架、多功能性、高性能、可靠稳定、易于集成和灵活可拓展。JavaVision旨在为Java开发者提供一个全面的视觉智能识别解决方案,让他们能够以熟悉且喜爱的编程语言构建出先进、可靠且易于集成的AI应用。
AI-Powered Background Removal(AI驱动的背景移除)是一款基于AI技术的在线工具,它能够快速且高效地从用户上传的图片中移除背景。该工具的主要优点在于其隐私保护和本地执行能力,即图片处理在用户设备上完成,无需上传至互联网,保证了数据的安全性和处理速度。此外,作为一款开源且完全免费的工具,它极大地释放了用户的创造力,无需担心成本问题。
SearchForJohn是一个在线搜索工具,旨在帮助用户快速找到所需的信息。它以简洁的界面和高效的搜索算法为特点,为用户提供了一个便捷的信息检索平台。该产品的主要优点包括快速响应、准确的搜索结果和用户友好的界面设计。SearchForJohn的背景信息显示,它是由一群对搜索技术充满热情的开发者创建的,旨在解决用户在信息过载时代中寻找特定信息的难题。目前,该产品提供免费试用,但具体价格和定位信息未在页面上明确展示。
OpenBioLLM-8B是由Saama AI Labs开发的先进开源语言模型,专为生物医学领域设计。该模型在大量高质量的生物医学数据上进行了微调,能够理解并生成具有领域特定准确性和流畅性的文字。它在生物医学基准测试中的表现超越了其他类似规模的开源生物医学语言模型,并与更大的专有和开源模型如GPT-3.5和Meditron-70B相比也展现出更好的结果。
小悟空是一个集成了多种智能工具的网站,旨在提高个人和团队的创作效率和运营效果。它通过提供诸如文章生成、视频脚本创作、笔记创作等多样化功能,满足不同用户在内容创作、个人表达、学习教育等方面的需求。产品背景基于人工智能技术,结合大数据分析,为用户提供个性化、高质量的服务。价格定位为免费试用,部分功能付费,以适应不同用户的需求。
Jasper Chat是一个先进的人工智能聊天工具,它通过数十亿的文章、论坛、视频文字稿和网络内容的学习,能够就复杂主题进行详细对话。它的设计易于使用,能够记住对话内容,快速生成有用、适用且独特的内容,并且支持30多种语言。Jasper Chat不仅功能强大,而且使用起来充满乐趣,可以用于写作诗歌、讲笑话、制作剧本或生成日常星座运势等。
YouTube Transcript Generator可以下载任何YouTube视频的转录文本,并提供复制、下载、搜索和转换等功能。通过AI将YouTube转录文本转换为文章或博客帖子。
Undress AI Tool是一款强大的深度脱衣应用程序,可以修改图像,使人们看起来像是没有穿衣服。它使用先进的技术准确地修改照片,生成DeepNude和AI成人图像。该工具的主要优点是可以快速准确地创建深度脱衣图像。
TinderProfile.ai是一个使用AI技术分析用户自拍和照片,生成一组高质量、专业外观的图片,以确保在约会档案上留下良好的第一印象,增加用户获得更多匹配的机会。
OpenBioLLM-70B是由Saama AI Labs开发的先进开源语言模型,专为生物医学领域设计。该模型在大量高质量的生物医学数据上进行了微调,能够理解和生成具有领域特定准确性和流畅性的文字。它在生物医学基准测试中展示了超越其他类似规模开源生物医学语言模型的优越性能,并且在与更大的专有和开源模型如GPT-4、Gemini、Medtron-70B、Med-PaLM-1和Med-PaLM-2的比较中也展现了更好的结果。
FunGifts.AI是一个提供个性化AI生成的记忆游戏的平台。用户可以上传照片,通过AI生成独特的艺术作品,并打印成为一款记忆卡片游戏。这款游戏拥有30张卡片,印有训练人物的AI艺术作品。FunGifts.AI提供快速的打印和寄送服务,为用户打造一款独一无二的记忆游戏。
Lawdeck是一款利用人工智能技术的在线法律平台,旨在自动化律师事务所的80%例行工作。它可以通过分析输入的详细信息,为用户提供最佳的法律策略,并生成完整的文件供用户编辑和共享。
ChatALL是一款桌面客户端软件,它允许用户同时与多个大型语言模型(LLMs)基础的AI聊天机器人进行对话,帮助用户发现最佳的对话结果。这款软件的主要优点在于其能够并发发送提示给不同的AI机器人,从而快速比较它们在不同任务上的表现,并找到最适合的机器人。产品背景信息显示,ChatALL适合于希望从LLMs中找到最佳答案或创作的专家、研究人员以及LLM应用的开发者。目前,ChatALL是免费提供给用户的。
TTS Generator AI是一款创新的免费在线文本转语音工具,利用先进的AI技术将书面文本转换为高质量、自然流畅的音频。该工具适用于各种用户,包括需要听觉学习材料的学生、想要听长篇文件的研究人员以及希望使其书面内容更易访问的专业人士。TTS工具的一大亮点是它能够支持各种文本格式,从简单的文本文件到复杂的PDF文件,使其非常灵活。
Neopaths是一款游戏化的个人成长平台,通过智能任务管理和微学习等功能,帮助用户开发潜力。该平台采用科学方法,提供个人成长和教育支持。Neopaths可以帮助用户提高注意力、支持长期记忆,并通过引入游戏元素和机制,使非游戏化内容更加有趣。Neopaths提供免费、有趣和简单的个人成长方法。
Illusion Diffusion是一款免费创新的AI工具,通过Stable Diffusion和Controlnet AI模型,将普通照片转化为艺术品,提供文本提示来生成视觉错觉和超现实图像。
Datascale是一个AI SQL知识库,帮助数据团队跟踪所有用于数据分析的查询。它将保存的查询转化为知识,从分散的分析中提取表格洞见和可视化关系。