11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
在众多开源的大型语言模型中,如LLaMA、Falcon和Mistral等,大多数仅公开了特定组件,如最终模型权重或推理脚本。技术文档通常集中在更广泛的设计方面和基本指标上,限制了该领域的进展,因为训练方法的清晰度不足,导致团队不断努力揭示训练过程的众多方面。如果您喜欢他们的工作,不要忘记加入MLSubReddit、Facebook社群、Discord频道和电子邮件通讯,以获取最新的AI研究新闻和有趣的AI项目。
开源模型在人工智能领域展现强大活力,但闭源策略限制了LLM的发展。邢波团队提出的LLM360全面开源倡议旨在解决这一问题。这一全面开源的趋势有望促进更多研究者的参与与合作,推动人工智能技术的不断创新。
【新智元导读】Anthropic发布最新研究,发现Claude3Opus的说服力与人类大致相当,该成果在评估语言模型说服力方面迈出了重要的一步。人工智能模型在对话说服力方面表现如何?对这一问题大家可能都心存疑惑。Anthropic也表示,他们已经采取了一系列措施来降低Claude被用于破坏性事件的风险。
医疗人工智能技术正在迅速发展,旨在利用大型语言模型的巨大潜力彻底改变医疗保健交付方式。这些技术进步承诺提高诊断准确性,个性化治疗方案,并解锁全面医学知识的获取,从根本上改变患者护理。该倡议弥补了全球医疗沟通中的重要差距,并为未来的多语言医疗AI创新奠定了基础。
穆罕默德・本・扎耶德人工智能大学VILALab带来了一项关于如何更好地为不同规模的大模型书写提示词的研究,让大模型性能在不需要任何额外训练的前提下轻松提升50%以上。该工作在X、Reddit和LinkedIn等平台上都引起了广泛的讨论和关注。更多提示词原则使用方法和说明,欢迎阅读原文。
【新智元导读】大模型幻觉问题还有另一种解法?斯坦福联手OpenAI研究人员提出「元提示」新方法,能够让大模型成为全能「指挥家」,汇聚不同专家模型精华,让GPT-4的输出更精准。当你让大模型写一首「莎士比亚十四行诗」,并以严格的韵律「ABABCDCDEFEFGG」执行。在加入微软研究院之前,他曾在乔治亚理工学院和丰田工业大学芝加哥分校担任计算机科学助理教授。
用AMD的软硬件系统也能训练GPT-3.5级别的大模型了。位于美国橡树岭国家实验室的全世界最大的超算Frontier,集合了37888个MI250XGPU和9472个Epyc7A53CPU。整个系统拥有602112个CPU核心,4.6PBDDR4内存。
2023年的LLM开源社区都发生了什么?来自HuggingFace的研究员带你回顾并重新认识开源LLM2023年的大语言模型,让几乎所有人都燃起了热情。现在大多数人都知道LLM是什么,以及可以做什么。常用的方法包括bitsandbytes、GPTQ和AWQ。
深度求索发布了一个67B的大模型,名为DeepSeekLLM67B。这个模型完全开源,可以通过访问chat.deepseek.com来使用。在开放域推理的测试中,DeepSeekLLM67B展现出了较好的表现。
李开复是一位著名的计算机科学家,他以西方畅销书《AISuperpowers》和在中国对人工智能独角兽的投注闻名。他最近创办了一家名为01.AI的新公司,旨在满足中国市场对大型语言模型的需求。李开复的01.AI计划有望在未来获得成功,为中国市场带来创新和解决方案。
加拿大多伦多的人工智能初创公司Cohere已经发布了EmbedV3,这是其嵌入模型的最新版本,旨在为语义搜索和大型语言模型应用提供支持。嵌入模型将数据转换为数字表示,通常称为“嵌入”,由于大型语言模型的崛起以及它们在企业应用中的潜在用途,嵌入模型备受关注。Cohere的EmbedV3提供了一种强大的工具,用于帮助企业构建LLM应用,提高性能并降低运营成本,为语义搜索和大
Cohere的最新嵌入模型EmbedV3旨在帮助企业构建大型语言模型应用程序,具有出色的数据压缩功能。该模型与OpenAI的Ada竞争,承诺卓越性能。EmbedV3的高性能和多功能性使其成为企业构建LLM应用程序的有力工具。
还在用指令微调解决多模态大模型的“幻觉”问题吗?比如下图中模型将橙色柯基错认为“红狗”指出周围还有几条。中科大的一项研究想到了一个全新办法:一个免重训、即插即用的通用架构,直接从模型给出的错误文本下手,“倒推”出可能出现“幻觉”之处,然后与图片确定事实,最终直接完成修正。如下图所示,上传图片并输入请求,就可以得到修正前以及修正后的模型
【新智元导读】最近,来自澳国立、牛津和智源的研究人员提出了一个由LLM驱动,用文字提示就能生成复杂3D场景的智能体框架。无所不能的大模型真的要开始创造3D世界了吗?继火爆全网的AI文生图,文生视频之后,文生3D场景的技术也来了!只要不到30个字的提示词,瞬间就能生成这样的3D场景。这些结果表明,研究人员的方法可以有效地使用单一函数以及推断相应的参数。
微软提出的CodePlan让码农的生产力又提高了!对于大模型来说,擅长的是本地化编码任务。但如果任务跨越了多个相互依赖的文件,LLM却无法解决。它成功应对了许多挑战,为高效可靠的软件工程实践开辟了新的可能性。
日本的人工智能初创公司ELYZA宣布发布了一款基于Meta的「Llama2」的日本语言模型,该模型被命名为「ELYZA-japanese-Llama-2-7b」,拥有70亿参数。此举使得该模型能够与开放AI领域的巨头GPT3.5相媲美。虽然目前在参数数量上仍不及一些国际级模型,但这一进展为日本语自然语言处理和生成领域带来了更多可能性,未来可望进一步提高日本语LLM的性能。
总部位于伦敦的初创公司Context宣布已从谷歌风险投资等投资方筹集了350万美元的资金。Context是一家通过详细分析帮助企业构建更好LLM支持应用的公司。Context希望利用资金提升产品质量,为客户带来更深刻的洞察。
【新智元导读】参数高效的微调方法SUR-adapter,可以增强text-to-image扩散模型理解关键词的能力。扩散模型已经成为了主流的文本到图像生成模型,可以基于文本提示的引导,生成高质量且内容丰富的图像。HCP实验室简介中山大学人机物智能融合实验室由林倞教授于2010年创办,近年来在多模态内容理解、因果及认知推理、具身智能等方面取得丰富学术成果,数次获得国内外科技�
ChatGPT能力解禁是加入插件功能后,性能得到了强化。所有大模型皆是如此。BMTools工具包也已集成最近爆火的Auto-GPT与BabyAGI。
有了3D-语言模型,去重庆导航也不在「话」下!大型语言模型和视觉语言模型在各种评测基准中都展现出了强大的性能,比如可以看图说话、进行常识推理。但这些模型的训练过程并没有引入3D物理世界,也就无法理解更丰富的现实概念,包括空间关系、布局、物体反馈等。还可以发现,以单视角图像或多视角图像作为输入,二维VLM的性能会比三维VLM下降很多,也就是说多视角�
研究人员推出了一款名为3D-LLM的新方法,可以将对3D环境的理解融入到大型语言模型中。这意味着聊天机器人将能够理解和处理3D空间的概念,从更好地在三维世界中导航和操作。这意味着未来可能会有更智能的机器人和具体人工智能应用程序。
【新智元导读】90年代显卡芯片的红海市场中,为什么是英伟达脱颖出?3D、矿卡、移动构架、人工智能,老黄带着英伟达,踏准了一个个风口,笑到了最后。仅仅在一天内,英伟达的市值就暴涨了超2000亿美元,震惊了美股市场。战略性的撤退、牺牲、决定放弃什么是成功的核心,非常关键的核心。
红杉资本已对企业应用开发商MeLLmo投资了3000万美元。MeLLmo创立已有3年时间,该公司为企业用户开发iPhone和iPad应用,帮助企业分析并演示公司数据。
7月22日,在极客公园旗下科技创业者社区FounderPark举办的AGIPlayground2023大会上,首次发布了2023「中国最具价值AGI创新机构TOP50」。即时设计以AIGC产品「即时AI」入选AGIMVPTOP50。“持续的改进,胜过延迟的完美”,在使用即迭代的AIGC产品逻辑下,即时设计通过对产品的持续改进,让即时AI也展现出了行业领先的创新力与潜力。
峰米在在CES 2023上首次展示了激光投影新品峰米S5 Rolling,采用ALPD激光显示技术。从官方的图片可看出,峰米S5 Rolling投影仪外观采用全新的框架形态,以一个圆角矩形的框架和云台结构与投影仪主体相连接,使得投影可以实现360的纵向旋转。官方尚未公布这两款新品的详细信息和发布时间。
360 提醒用户加强防护,并建议使用 360 终端安全产品提供的安全补丁,防御查杀该病毒...360 安全大脑监测历史显示,Mallox(又被称作Target Company)于 2021 年 10 月进入中国,早期主要通过SQLGlobeImposter渠道进行传播(通过获取到数据库口令后,远程下发勒索病毒...在发现病毒后, 360 终端安全产品快速进行了响应,通过上新安全补丁帮助政企客户保护财产安全......
以“拥抱变化”为主题的2021第十九届上海国际汽车工业展览会于4月19日隆重举行。其中,在华为展台上展示的华为生态第一款儿童座椅——360智能通风儿童座椅T705吸引了很多人的关注。与此同时,它还在华为vmall商城以众测的方式上架,仅需1360元。
8月31日,360手机vizza发布,售价为极其亲民的899元。9月6日,将于京东王牌首发,目前正在京东预约。与市面上其他同价位产品相比,360手机vizza的最大亮点是硬件性能优异,在同价位产品中首次搭载了1080P全高屏及4GB大运存,同时实用黑科技爆棚,性价比超高。外观设计上,360手机vizza延续了360手机鲜明的简洁风格,全金属机身背面采用了磨砂处理,质感十足,同时对边框弧线进行了紧凑化处理,正面配备了5.5英寸1080P全高清屏,整体外
《合金装备崛起复仇》Xbox360版 金手指 Dualla TU4 V3.0 (含RGH和DEV)内容Dualla TU4 V3.0 (含RGH和DEV) 作者说是14项修改 比2.0少了3个 但具体没写 自行测试吧 1、解压金手指文件到任意目录 2、运行大小为100K的文件 会自动加载金手指到内存 3、此时运行游
《合金装备崛起复仇》Xbox360版 金手指 Dualla V2.0(含RGH和DEV)内容Dualla V2.0 (含RGH和DEV) OneHitKill (LB LB LB LB) Freeze Fight Timer (Y Y Y Y) Unlimited BattlePoints (RB RB RB RB) Max Zandatsu Kills (X X X X) Unlimited Blade Mode