11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
【新智元导读】LLM训练速度还可以再飙升20倍!英伟达团队祭出全新架构归一化Transformer,上下文越长,训练速度越快能维持原有精度。AI的未来,或许就此改写......最近,英伟达团队抛出的一枚重磅炸弹,提出了全新神经网络架构——归一化Transformer,基于超球面进行表示学习。下图6展示了,注意力模块和MLP模块的特征学习率,应用于MLP中间状态的缩放因子,应用于QK点积之前�
NVIDIA的最新研究可能彻底改变AI的未来,其研究团队提出了一种名为归一化Transformer的新型神经网络架构。这一架构在超球面上进行表示学习,能够显著提升大型语言模型的训练速度,最高可达20倍,同时保持了模型的精度。这种方法不仅提高了训练速度增强了模型的稳定性。
香港大学与百度联合发布了首个智慧城市大模型UrbanGPT,该模型在时空预测技术领域引发了重大突破。时空预测技术的重要性日益凸显,不仅关注交通和人流的流动涵盖了犯罪趋势等多个维度。该模型的泛化能力也为智慧城市的发展提供了有力支持。
MotionGPT是一个基于HuggingFaceSpaces打造的开源机器学习应用社区。用户可以发现许多由社区成员开发的酷炫机器学习项目和应用。要获取更多详细信息并加入这个机器学习应用社区,请访问MotionGPT官方网站。
MotionGPT是一款令人惊叹的技术创新,它统一了语言和运动,将语言指令转换为引人入胜的3D人体运动。这一模型的设计灵感源于即时学习,通过混合运动语言数据进行预训练,并通过基于提示的问答任务进行微调,使其具备卓越的性能。MotionGPT不仅是一种技术的突破,更是对人机交互的重大推动,将语言与运动巧妙地融合,开创了全新的应用前景。
澳大利亚悉尼科技大学科学家开发出一种便携式、非侵入性的人工智能读心”头戴设备BrainGPT,可将思想转化成文本。BrainGPT把脑电波信号分割成不同的单元,从中捕获特定的特征和模式。研究人员表示,这套系统将来有望把准确率做到接近90%,这将是与传统语言翻译,或语音识别程序相当的水平。
PyTorch团队让大模型推理速度加快了10倍。且只用了不到1000行的纯原生PyTorch代码!项目名为GPT-fast,加速效果观感是这样婶儿的:通畅,属实通畅!重点是,团队直接放出了代码以及详细“教程”。这些性能都接近或超越了当前SOTA。
TRON与Web3人工智能基础设施服务商ChainGPT正式达成合作。通过本次合作,双方将进一步推动人工智能和区块链技术的融合,在实现优势互补的同时,真正惠及日常生活。ChainGPT的首席执行官IlanRakhmanov也将以评委身份参与区块链领域知名的TRON黑客松大赛第五季。
一篇介绍开源人工智能模型FinGPT的论文引起了广泛关注。该模型是专门为金融领域开发的,旨在为金融研究和开发提供易于使用的工具,包括自动化数据管理和类似机器人顾问和算法交易等应用的潜力。RLHF技术支持:FinGPT采用强化学习从人类反馈中学习个性化偏好,为用户提供个性化的投资建议和智能投资工具。
用友BIP重磅升级,发布用友BIP3最新版,在领先技术、应用架构、创新服务及生态规模上,持续迭代,进化发展。新发布的业界首个企业服务大模型YonGPT。YonGPT覆盖企业财务、人力和业务,契合了企业基于数智技术实现业务与业务、业务与财务、业务与管理融合创新的时代需求,能够为企业带来智能化的业务运营、自然化的人机交互、智慧化的知识生成、语义化的应用生成。