11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
近几个月来,大型语言模型在人工智能社区中引起了极大的关注和流行。这些模型在文本摘要、问答、代码完成、内容生成等任务中展示出了强大的能力。考虑到低质量网络数据的丰富性和经典LLM训练方法的资源密集性,这种方法提供了一种可能的前进方式。
《纽约时报》在美国时间12月27日对微软和OpenAI提起诉讼,理由是这两家公司利用其文章训练ChatGPT等人工智能聊天机器人,侵犯了其版权。媒体与可能对新闻业造成颠覆性影响的人工智能技术之间的关系正日益紧张。OpenAI发言人周三表示:“我们希望能找到一种互利的合作方式,就像我们与许多其他出版商所做的那样。
ElevenLabs的语音生成式AI平台发布了“语音转语音”功能,用户可上传语音并自动转换为不同音色,实现声音的自由切换,为用户带来全新的语音生成体验。免费体验地址:https://elevenlabs.io/voice-changerWhatsApp的人工智能助手向部分iOS用户开放Meta旗下的WhatsApp在最新的iOS测试版中引入了人工智能助手,用户可通过快捷方式在聊天中进行自然对话,获取实时信息和自动建议。Windmill:快速
微软研究和清华大学的研究人员共同提出了一种名为“Skeleton-of-Thought”的全新人工智能方法,旨在解决大型语言模型生成速度较慢的问题。尽管像GPT-4和LLaMA等LLMs在技术领域产生了深远影响,但其处理速度的不足一直是一个制约因素,特别是在对延迟敏感的应用中,如聊天机器人、协同驾驶和工业控制器。通过引导LLMs构建答案的骨架,然后进行并行扩展,SoT有效地提高了响应�
低精度训练是大模型训练中扩展模型大小,节约训练成本的最关键技术之一。在这种背景下,尤其是当我们关注扩展至OpenAI提出的超级智能模型规模时,低精度训练是其中最有效且最关键的技术之一,其优势包括内存占用小、训练速度快,通信开销低。可预见,FP8低精度训练将成为未来大模型研发的新基建。
上海人工智能实验室发布了一款面向大模型训练的开源工具箱XTuner,通过支持多种硬件适配,大幅降低了企业进行大模型训练的门槛,尤其是对中小企业具有重要意义。XTuner为各类开源模型提供了多样的微调框架XTuner支持与多款开源大模型的无缝衔接,可执行增量预训练、指令微调等任务类型。业内人士表示,这将推动我国在人工智能核心领域的技术进步。
在今日的百度云智大会上,百度集团执行副总裁、百度智能云事业群总裁沈抖发表了主题为“智能生产力,穿越大周期”的演讲。百度智能云千帆大模型平台自上线以来,已有超过10000家客户在使用该平台,应用场景也超过了400个。平台还提供了模型安全、内容安全和数据安全保障能力,保护模型资产安全并控制输入和输出的安全风险。
斯坦福大学的研究人员开发了一种名为Sophia的新型优化器,可将语言模型的预训练时间缩短一半。相比于Adam优化器,Sophia可以更快地解决语言模型的问题。研究人员在研究过程中广泛使用了理论推理,并在明天发布的代码中使用了稍微修改过的学习率的定义。
5月21日,2023祥符创新论坛转化医学产业高峰论坛在浙江嘉善举办。上海人工智能研究院、祥符实验室、转化医学国家科学中心联合重磅发布全国首个DNA存储领域预训练大模型“ChatDNA”。会上还围绕精准医学及生命科学前沿热点问题,诊断技术、基因测序、DNA存储、医学人工智能、生物材料及药物研发等前沿领域的最新进展,共同探讨当前转化医学产业的发展现状,分析热点和难点,分享实践经验和创新思路,推动医学产业的健康发展。
天翼云科技有限公司在2023云生态大会上表示,天翼云正在自主研发预训练大模型,目前已经进入内部测试阶段,将在近期适当的时候发布。天翼云科技有限公司,是中国电信子公司。天翼云是中国电信旗下云计算品牌,2016年,天翼云发布天翼云3.0。