11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
4月24日,苹果开源了大语言模型OpenELM。这与微软刚开源的Phi-3Mini类似,是一款专门针对手机等移动设备的模型。这次苹果真的是很有诚意的开源,一开到底所有内容都贡献出来了,家大业大就是敢玩。
开源大模型还是闭源大模型,究竟谁才是“版本答案”?围绕这个问题,360创始人周鸿祎和百度创始人李彦宏最近就来了一次隔空论战。先是在4月12日,有媒体曝光了李彦宏在百度内部的讲话。大模型到底是开源好、还是闭源更佳,目前在技术层面暂时还没有分出高下,但闭源或开源对于不同公司的商业利益却各有优劣。
在近日的一次内部讲话中,百度董事长李彦宏给开源大模型泼了不少冷水。李彦宏认为,大模型开源的意义不大,闭源模型在成本和能力上会持续领先。其实你仔细听听李彦宏说的是有道理的,他是说在写古诗方面,百度超过了GPT4,”周鸿祎的这番言论也引发了现场轰笑。
澜舟科技宣布,将于2024年3月18日举办大模型技术与产品发布会,主题为“创新落地,生态共赢”。该发布会旨在展示孟子大模型及“一横N纵”全方位技术与产品体系,分享在金融等领域的技术创新和落地实践案例。澜舟的解决方案覆盖金融、营销、文化创意等多个行业领域,帮助企业智能化升级。
海淀区是全国人工智能发展高地,具有较好的产业基础和先发优势。为精准支持人工智能大模型的发展,近年来,海淀区陆续出台了《关于加快中关村科学城人工智能大模型创新发展的若干措施》《中关村科学城通用人工智能创新引领发展实施方案》等政策文件,结合区域资源禀赋,在强化底层技术攻关和算力、数据等关键要素供给等方面持续发力,从人才、孵化培育、资本、国际合作等多维度完善产业生态环境,加速推动通用人工智能产业健康有序发展。本次活动由中关村论坛办公室、北京市网信办、北京市发改委、北京市经信局、海淀区人民政府指导,中关村科学城管委会、CSDN中国开发者网络联合主办。
蚂蚁开源了两项与大模型相关的新技术:ATorch和Lookahead。ATorch是一个大模型分布式训练加速扩展库,可实现深度学习自动资源动态优化和分布式训练稳定性提升,可提升深度学习的智能性,千亿模型千卡级别训练的算力利用率可达60%。为了提高易用性,Lookahead的trie树构建不依赖额外的草稿模型,只利用推理过程中的prompt及生成的回答进行动态构建,降低了用户的接入成本。
AI公司OpenCSG近日在上海宣布推出“传神”开放创新生态社区,以支持大语言模型应用的开发和落地。该社区允许用户通过编排、测试、托管和分享,快速构建和发布专属的大模型应用。OpenCSG创始人陈冉表示,开源生态对大模型发展至关重要,公司将和合作伙伴共同完善大模型开源社区,真正实现大模型在各行各业的落地。
大数据+大算力+强算法=大模型”是当前人工智能发展的主要技术路径。语言大模型ChatGPT成为现象级应用,人工智能进入普及应用的新时期。为推动AI底层基础软硬件生态的共建共享和共同繁荣,智源研究院联合浪潮信息、昆仑芯科技、壁仞科技、天数智芯、燧原科技、摩尔线程等硬件企业,清华大学、北京大学、中科院计算所优势团队,共建“北京国家新一代人工智能创新发展试验区AI开放生态实验室”,共同开展基础软硬件适配、评测等工作,实现拉动基础软硬件对AI重大科研计算范式的优化,加速完善软硬件生态建设。