11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
进入2024,大模型的风向变了。当初“百模大战”时,只要简单粗暴拿个Demo搞MaaS,也就是让用户直接和大模型交互就足以上牌桌。简单告别后,他又一屁股坐回沙发上,一心沉醉到琢磨怎么改进Badcase的世界里了。
扎克伯格:「有了Llama3,全世界就能拥有最智能的AI。」ChatGPT拉开了大模型竞赛的序幕,Meta似乎要后来居上了。也许只有OpenAI的GPT-5才能压下开源模型了。
“过去这一年,我跟很多创业者、开发者交流,感觉大家都处在一种‘FOMO’状态,既兴奋、又害怕错过。”面对在生成式AI浪潮中正被彻底改变的开发者群体,4月16日对外演讲中,李彦宏率先谈起了他们所遭遇的选择迷茫问题。在文字、图片、语音、视频等多模态大模型的长期竞争中,留给李彦宏的新挑战之一便是,如何带领百度继续保持模型性能的领先优势。
在人工智能领域,尤其是在模型训练和推理阶段,显卡的性能至关重要。随着模型的规模越来越大,对算力的需求也会倍增。新用户还可以免费领取500元卡时计算资源。
据昆仑万维官微发文,天工大模型3.0将于4月17日正式发布,并同步开源4000亿参数MoE超级模型。这一模型采用了4千亿级参数MoE混合专家模型,是全球模型参数最大、性能最强的MoE模型之一。天工大模型3.0的发布和开源,无疑将推动人工智能领域的技术进步和应用创新,为产业界和学术界带来全新的机遇和挑战。
2023年4月17日,昆仑万维发布自研双千亿级大语言模型「天工1.0」正式奠定了国产大模型崛起之路。「天工3.0」也是全球首个多模态“超级模型”,其集成了AI搜索、AI写作、AI长文本阅读、AI对话、AI语音合成、AI图片生成、AI漫画创作、AI图片识别、AI音乐生成、AI代码写作、AI表格生成等多项能力,是大模型时代的“超级应用”。“超级模型”的概念诞生于“超级应用”。
在即将到来的2024年4月17日,也就是「天工」大模型一周年之际,昆仑万维宣布「天工3.0」正式开启公测!这一版本采用了4千亿级参数的MoE混合专家模型,并将选择开源,是全球模型参数最大、性能最强的MoE模型之一。「天工3.0」相较于上一代的「天工2.0」MoE大模型,在模型语义理解、逻辑推理、通用性、泛化性、不确定性知识、学习能力等方面都有惊人的性能提升。用户可以在4月17日下载新版的“天工AI助手”App,来体验超级模型的震撼AI功能。
腾讯控股今日公布了其截至12月31日的2023年第四季度及全年财报,各项数据呈现出不同的增长态势。在第四季度,腾讯控股的营收达到了1552亿元,同比增长了7%。值得一提的是,视频付费会员数量达到了1.17亿,音乐付费会员数量也达到了1.07亿,这两项数据均显示出腾讯在内容付费领域的持续领先地位。
3月20日,腾讯发布2023年第四季度及全年业绩报告,全年研发投入达到640.78亿元。自2018年以来,腾讯累计研发投入超过2696.54亿元。广告业务依托AI技术显著提升广告定向能力,Q4收入同比增长21%至297.94亿元,创季度新高。
马斯克的AI创企xAI正式宣布其大语言模型Grok-1已实现开源,并向公众开放下载。Grok-1是一款基于混合专家系统技术构建的大语言模型,拥有3140亿参数,远超OpenAIGPT-3.5的1750亿。xAI并没有放出Grok-1的具体测试成绩,它与其他公司的大模型之战将成为业内关注的焦点。
国内在过去的六个月内批准了超过40个人工智能模型供公众使用,旨在迎头赶上美国在AI领域的发展。中国监管机构共批准了14个大型语言模型供公众使用,其中包括小米公司、第四范式和零一万物等企业。百度的文心一言等ChatGPT类似的聊天机器人用户数量已于去年12月达到1亿。
1月21日,猎户星空在傅盛2024开年AI大课暨猎户星空大模型发布会上发布了猎户星空大模型。这是一款由猎户星空研发的预训练多语言大语言模型,拥有140亿参数规模,覆盖了常见语言和专业术语,并在多个第三方测试集上取得了同级别模型的最佳效果。猎户星空目前正在基于MoE架构训练混合专家模型,下一个里程碑是百亿参数的智能模型。
今天,摩尔线程发布了全新智算加速卡MTTS4000,训推兼顾专为大模型打造,单卡支持48GB显存。MTTS4000采用了第三代MUSA内核,单卡支持48GB显存和768GB/s的显存带宽,FP32性能为25TFLOPs、TF32性能为50TFLOPs、INT8性能为200TFLOPs。基于MTTS4000和双路8卡GPU服务器MCCXD800,该算力集群支持从单机多卡到多机多卡,从单卡到千卡集群的无缝扩展,未来还将推出更大规模的集群。
在当前技术发展的背景下,英特尔公司推出的ExtensionforTransformers工具包成为一个重要创新,实现了在CPU上对大型语言模型推理性能的显著加速。该工具包通过LLMRuntime技术,优化了内核,支持多种量化选择,提供更优的KV缓存访问和内存分配策略,使得首个token和下一个token的推理速度分别提升多达40倍和2.68倍。通过不断引入先进的技术和解决实际问题的能力,该工具包展现了英�
微软宣布在AzureAI云开发平台中新增40个大模型,包括WhisperV3、StableDiffusion、Phi、Falcon、SAM、CLIP、CodeLlama等,支持文本生成、图像处理、代码编写、语音识别等多种功能。三星确认GalaxyS24是AI手机三星确认其即将推出的GalaxyS24系列将聚焦于人工智能,申请了与AI相关的商标,预计在1月17日发布,并计划推出多项AI功能。论文地址:https://arxiv.org/abs/2311.13110芝加哥大学研究人员推出3D�
微软在官方宣布在AzureAI云开发平台中,新增了Falcon、Phi、Jais、CodeLlama、CLIP、WhisperV3、StableDiffusion等40个新模型,涵盖文本、图像、代码、语音等内容生成。开发人员只需要通过API或SDK就能快速将模型集成在应用程序中,同时支持数据微调、指令优化等量身定制功能。CodeLlamaCodeLlama是Meta开发的专注开发领域的模型,通过文本就能生成、审核、改写代码,拥有CodeLlama-34b-Python、CodeLlama-13b-Instruct等8个版本,是目前最强开源代码模型之一。
经历了2023年「百模大战」的洗礼,不管是国内还是海外,不管是开源还是闭源,各家大模型都从追赶和超越中获得了实质的进步。在语言、语音、视觉领域,大模型已经获得了强大的生成能力,不仅能在几秒钟之内生成非常合理的内容,甚至可以媲美拥有多年技能和知识储备的专家。曾经只会出现在科幻作品的情节,终将走进现实。
11月6日,李开复亲自领导的零一万物在官网正式开源了,两款预训练大模型Yi-34B和6B。在HuggingFace英文开源社区平台和C-Eval中文评测显示,Yi-34B取得了多项SOTA国际最佳性能指标认可,成为全球开源大模型“双料冠军”,也是迄今为止唯一成功登顶HuggingFace全球开源模型排行榜的国产模型。零一万物将致力于打造一个开放、共享、协作的大模型平台,与全球的研究者、开发者、创业者共同探索和创造AI2.0的未来。
由李开复博士亲自下场创办的零一万物,自3月底官宣成立后,于近日发布并开源了两个版本的中英文大模型Yi-6B和Yi-34B。在线上发布环节,李开复博士重点介绍了Yi系列大模型的三处性能亮点:全球最长200K上下文窗口,免费开源超强AlInfra实测训练,成本下降40%科学训模自研「规模化训练实验平台」Yi-34B目前在各个基准测试中,都获得了很好的表现,据零一万物提供的评测结果看来,Yi-34B和Yi-6B均在MMLU、BBH、C-Eval取得了不错的成绩。零一万物相信AI赋能推动人类社会前行,AI应本着以人为本的精神,为人类创造巨大的价值。
零一万物推出了「Yi」系列开源大模型,其中Yi-34B在全球开源大模型排行榜上取得了显著成就,击败了其他竞品模型,成为双料冠军,尤其在中文指标上表现卓越。Yi-34B的性能超越了全球其他大模型,拥有强大的语言理解和处理能力,可以满足国内市场的需求。Yi-34B的发布标志着中国在大模型领域的取得重大突破,为全球开源大模型社区带来了新的竞争力。
在RTX4090被限制的时代下,一种名为ReMax的全新算法为大型模型在基于人类反馈的强化学习任务中带来了高效性的解决方案。这篇文章介绍了ReMax算法,它的作者是李子牛、许天、张雨舜、俞扬、孙若愚和罗智泉。这一算法为大型模型的发展开辟了新的道路,有望在未来的研究和应用中发挥关键作用。
开源界最强的中英双语大模型,悟道·天鹰34B,来了!有多强?一言蔽之:不仅模型够大够能打还一口气送上整套“全家桶”级豪华周边。能有如此大手笔的,正是中国大模型开源派先锋——智源研究院。Aquila2模型全系开源地址:https://github.com/FlagAI-Open/Aquila2https://model.baai.ac.cn/https://huggingface.co/BAAIAquilaSQL开源仓库地址:https://github.com/FlagAI-Open/FlagAI/tree/master/examples/Aquila/Aquila-sqlFlagAttenti
智源研究院发布了最强开源中英双语大模型——悟道・天鹰340亿。这个新模型在推理、泛化等方面表现出色,在智能体、代码生成、文献检索等场景方面取得了一系列成绩。智源研究院还发布了FlagScale高效并行训练框架和FlagAttention高性能Attention算子集,进一步推动大模型研究的发展。
阿里云通义千问140亿参数模型Qwen-14B及其对话模型Qwen-14B-Chat正式开源,免费可商用。Qwen-14B在多个权威评测中超越同等规模模型,部分指标甚至接近Llama2-70B。过去两个月内,魔搭社区的模型下载量从4500万飙升到8500万,增幅接近100%。
凤凰网科技讯《AI前哨》北京时间9月22日,ChatGPT在中国引发了生成式人工智能热潮,几乎每天都有创业公司和科技巨头发布自家大语言模型。投资者警告称,随着成本和利润压力的增加,大模型行业的洗牌即将到来。凤凰网科技《AI前哨》对此将持续关注。
2022年,在英特尔大会的演讲前,英特尔CEO帕特-基辛格在后台做俯卧撑起跳;今年,他直接在主题演讲的舞台上做了起来。9月19日,在圣何塞的会展中心,这位要把英特尔带回巅峰的CEO显得活力十足。但英特尔更想外界知道的是,到了2024年,它就不会满足于仅仅是“在那里”了,它的反击已经真正开始。
国产大模型明星选手孟子GPT上新!400亿参数通用大模型正式发布,已开启邀测。孟子GPT-40B版本全面领先7B版本,大约提升10-15个百分点。这是澜舟科技收获的第2轮融资,2轮累计总额数亿元。
澜舟科技旗下国产百亿大模型孟子GPT-40B正式发布,参数数量达到400亿,各项任务平均提升10-15%。孟子GPT-40B在中文及多语言能力、写作、多轮对话等方面都有提升,接近ChatGPT-3.5的水平。澜舟科技是由AI大牛周明创办的认知智能公司,已拿下数亿元融资,并在轻量化大模型、垂直领域大模型方面进行了多项探索。
北京市经济和信息化局党组书记、局长姜广智最近在接受媒体采访时宣布,北京将以场景为引领,以应用为导向,进一步开放典型场景,推动大规模模型产业化应用。为了促进人工智能与经济社会发展的深度融合,该局将每个季度都推出一批大模型应用成果,形成典型案例。首期的算力券预计将资助不低于4000万元的模型伙伴企业。
第135届广交会正在火热进行支付宝小程序云助力合作伙伴田螺云厨,在烹饪机器人上开始用上大模型技术。各类智能产品的亮相,从中国制造迈向中国创造,也成为广交会的一个亮点。CookGPT不仅是菜谱的提供者,更能与用户一同成为“创新者”,让每个用户都能创造出专人专属的膳食解决方案与个性化菜谱创作,体验烹饪乐趣。