11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
UIUC与BigCode组织的研究者们最近发布了StarCoder2-15B-Instruct代码大模型,这一创新成果在代码生成任务方面取得了显著突破。这款模型成功超越了CodeLlama-70B-Instruct,登上了代码生成性能榜单之巅。该模型的开源数据集和训练流程为未来该领域的研究和发展奠定了坚实的基础。
快科技1月31日消息,近日,人工智能产业发展联盟AIIA发布通告称,由中国信通院联合中国工商银行牵头《智能化软件工程技术和应用要求 第1部分:代码大模型》标准发布。作为业内首个代码大模型标准,该标准的核心参编单位共12家,分别为:中国工商银行、科大讯飞、华为、平安银行、阿里云、三六零、蚂蚁、天翼数字生活、交通银行、网易数帆、深圳集义。此外还有百度
仅需1块80G显卡,大模型理解小时级超长视频。智源研究院联合上海交通大学、中国人民大学、北京大学和北京邮电大学等多所高校带来最新成果超长视频理解大模型Video-XL。Video-XL的模型代码均已开源,以促进全球多模态视频理解研究社区的合作和技术共享。
【新智元导读】最近,大模型训练遭恶意攻击事件已经刷屏了。Anthropic也发布了一篇论文,探讨了前沿模型的巨大破坏力,他们发现:模型遇到危险任务时会隐藏真实能力会在代码库中巧妙地插入bug,躲过LLM和人类「检查官」的追踪!就在昨天,某大厂模型训练遭入侵的事件,惊动了整个AI圈。随着AI模型能力继续提升,这些评估和缓解措施还够用吗?Anthropic研究者也表示,希望其他AI研究者和开发者都能加入改进这些评估的行列。
大模型正式上岗,化身AI售前助手,已经开始拯救IT售前人了!在浪潮信息内部,一款名为“元小智”的AI助手,已经成为了员工们的得力助手。不仅能几秒钟读完上百页的招标文件,产品资料问答、信息比对、查询检索等工作也都得心应手。元脑企智EPAI,使大模型落地成为了可触可及的现实。
腾讯云表示,腾讯云AI代码助手已经正式上线,可以帮助开发者高效、优雅地进行软件开发。有三成的代码是由AI助手生成的。AI助手已经为进驻金融机构做好了准备,未来还将进入更多行业,帮助工程师们高效撸码。
让AI写代码正在越来越流行。今天蚂蚁集团智能研发平台CodeFuse推出了“图生代码”技术,这一技术集成在CodeFuse上,可将网页、App等设计图一键转化成前端代码。
aiXcoder-7B是一个拥有70亿参数的代码大模型,专为企业级软件开发设计。其性能超越340亿参数的Codellama模型,在真实开发场景下表现卓越。提升您的软件开发效率,优化代码质量,尽在aiXcoder-7B。
大语言模型集成至编程领域、完成代码生成与补全任务成为重要趋势。业界已经出现了一批引人瞩目的代码大模型,比如OpenAI的CodeX、谷歌DeepMind的AlphaCode、HuggingFace的StarCoder,帮助程序员更迅捷、更准确、更高质量地完成编码任务,大幅提升效率。aiXcoder也因其极具前瞻性的探索方向、踏踏实实的落地实践,不断受到资本市场的追捧,高瓴、清流、彬复等极具行业引领性的基金
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
在当今科技快速发展的时代,AI代码生成技术正逐渐成为软件开发领域的热门话题。尽管AI在解决编程问题方面表现出色,但在真实的企业开发环境中,其应用似乎还不够理想。随着代码大模型能力的日益增强,我们有理由相信,aiXcoder-7B将为程序员们带来更多的创新潜能,推动编程自动化的浪潮向前发展。
零代码1分钟,构建一个Agent应用。做一个“英语作文批改小帮手”应用,只需在AppBuilder中输入应用名称或者希望开发的功能,平台就能自动生成应用。谢广军认为,未来精调模型的需求增长会比较大,精调后仍然需要做推理,推理的需求同样也会有很大涨幅。
一款名为ChatwithMLX的大模型框架推出,专为Mac用户打造,让他们也能享受本地大模型的乐趣。这个框架仅需两行代码即可部署,支持与本地数据交互,并提供中文支持。对于Mac用户来说,这无疑是一次令人振奋的消息,也让他们更便捷地体验到大模型带来的便利和乐趣。
语言模型一直是自然语言处理技术的核心,考虑到模型背后的巨大商业价值,最大最先进的模型的技术细节都是不公开的。真·完全开源的大模型来了!来自艾伦人工智能研究所、华盛顿大学、耶鲁大学、纽约大学和卡内基梅隆大学的研究人员,联合发表了一项足以载入AI开源社区史册的工作——他们几乎将从零开始训练一个大模型过程中的一切数据和资料都开源了!论文:https://allenai.org/olmo/olmo-paper.pdf权重:https://huggingface.co/allenai/OLMo-7B代码:https://github.com/allenai/OLMo数据:https://huggingface.co/datasets/allenai/dolma评估:https://github.com/allenai/OLMo-Eval适配:https://github.com/allenai/open-instruct具体来说,艾伦人工智能研究所推出的这个开放大语言模型实验和训练平台,则提供了一个完全开源的大模型,以及所有和训练开发这个模型有关的数据和技术细节——训练和建模:它包括完整的模型权重、训练代码、训练日志、消融研究、训练指标和推理代码。她对机器学习的技术和认知科学的理论的融合应用充满了热情。
智源悟道3.0是由智源研究院开发的先进人工智能大模型系列,包括AquilaChat对话模型、AquilaCode文本代码生成大模型以及多种视觉大模型。产品功能涵盖流畅的文本对话、多语言生成任务、文本代码生成、多模态和视觉处理等领域。立即点击上方链接,体验智源悟道3.0的强大功能。
只要四行代码就能让大模型窗口长度暴增,最高可增加3倍!且是“即插即用”,理论上可以适配任意大模型,目前已在Mistral和Llama2上试验成功。有了这项技术,大模型就能摇身一变,成为LongLM。SE的原作者也说,目前SE方法的确还没有做过效率方面的优化,未来计划通过引入FlashAttention机制等策略来解决这一问题。
在代码生成领域,UIUC和清华合作发布了Magicoder,这一全新的大型语言模型仅使用了7B参数,却能与顶级模型媲美,并以全面开源的方式分享了其代码、权重和数据。Magicoder的关键在于采用了OSS-INSTRUCT方法,该方法通过从开源代码中获取灵感,生成多样、真实和可控的编码指令数据,强调了真实性对于指令调整的重要性。通过开源所有数据和代码细节,Magicoder的推出或许只是众多先进代码模型中的一个,展望未来,我们可以期待更多的创新和进步。
元象宣布开源高性能大模型XVERSE-65B-2底座版,专项提升其代码和数学能力,并保持了上一代强大的生成创作、角色扮演与工具使用等能力,为生态献上了一个“文理兼修、大有可为”的大模型。XVERSE-65B-2在上一代基础上通过综合优化器状态、学习率调节策略和采样比进行了ContinualPre-Training,训练token总量达3.2万亿;模型支持中、英、俄、法等40多种语言,上下文窗口为16K。元象共开源70亿、130亿、650亿参数的3款大模型,其中XVERSE-65B为国内最早开源、最大参数的免费商用模型。
大模型巅峰对决开启,Gemini和GPT-4展开大pk!代码和数学Gemini惨遭GPT-4碾压,但要论讲笑话和写作,它的答案却意外的好笑。被谷歌寄予厚望的复仇杀器Gemini,是否能够如愿单挑ChatGPT?最近几天,外媒记者和网友们纷纷放出实测,比较了GeminiPro加持的新Bard与GPT-3.5和GPT-4的各项性能。我们很期待看到,像GeminiUltra或者可能融合了OpenAI神秘的Q*技术的新模型,将如何在不久的将来应对这
商汤科技推出了基于大语言模型的智能编程助手——代码小浣熊Raccoon,并开放公测。代码小浣熊支持30主流编程语言和主流IDE,可以帮助开发者提升编程效率。代码小浣熊还将引入更多能力,进一步提升编程效率和开发者体验。
PyTorch团队让大模型推理速度加快了10倍。且只用了不到1000行的纯原生PyTorch代码!项目名为GPT-fast,加速效果观感是这样婶儿的:通畅,属实通畅!重点是,团队直接放出了代码以及详细“教程”。这些性能都接近或超越了当前SOTA。
快科技11月10日消息,今天,中国电信2023数字科技生态大会暨2023数字科技生态展在广州正式启幕,电信多个高管轮流上阵发布了多项产品、平台及技术更新。其中,中国电信人工智能科技总经理何忠江正式发布了星辰语义”千亿参数的大模型。据介绍,星辰语义大模型是中国电信自研大模型的升级,由此前的百万参数量级升至千亿,并且各项能力均有显著提升。何忠江表示,�
蚂蚁集团旗下CodeFuse代码大模型宣布开源了ModelCache大模型语义缓存,可以降低大型模型应用的推理成本,提升用户体验。ModelCache的架构包括adapter、embedding、similarity和data_manager模块。将进一步改进语义表示技术和相似度评估模块,以提高模型对复杂语义的理解能力和召回率。
DeepSeek是一个专注于探索AGI本质的团队,最近发布了开源的代码大模型DeepSeekCoder。DeepSeekCoder是一个智能代码助手,可以生成各种代码,包括贪吃蛇游戏、2048游戏、测试样例、修bug、SQL查询等。DeepSeek致力于探索AGI的本质,未来还将推出更多研究成果。
11月2日,巨人网络首批“游戏AI”成果在杭州云栖大会上亮相。巨人网络表示,巨人AI实验室已搭建起基于游戏核心生产要素的“游戏AI”增效平台,覆盖游戏开发、运营、发行等环节中,所涉及到的图像、视频、音频、代码、文本、模型、策略等领域,利用不同AI技术构建起工业化生产管线。在公司内部推出CodeBrain代码层的大模型,它结合了公司自有数据以及自研的编译器插件,为公司内部开发人员提供高效的代码生成助手,对这块的研发效率提升达30%-40%。
智谱AI在2023中国计算机大会上发布了第三代基座大模型ChatGLM3及相关系列产品。ChatGLM3经过深度优化,在中英文公开数据集测试中表现优秀,其中MML提升36、CEval提%、GSM8K提升179%、BBH提升126%。智谱AI一直致力于创新,目前已支持多种国产硬件生态,期待国产原生大模型与国产芯片能够在国际舞台上脱颖出。
人工智能已融入医疗健康、交通运输等多个社会领域,成为引领未来的战略性技术,以预训练大模型引领的人工智能创新浪潮也不断更迭。为应对训练成本急剧攀升的大模型训练,AI开发计算平台成为重要的解决方案。京东云正提供从硬件基础设施、到智算集群,再到MaaS服务,一站式的大模型服务能力,从更强算力、更大存力、更加易用和更低门槛等方向发力,推动大模型在产业里的落地应用。
大模型微调有“免费的午餐”了,只要一行代码就能让性能提升至少10%。在7B参数量的Llama2上甚至出现了性能翻倍的结果,Mistral也有四分之一的增长。只是强制模型生成更长的文本无法达到NEFT的效果。
北大等机构宣布开源CodeShell-7B代码基座大模型和CodeShell-Chat代码助手,加上便捷的IDE插件,为编程提供强大支持。CodeShell-7B采用5000亿Tokens的冷启动训练,在评估基准上表现卓越,超越了竞争对手。CodeShell的开源项目将有望改善编程体验,让代码编写更加高效和便捷。
【新智元导读】继CodeLlama开源之后,北大等机构正式开源了性能更强的代码基座大模型CodeShell-7B和代码助手CodeShell-Chat。团队还把方便易用的IDE插件也开源了!今天,北京大学软件工程国家工程研究中心知识计算实验室联合四川天府银行AI实验室,正式开源70亿参数的代码大模型CodeShell,成为同等规模最强代码基座。CodeShell-UCG评估基准既可以用于评估模型的编程能力,也可以用于