首页 > 业界 > 关键词  > 大模型最新资讯  > 正文

AI视野:Meta开源史上代码工具Code Llama;Midjourney不行的事Ideogram做到了;最长开源大模型“长颈鹿”来了

2023-08-25 15:28 · 稿源:站长之家

杀疯了!Meta开源史上最强代码工具CodeLlama

Meta宣布推出CodeLlama,这是一款用于辅助编写计算机代码的AI模型,旨在与微软的代码编写工具GitHubCopilot进行竞争。CodeLlama可以根据文本提示来生成代码,支持代码补全和调试。

image.png

该模型基于Meta的Llama2语言模型构建,将以社区许可证方式免费开源,可用于研究和商业用途。CodeLlama在代码生成方面的测试表现优于当前其他公开的基于LLM的模型。

项目地址:https://github.com/facebookresearch/codellama

要点:

  • CodeLlama是Meta推出的辅助编写代码的AI模型,与GitHubCopilot竞争

  • CodeLlama可根据文本提示生成代码,支持补全和调试,基于Llama2构建

  • CodeLlama以社区许可证开源,可免费用于研究和商业用途,测试表现强于其他基于LLM的代码生成模型

Midjourney危!Ideogram可以生成逼真的文字了

人工智能创业公司Ideogram推出新一代文本到图像生成系统,可靠地渲染出清晰易读的文字元素,具有强大的排版生成能力。

小编亲测:效果还是不错的,除了用来做单独的字体效果外,还可以用来做举牌图片。效果如下:

image.png

体验地址:https://ideogram.ai/

要点:

  • Ideogram由前GoogleBrain研究员创立,获得了a16z和IndexVentures领投的1650万美元种子投资。

  • Ideogram系统通过文本提示可生成包含清晰文本的图像,文字元素栩栩如生、格式规范。

  • Ideogram凭借排版创新在竞争激烈的AI生成图像领域确立了独特定位。

更适合中国宝宝体质的语言模型?阿里云开源通义千问视觉语言模型Qwen-VL

阿里云旗下魔搭社区宣布开源视觉语言模型Qwen-VL,该模型以通义千问70亿参数模型Qwen-7B为基座语言模型,支持图文输入,具备多模态信息理解能力。

image.png

模型链接:https://modelscope.cn/models/qwen/Qwen-VL-Chat

要点:

  • Qwen-VL新增了视觉定位、图像中文字理解等功能,可以接受图像和多语言文本作为输入。

  • Qwen-VL开源了通用模型Qwen-VL和对话模型Qwen-VL-Chat两个模型。

  • Qwen-VL-Chat可以用于快速搭建具备多模态能力的对话应用,推理速度快且资源消耗低。

爱奇艺引入AIGC 搜索剧情关键词可一键直达“名场面”

爱奇艺在2023年第二季度财报中披露已引入AIGC辅助内容运营,通过剧本评估、剧情理解、搜索推荐等应用提升内容生产与用户体验,例如用户搜索热播剧《长风渡》剧情关键词,可以直接定位至对应剧情片段。

image.png

要点:

  • 爱奇艺引入AIGC辅助剧本评估,提升效率超过90%。

  • AIGC实现剧情理解,改进搜索结果和用户体验。

  • 爱奇艺成立AIGC内容科技创新中心,站内素材超过70万条。

服装设计师狂喜!支持一键改面料/款式的设计软件来了

AI智绘是一款面向服装行业的AI设计工具,提供AI改款、AI生款、图案生成等功能,可以极速实现改款设计、线稿生款、批量生款以及图案生成,已服务超过127万设计师,助力设计师进行快速高效的原创设计。

image.png

体验地址:https://www.pop-fashion.com/aidraw

核心功能:

  • 极速AI改款:基于巨量款式库,支持一键改面料、花型、细节,5秒内完成改款。

  • 线稿生款:文本转线稿再生成款式,实现设计全流程一站式操作。

  • 高效AI制款:一键批量生款,提供无限创意灵感。

  • 图案花型生成:支持文本生成功能,秒速呈现花型设计。

  • AI工具箱:褪底、放大等图片处理功能。

32k上下文可商用!最长开源大模型“长颈鹿”来了!

长颈鹿是Abacus.AI团队基于LLaMA模型系列打造的新作,被称为“开源大模型史上第一个上下文长度达到32k的版本”,通过改进注意力机制实现32k的上下文外推。

image.png

论文地址:https://arxiv.org/abs/2308.10882

项目地址:https://huggingface.co/abacusai/Giraffe-v2-13b-32k

要点:

  • 长颈鹿是基于LLaMA模型打造的,上下文长度达到32k,是目前开源大模型中最长的。

  • 研发团队Abacus.AI通过测试不同的上下文外推方法,发现线性插值效果最好,并在此基础上提出了PowerScaling和TruncatedBasis两种新思路。

  • 尽管Abacus.AI宣称长颈鹿是首个32k开源模型,但Together.AI更早发布了类似规模的版本,两者可以说并列第一

性能时延仅3.7秒!大模型BLOOMZ让推理变得更容易

Anthropic公司开源大模型BLOOMZ,参数量达1760亿,在HabanaGaudi®2芯片上推理时延仅3.7秒,实现接近实时的性能。

image.png

论文地址:https://arxiv.org/abs/2211.05100

要点:

  • BLOOMZ是拥有1760亿参数的大规模语言模型,在HabanaGaudi®2硬件上进行推理时延仅3.7秒。

  • HabanaGaudi®2具有强大的计算能力和内存容量,可支持大模型的训练和推理。

  • 利用DeepSpeed的模型并行技术,可以在多台Gaudi®2设备上分布一个极大规模的模型进行推理。

小爱大模型继续开放内测 第二批名额下周开放

小米语音助手小爱同学将在下周继续开放大模型内测名额,报名审核通过的用户将收到小米社区站内消息推送,让更多米粉用户体验升级后的小爱同学。

image.png

第二批(8月21号起陆续审核)

XiaomiMIXFold2

XiaomiMIX4

Xiaomi11系列(含11/11Pro/11Ultra)

XiaomiCivi系列(含Civi/Civi1S/Civi2/Civi3)

RedmiK40系列(含K40/K40S/K40Pro/K40Pro+/K40游戏增强版)

RedmiNote12系列(含12TPro/12Pro/12Pro+/12Pro极速版/12turbo/125G)

RedmiNote11系列

(含115G/11E/11SE/11Pro/11Pro+/11EPro/11TPro/11TPro+/11Pro5G/11Pro+5G)

奇安信发布奇安信大模型Q-GPT 可降低数据安全风险

奇安信集团发布了Q-GPT安全机器人和大模型卫士,通过安全风险发现、访问控制、数据泄露管控等手段,为企业使用大模型提供四重防护,全面降低数据安全风险。

要点:

  • 建立技术监管手段,防止员工向大模型投喂敏感数据,防止数据泄露。

  • 对大模型应用状况进行分析,调整资源配置,辅助企业业务流程重构。

  • 完美适配主流大模型应用,实现对大模型的精准管控,降低数据安全风险。

举报

  • 相关推荐
  • 机器人“全能导航大脑”来了!银河通用发布NavFoM大模型

    银河通用发布全球首个跨本体全域环视导航基座大模型NavFoM,实现机器人从“学会完成导航任务”到“真正理解移动”的跨越。该模型支持全场景、多任务、跨本体应用,通过统一“视频流+文本指令→动作轨迹”范式,融合800万条跨任务导航数据,在真实机器人上实现零样本自主避障、路径规划等复杂任务。其技术突破将推动具身智能从单一功能进化为基础设施,为规模化商业落地奠定关键基础。

  • 何小鹏首次披露物理AI巨大进展 发布第二代VLA大模型

    小鹏汽车在2025科技日发布第二代VLA大模型,颠覆传统“视觉-语言-动作”架构,实现端到端直接输出动作指令,开创物理模型新范式。该模型具备动作生成与物理世界理解能力,参数规模达数十亿级,训练数据近1亿clips。基于2250TOPS算力的Ultra车型成功搭载,推动智驾技术显著进化,同步发布“小径NGP”功能,复杂小路接管里程提升13倍。行业首发的无导航辅助驾驶Super+LCC实现全球覆盖。何小鹏表示,大模型将成为物理AI世界的操作系统,并宣布与大众汽车达成战略合作,共同推进智能出行发展。

  • 如何检查你的网站是否被大模型引用?AI排名查询工具推荐

    本文探讨AI搜索时代网站流量获取新逻辑:传统SEO因Google搜索"零点击"现象失效,而71%用户通过AI工具研究购买决策。文章指出被大语言模型引用成为新流量入口,并推荐使用AIBase等GEO工具监测网站在豆包、DeepSeek等国内主流AI平台的曝光情况。提出三步操作法和三个优化建议:建立监控基线、定期检查变化、聚焦高转化场景。强调在AI搜索时代,内容被LLM引用已成为新的流量生命线。

  • 来教装展,看全栈自主可控国产教育大模型何以赋能教学?

    10月24-26日,第86届中国教育装备展在青岛举行。科大讯飞以“全栈自主可控国产教育大模型”为核心,展示五大智慧教育场景:智慧教学通过AI黑板实现师生协同,提升效率;科学教育推出AI虚拟科学家互动平台,激发探索精神;身心健康方案构建体育健康闭环与心理服务体系;教育治理推出数据驱动决策平台;学前教育引入游戏化学习产品。目前方案已覆盖全国5万余所学校,服务超1.3亿师生,展现AI从工具升级为“教育伴侣”的价值。

  • 免费 GEO品牌可见度查询——让大模型信得过就这么玩

    本文探讨在AI时代如何成为大模型信赖的信息源。关键点包括:可信信息源需具备数据来源清晰、内容结构化、可验证追踪等能力;提出五大实操要点——确保数据干净可追溯、采用RAG等技术增强可检索性、保持内容更新与时效性、强化品牌可见度、建立反馈优化机制。同时推荐使用AIBase平台的GEO排名查询工具免费监测内容可见度,通过持续优化提升在大模型入口的推荐概率。

  • 【AI 智惠季】全模态大模型齐发优惠,GPU新客包月2.8折起

    阿里云启动双十一“AI智慧季”大型优惠活动,聚焦企业多元AI场景落地需求,推出7000万tokens大模型免费体验、GPU新客特惠等政策,助力企业降低开发成本。同时提供标准化AI产品与解决方案,覆盖内容创作、智能客服等高频应用场景,并举办系列技术分享活动,携手企业拥抱AI新时代。

  • 升级版“蓝心小V”亮相,豆包大模型助力vivo打造AI原生体验

    vivo发布全新OriginOS 6系统,升级私人助手“蓝心小V”。该系统依托蓝心大模型与豆包大模型协同,实现精准意图识别与多模态交互,支持新闻、教育、天气等场景的智能问答。通过火山引擎联网搜索及内容整合,提供低延迟、高情感语音响应。同时拓展无障碍服务,为视障用户提供实时视觉辅助。未来将持续深化AI生态建设,打造更智能便捷的原生体验。

  • 火山 AI 搜索引擎升级:大模型时代重塑用户体验与业务增长

    火山引擎近日升级企业级AI搜索助手,底层模型升级至豆包大模型1.6,全面提升搜索、推荐、问答能力。该平台支持“开箱即用”,企业可快速构建专属对话式搜索助手,已在电商导购、视频新闻、AI搜图、智能硬件等多场景落地,帮助优化产品体验,为业务增长注入新动能。

  • 金融行业用好大模型,只有“垂直”一个解

    文章探讨大模型在金融等复杂业务场景的落地挑战,指出通用模型难以满足行业对准确性、可解释性及合规性的高要求。垂直模型通过内化行业核心知识与能力,成为解决复杂业务问题的关键路径。实践显示,金融垂直模型已在营销、客服、风控等场景实现显著成效,如提升效率80%、降低风险。未来需通过数据飞轮、深度适配等技术实现模型持续迭代,构建一站式金融垂直模型生产工场。

  • 京东11.11直播技术全面升级,立影3D技术、JoyAI大模型重构沉浸式购物体验

    京东在双11期间升级直播技术,推出“立体3D技术”和“JoyAI大模型”等创新。立体3D技术实现裸眼360度商品展示,用户无需额外设备即可旋转查看产品细节;JoyAI生成虚拟偶像Aura,与真人明星跨次元互动,提升趣味性。AI工具还简化直播运营,支持智能脚本和选品。这些技术打破传统直播边界,增强沉浸感和互动效率,引领电商直播创新方向。

今日大家都在搜的词: