首页 > 业界 > 关键词  > 大模型最新资讯  > 正文

AI视野:Meta开源史上代码工具Code Llama;Midjourney不行的事Ideogram做到了;最长开源大模型“长颈鹿”来了

2023-08-25 15:28 · 稿源:站长之家

杀疯了!Meta开源史上最强代码工具CodeLlama

Meta宣布推出CodeLlama,这是一款用于辅助编写计算机代码的AI模型,旨在与微软的代码编写工具GitHubCopilot进行竞争。CodeLlama可以根据文本提示来生成代码,支持代码补全和调试。

image.png

该模型基于Meta的Llama2语言模型构建,将以社区许可证方式免费开源,可用于研究和商业用途。CodeLlama在代码生成方面的测试表现优于当前其他公开的基于LLM的模型。

项目地址:https://github.com/facebookresearch/codellama

要点:

  • CodeLlama是Meta推出的辅助编写代码的AI模型,与GitHubCopilot竞争

  • CodeLlama可根据文本提示生成代码,支持补全和调试,基于Llama2构建

  • CodeLlama以社区许可证开源,可免费用于研究和商业用途,测试表现强于其他基于LLM的代码生成模型

Midjourney危!Ideogram可以生成逼真的文字了

人工智能创业公司Ideogram推出新一代文本到图像生成系统,可靠地渲染出清晰易读的文字元素,具有强大的排版生成能力。

小编亲测:效果还是不错的,除了用来做单独的字体效果外,还可以用来做举牌图片。效果如下:

image.png

体验地址:https://ideogram.ai/

要点:

  • Ideogram由前GoogleBrain研究员创立,获得了a16z和IndexVentures领投的1650万美元种子投资。

  • Ideogram系统通过文本提示可生成包含清晰文本的图像,文字元素栩栩如生、格式规范。

  • Ideogram凭借排版创新在竞争激烈的AI生成图像领域确立了独特定位。

更适合中国宝宝体质的语言模型?阿里云开源通义千问视觉语言模型Qwen-VL

阿里云旗下魔搭社区宣布开源视觉语言模型Qwen-VL,该模型以通义千问70亿参数模型Qwen-7B为基座语言模型,支持图文输入,具备多模态信息理解能力。

image.png

模型链接:https://modelscope.cn/models/qwen/Qwen-VL-Chat

要点:

  • Qwen-VL新增了视觉定位、图像中文字理解等功能,可以接受图像和多语言文本作为输入。

  • Qwen-VL开源了通用模型Qwen-VL和对话模型Qwen-VL-Chat两个模型。

  • Qwen-VL-Chat可以用于快速搭建具备多模态能力的对话应用,推理速度快且资源消耗低。

爱奇艺引入AIGC 搜索剧情关键词可一键直达“名场面”

爱奇艺在2023年第二季度财报中披露已引入AIGC辅助内容运营,通过剧本评估、剧情理解、搜索推荐等应用提升内容生产与用户体验,例如用户搜索热播剧《长风渡》剧情关键词,可以直接定位至对应剧情片段。

image.png

要点:

  • 爱奇艺引入AIGC辅助剧本评估,提升效率超过90%。

  • AIGC实现剧情理解,改进搜索结果和用户体验。

  • 爱奇艺成立AIGC内容科技创新中心,站内素材超过70万条。

服装设计师狂喜!支持一键改面料/款式的设计软件来了

AI智绘是一款面向服装行业的AI设计工具,提供AI改款、AI生款、图案生成等功能,可以极速实现改款设计、线稿生款、批量生款以及图案生成,已服务超过127万设计师,助力设计师进行快速高效的原创设计。

image.png

体验地址:https://www.pop-fashion.com/aidraw

核心功能:

  • 极速AI改款:基于巨量款式库,支持一键改面料、花型、细节,5秒内完成改款。

  • 线稿生款:文本转线稿再生成款式,实现设计全流程一站式操作。

  • 高效AI制款:一键批量生款,提供无限创意灵感。

  • 图案花型生成:支持文本生成功能,秒速呈现花型设计。

  • AI工具箱:褪底、放大等图片处理功能。

32k上下文可商用!最长开源大模型“长颈鹿”来了!

长颈鹿是Abacus.AI团队基于LLaMA模型系列打造的新作,被称为“开源大模型史上第一个上下文长度达到32k的版本”,通过改进注意力机制实现32k的上下文外推。

image.png

论文地址:https://arxiv.org/abs/2308.10882

项目地址:https://huggingface.co/abacusai/Giraffe-v2-13b-32k

要点:

  • 长颈鹿是基于LLaMA模型打造的,上下文长度达到32k,是目前开源大模型中最长的。

  • 研发团队Abacus.AI通过测试不同的上下文外推方法,发现线性插值效果最好,并在此基础上提出了PowerScaling和TruncatedBasis两种新思路。

  • 尽管Abacus.AI宣称长颈鹿是首个32k开源模型,但Together.AI更早发布了类似规模的版本,两者可以说并列第一

性能时延仅3.7秒!大模型BLOOMZ让推理变得更容易

Anthropic公司开源大模型BLOOMZ,参数量达1760亿,在HabanaGaudi®2芯片上推理时延仅3.7秒,实现接近实时的性能。

image.png

论文地址:https://arxiv.org/abs/2211.05100

要点:

  • BLOOMZ是拥有1760亿参数的大规模语言模型,在HabanaGaudi®2硬件上进行推理时延仅3.7秒。

  • HabanaGaudi®2具有强大的计算能力和内存容量,可支持大模型的训练和推理。

  • 利用DeepSpeed的模型并行技术,可以在多台Gaudi®2设备上分布一个极大规模的模型进行推理。

小爱大模型继续开放内测 第二批名额下周开放

小米语音助手小爱同学将在下周继续开放大模型内测名额,报名审核通过的用户将收到小米社区站内消息推送,让更多米粉用户体验升级后的小爱同学。

image.png

第二批(8月21号起陆续审核)

XiaomiMIXFold2

XiaomiMIX4

Xiaomi11系列(含11/11Pro/11Ultra)

XiaomiCivi系列(含Civi/Civi1S/Civi2/Civi3)

RedmiK40系列(含K40/K40S/K40Pro/K40Pro+/K40游戏增强版)

RedmiNote12系列(含12TPro/12Pro/12Pro+/12Pro极速版/12turbo/125G)

RedmiNote11系列

(含115G/11E/11SE/11Pro/11Pro+/11EPro/11TPro/11TPro+/11Pro5G/11Pro+5G)

奇安信发布奇安信大模型Q-GPT 可降低数据安全风险

奇安信集团发布了Q-GPT安全机器人和大模型卫士,通过安全风险发现、访问控制、数据泄露管控等手段,为企业使用大模型提供四重防护,全面降低数据安全风险。

要点:

  • 建立技术监管手段,防止员工向大模型投喂敏感数据,防止数据泄露。

  • 对大模型应用状况进行分析,调整资源配置,辅助企业业务流程重构。

  • 完美适配主流大模型应用,实现对大模型的精准管控,降低数据安全风险。

举报

  • 相关推荐
  • 改写语音交互行规,豆包大模型更稳了

    豆包大模型,又上新了。 2026年4月9日,原生全双工语音大模型Seeduplex正式发布,相比上一代半双工豆包端到端语音模型,新模型基于“边听边说”的全新框架设计,交互体验的自然感、顺畅度大幅提升,目前已在豆包App全量上线。 这意味着,前沿的全双工语音技术,第一次实现商业规模化落地。 而依托全双工语音技术,豆包的语音交互不再是机械式的一问一答,而是收放�

  • 百度文心大模型5.1正式发布

    百度正式发布了新一代基础大模型——文心大模型5.1。该模型采用了自主研发的“多维弹性预训练”技术,仅以业界同规模模型约6%的预训练成本,便达到了基础效果领先的水平,并登上LMArena搜索榜国内第一的位置。 在多项行业权威基准测试中,文心5.1在智能体、知识理解、逻辑推理以及深度搜索等核心能力上表现突出。其中,智能体能力提升显著,已超越DeepSeek-V4-Pro;创意�

  • 小米自研AI大模型!Xiaomi MiMo再次登顶全球第一

    小米官方今天发文宣布,小米技术官方宣布,在OpenRouter平台最新数据中,Hermes Agent登顶全球调用量榜首,日Token调用量达2910亿,周调用量超1.75万亿。 小米自研MiMo模型成为第一大贡献模型,近一个月累计贡献1.45万亿Token调用量。

  • 普渡机器人正式发布具身智能大模型PuduFM 1.0

    2026年5月11日,普渡机器人发布具身智能大模型PuduFM1.0,构建三维空间深度感知、物理状态预测和持续进化学习三大技术维度,实现从“简单执行”向“物理认知”的跨越。该模型通过分层架构和虚实双数据闭环,解决行业在协作、操作和异构数据复用上的困境,支持超长程任务和异构机器统一运行,推动具身智能规模化落地。

  • 告别价格战,大模型共迎通胀时代

    眼下,涨价成为大模型的关键词。 迈入2026年,大模型不再是优惠缩水,而是毫不掩饰地开启了涨价模式,大大小小的厂商纷纷入局,智普甚至在短短三个月之内两次提价。 以至于,国产大模型定价首次与海外头部厂商对齐。 大模型涨价,是昙花一现还是旷日持久?降价争夺市场的打法,是否走到了尽头?价值战会成为未来竞争的核心叙事吗?

  • 面壁智能,大模型“另类”生存法则

    面壁智能,是中国大模型行业中的“另类”。 在国内外大肆流行Scaling Law(规模定律),即奉行参数越大、数据越多、算力越强,模型能力就越强的时候。 面壁智能则反其道行之,遵循“知识密度”,即用更少的参数实现更强的能力;以及“密度法则”,即在有限算力下,持续提升模型能力密度。 一个是“大力出奇迹”,一个是“以小博大”,这注定一开始面壁就与主流的�

  • 福瑞泰克FUGA 4.0重构智驾数据中枢:大模型赋能,从“浅挖”到“深算”

    在智驾行业硬件趋同、算法收敛的背景下,数据成为技术制高点争夺的核心。福瑞泰克升级的FUGA 4.0数据平台,以AI大模型为核心,从海量数据中精准提炼“黄金场景”,实现从浅挖掘到真理解的跨越。其“大模型大脑+轻量级小脑”架构,兼顾泛化能力与精准度,显著提升通用场景识别、复杂路口理解和运动预测能力。该平台已进入大规模实战阶段,每月挖掘数十万高价值场景并精准标注,大幅缩短算法开发周期,助力仿真环境实现“日行百万公里”的高效迭代,从记录者升级为智能驾驶的守护者与领航员。

  • 奔驰纯电 GLC 首秀:携手豆包大模型,定义“活人感”智能座舱

    4月23日,梅赛德斯-奔驰最畅销SUV车型迎来首款纯电之作——全新纯电GLC SUV全球首秀。新车以史上最大GLC、最大尺寸屏幕等越级配置,开启豪华纯电SUV新时代,并全面接入豆包大模型,将“活人感”智能交互提升至新高度。这是继2025年发布纯电CLA车型后,双方在大模型领域合作的又一里程碑,标志着火山引擎的AI技术已深度融入奔驰量产车型矩阵。

  • AI日报:千问PC端上线AI语音输入;字节发布全模态大模型Doubao-Seed-2.0-lite;谷歌更新AI搜索功能

    本期AI日报涵盖多项重要进展:千问PC端上线AI语音输入,提升办公效率;字节跳动发布全模态大模型Doubao-Seed-2.0-lite,实现视频、图像、音频与文本统一理解;腾讯联合多所高校推出开源多模态深度搜索智能体方案OpenSearch-VL;月之暗面申请“KimiClaw”商标,或涉硬件领域;Mininglamp开源Cider和Mano-P,打造本地AI工作站;OpenAI携手硬件巨头发布MRC协议,解决GPU闲置浪费;谷歌升级AI搜索功能,整合Reddit等社交观点;xAI推出Grok Imagine API质量模式,提升图像生成写实度。

  • 百度智能云联合中国信通院共建AI终端生态 加速大模型落地消费电子

    5月14日,百度智能云联合中国信通院等30余家单位发起“智能终端大模型生态加速社区”倡议,推动消费电子产业在大模型时代实现生态协同、技术共创与标准共建。随着AI技术演进,智能终端正从功能设备向“智能伙伴”转型,但面临互联互通不足、开发门槛高、标准体系不完善等问题。社区将围绕技术攻关、市场研究、标准落地、测试认证、场景孵化、交流联动六大方向建设,通过开放协同机制降低创新门槛,打造开放、兼容、安全、普惠的AI终端生态,促进全产业链协同发展。

今日大家都在搜的词: