首页 > 业界 > 关键词  > OpenAI最新资讯  > 正文

离开OpenAI待业的Karpathy推出大模型新项目minbpe

2024-02-18 14:27 · 稿源:站长之家

要点:

1、Karpathy宣布离开OpenAI后不懈努力,推出新项目minbpe,一天内GitHub标星量达到1.2k。

2、minbpe项目旨在为LLM中常用的BPE算法创建干净、教育性的代码。

3、minbpe项目提供了两个Tokenizer,实现训练、编码和解码等主要功能。

站长之家(ChinaZ.com)2月18日 消息:最近,Karpathy离开OpenAI后并未放松,快速推出了新项目minbpe。该项目的GitHub标星数量在短短一天内就突破了1.2k,展现出了巨大的关注度和吸引力。这一动态引发了网友们的热烈讨论和期待。

image.png

项目地址:https://top.aibase.com/tool/minbpe

minbpe项目的初衷在于为LLM中广泛使用的BPE算法打造最简洁、最清晰、最具教育性的代码。通过提供两种Tokenizer,minbpe项目实现了对分词器的训练、编码和解码等核心功能。这样的设计不仅提高了代码的可读性,还为用户提供了更便捷、高效的操作体验。

具体来看,minbpe项目存储库中包含了基于类的Tokenizer实现,如BaseTokenizer和BasicTokenizer等。这些类的设计旨在提供训练、编码和解码的基本功能,以及保存和加载等实用功能。此外,RegexTokenizer和GPT4Tokenizer等的实现进一步拓展了项目的功能,为用户提供了更多选择和可能性。

除了代码的实现,Karpathy还表示会很快发布相关的教学视频,进一步帮助用户理解和应用minbpe项目。这种全方位的服务和支持将使项目更具实用性和吸引力,为广大用户带来更多的价值和帮助。相信随着项目的不断发展和完善,minbpe将在人工智能领域发挥重要作用,为行业的进步和发展贡献力量。

举报

  • 相关推荐
  • OpenAI发布GPT-5-Codex:可完成7小时单次编程任务

    OpenAI宣布推出新一代AI编程模型GPT-5-Codex,其最大亮点是创新的动态时间分配系统。 不同于传统AI追求秒级响应”,该模型可根据任务复杂度灵活调整处理时长,从数秒到7小时不等,以更接近人类专家的决策方式优化代码质量。 GPT-5-Codex产品负责人亚历山大恩比里科斯解释称,传统模型在任务初期即固定计算资源,而GPT-5-Codex能实时评估需求:动态决定加速推进、暂停语法核�

  • Nano Banana更像是AI图像领域的DeepSeek

    这是《窄播Weekly》的第66期,本期我们关注的商业动态是:Google最新的AI图像生成模型Nano Banana,可能会给AI图像领域带来一场应用大爆炸。 去年这个时候,我想把照片中人物手里拿的玩具火车换成玩具飞机,还需要给玩具火车做出精细标记,找到干净的玩具飞机图片,告诉AI将其替换成另一张图里的飞机。我花费一个小时,多番尝试下来,飞机会变形,人物的手会消失,最后的�

  • AI日报:快手推出AI视频制作助手Kwali;字节跳动推出USO模型;OpenAI推出ChatGPT开发者模式

    本文介绍了AI日报栏目,聚焦AI领域最新动态。快手推出Kwali视频助手,简化视频制作流程;字节跳动发布USO模型,解决图像生成中风格与主题的矛盾;微软推出Copilot Audio音频模式,提供个性化语音交互;Stability AI升级Stable Audio 2.5,支持高质量音频生成;阿联酋推出开源大模型K2 Think,拥有320亿参数;微信上线智能回复功能,提升公众号运营效率;OpenAI推出ChatGPT开发者模式,支持AI控制外部工具;字节跳动Seed团队发布AgentGym-RL框架,提升语言模型决策能力;月之暗面开源Checkpoint Engine中间件,优化LLM推理效率;B站开源IndexTTS-2.0文本转语音系统,支持情感与时长控制;Replit推出Agent 3编程助手,自主性提升10倍。

  • 赫力昂联合Springer Nature旗下自然定制揭秘大脑抗衰

    全球老龄化加速,大脑健康成为焦点。9月16日是中国脑健康日,9月21日是世界阿尔茨海默病日。数据显示,2020至2023年全球60岁以上人口增长40%,达14亿;中国60岁以上人口超3亿,占比22%。阿尔茨海默病带来的经济负担约占GDP的1.47%。科学界正探索维持大脑年轻态的机制,企业合作举办高峰论坛,专家分享前沿研究成果,强调40-60岁是干预黄金窗口期。复合维生素矿物质等营养干预手段显示认知改善潜力,未来需跨学科协作推动大脑抗衰研究普及。

  • AI日报:国产版Nano Banana?即梦图片4.0发布;阿里巴巴发布 Qwen3-Max-Preview;上海重磅发布AI广告扶持政策

    AI日报栏目聚焦人工智能领域最新动态。主要内容包括:即梦图集4.0发布,新增文生图、图像编辑等功能;阿里巴巴推出超万亿参数语言模型Qwen3-Max-Preview;小米AI眼镜上线支付宝“看一看”支付功能;微软开源14B参数模型rStar2-Agent在数学推理领域表现突出;MiniMax启动股权激励计划覆盖核心员工;谷歌明确Gemini使用限制,免费用户每日最多5次提示;上海发布AI广告扶持政策,最高补贴500万元。这些进展展示了AI技术在图像处理、语言模型、智能支付等领域的创新应用。

  • REDMI产品经理胡馨心上手iPhone 17 Pro:和K70至尊版有点撞脸

    Redmi产品经理胡馨心发布iPhone 17 Pro上手体验视频,指出其横向矩阵摄像头与Redmi K70至尊版设计相似,但强调两者功能、设计细节完全不同。小米17 Pro系列采用斥巨资打造的妙享背屏,可自定义显示内容并预览自拍画面。卢伟冰称友商或难跟进,因成本过高。此次升级旨在为手机行业带来创新突破。

  • 小米澎湃OS 3第二批Beta版开启招募:覆盖REDMI K80、小米MIX Flip2等五款

    据小米官方消息,澎湃OS 3第二批Beta版已经开启招募,覆盖五款机型,包括:小米MIX Flip 2、REDMI K80、小米平板7 Ultra、小米平板7、REDMI K Pad。 据了解,澎湃OS 3采用自研底层内核技术平台,深入微架构流水线,识别CPU空转时长,通过一体化调频技术提升效率,整体任务执行效率提升19%。 同时,澎湃OS 3终于登岛”,命名为小米超级岛”,支持三岛并存,能显示待取快递提醒、登�

  • AI日报:苹果明年推出SiriAI搜索;OpenAI放开ChatGPT Projects功能;Kimi K2-0905 上线 Discord

    本文汇总了AI领域最新动态:苹果与谷歌合作,计划在Siri中引入Gemini AI技术;OpenAI向免费用户开放Projects功能,提升任务管理效率;谷歌推出免费Gemini CLI工具,集成GitHub提升开发效率;OpenAI估值飙升至5000亿美元,二级股票售出103亿美元;苹果自研AI搜索引擎“世界知识问答”计划2026年上线;月之暗面发布Kimi K2-0905模型,提升编程与创意写作能力;Raycast推出Cursor Agent插件优化代码编辑;谷歌发布nano banana官方Prompt模板,助力创意设计。

  • 微信员工回应新iPhone提示空间不足:代码Bug所致

    iPhone 17系列开售后,用户转移微信聊天记录时出现异常提示“设备空间不足”,但实际手机仍有1.29TB可用空间。微信员工“客村小蒋”回应称这是代码Bug,因缓存机制导致开机5分钟内接口返回错误数据。用户只需正常使用手机5分钟后即可恢复正常。该事件提醒用户关注微信聊天记录及缓存对设备空间的影响,同时期待微信团队尽快修复Bug。

  • 性能超越GPT-4o及Qwen2.5-VL,百度超轻量小模型PP-OCRv5 Blog持续登顶Hugging Face热度第一

    百度发布超轻量级文字识别模型PP-OCRv5,仅0.07B参数却实现媲美700亿参数大模型的OCR精度。在多项测试中超越GPT-4o等通用视觉大模型,尤其在文本定位和边界框精度上表现优异。该模型支持5种文字类型识别,适用于教育、医疗、法律等多行业数字化需求,累计下载量超900万,是GitHub上唯一Star数超5万的中国OCR项目。

今日大家都在搜的词: