首页 > AI头条  > 正文

全球首个芯片设计开源大模型SemiKong正式发布 性能超越通用大模型

2024-07-10 17:41 · 来源: AIbase基地

全球首个芯片设计开源大模型SemiKong正式发布,它基于Llama3微调而来,性能超越了通用大模型。这不仅是技术的突破,更是开源精神的胜利,预示着未来五年内,5000亿美元的半导体行业将迎来翻天覆地的变化。

SemiKong的问世,标志着AI在芯片设计领域的应用迈出了坚实的一步。它由Aitomatic与FPT Software联手打造,在Semicon West2024大会上首次亮相,便引起了业界的广泛关注。这一开源大模型不仅在处理行业特定任务时优于通用大模型,更在准确性、相关性以及对半导体工艺的理解上取得了显著进步。

QQ截图20240710174025.jpg

官网地址:https://www.semikong.ai/

项目地址:https://github.com/aitomatic/semikong

LeCun等业界大佬纷纷转发这一开源芯片设计的AI模型,其代码权重已经公开在Hugging Face和GitHub上,供全球开发者下载使用。这一前所未有的开放举措,在以竞争和保密著称的半导体行业,无疑是一次大胆的尝试。

Aitomatic的CEO Christopher Nguyen表示,公司选择开源,是因为他们相信,在基础层共享研发成果的好处,远远超过保密带来的价值。他们希望通过开源,激发更多的创新和竞争,推动整个行业的发展。

SemiKong模型的训练过程分为三个阶段:预训练领域知识、自我微调和合并量化。它拥有8B的参数量,专门接受过半导体领域知识的训练,为芯片公司提供了一个强大的基础平台,帮助他们构建适合自身需求的专有模型。

SemiKong的出现,不仅能够加速半导体行业的创新,还有望降低生产成本。未来几年内,消费者可能会发现,更强大的智能手机、笔记本电脑和智能家居设备以更低的价格进入市场。

更令人期待的是,SemiKong的下一个版本计划在今年12月推出,首个针对工艺特定模型预计将在9月发布。这标志着半导体行业即将迎来一个全新的时代。

SemiKong的诞生,是人工智能联盟共同努力的结果。CEO Christopher Nguyen作为AI Alliance的领导者之一,他的远见卓识和开放合作精神,为这一突破性成果的诞生奠定了基础。

业界对SemiKong的评价极高。东京电子与人工智能联盟产品生命周期管理总监Atsushi Suzuki表示,SemiKong代表着人工智能在半导体制造领域的应用向前迈出了重要一步。FPT Software首席人工智能官Phong Nguyen也表示,他们相信SemiKong将巩固FPT Software在全球半导体行业的领导地位。

AiBase副业搞钱交流群

欢迎大家加入AiBase交流群, 扫码进入,畅谈AI赚钱心得,共享最新行业动态,发现潜在合作伙伴,迎接未来的赚钱机遇!。

AiBase副业搞钱交流群

  • 相关推荐
  • 大家在看
  • 中国杀出全球首个烹饪大模型

    什么?烹饪也有大模型?!没有听错,这就是国产厨电龙头老板电器最新发布——“食神”大模型。数十亿级行业数据,数千万级知识图谱加持,据称还是全球首个。现在大模型的到来,才是真正意义上实现了智能化,为这些家电“注入了灵魂”以老板电器为代表,大模型正在重新焕发传统家电行业。

  • 遥遥领先!阿里Qwen-2成全球开源大模型排行榜第一

    全球知名的开源平台HuggingFace的联合创始人兼首席执行官Clem在社交平台激动宣布,阿里巴巴最新开源的Qwen2-72B指令微调版本在开源模型排行榜上荣登榜首。为了打造一个更为公正和准确的开源大模型排名,Clem及其团队利用300块H100高性能硬件,对全球100多个主流开源大模型,包括Qwen2、Llama-3、Mixtral、Phi-3等,在BBH、MUSR、MMLU-PRO、GPQA等严格的基准测试集上进行了全面深入的评估。中国在这一领域正逐渐展现出领导者的姿态,引领着全球开源模型的发展潮流。

  • 吴恩达抵制美国SB 1047法案,对开源大模型是毁灭性打击

    7月12日凌晨,全球著名AI科学家吴恩达在社交平台发表深度长文,再次抵制并吐槽美国加州拟定的SB-1047法案。仍然对美国加州拟定的SB1047法案,对开源大模型带来的巨大伤害感到震惊。这是一个专门针对开源大模型的法案,里面有很多不合理的条款,受到了科技界专业人士的强烈抵抗和不满。

  • 全球最强开源模型!阿里通义千问登顶国内第一:超越一众开闭源模型

    根据SuperCLUE发布的中文大模型基准测评最新报告,阿里通义千问开源模型Qwen2-72B-Instruct以卓越的表现位居国内通用能力第一,更在全球范围内成为最强开源模型。SuperCLUE报告详细披露了对国内外33个大模型的综合测评结果,Qwen2-72B在一级总分上以77分的高分与Claude-3.5-Sonnet并列第二,仅次于OpenAI的GPT-4o。截至目前Qwen系列模型的下载量已突破2000万次,其应用场景覆盖了工业、金融、医疗、汽车等多个垂直领域。

  • 蚂蚁集团WAIC发布大模型密算平台,助力大模型破解数据供给挑战

    大模型向下扎根深入行业,必须要破解高质量数据供给的挑战。7月5日,2024年世界人工智能大会进入第二天,作为数据要素领域的主要技术服务商,蚂蚁集团发布“隐语Cloud”大模型密算平台,通过软硬件结合的可信隐私计算技术,在大模型托管和大模型推理等环节实现数据密态流转,保护模型资产、数据安全和用户隐私。今年5月底,蚂蚁集团对外公布了以人工智能和数据要素技术为核心的科技战略,随后成立了独立运营的密态计算公司——浙江蚂蚁密算科技有限公司,将提供密算相关的产品和服务,包括一套端到端的数据安全保障、一套软硬件结合的计算加速解决方案和一个隐私计算云服务平台,推动数据安全可信的跨云跨端低成本流通。

  • OpenAI发布PVG:用小模型验证大模型输出,解决“黑盒”难题

    7月18日凌晨,OpenAI在官网发布了最新技术研究——Prover-Verifier-Games。随着ChatGPT在法律、金融、营销等领域的广泛使用,确保模型的安全、准确输出同时被很好理解变得非常重要。如果使用的验证模型存在偏差,那么验证的内容还是会出现非法输出的可能。

  • 谁才是大模型“四小龙”?

    这两年热闹的大模型创业潮,被业内称为“AI2.0”。与之对应的“AI1.0”,指的是2015年左右开始的那一波AI创业潮,当时诞生了商汤、旷视、云从、依图等明星创业公司,它们以CV技术为主导,大量融资,风头无两。它们面对的挑战,丝毫不比“AI四小龙”小。

  • 中国AI大模型论文数量全球第一,清华力压麻省理工、斯坦福

    论文是研究新技术、开发新产品获取“图纸”的重要途径之一,OpenAI的研究人员正是借鉴了Transformer的论文,才开发出了对全球各行业影响巨大的产品ChatGPT。论文的数量、通过率和被引用次数是衡量一个国家科技人才素质,以及技术创新能力的重要标准之一。这也充分证明了,中国对生成式AI、大模型的重视程度、技术环境以及拥有庞大的AI人才库。

  • AI日报:GPTs靠边站!Claude推新功能Projects;Figma大更新!AI设计几秒成稿;阿里Qwen-2稳夺全球开源大模型榜首

    欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、Claude推类GPTs功能Projects可创建特定项目的个性化机器人Claude最近推出的创新功能\"Projects\"为用户提供了定制化的聊天机器人服务,具有独特的特点和优势。DIVID是哥伦比�

  • SuperCLUE最新测评发布,360智脑大模型稳居大模型第一梯队

    7月9日,国内权威大模型评测机构SuperCLUE发布《中文大模型基准测评2024上半年报告》,360智脑大模型在SuperCLUE基准6月测评中,取得总分72分,超过GPT-3.5-Turbo-0125,位列国内大模型第4名次,稳居大模型第一梯队,并入选SuperCLUE“卓越领导者”模型象限。《中文大模型基准测评2024上半年报告》选取国内外具有代表性的33个大模型,采用多维度、多层次的综合性测评方案,通过理科、文科和Hard三大维度真实反映大模型通用能力。360重塑国民级产品,相继推出360AI浏览器、360AI搜索等产品,其中360AI搜索连续登榜全球AI产品数据增速榜榜首,领跑国内AI搜索引擎市场。

  • AI写作宝:AI驱动的文字生产力工具

    AI写作宝是一个利用人工智能技术提供多种写作辅助服务的在线平台。它通过各种功能帮助用户快速生成高质量文本内容,提高写作效率,适用于多种场景,如社媒写作、教育、工作、短视频、电商和娱乐等。

  • RTVI-AI:实时语音和视频推理的开放标准

    RTVI-AI是一个旨在简化构建AI语音到语音和实时视频应用的开放标准。它提供了开源SDK代码和标准端点形状、事件消息以及数据结构的文档,支持开发者使用任何推理服务,并允许推理服务利用开源工具为实时多媒体开发复杂的客户端工具。

  • File Transcribe:AI驱动的音频转文字服务

    File Transcribe 是一款利用先进人工智能技术将音频文件转换为文本的服务。它通过高精度的AI模型,提供即时、准确的转录服务,并具备多种高级功能,如说话人识别、情绪检测、主题检测等。该服务支持多种语言,能够满足不同用户的需求,提高工作效率,适用于记者、学生、企业等各类用户。

  • NinjaRIP:AI驱动的文档处理工具,快速准确。

    NinjaRIP是一款AI驱动的文档处理服务,它通过先进的机器学习模型来识别模式和提取有意义的信息,从而简化文档工作流程。它以99%以上的准确率在文档识别和数据提取方面提供无与伦比的精确度,确保了数据的可靠性和可信度。NinjaRIP在beta阶段免费提供,一旦过渡到正式版,将提供不同业务需求的定价计划,价格透明且具有竞争力。

  • DeepL Chrome扩展:在Chrome浏览器内翻译阅读或书写的内容

    DeepL Chrome扩展是一款由全球最精确的人工智能翻译器支持的浏览器插件,它允许用户在Chrome浏览器中即时翻译阅读或书写的内容。它利用神经网络和人工智能技术,能够捕捉最细微的差别,提供比同行业竞争对手更准确的翻译结果,准确度高达三倍以上。

  • 豆包浏览器插件:浏览器AI助手,提升工作学习效率

    豆包浏览器插件旨在通过AI技术提升用户的工作效率和学习效率。它具备快速视频与一键从网页、PDF和视频中总结并生成亮点的功能,同时支持在网页任意地方划词进行全方位AI搜索。此外,它还提供全文对照翻译功能,帮助用户在阅读外文资料时更轻松地理解内容。豆包插件的设计理念是将AI技术与日常使用场景相结合,让用户在进行网页浏览、文档阅读和视频观看时能够更加便捷地获取信息和知识。

  • 聚好用AI:一站式创意平台,激发无限创意。

    聚好用AI是一个集成了多种创意工具的在线平台,旨在帮助用户快速生成和编辑各种创意内容。它结合了AI技术,使得设计、绘画、音乐创作等变得更加简单和高效。平台的主要优点在于其易用性、高效性和创新性,能够满足不同用户在创意表达上的需求。聚好用AI背后的技术团队拥有丰富的行业经验,致力于通过AI技术推动创意产业的发展。目前,该平台提供免费试用,但部分高级功能可能需要付费。

  • E象:AI技术助力电商,提升运营效率

    E象 HiDream.ai 是一家专注于电商行业的AI技术公司,通过人工智能技术提供高质量的商品图,帮助商家提高商品上架和运营活动的效率。产品通过AI技术替代传统拍摄,降低成本,提升人效,缩短上架时间。主要技术包括AI生成商品图、模特效果图、商品视频生成等,适用于跨境电商和本地电商。

  • HackerPulse.io:开发者成长助手

    HackerPulse 是一个专门为开发者设计的个人资料聚合平台。它通过整合 GitHub、LinkedIn 等多个开发者常用的平台数据,帮助开发者构建一个全面的个人资料。这个平台不仅可以展示开发者的技能和成就,还能识别技能差距和提升空间,从而支持开发者的职业成长。

  • SuperCoder 2.0:开源自主软件开发系统

    SuperCoder 2.0是一个开源的自主软件开发系统,利用大型语言模型(LLMs)和大型动作模型(LAMs)针对Python代码生成进行微调,以实现更高精度的一次性或少次编程。它结合特定于开发框架的软件护栏,如Flask和Django,与SuperAGI的通用智能开发代理一起,提供复杂的现实世界软件系统。SuperCoder 2.0还确保了您的知识产权和代码免受AI相关的滥用,并与现有的开发栈如Jira、Github或Gitlab、Jenkins、CSPs以及QA解决方案如BrowserStack/Selenium Clouds深度集成,确保无缝的软件开发体验。

  • Llama Tutor:个性化AI教学助手,学习更高效

    Llama Tutor是一个基于Llama 3.1和Together AI的个性化AI教学助手,旨在为用户提供定制化的学习体验。它完全开源,用户可以在GitHub上找到相关代码并进行个性化的调整。该产品通过用户输入的学习主题和教育水平,生成个性化的学习计划,帮助用户更高效地掌握知识。

  • HoloDreamer:从文本描述生成全息3D全景世界

    HoloDreamer是一个文本驱动的3D场景生成框架,能够生成沉浸式且视角一致的全封闭3D场景。它由两个基本模块组成:风格化等矩形全景生成和增强两阶段全景重建。该框架首先生成高清晰度的全景图作为完整3D场景的整体初始化,然后利用3D高斯散射(3D-GS)技术快速重建3D场景,从而实现视角一致和完全封闭的3D场景生成。HoloDreamer的主要优点包括高视觉一致性、和谐性以及重建质量和渲染的鲁棒性。

  • MusiConGen:基于Transformer的文本到音乐生成模型

    MusiConGen是一个基于Transformer的文本到音乐生成模型,它通过时间条件增强对节奏和和弦的控制。该模型从预训练的MusicGen-melody框架中微调而来。它使用符号表示的和弦和节奏控制,并结合五种不同风格的文本描述来生成样本。生成样本的和弦通过BTC和弦识别模型进行估计,如论文中所述。

  • PixVerse V2:轻松创建视觉冲击的视频内容。

    PixVerse V2是一个革命性的更新,它赋予每个用户轻松创建令人惊叹的视频内容的能力。使用V2,您可以轻松制作视觉冲击力强的电影,甚至可以加入现实世界中不存在的元素。主要优点包括模型升级、画质提升、剪辑间的一致性等。

  • KLING AI:激发你的想象力,开启创意生产的新时代。

    KLING AI是快手可灵的国际版,是一个以AI技术为核心的创意生产平台,提供AI图像和视频生成服务。其背后的技术由KOLORS和KLING提供支持,旨在通过先进的算法快速生成高质量的视觉内容,帮助用户实现创意想法,提升生产效率。

  • Comfy Deploy:快速部署AI应用的协作平台

    Comfy Deploy是一个面向产品团队的开源平台,专注于将ComfyUI工作流程快速转化为生产就绪的API。它提供了一键部署API、强大的管理GPU支持、任何模型和自定义节点的安装,以及无需自托管即可享受的ComfyUI的强大功能。该平台通过简化复杂流程,帮助团队协作、迭代和部署AI应用,显著提高了生产效率。

  • NVIDIA AI Foundry: 提供定制化的 AI 模型和解决方案。

    NVIDIA AI Foundry 是一个平台,旨在帮助企业构建、优化和部署 AI 模型。它提供了一个集成的环境,使企业能够利用 NVIDIA 的先进技术来加速 AI 创新。NVIDIA AI Foundry 的主要优点包括其强大的计算能力、广泛的 AI 模型库以及对企业级应用的支持。通过这个平台,企业可以更快速地开发出适应其特定需求的 AI 解决方案,从而提高效率和竞争力。

  • HeyGen Interactive Avatar:在线创建AI虚拟形象视频,实时互动。

    HeyGen Interactive Avatar是一个在线AI视频生成器,专注于创建和优化虚拟形象视频,支持实时互动。它允许用户创建一个为连续流媒体优化的虚拟形象,同时提醒用户保持头部和手部的最小动作。HeyGen的背景信息包括与Baron David和Ryan Hoover等知名人士的合作,产品目前处于Beta测试阶段,提供免费试用。

  • Adobe Firefly Vector AI:创意生成AI工具

    Adobe Firefly Vector AI是Adobe推出的一系列创意生成AI模型,旨在通过生成AI功能增强创意工作。Firefly模型和服务于Photoshop、Illustrator、Lightroom等Adobe创意应用中。它通过文本到图像、生成填充、生成扩展等功能,帮助用户以前所未有的控制力和创造力生成丰富、逼真的图像和艺术作品。Firefly的训练数据包括Adobe Stock的授权内容、公开许可内容和公共领域内容,确保其商业使用安全。Adobe致力于负责任地开发生成AI,并通过与创意社区的紧密合作,不断改进技术,支持和提升创意过程。

  • Jelled.ai:使用AI数字孪生优化职场沟通

    Jelled.ai是一个利用人工智能技术来提升职场沟通效率的平台。它通过创建用户的数字孪生,帮助用户从Gmail和Slack等主要通信渠道中提取、总结关键信息,并生成及时、知情的邮件草稿。数字孪生能够学习用户的邮件回复模式,节省时间和精力。此外,它还提供了即时回复、智能代理聊天、消息审查等功能,帮助用户有效管理日常沟通。Jelled.ai致力于保护用户数据安全,通过年度安全审计和符合Google API服务用户数据政策的措施,确保数据安全。

今日大家都在搜的词: