首页 > 业界 > 关键词  > AI芯片最新资讯  > 正文

AI日报:AMD向英伟达亮剑推出AI芯片;斯坦福AI团队承认抄袭国产大模型;suno将推“哼歌”功能;昆仑万维开源2千亿稀疏大模型天工MoE

2024-06-04 15:13 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://top.aibase.com/

1、挑战英伟达!AMD亮出旗下最强AI芯片锐龙AI 300系列

AMD在Computex科技大会上展示了最新的AI芯片产品线,展示了Zen5架构的Ryzen99950X处理器和锐龙AI300系列APU,挑战英伟达在AI领域的地位。

image.png

【AiBase提要:】

🚀 英伟达和AMD在Computex科技大会上展示最新技术成果,AMD展示了Zen5架构的Ryzen99950X处理器和锐龙AI300系列APU。

💥 苏姿丰强调Zen5架构的Ryzen CPU具有更宽的CPU引擎指令窗口,支持完整的AVX512吞吐量,提升AI性能一倍。

🔥 AMD的锐龙AI300系列APU采用XDNA AI NPU,算力高达50TOPS,超越了其他竞争对手的性能标准。

2、Suno又要推新功能!随便哼两句它就能帮你创作成歌曲了

Suno最近宣布推出令人激动的新功能,可以通过哼唱声音生成完整的歌曲,展示出人工智能在音乐创作领域的无限可能。Suno的创新举措为音乐创作注入新活力,让用户通过日常声音创作音乐作品,开拓了音乐创作的新可能性。期待Suno未来带来更多令人惊叹的创新。

【AiBase提要:】

🎵 哼唱生成歌曲:Suno推出新功能,用户哼唱一小段即可创作完整歌曲,音乐与原声融合自然

🎶 日常声音转化音乐:Suno新功能能将任何声音转化为音乐作品,展示技术强大创意潜力

🎤 激发音乐创作活力:Suno的创新举措为音乐创作领域注入新活力,开拓音乐创作新可能性

详情链接:https://top.aibase.com/tool/suno-ai

3、昆仑万维宣布开源2千亿稀疏大模型Skywork-MoE

昆仑万维公司开源了具有里程碑意义的稀疏大型语言模型Skywork-MoE,该模型性能强劲,推理成本大幅降低,为大规模密集型LLM带来有效解决方案。

【AiBase提要:】

🌟 开源和免费商用: Skywork-MoE模型权重、技术报告完全开源,免费商用,推动人工智能领域发展。

💡 推理成本降低: Skywork-MoE在保持性能的同时大幅降低了推理成本,解决大规模数据处理挑战。

🚀 技术创新和性能优势: Skywork-MoE是首个支持单台4090服务器推理的开源千亿MoE大模型,性能强劲且参数量大。

详情链接:https://top.aibase.com/tool/skywork-moe

4、Adobe 发布 VideoGigaGAN 超分辨率视频模型

Adobe 和研究人员合作推出 VideoGigaGAN,兼顾帧率连贯性和细节丰富的超分辨率视频模型。该模型解决了超分辨率视频模型的时间连贯性和细节丰富性问题,为视频处理领域带来了重要突破。

image.png

【AiBase提要:】

⭐ VideoGigaGAN 基于 GigaGAN 模型开发,添加时序卷积、自注意力层和光流引导模块,解决超分辨率视频模型的时间连贯性和细节丰富性问题。

⭐ VideoGigaGAN 利用时序卷积捕捉视频帧之间的时间依赖性,自注意力层提取空间细节和纹理信息,光流引导模块保持特征的空间一致性,生成清晰的超分辨率视频。

⭐ VideoGigaGAN 具有视频超分辨率、时域一致性、丰富细节处理、抗锯齿处理等功能特点,适用于多种视频处理场景。

详情链接:https://top.aibase.com/tool/videogigagan

5、斯坦福大学AI研究团队被指抄袭清华系模型

这篇文章报道了斯坦福大学AI研究团队的Llama3-V开源模型因抄袭清华系明星创业公司面壁智能开发的开源模型“小钢炮”MiniCPM-Llama3-V2.5而引发的风波。事件曝光后,斯坦福团队的两位主要作者向面壁智能团队和公众道歉,并承诺撤下所有Llama3-V模型。

【AiBase提要:】

🔍 斯坦福大学AI研究团队的Llama3-V模型被指抄袭清华系明星创业公司面壁智能开发的MiniCPM-Llama3-V2.5模型。

🚨 网友发现Llama3-V模型的结构和代码与“小钢炮”模型高度相似,引发广泛关注和热议。

🔗 面壁智能团队证实抄袭事实,斯坦福团队的两位主要作者在社交平台上公开道歉并承诺撤下所有Llama3-V模型。

详情链接:https://top.aibase.com/tool/minicpm-llama3-v-2-5

6、多模态模型再进化,已学会看图玩扑克、算“12点”

本文介绍了UC伯克利等高校研究团队提出的新强化学习框架RL4VLM,成功提升了多模态大模型在决策任务上的表现。该模型通过强化学习微调学会了看图玩扑克、算“12点”等任务,超越了GPT-4v。研究团队由多位重量级人物组成,成果已在GitHub上开源。

image.png

【AiBase提要:】

🧠 新强化学习框架RL4VLM成功提升多模态大模型决策能力,超越GPT-4v。

🌟 研究团队由重量级人物组成,包括图灵奖得主LeCun等。

💡 RL4VLM采用强化学习微调,直接使用环境奖励信息,赋予多模态模型自主决策能力。

论文地址:https://arxiv.org/abs/2405.10292

项目地址:https://top.aibase.com/tool/rl4vlm

7、OpenAI衍生公司人工智能模型 让机器人像人一样思考、学习

本文介绍了OpenAI衍生公司Covariant推出的人工智能模型,使机器人具备像人类一样思考、学习的能力。该模型结合推理与物理能力,具有多模态输入、自主执行任务、反馈与交互、适应性等特点,代表了机器人学习和自动化技术的重大进步。

image.png

【AiBase提要:】

🤖 Covariant AI系统融合了推理技能和物理灵巧性,开发了RFM-1模型处理多种输入类型,使机器人更全面地理解任务需求。

🧠 机器人可以自主执行任务,根据反馈和交互请求建议,适应环境而不依赖特定任务代码,简化了编程过程。

🔗 Covariant的AI系统赋予机器人视觉识别、思考、行动和学习的能力,提高了自动化的灵活性和效率。

8、比特币矿工向人工智能企业投入数百万美元,寻求数十亿美元回报

比特币矿工Core Scientific与云公司CoreWeave达成35亿美元合作,拓展人工智能业务,迎接人工智能领域需求增长。这一举动将带来丰厚收入,推动矿工企业转型应对比特币减半带来的挑战。

【AiBase提要:】

⭐ 比特币矿工Core Scientific与CoreWeave达成35亿美元合作,拓展人工智能业务。

⭐ 人工智能领域需求巨大,将提供丰厚收入,推动矿工企业转型。

⭐ 比特币矿工们在AI市场中寻求多样化收入,应对减半带来的挑战。

9、IBM 推出高效 LLM 基准测试方法,计算成本降低99%

IBM研究推出了一种创新的LLM基准测试方法,通过微型化基准测试大幅降低评估LLM所需的时间和金钱成本,引起AI社区关注,有望推动人工智能模型评估领域的快速发展。

【AiBase提要:】

⭐️ 创新的LLM基准测试方法降低计算成本99%。

⭐️ 高效方法利用微型化基准测试,减少评估LLM时间和金钱成本。

⭐️ 引起AI社区关注,被广泛采用,有望推动人工智能模型评估领域发展。

10、麦肯锡全球调查:生成式AI采用开始产生价值

AI的广泛应用正在改变组织的运营方式,但也带来了一些负面影响。麦肯锡的调查显示,人工智能在营销、销售等领域带来成本降低和收入增长,但不准确性和安全性仍是关注点。高绩效者在GenAI采用中更具挑战性,但通过最佳实践取得成功。

【AiBase提要:】

⭐️ 65%的组织正在定期使用AI,GenAI在多个领域得到广泛应用,带来成本降低和收入增长。

⭐️ 44%的受访者表示从GenAI使用中经历了负面影响,主要包括不准确性、网络安全和知识产权侵权等风险。

⭐️ 高绩效者在GenAI采用中更有挑战性,但通过增加风险认识、建立明确流程和培养员工技能取得成功。

举报

  • 相关推荐
  • 大家在看
  • TCAN:使用扩散模型实现时间一致性的人像动画

    TCAN是一种基于扩散模型的新型人像动画框架,它能够保持时间一致性并很好地泛化到未见过的领域。该框架通过特有的模块,如外观-姿态自适应层(APPA层)、时间控制网络和姿态驱动的温度图,来确保生成的视频既保持源图像的外观,又遵循驱动视频的姿态,同时保持背景的一致性。

  • MAVIS:数学视觉指令调优模型

    MAVIS是一个针对多模态大型语言模型(MLLMs)的数学视觉指令调优模型,主要通过改进视觉编码数学图表、图表-语言对齐和数学推理技能来增强MLLMs在视觉数学问题解决方面的能力。该模型包括两个新策划的数据集、一个数学视觉编码器和数学MLLM,通过三阶段训练范式在MathVerse基准测试中取得领先性能。

  • H2O-Danube2-1.8B:开源小型语言模型,适用于企业级应用

    H2O-Danube2-1.8B是H2O.ai最新发布的开源小型语言模型,专为离线应用和企业级应用设计,具有经济高效的接口和训练成本,易于嵌入到移动电话、无人机等边缘设备中。该模型在Hugging Face Open LLM Leaderboard的<2B范围内排名第一,提供高达200倍的查询成本节省,同时在文档处理上提供更好的准确性,成本降低高达100%。H2O.ai平台还提供了成本控制和灵活性,支持超过30种大型语言模型(Large Language Models, LLMs)的混合使用,包括专有和开源的LLMs。

  • BlitzToksAi:AI驱动的TikTok视频生成器,快速、简单、震撼。

    BlitzToksAi是一个利用先进AI技术的视频生成器,能够将用户的想法轻松转化为吸引人、高质量的TikTok视频。它简化了视频创作流程,无需昂贵的视频编辑工具,节省时间并增强社交媒体影响力。用户只需点击一下即可生成视频,无需视频编辑技能,AI负责所有技术细节,让用户专注于内容和创意。

  • AI Image Extender:AI技术扩展图像边界,创造无限可能

    AI Image Extender是一款利用人工智能技术扩展图像边界的在线工具。它允许用户通过点击和拖动操作来扩大图像的背景,调整图像的长宽比,甚至在图像边缘创造新的视觉效果。这项技术的重要性在于它能够帮助设计师和摄影师在不损失图像质量的前提下,轻松实现图像的尺寸调整和视觉效果增强,为创意工作提供了极大的便利。

  • Claude Dev:智能代码助手,提升开发效率

    Claude Dev是一款VSCode扩展,利用Anthropic的Claude 3.5 Sonnet的代理编码能力,可以逐步处理复杂的软件开发任务。它不仅支持文件读写、创建项目和执行终端命令(在获得用户许可后),还提供了一个直观的GUI,使用户能够安全且容易地探索代理AI的潜力。

  • H2O Danube3:文本生成领域的先进模型

    H2O Danube3 是由 h2oai 公司开发的一系列文本生成模型,这些模型专注于提供高质量的文本生成服务,广泛应用于聊天机器人、内容创作等领域。它们具备强大的语言理解和生成能力,能够根据给定的上下文生成连贯、准确的文本。

  • exo:在家使用日常设备搭建自己的AI集群。

    exo是一个实验性的软件项目,旨在利用家中的现有设备,如iPhone、iPad、Android、Mac、Linux等,统一成一个强大的GPU来运行AI模型。它支持多种流行的模型,如LLaMA,并具有动态模型分割功能,能够根据当前网络拓扑和设备资源来最优地分割模型。此外,exo还提供了与ChatGPT兼容的API,使得在应用程序中使用exo运行模型仅需一行代码的更改。

  • StreamVC:实时低延迟语音转换技术

    StreamVC是由Google研发的实时低延迟语音转换解决方案,能够在保持源语音内容和韵律的同时,匹配目标语音的音色。该技术特别适合实时通信场景,如电话和视频会议,并且可用于语音匿名化等用例。StreamVC利用SoundStream神经音频编解码器的架构和训练策略,实现轻量级高质量的语音合成。它还展示了学习软语音单元的因果性以及提供白化基频信息以提高音高稳定性而不泄露源音色信息的有效性。

  • H2O AI Personal GPT:智能AI助手,本地处理数据,保护隐私。

    H2O AI Personal GPT是一款由H2O.ai开发的AI助手应用,旨在提供智能、对话式的AI服务,同时确保用户的隐私安全。该应用在本地处理数据,无需担心数据离开设备,支持无网络环境下使用,适合需要移动办公和隐私保护的用户。

  • GraphAi:链接全球热门科技企业、模型及应用

    GraphAi智能工具图谱是一个综合性的网络平台,旨在链接全球热门的科技企业、模型及应用。它通过构建图谱的方式,帮助用户探索和学习人工智能领域的最新动态和产品信息。该平台不仅涵盖了国内外众多知名企业的AI产品,还提供了丰富的行业资讯和学习资源,是技术爱好者和专业人士了解AI发展的重要渠道。

  • PNG Maker:在线免费将文本转换为带透明背景的PNG图片

    PNG Maker是一个创新的在线工具,利用AI技术将文本转换为PNG图片,特别适合网页设计师、市场营销人员和内容创作者。它提供了高级的文本到PNG的转换能力,用户可以轻松地自定义字体、大小和颜色,确保专业和视觉上吸引人的结果。

  • Phaie AI:设计系统管理与自动化插件

    Phaie AI 是一个专为设计系统内部工作设计的插件,旨在帮助识别和重命名现有设计系统中的样式。它允许设计师和设计团队节省时间,通过一键操作管理颜色、排版等设计元素,创建和更新设计系统。插件背景信息包括对内部设计系统工作的深入理解,以及Beta用户的高度成功反馈。

  • Easel AI:创意表达,一键分享给朋友

    Easel AI是一款设计类应用,专注于帮助用户通过简单的操作表达自己的风格,并快速分享给朋友。它可能利用人工智能技术简化设计流程,让用户即使没有专业设计背景也能轻松创作出个性化的作品。

  • 社交媒体图片生成器:智能设计,一键生成社交媒体图片封面

    社交媒体图片生成器是uBrand品牌创意工作室推出的一款在线设计工具,它能够帮助用户快速生成适合社交媒体的图片封面。该工具利用人工智能技术,简化了设计流程,提高了设计效率,使得即使是设计新手也能轻松制作出专业水准的图片。

  • Faceindex:互联网人脸搜索工具

    Faceindex是一个利用AI技术进行人脸搜索的网站,能够扫描互联网上的照片,提供详细的搜索结果和链接。它在安全、隐私保护和用户反馈方面表现良好,是背景调查和身份验证的有力工具。

  • CalmJobs:寻找平衡工作与生活的职位

    CalmJobs是一个AI驱动的职位聚合平台,专注于提供那些重视工作生活平衡的公司职位。它帮助求职者找到既能在专业上发展也能在个人生活中保持平静和平衡的工作机会。

  • AI Presentation Maker:智能在线演示文稿制作工具

    AI Presentation Maker是一个利用人工智能技术,将文本内容快速转化为结构化、视觉吸引的幻灯片的在线工具。它通过先进的算法自动创建专业幻灯片,提供多语言支持,确保全球用户都能制作出语言和文化上合适的演示文稿。该工具的主要优点包括免费在线访问、文本到演示文稿的转换、自动化幻灯片创建、可定制的设计模板、快速演示文稿生成等。

  • Nimble:智能网页数据抓取平台

    Nimble是一个为AI和BI应用提供数据的现代数据平台,通过其企业级的数据管道,提供准确、实时的网页数据。它拥有无与伦比的数据质量和准确性,完全由AI浏览器技术管理,具有全面的治理和信任度,是领先数据团队信赖的选择。

  • Tribe AI:低代码工具,快速构建和协调多智能体团队

    Tribe AI是一个低代码工具,它利用langgraph框架,让用户能够轻松自定义和协调智能体团队。通过将复杂任务分配给擅长不同领域的智能体,每个智能体可以专注于其最擅长的工作,从而更快更好地解决问题。

今日大家都在搜的词:

热文

  • 3 天
  • 7天