首页 > 业界 > 关键词  > 天工SkyMusic最新资讯  > 正文

AI日报:天工SkyMusic开启公测;UP主用AI技术“复活”巨人族;通义千问开源代码模型CodeQwen1.5;免费AI音乐生成工具Sonauto

2024-04-17 16:11 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

昆仑万维「天工3.0」与「天工SkyMusic」音乐大模型开启公测

昆仑万维推出的「天工3.0」和「天工SkyMusic」音乐大模型开启公测,彰显了其在AI领域的技术实力和创新能力。这两款大模型在语义理解、音乐生成等领域展现出卓越性能,为用户提供更强大的AI体验。

image.png

亮点提要:

⚙️「天工3.0」拥有超过4000亿参数,是全球最大的开源MoE大模型,具有突破性性能提升。

🎵「天工SkyMusic」是中国首个音乐SOTA模型,支持多种方言,具有端到端音乐生成能力。

🔍「天工3.0」拥有多轮搜索、图表绘制、研究模式等AI能力,「天工SkyMusic」支持参考音乐生成和方言歌曲生成。

详情入口:🔗 https://top.aibase.com/tool/tiangongskymusic

通义千问开源基于Qwen1.5的代码模型CodeQwen1.5

基于Qwen 语言模型的代码专家模型CodeQwen1.5,具有7B 参数、GQA 架构和支持92种编程语言的特点。CodeQwen1.5在代码生成、长序列建模、代码修改和 SQL 能力等方面表现出色,极大提升了开发人员的工作效率。

image.png

亮点提要:

⭐ CodeQwen1.5拥有7B 参数,支持92种编程语言。

⭐ 在代码生成、长序列建模、代码修改和 SQL 能力方面表现出色。

⭐ 在多语言编程、长序列支持和代码修改方面展现出卓越能力。

详情入口:🔗 https://qwenlm.github.io/zh/blog/codeqwen1.5/

Spline发布3D生成工具AI3D Generation

Spline发布的最新3D生成工具标志着3D设计领域的重大进步,提供直观易用的界面、丰富的资源库和模板、先进的AI辅助设计以及团队合作功能。

image.png

亮点提要:

🌟直观易用的界面,适合3D设计初学者快速上手

🎨丰富的资源库和模板加速设计过程

🤖先进的AI辅助设计提升作品专业品质

详情入口:🔗 https://top.aibase.com/tool/spline-ai

CTRL-F-VIDEO:允许用户在视频中搜索特定的单词或短语

在数字化时代,视频已成为重要信息获取渠道。CTRL-F-VIDEO项目通过Chrome扩展提供视频内搜索功能,节省用户时间,利用OpenAI技术转换音频为文本实现精准搜索。项目性能出色,展示高效处理能力。

image.png

亮点提要:

⚙️ 视频搜索效率提升:用户可在YouTube视频中搜索特定内容,节省检索时间。

🔍 技术核心:文本搜索和时间轴标记、音频转文本、匹配词汇标记。

💡 创新可能性:项目开拓视频内容搜索、管理新思路,尽管初级阶段,性能表现优秀。

详情入口:🔗 https://top.aibase.com/tool/ctrl-f-video

B站UP主利用AI技术“复活”巨人族,引发广泛关注

本文介绍了B站UP主利用AI技术创造出看似真实的历史神话视频,引发130万播放量和讨论。观众对AI生成内容真实性产生讨论,网友展开“鉴定AI大赛”,探索视频细节。

image.png

亮点提要:

🎬 B站UP主通过AI技术创造出看似真实的历史神话视频

🤔 观众讨论AI生成内容真实性,虚实界限成焦点

💬 网友展开“鉴定AI大赛”,探索视频细节

详情:https://www.chinaz.com/2024/0417/1610688.shtml

免费AI音乐生成工具Sonauto

image.png

Sonauto是一款强大的在线音乐创作工具,通过人工智能技术使得每个人都可以成为音乐创作者。其核心优势在于编辑功能和用户友好操作界面,简化音乐创作流程。

亮点提要:

⚙️ 用户无需专业音乐制作技能,通过文本提示或歌词生成完整音乐作品

🎵 提供各种音乐风格选择,用户可进一步编辑和调整生成的音乐作品

🔓 适用于各类人群,包括音乐爱好者、独立音乐人、视频内容创作者等

详情入口:🔗 https://top.aibase.com/tool/sonauto-

MiniMax 稀宇科技发布万亿 MoE 模型abab6.5

MiniMax稀宇科技推出了abab6.5系列模型,是万亿MoE模型,展示出领先的大语言模型能力。abab6.5和abab6.5s将陆续更新到产品中,用户可通过海螺AI和MiniMax开放平台体验先进语言模型。

亮点提要:

⚙️ abab6.5系列包含abab6.5和abab6.5s两个模型,支持200k tokens的上下文长度。

💡 abab6.5s更高效,可在1秒内处理近3万字的文本,接近世界领先大语言模型水平。

🚀 abab6.5和abab6.5s将陆续更新到MiniMax产品中,包括海螺AI和MiniMax开放平台。

多模态语言模型Reka Core:可分析图片、视频、音频

Reka Core是一款性能强大、灵活部署的前沿多模态语言模型,具备多模态理解、超长上下文窗口、强大推理能力等关键能力,与业界领先模型媲美。与Snowflake、Oracle等领先技术平台和政府机构合作,推动多模态技术发展。

image.png

亮点提要:

🌟 Reka Core具备出色性能和灵活部署,可分析图片、视频、音频。

🔍 Core拥有多模态理解、超长上下文窗口、强大推理能力。

🤝 Reka与Snowflake、Oracle等合作推动多模态技术发展,助力客户实现数据价值最大化。

详情入口:🔗 https://top.aibase.com/tool/reka-core

性能超越LLaMA2-7B!AI模型JetMoE-8B训练成本不到10万美元

JetMoE-8B是一款采用稀疏激活架构的人工智能模型,性能超越LLaMA2-7B、LLaMA-13B和DeepseekMoE-16B,训练成本不到10万美元。其架构设计独特,计算成本低,参数激活效率高,训练全依赖公开数据且完全开源。在评估中表现优异,展示了高效性能和成本优势。

image.png

亮点提要:

⚙️ JetMoE-8B采用稀疏激活架构,性能超越多款AI模型

💡 独特设计使计算成本低,每个输入令牌激活效率高

🔗 JetMoE-8B训练完全依赖公开数据,整个过程完全开源

详情入口:🔗 https://huggingface.co/jetmoe/jetmoe-8b

Ollama软件更新:性能提升与新模型支持

Ollama软件最新更新带来了显著的性能提升和对多个热门模型的支持。优化了VRAM和GPU利用率,新增模型支持WizardLM2、Snowflake Arctic Embed等,提高了软件稳定性和灵活性。用户将更高效地完成任务,探索人工智能的新可能。

image.png

亮点提要:

🚀 优化VRAM和GPU利用率,减少内存错误,提升软件性能。

💡 新增模型支持WizardLM2、Snowflake Arctic Embed等,提高文本生成质量。

🔗 阅读详细介绍和模型下载地址,了解更多更新内容。

详细介绍:https://github.com/ollama/ollama/releases

模型下载:https://top.aibase.com/tool/ollama

37%专业人士使用生成式AI工具每周节省5-10小时

生成式人工智能工具带来效率提升,助力专业人士更高效工作。通过Generative AI工具,专业人士实现工作时间节省。

亮点提要:

⭐37% 的专业人士每周节省5-10小时

⭐ Generative AI 工具提升工作效率

⭐ 专业人士通过Generative AI工具实现工作时间节省

——————

每日midjourney prompt:证件照

1_1713335965584_ai2023_A_handsome_20_year_old_Chinese_man_Wear_a_White_shirt_ex_b2b1ec07-94dd-477d-9c8c-05c30538930e.png

图源备注:图片由AI生成,图片授权服务商Midjourney

垫图+A handsome20year old Chinese man Wear a White shirt, exquisieAsian face,A delicate appearance ,Korean style short hair, eyebrows and ears exposed,no makeup,front, one nch photo, stock photo,Blue background, studio lighting --ar5:7--no necklace or earrings --s250--iw2

一个英俊的20岁中国男人穿着白色衬衫,精致的亚洲人的脸,精致的外表,韩国风格的短发,露出眉毛和耳朵,没有化妆,正面,一英寸的照片,库存照片,蓝色背景,工作室照明--ar5:7-没有项链或耳环

1_1713336080137_ai2023_American_ID_photoA_beautiful_Chinese_woman_wearing_a_Whi_2a66319c-5c4e-4735-b611-181e311bebe2.png

图源备注:图片由AI生成,图片授权服务商Midjourney

American ID photo,A beautiful Chinese woman wearing a White shirt, short hair, leaking ears, one inch photo, stock photo, red background, studio lighting --ar5:7--s250

美式身份证照片,一位身穿白衬衫、短发、漏耳的中国美女,一英寸照片,库存照片,红色背景,摄影棚照明

举报

  • 相关推荐
  • 大家在看
  • AI Notebook:构建你的AI驱动的第二大脑。

    AI Notebook是一款AI驱动的笔记应用,旨在通过智能摘要、灵活捕捉以及各种样式来提升用户的生产力和学习效率。它能够无缝地组织文本、图片甚至音频,提供强大的笔记体验。AI Notebook通过AI助手提升生产力和学习,用户可以通过上传音频、文本、照片和YouTube链接来提问或使用AI进行头脑风暴。它还具备高质量的音频录制和实时转录功能,以及AI生成的摘要和模板,以及自动生成的闪卡和测验,帮助用户高效地创建、组织和复习所学内容。

  • AR2R:AI助手,解放人类创造力,提高生产力

    AR2R是一款旨在解放人类从日常琐事中,通过人工智能技术提高生产力和创造力的AI助手。它通过自然语言用户界面、定制训练的AI协调器以及一系列专业AI代理,为用户提供日程管理、决策支持、在线活动组织、任务提醒、详细跟进和流程自动化等功能。由拥有超过50,000名专家信赖的AI平台团队开发,AR2R致力于帮助用户专注于他们热爱的事情,而不是工作。

  • Rupt:防止账户共享,提高用户转化率

    Rupt是一个专注于防止账户共享的服务,它使用先进的AI算法来精确识别共享账户的行为,并将这些共享者转化为付费用户。该服务通过简单的SDK和集成,快速检测账户共享,提供个性化的用户体验,以确保用户在享受服务的同时,不会受到干扰。Rupt还提供了详细的分析和洞察,帮助企业优化产品并增加收入。

  • BypassAI:AI文本人性化工具,转换AI生成文本为人类风格。

    Bypass AI是一个AI到人类文本生成器工具,它创建类似人类的内容,确保看起来像是真人编写的,同时保持高原创性标准。它旨在通过先进的人性化技术避免AI检测并提高可读性。

  • Milvus:开源向量数据库,适用于开发者构建通用AI应用。

    Milvus是一个为开发者设计的开源向量数据库,专门用于大规模高维向量的相似性搜索。它支持pip安装,可以与流行的AI开发工具一起使用,并且能够扩展到数十亿个向量。Milvus以其高效的向量相似性搜索能力,帮助开发者构建强大且可扩展的图像检索系统,无论是管理个人照片库还是开发商业图像搜索应用程序,Milvus都提供了一个强大的基础,帮助开发者发掘图像集合中的潜在价值。

  • InstaDrag:快速高质量的基于拖拽的图像编辑技术

    InstaDrag 是一种快速高质量的基于拖拽的图像编辑技术,利用视频中的信息进行训练,能够在大约 1 秒内实现像素级控制。通过消除梯度导向等耗时操作,提高了编辑速度和准确性。该技术能够广泛应用于图像编辑领域。

  • Scale Leaderboard:AI模型性能评估平台

    Scale Leaderboard是一个专注于AI模型性能评估的平台,提供专家驱动的私有评估数据集,确保评估结果的公正性和无污染。该平台定期更新排行榜,包括新的数据集和模型,营造动态竞争环境。评估由经过严格审查的专家使用特定领域的方法进行,保证评估的高质量和可信度。

  • No-Code Scraper:无需编码即可从任何网站提取数据。

    No-Code Scraper是一个无需编码即可从任何网站提取数据的工具。它利用大型语言模型简化数据提取过程,使每个人都能轻松使用。该平台能够适应任何网站的变化,提供最简单和最快的网络抓取体验。

  • Biofy:一站式社交媒体链接管理平台

    Biofy是一个多功能的社交媒体链接管理平台,它允许用户通过一个链接整合所有社交媒体和在线内容,包括链接到应用商店、YouTube深层链接、URL缩短、QR码生成和分析等。Biofy特别适用于内容创作者、品牌和企业,帮助他们更有效地管理和推广自己的在线存在。

  • AI-Powered Sleep Story Generator:个性化AI助眠故事生成器,助你安然入梦

    AI-Powered Sleep Story Generator是一款创新的AI驱动工具,旨在帮助用户进入深度而宁静的睡眠。用户可以描述自己理想的睡眠场景,AI将利用最新技术制作出舒缓而沉浸式的音频故事,安抚心灵,帮助用户放松进入梦乡。该工具将个性化提升到新水平,根据用户的特定偏好和需求定制每个故事,无论是轻柔的自然声音、舒缓的叙述,还是两者的结合,AI技术都能确保完美适应用户的睡前例程。

  • Tap4 AI:提供免费 AI 工具目录,汇集各类 AI 工具并为用户提供最佳选择。

    Tap4 AI Directory 是一个提供免费 AI 工具目录的工具,旨在收集所有 AI 工具并为用户提供最佳选择。用户可以在 Tap4 AI 目录中找到各类 AI 工具,助力工作效率和创意。

  • Carteisa Sonic:低延迟语音模型,生成逼真语音

    Sonic是由Carteisa团队开发的低延迟语音模型,旨在为各种设备提供逼真的语音生成能力。该模型利用了创新的状态空间模型架构,以实现高分辨率音频和视频的高效、低延迟生成。Sonic模型的延迟仅为135毫秒,是同类模型中最快的。Carteisa团队专注于优化智能的效率,使它更快、更便宜、更易于访问。Sonic模型的发布,标志着实时对话式AI和长期记忆的计算平台的初步进展,预示着未来AI在实时游戏、客户支持等领域的新体验。

  • ViViD:视频虚拟试穿技术

    ViViD是一个利用扩散模型进行视频虚拟试穿的新框架。它通过设计服装编码器提取精细的服装语义特征,并引入轻量级姿态编码器以确保时空一致性,生成逼真的视频试穿效果。ViViD收集了迄今为止规模最大、服装类型最多样化、分辨率最高的视频虚拟试穿数据集。

  • xinsir:深度学习、表示学习、细粒度分类

    xinsir (qi) 是一个关于深度学习、表示学习和细粒度分类的产品。它提供了强大的功能和技术,具有主要优点和背景信息。该产品具有多个模型可供选择。

  • 腾讯元宝:是一个多功能工具,帮助用户轻松工作和享受多彩生活。

    腾讯元宝是一款集成了多种实用工具和服务的生产力工具,旨在提高用户工作效率和生活品质。其背景信息是由腾讯公司推出,定位为全面满足用户工作和生活需求的综合性工具。腾讯元宝提供了丰富的功能和服务,包括日程管理、文件存储、社交聊天、视频会议等,用户可以在一个平台上完成各种任务。

  • GPTResearcher:AI助力的快速洞察和全面研究助手

    GPT Researcher是一个领先的自主研究代理,专为多代理框架设计,提供实时、准确和事实性的结果。它能够简化数据收集,通过一个函数调用提供可信赖、聚合和策划的结果。它支持超过100种不同的大型语言模型(LLMs),并且可以与任何搜索引擎协作,从Google到DuckDuckGo。用户可以轻松搜索本地文档和文件,并生成超过2000字的长篇报告,支持多种格式的导出,如PDF、Word、Markdown、JSON和CSV。

  • DenserRetriever:先进的AI检索器,用于RAG。

    DenserRetriever是一个开源的AI检索模型,专为RAG(Retrieval-Augmented Generation)设计,利用社区协作的力量,采用XGBoost机器学习技术有效结合异构检索器,旨在满足大型企业的需求,并且易于部署,支持docker快速启动。它在MTEB检索基准测试中达到了最先进的准确性,并且Hugging Face排行榜上也有其身影。

  • Groqbook:使用Groq和Llama3快速生成整本书

    Groqbook是一个基于Streamlit的应用程序,它利用Llama3在Groq上从一行提示快速构建书籍。它适用于非小说类书籍的创作,并能在几秒钟内生成每一章节。该应用程序混合使用Llama3-8b和Llama3-70b模型,利用较大的模型生成结构,较小的模型创造内容。目前,模型仅使用章节标题的上下文来生成章节内容。未来,这将扩展到书籍的完整上下文,以允许Groqbook生成高质量的小说书籍。

  • MusePose:虚拟人物生成的图像到视频框架

    MusePose是由腾讯音乐娱乐的Lyra Lab开发的一款图像到视频的生成框架,旨在通过姿势控制信号生成虚拟人物的视频。它是Muse开源系列的最后一个构建块,与MuseV和MuseTalk一起,旨在推动社区向生成具有全身运动和交互能力的虚拟人物的愿景迈进。MusePose基于扩散模型和姿势引导,能够生成参考图像中人物的舞蹈视频,并且结果质量超越了当前几乎所有同一主题的开源模型。

  • Codestral-22B-v0.1:一款支持80+编程语言的AI代码生成模型

    Codestral-22B-v0.1是由Mistral AI Team开发的大型语言模型,它经过了80多种编程语言的训练,包括Python、Java、C、C++、JavaScript和Bash等。该模型能够根据指令生成代码,或对代码片段进行解释、重构等。它还支持Fill in the Middle (FIM)功能,用于预测代码中的中间部分,特别适合软件开发工具的插件使用,如VS Code。该模型目前没有内容审查机制,但开发团队正在寻求社区合作,以实现在需要内容审查的环境中部署。

今日大家都在搜的词: