首页 > 业界 > 关键词  > 天工SkyMusic最新资讯  > 正文

AI日报:天工SkyMusic开启公测;UP主用AI技术“复活”巨人族;通义千问开源代码模型CodeQwen1.5;免费AI音乐生成工具Sonauto

2024-04-17 16:11 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

昆仑万维「天工3.0」与「天工SkyMusic」音乐大模型开启公测

昆仑万维推出的「天工3.0」和「天工SkyMusic」音乐大模型开启公测,彰显了其在AI领域的技术实力和创新能力。这两款大模型在语义理解、音乐生成等领域展现出卓越性能,为用户提供更强大的AI体验。

image.png

亮点提要:

⚙️「天工3.0」拥有超过4000亿参数,是全球最大的开源MoE大模型,具有突破性性能提升。

🎵「天工SkyMusic」是中国首个音乐SOTA模型,支持多种方言,具有端到端音乐生成能力。

🔍「天工3.0」拥有多轮搜索、图表绘制、研究模式等AI能力,「天工SkyMusic」支持参考音乐生成和方言歌曲生成。

详情入口:🔗 https://top.aibase.com/tool/tiangongskymusic

通义千问开源基于Qwen1.5的代码模型CodeQwen1.5

基于Qwen 语言模型的代码专家模型CodeQwen1.5,具有7B 参数、GQA 架构和支持92种编程语言的特点。CodeQwen1.5在代码生成、长序列建模、代码修改和 SQL 能力等方面表现出色,极大提升了开发人员的工作效率。

image.png

亮点提要:

⭐ CodeQwen1.5拥有7B 参数,支持92种编程语言。

⭐ 在代码生成、长序列建模、代码修改和 SQL 能力方面表现出色。

⭐ 在多语言编程、长序列支持和代码修改方面展现出卓越能力。

详情入口:🔗 https://qwenlm.github.io/zh/blog/codeqwen1.5/

Spline发布3D生成工具AI3D Generation

Spline发布的最新3D生成工具标志着3D设计领域的重大进步,提供直观易用的界面、丰富的资源库和模板、先进的AI辅助设计以及团队合作功能。

image.png

亮点提要:

🌟直观易用的界面,适合3D设计初学者快速上手

🎨丰富的资源库和模板加速设计过程

🤖先进的AI辅助设计提升作品专业品质

详情入口:🔗 https://top.aibase.com/tool/spline-ai

CTRL-F-VIDEO:允许用户在视频中搜索特定的单词或短语

在数字化时代,视频已成为重要信息获取渠道。CTRL-F-VIDEO项目通过Chrome扩展提供视频内搜索功能,节省用户时间,利用OpenAI技术转换音频为文本实现精准搜索。项目性能出色,展示高效处理能力。

image.png

亮点提要:

⚙️ 视频搜索效率提升:用户可在YouTube视频中搜索特定内容,节省检索时间。

🔍 技术核心:文本搜索和时间轴标记、音频转文本、匹配词汇标记。

💡 创新可能性:项目开拓视频内容搜索、管理新思路,尽管初级阶段,性能表现优秀。

详情入口:🔗 https://top.aibase.com/tool/ctrl-f-video

B站UP主利用AI技术“复活”巨人族,引发广泛关注

本文介绍了B站UP主利用AI技术创造出看似真实的历史神话视频,引发130万播放量和讨论。观众对AI生成内容真实性产生讨论,网友展开“鉴定AI大赛”,探索视频细节。

image.png

亮点提要:

🎬 B站UP主通过AI技术创造出看似真实的历史神话视频

🤔 观众讨论AI生成内容真实性,虚实界限成焦点

💬 网友展开“鉴定AI大赛”,探索视频细节

详情:https://www.chinaz.com/2024/0417/1610688.shtml

免费AI音乐生成工具Sonauto

image.png

Sonauto是一款强大的在线音乐创作工具,通过人工智能技术使得每个人都可以成为音乐创作者。其核心优势在于编辑功能和用户友好操作界面,简化音乐创作流程。

亮点提要:

⚙️ 用户无需专业音乐制作技能,通过文本提示或歌词生成完整音乐作品

🎵 提供各种音乐风格选择,用户可进一步编辑和调整生成的音乐作品

🔓 适用于各类人群,包括音乐爱好者、独立音乐人、视频内容创作者等

详情入口:🔗 https://top.aibase.com/tool/sonauto-

MiniMax 稀宇科技发布万亿 MoE 模型abab6.5

MiniMax稀宇科技推出了abab6.5系列模型,是万亿MoE模型,展示出领先的大语言模型能力。abab6.5和abab6.5s将陆续更新到产品中,用户可通过海螺AI和MiniMax开放平台体验先进语言模型。

亮点提要:

⚙️ abab6.5系列包含abab6.5和abab6.5s两个模型,支持200k tokens的上下文长度。

💡 abab6.5s更高效,可在1秒内处理近3万字的文本,接近世界领先大语言模型水平。

🚀 abab6.5和abab6.5s将陆续更新到MiniMax产品中,包括海螺AI和MiniMax开放平台。

多模态语言模型Reka Core:可分析图片、视频、音频

Reka Core是一款性能强大、灵活部署的前沿多模态语言模型,具备多模态理解、超长上下文窗口、强大推理能力等关键能力,与业界领先模型媲美。与Snowflake、Oracle等领先技术平台和政府机构合作,推动多模态技术发展。

image.png

亮点提要:

🌟 Reka Core具备出色性能和灵活部署,可分析图片、视频、音频。

🔍 Core拥有多模态理解、超长上下文窗口、强大推理能力。

🤝 Reka与Snowflake、Oracle等合作推动多模态技术发展,助力客户实现数据价值最大化。

详情入口:🔗 https://top.aibase.com/tool/reka-core

性能超越LLaMA2-7B!AI模型JetMoE-8B训练成本不到10万美元

JetMoE-8B是一款采用稀疏激活架构的人工智能模型,性能超越LLaMA2-7B、LLaMA-13B和DeepseekMoE-16B,训练成本不到10万美元。其架构设计独特,计算成本低,参数激活效率高,训练全依赖公开数据且完全开源。在评估中表现优异,展示了高效性能和成本优势。

image.png

亮点提要:

⚙️ JetMoE-8B采用稀疏激活架构,性能超越多款AI模型

💡 独特设计使计算成本低,每个输入令牌激活效率高

🔗 JetMoE-8B训练完全依赖公开数据,整个过程完全开源

详情入口:🔗 https://huggingface.co/jetmoe/jetmoe-8b

Ollama软件更新:性能提升与新模型支持

Ollama软件最新更新带来了显著的性能提升和对多个热门模型的支持。优化了VRAM和GPU利用率,新增模型支持WizardLM2、Snowflake Arctic Embed等,提高了软件稳定性和灵活性。用户将更高效地完成任务,探索人工智能的新可能。

image.png

亮点提要:

🚀 优化VRAM和GPU利用率,减少内存错误,提升软件性能。

💡 新增模型支持WizardLM2、Snowflake Arctic Embed等,提高文本生成质量。

🔗 阅读详细介绍和模型下载地址,了解更多更新内容。

详细介绍:https://github.com/ollama/ollama/releases

模型下载:https://top.aibase.com/tool/ollama

37%专业人士使用生成式AI工具每周节省5-10小时

生成式人工智能工具带来效率提升,助力专业人士更高效工作。通过Generative AI工具,专业人士实现工作时间节省。

亮点提要:

⭐37% 的专业人士每周节省5-10小时

⭐ Generative AI 工具提升工作效率

⭐ 专业人士通过Generative AI工具实现工作时间节省

——————

每日midjourney prompt:证件照

1_1713335965584_ai2023_A_handsome_20_year_old_Chinese_man_Wear_a_White_shirt_ex_b2b1ec07-94dd-477d-9c8c-05c30538930e.png

图源备注:图片由AI生成,图片授权服务商Midjourney

垫图+A handsome20year old Chinese man Wear a White shirt, exquisieAsian face,A delicate appearance ,Korean style short hair, eyebrows and ears exposed,no makeup,front, one nch photo, stock photo,Blue background, studio lighting --ar5:7--no necklace or earrings --s250--iw2

一个英俊的20岁中国男人穿着白色衬衫,精致的亚洲人的脸,精致的外表,韩国风格的短发,露出眉毛和耳朵,没有化妆,正面,一英寸的照片,库存照片,蓝色背景,工作室照明--ar5:7-没有项链或耳环

1_1713336080137_ai2023_American_ID_photoA_beautiful_Chinese_woman_wearing_a_Whi_2a66319c-5c4e-4735-b611-181e311bebe2.png

图源备注:图片由AI生成,图片授权服务商Midjourney

American ID photo,A beautiful Chinese woman wearing a White shirt, short hair, leaking ears, one inch photo, stock photo, red background, studio lighting --ar5:7--s250

美式身份证照片,一位身穿白衬衫、短发、漏耳的中国美女,一英寸照片,库存照片,红色背景,摄影棚照明

举报

  • 相关推荐
  • AI日报:通义千问开源Qwen3向量模型;字节跳动图像编辑模型SeedEdit 3.0;ElevenLabs推v3语音模型

    本文汇总了近期AI领域的重要动态:1)通义千问发布Qwen3-Embedding系列模型,在多语言文本处理表现优异;2)字节跳动推出图像编辑模型SeedEdit3.0,提升细节保持能力;3)ElevenLabs发布情感语音合成系统Eleven v3 Alpha;4)Anthropic推出面向国家安全的Claude Gov模型;5)可灵AI月收入连续两月超1亿元;6)Meta公布智能眼镜Aria Gen2技术细节;7)爱诗科技上线AI视频工具"拍我AI";8)富国银行预测2030年ChatGPT广告收入将达千亿美元。

  • AI日报:通义千问3大模型全球爆火;即梦图片3.0智能参考全量上线;智谱AI企业级超级助手Agent CoCo上线

    【AI日报】今日AI领域重要动态:1.通义千问3大模型全球下载量超1250万,衍生模型13万+;2.即梦图片3.0上线,AI设计进入"零门槛"时代;3.智谱AI发布企业级超级助手Agent CoCo;4.百度推出金融行业大模型"千帆慧金";5.小红书开源首个大模型dots.llm1,含1420亿参数;6.Hugging Face开源LeRobot项目,降低机器人研发门槛;7.ChatGPT语音功能升级,支持更自然对话翻译;8.Google Gemini应用下载量超ChatGPT但活跃度不足;9.轻量级文档解析模型MonkeyOCR表现优异;10.Google Veo3推出高速视频生成模式;11.Google调整AI Studio政策,限制Gemini2.5Pro免费访问。

  • AI日报:腾讯混元3D 2.1大模型开源;字节跳动AI Lab负责人李航卸任;OpenAI Codex 全新升级

    本文介绍了AI领域最新动态:1)腾讯开源混元3D2.1大模型,提升3D生成质量;2)OpenAI Codex升级,优化代码生成功能;3)字节跳动AI Lab负责人李航卸任;4)微软发布700个AI应用案例;5)微软推出Code Researcher工具,解决58%系统崩溃问题;6)Observer AI实现屏幕操作自动化;7)Genspark发布AI浏览器;8)麻省理工用AI技术3.5小时修复15世纪名画;9)蚂蚁集团推出开源多模态GPT-4o模型Ming-Omni;10)MagicTryOn视频换衣框架;11)字节跳动发布实时互动AI视频生成模型Seaweed APT2;12)ChatGPT搜索功能升级;13)字节跳动与老凤祥合作开发AI智能眼镜。

  • AI日报:美团AI编程工具NoCode将上线;火山引擎发布MCP Servers;腾讯混元上线游戏视觉生成平台

    本文汇总了近期AI领域的重要动态:1)美团将推出对话式编程工具"NoCode";2)火山引擎发布大模型生态平台MCP Servers;3)B站开源动画视频生成模型Index-AniSora;4)字节跳动升级AI耳机Ola Friend的英语学习功能;5)GitHub推出AI编程助手自动修复代码漏洞;6)腾讯混元上线游戏视觉生成平台;7)微软将VS Code转型为开源AI编辑器;8)Windows 11原生支持MCP协议;9)Anthropic发布AI代理开发指南;10)谷歌推出编程AI代理Jules;11)NotebookLM推出iOS版;12)Genspark创3600万美元ARR纪录;13)Bright Data发布开源MCP服务器;14)马斯克宣布Grok模型将登陆Azure平台。这些进展展示了AI技术在编程、内容生成、操作系统等领域的快速发展和应用创新。

  • AI日报:QQ浏览器升级为AI浏览器;OpenAI全新编程智能体Codex;B站团队推动漫视频生成模型AniSora

    本文介绍了AI领域多项最新进展:1)B站团队推出开源动漫视频生成模型AniSora,支持多种风格创作;2)OpenAI发布编程智能体Codex,提升开发效率;3)Google测试AI问答功能AI Mode;4)ChatGPT将整合MCP协议,支持第三方AI服务对接;5)阿里推出ZeroSearch框架,减少对搜索引擎的依赖;6)Stability AI与Arm合作推出手机端音频生成AI;7)Qwen发布WorldPM系列大模型;8)GPT-5将整合多款产品功能;9)ListenHub上线AI播客生成工具;10)QQ浏览器升级为AI浏览器;11)数学建模AI助手MathModelAgent面世;12)GenSpark推出全球首个智能下载代理;13)谷歌NotebookLM将推出视频摘要功能。这些创新展现了AI技术在各领域的快速发展和广泛应用。

  • AI日报:美团No Code平台免费开放;豆包App升级“一句话P图”功能;苹果Xcode 26内置ChatGPT等AI功能

    本文介绍了AI领域多项重要进展:1)美团推出No Code平台和1680个AI应用;2)豆包App升级"一句话P图"功能;3)苹果发布内置ChatGPT的Xcode26开发工具;4)iOS26新增视觉智能功能;5)讯飞星火X1升级版即将发布;6)比亚迪接入阿里通义大模型;7)DeepSeek支持本地工具调用;8)开源框架Rowboat支持快速构建智能助手;9)X平台整合Grok AI优化内容推荐;10)港科大开发进化搜索技术提升小模型图像生成能力;11)硅基流动完成数亿元融资;12)港大与英伟达合作开发新型视觉注意力机制。这些创新展示了AI技术在各领域的快速发展和应用突破。

  • AI日报:Anthropic推最强编码AI模型Claude4;苹果计划推AI智能眼镜;QQ浏览器上线首个高考Agent

    【AI日报】今日AI领域重要动态:1)Anthropic发布Claude4系列AI模型,编程能力超越竞争对手;2)苹果计划2026年推出集成AI技术的智能眼镜;3)字节跳动与清华合作推出时序多模态大模型ChatTS;4)3DTown框架实现单张照片生成逼真3D场景;5)OpenAI秘密开发无屏幕AI设备;6)商汤科技推出儿童AI下棋机器人;7)微软记事本新增AI写作功能;8)深圳设立70亿元基金支持AI硬件初创企业;9)谷歌发布3D视频通信平台Beam;10)阿联酋推出"星际之门"计划,免费提供ChatGPT服务;11)法国Mistral推出开源模型Devstral;12)Anthropic API新增四大功能;13)美国众议院通过法案限制各州监管AI;14)QQ浏览器推出高考AI助手。

  • 小白如何用海绵音乐生成AI音乐?

    本教程介绍如何利用AI音乐生成工具"海绵音乐"零基础创作个性化音乐。通过输入情绪(治愈/欢快)、乐器(钢琴/吉他)、节奏(慢/中/快)等关键词,AI可快速生成适合短视频配乐、背景音乐等场景的原创音乐。操作流程简单:注册账号→输入关键词→生成试听→下载使用。关键技巧包括使用具体关键词组合、多次调整优化。注意商用需确认版权,部分功能需付费。该工具让音

  • AI日报:阿里开源长文本深度思考模型QwenLong-L1;GPT-4o语音模式上线唱歌功能;秘塔AI搜索推出全新“极速”模型

    本文汇总了AI领域最新动态:1)中国信通院发布智能体开发标准,推动AI商业化进程;2)阿里推出QwenLong-L1-32B长文本推理模型,性能媲美Claude-3;3)GPT-4o语音模式升级,新增唱歌功能;4)秘塔AI搜索推出极速模型,响应速度达400tokens/秒;5)谷歌发布LMEval评估框架,统一大模型评测标准;6)Chrome浏览器集成Gemini AI助手;7)阿联酋全民免费使用ChatGPT Plus;8)苏州成立60亿元AI产业基金;9)法国Kyutai实验室推出10秒定制语音的Unmute系统;10)UAV-Flow项目实现无人机语音精准控制;11)Claude将升级支持百万字上下文和记忆功能;12)百度心响iOS版上线;13)夸克推出高考深度搜索功能;14)Chrome v137开发者工具升级;15)美团AI业务接近GPT-4o水平;16)Direct3D-S2实现3D生成速度提升10倍;17)OpenAI计划2026年推出首款AI硬件。

  • AI日报: ChatGPT免费开放记忆功能;华为WATCH 5智能手表接入双大模型;Claude Pro升级重磅功能

    本期AI日报主要报道了多项AI领域重要进展:1)OpenAI向所有ChatGPT用户免费开放记忆功能;2)蚂蚁集团推出"AI健康管家",服务4000万用户;3)Anthropic与DeepLearning.AI合作推出免费MCP课程;4)谷歌DeepMind开发无需3D模型即可生成逼真运动视频的新技术;5)Exa与OpenRouter合作为400+大模型提供实时网络搜索功能;6)中国知网推出CNKI AI学术研究助手;7)Anthropic推出Claude Explains博客项目;8)Claude Pro新增研究模式和远程MCP整合功能;9)Fish Audio发布基于200万小时数据训练的OpenAudio S1语音模型;10)OpenAI升级Codex编程工具;11)华为WATCH5接入盘古和DeepSeek双大模型。