首页 > 业界 > 关键词  > 天工SkyMusic最新资讯  > 正文

AI日报:天工SkyMusic开启公测;UP主用AI技术“复活”巨人族;通义千问开源代码模型CodeQwen1.5;免费AI音乐生成工具Sonauto

2024-04-17 16:11 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

昆仑万维「天工3.0」与「天工SkyMusic」音乐大模型开启公测

昆仑万维推出的「天工3.0」和「天工SkyMusic」音乐大模型开启公测,彰显了其在AI领域的技术实力和创新能力。这两款大模型在语义理解、音乐生成等领域展现出卓越性能,为用户提供更强大的AI体验。

image.png

亮点提要:

⚙️「天工3.0」拥有超过4000亿参数,是全球最大的开源MoE大模型,具有突破性性能提升。

🎵「天工SkyMusic」是中国首个音乐SOTA模型,支持多种方言,具有端到端音乐生成能力。

🔍「天工3.0」拥有多轮搜索、图表绘制、研究模式等AI能力,「天工SkyMusic」支持参考音乐生成和方言歌曲生成。

详情入口:🔗 https://top.aibase.com/tool/tiangongskymusic

通义千问开源基于Qwen1.5的代码模型CodeQwen1.5

基于Qwen 语言模型的代码专家模型CodeQwen1.5,具有7B 参数、GQA 架构和支持92种编程语言的特点。CodeQwen1.5在代码生成、长序列建模、代码修改和 SQL 能力等方面表现出色,极大提升了开发人员的工作效率。

image.png

亮点提要:

⭐ CodeQwen1.5拥有7B 参数,支持92种编程语言。

⭐ 在代码生成、长序列建模、代码修改和 SQL 能力方面表现出色。

⭐ 在多语言编程、长序列支持和代码修改方面展现出卓越能力。

详情入口:🔗 https://qwenlm.github.io/zh/blog/codeqwen1.5/

Spline发布3D生成工具AI3D Generation

Spline发布的最新3D生成工具标志着3D设计领域的重大进步,提供直观易用的界面、丰富的资源库和模板、先进的AI辅助设计以及团队合作功能。

image.png

亮点提要:

🌟直观易用的界面,适合3D设计初学者快速上手

🎨丰富的资源库和模板加速设计过程

🤖先进的AI辅助设计提升作品专业品质

详情入口:🔗 https://top.aibase.com/tool/spline-ai

CTRL-F-VIDEO:允许用户在视频中搜索特定的单词或短语

在数字化时代,视频已成为重要信息获取渠道。CTRL-F-VIDEO项目通过Chrome扩展提供视频内搜索功能,节省用户时间,利用OpenAI技术转换音频为文本实现精准搜索。项目性能出色,展示高效处理能力。

image.png

亮点提要:

⚙️ 视频搜索效率提升:用户可在YouTube视频中搜索特定内容,节省检索时间。

🔍 技术核心:文本搜索和时间轴标记、音频转文本、匹配词汇标记。

💡 创新可能性:项目开拓视频内容搜索、管理新思路,尽管初级阶段,性能表现优秀。

详情入口:🔗 https://top.aibase.com/tool/ctrl-f-video

B站UP主利用AI技术“复活”巨人族,引发广泛关注

本文介绍了B站UP主利用AI技术创造出看似真实的历史神话视频,引发130万播放量和讨论。观众对AI生成内容真实性产生讨论,网友展开“鉴定AI大赛”,探索视频细节。

image.png

亮点提要:

🎬 B站UP主通过AI技术创造出看似真实的历史神话视频

🤔 观众讨论AI生成内容真实性,虚实界限成焦点

💬 网友展开“鉴定AI大赛”,探索视频细节

详情:https://www.chinaz.com/2024/0417/1610688.shtml

免费AI音乐生成工具Sonauto

image.png

Sonauto是一款强大的在线音乐创作工具,通过人工智能技术使得每个人都可以成为音乐创作者。其核心优势在于编辑功能和用户友好操作界面,简化音乐创作流程。

亮点提要:

⚙️ 用户无需专业音乐制作技能,通过文本提示或歌词生成完整音乐作品

🎵 提供各种音乐风格选择,用户可进一步编辑和调整生成的音乐作品

🔓 适用于各类人群,包括音乐爱好者、独立音乐人、视频内容创作者等

详情入口:🔗 https://top.aibase.com/tool/sonauto-

MiniMax 稀宇科技发布万亿 MoE 模型abab6.5

MiniMax稀宇科技推出了abab6.5系列模型,是万亿MoE模型,展示出领先的大语言模型能力。abab6.5和abab6.5s将陆续更新到产品中,用户可通过海螺AI和MiniMax开放平台体验先进语言模型。

亮点提要:

⚙️ abab6.5系列包含abab6.5和abab6.5s两个模型,支持200k tokens的上下文长度。

💡 abab6.5s更高效,可在1秒内处理近3万字的文本,接近世界领先大语言模型水平。

🚀 abab6.5和abab6.5s将陆续更新到MiniMax产品中,包括海螺AI和MiniMax开放平台。

多模态语言模型Reka Core:可分析图片、视频、音频

Reka Core是一款性能强大、灵活部署的前沿多模态语言模型,具备多模态理解、超长上下文窗口、强大推理能力等关键能力,与业界领先模型媲美。与Snowflake、Oracle等领先技术平台和政府机构合作,推动多模态技术发展。

image.png

亮点提要:

🌟 Reka Core具备出色性能和灵活部署,可分析图片、视频、音频。

🔍 Core拥有多模态理解、超长上下文窗口、强大推理能力。

🤝 Reka与Snowflake、Oracle等合作推动多模态技术发展,助力客户实现数据价值最大化。

详情入口:🔗 https://top.aibase.com/tool/reka-core

性能超越LLaMA2-7B!AI模型JetMoE-8B训练成本不到10万美元

JetMoE-8B是一款采用稀疏激活架构的人工智能模型,性能超越LLaMA2-7B、LLaMA-13B和DeepseekMoE-16B,训练成本不到10万美元。其架构设计独特,计算成本低,参数激活效率高,训练全依赖公开数据且完全开源。在评估中表现优异,展示了高效性能和成本优势。

image.png

亮点提要:

⚙️ JetMoE-8B采用稀疏激活架构,性能超越多款AI模型

💡 独特设计使计算成本低,每个输入令牌激活效率高

🔗 JetMoE-8B训练完全依赖公开数据,整个过程完全开源

详情入口:🔗 https://huggingface.co/jetmoe/jetmoe-8b

Ollama软件更新:性能提升与新模型支持

Ollama软件最新更新带来了显著的性能提升和对多个热门模型的支持。优化了VRAM和GPU利用率,新增模型支持WizardLM2、Snowflake Arctic Embed等,提高了软件稳定性和灵活性。用户将更高效地完成任务,探索人工智能的新可能。

image.png

亮点提要:

🚀 优化VRAM和GPU利用率,减少内存错误,提升软件性能。

💡 新增模型支持WizardLM2、Snowflake Arctic Embed等,提高文本生成质量。

🔗 阅读详细介绍和模型下载地址,了解更多更新内容。

详细介绍:https://github.com/ollama/ollama/releases

模型下载:https://top.aibase.com/tool/ollama

37%专业人士使用生成式AI工具每周节省5-10小时

生成式人工智能工具带来效率提升,助力专业人士更高效工作。通过Generative AI工具,专业人士实现工作时间节省。

亮点提要:

⭐37% 的专业人士每周节省5-10小时

⭐ Generative AI 工具提升工作效率

⭐ 专业人士通过Generative AI工具实现工作时间节省

——————

每日midjourney prompt:证件照

1_1713335965584_ai2023_A_handsome_20_year_old_Chinese_man_Wear_a_White_shirt_ex_b2b1ec07-94dd-477d-9c8c-05c30538930e.png

图源备注:图片由AI生成,图片授权服务商Midjourney

垫图+A handsome20year old Chinese man Wear a White shirt, exquisieAsian face,A delicate appearance ,Korean style short hair, eyebrows and ears exposed,no makeup,front, one nch photo, stock photo,Blue background, studio lighting --ar5:7--no necklace or earrings --s250--iw2

一个英俊的20岁中国男人穿着白色衬衫,精致的亚洲人的脸,精致的外表,韩国风格的短发,露出眉毛和耳朵,没有化妆,正面,一英寸的照片,库存照片,蓝色背景,工作室照明--ar5:7-没有项链或耳环

1_1713336080137_ai2023_American_ID_photoA_beautiful_Chinese_woman_wearing_a_Whi_2a66319c-5c4e-4735-b611-181e311bebe2.png

图源备注:图片由AI生成,图片授权服务商Midjourney

American ID photo,A beautiful Chinese woman wearing a White shirt, short hair, leaking ears, one inch photo, stock photo, red background, studio lighting --ar5:7--s250

美式身份证照片,一位身穿白衬衫、短发、漏耳的中国美女,一英寸照片,库存照片,红色背景,摄影棚照明

举报

  • 相关推荐
  • A日报:月之暗面开源大模型Kimi K2;智源全面开源RoboBrain2.0;通义千问发布Qwen Chat桌面客户端

    本期AI日报重点报道了多项AI领域突破性进展:1.月之暗面推出万亿参数开源大模型Kimi K2,展现强大智能能力;2.智源研究院开源RoboBrain2.0和RoboOS2.0机器人系统;3.通义千问发布桌面客户端Qwen Chat;4.IndexTTS2实现影视级语音合成;5.HuggingFace开源机器人Reachy Mini热销;6.Meta推出实时视频生成模型StreamDiT;7.PixVerse新增多关键帧视频生成功能;8.特斯拉推出仅支持AMD处理器的Grok AI助手;9.OpenAI推迟开源大模型发布以加强安全测试;10.Liquid AI开源边缘AI模型LFM2;11.AI"时间穿越"特效在社交媒体走红。

  • 「6月30日AI日报」百度开源文心大模型4.5系列;通义千问发布多模态生成模型Qwen VLo

    AI日报精选:1)百度开源文心大模型4.5系列,含10款新模型,性能优异;2)通义千问发布多模态模型Qwen-VL,支持图文交互;3)阿里开源3亿参数多模态模型Ovis-U1;4)华为开源盘古7B稠密和72B混合专家模型;5)美图MOKI推出AI创意广告功能,一键生成专业视频;6)谷歌Gemini 2.5 Pro API重新免费开放;7)豆瓣上线"深入研究"AI功能;8)小米"AI百宝箱"结束内测;9)北京智研院开源多模态系统OmniGen2;10)知乎升级"直答"知识库功能。

  • AI日报:智谱上线PPT生成功能AI Slides;可灵 AI 发布可图2.1模型

    本文介绍了AI日报栏目及近期AI领域多项突破性进展:1)智谱推出免费AI Slides工具,基于GLM模型快速生成高质量PPT;2)可灵AI发布可图2.1模型,支持180多种风格图像生成;3)NVIDIA推出DiffusionRenderer技术,实现视频到可编辑3D场景转换;4)墨刀AI新增30秒生成高保真原型功能;5)Higgsfield推出Soul ID工具,10张照片即可生成虚拟形象;6)谷歌DeepMind开源GenAI Processors工具库;7)谷歌Veo新增图像转视频功能;8)Mistral AI发布专为代码建模的Devstral2507系列模型。这些创新展示了AI在内容生成、3D建模、产品设计等领域的快速发展。

  • AI日报:美图发布影像AI Agent RoboNeo;1.8bit量化Kimi K2模型上线;亚马逊推AI代码编辑器 Kiro

    【AI日报】今日AI领域重要动态:1)美图推出RoboNeo,通过自然语言指令实现图片精修、品牌设计等全能影像处理;2)Unsloth AI将Kimi K2模型量化至1.8bit,体积缩减78%保持性能;3)谷歌Gemini嵌入模型登顶MTEB榜单,超越OpenAI;4)亚马逊发布免费AI代码编辑器Kiro,集成Claude模型;5)Claude新增应用工具目录功能提升工作效率;6)MiniMax完成近3亿美元融资,估值超40亿美元;7)UTCP新协议让AI代理直

  • AI日报:12306 MCP Server上线;百度推AI搜索助手Tizzy.ai;ChatGPT录音模式面向Plus用户开放

    【AI日报】今日AI领域重要动态:1)百度推出无广告智能搜索助手Tizzy.ai,整合影视资源与深度思考功能;2)12306开源火车票查询引擎上线,采用FastAPI架构实现秒级响应;3)ChatGPT向Plus用户全面开放录音功能,支持实时记录与内容总结;4)开源SaaS模板FireGEO助力快速构建现代化Web应用;5)国产工具ReadMeX可一键生成高质量GitHub文档;6)百度AI助手新增视频通话功能,支持方言识别;7)Jacky

  • ppt自动生成工具最好用的3个

    文章介绍了当前AI生成PPT工具的发展现状,重点推荐了"秒出PPT"这一专业平台。该平台具有三大特色功能:1)智能对话式生成,支持中途修改需求;2)提供三种编辑模式(纯文本、纯设计和文本+设计);3)支持导入文档自动排版,提供"保持原文"和"AI智能修改"两种模式。平台还拥有丰富的模板库,支持在线更换颜色、字体等设计元素。虽然需要购买会员,但相比市面上质量参差不齐的同类产品,该工具在交互体验和功能完整性上表现突出。

  • OpenAI发布ChatGPT Agent智能体:支持写代码、做PPT、分析金融

    OpenAI推出ChatGPT智能体,整合网页交互、数据搜索与多模态协作功能,可完成代码生成、PPT制作、金融分析等复杂任务。该智能体融合Operator的网页自动化操作、Deep Research的数据分析能力及优化后的GPT-4对话引擎三大核心模块。目前面向付费用户开放,Pro版近乎无限使用,其他版本每月限50次任务。OpenAI承认其仍存在金融建模需人工验证、非英语文本解析准确率低等技术局限,并

  • 硬核评测UP主,正在成为这届网友的“赛博导购”

    ​每年6月,B站UP主“笔吧评测室”(下称“笔吧”)的评论区就准时热闹起来。 高考结束的学生们急切地留下各种关于笔记本电脑的选购问题,“笔吧”随之跟进,推出电脑“横评”选购指南,在一条视频中对多款同类型产品进行评测。 今年618选购指南里,“笔吧”就一口气横评了9档价位的50台笔记本电脑。这几乎成了B站数码区的固定节目,被观众称为“笔吧春晚”。 每

  • AI日报:字节将发布AI编程工具TRAE2.0版本;Mistral重磅推出音频模型Voxtral;月之暗面回应Kimi K2 API速度慢

    AI日报栏目聚焦AI领域最新动态:1)字节跳动将发布TRAE 2.0编程工具,新增语音交互功能;2)Mistral推出开源音频模型Voxtral,支持多语言;3)月之暗面回应Kimi K2API速度慢问题,正在优化系统;4)昆仑万维发布AgentOrchestra框架,实现多智能体协作;5)OpenAI前CTO创立的Thinking Machines Lab获20亿美元融资;6)Kimi-2上线,性能超越GPT-4.1;7)TRAE推出Kimi-K2模型服务,国际版支持Grok-4;8)字节跳动Seed�

  • AI日报:阿里通义开源音频生成模型ThinkSound;谷歌Veo3支态图片生成视频;昆仑万维发布 Skywork-R1V 3.0

    【AI日报】今日AI领域重要动态:1)阿里开源支持链式推理的音频生成模型ThinkSound,实现高保真空间音频生成;2)谷歌Veo3升级,支持静态图片生成生动视频;3)Hugging Face发布30亿参数小模型SmolLM3,性能优于Llama-3.2-3B;4)阿里开源网络智能体WebSailor,展现强大推理和检索能力;5)Moonvalley发布原生1080P视频生成模型Marey Realism v1.5;6)Vidu Q1支持最多七张参考图像生成一致性视频;7)苹果�