AI日报：北大Open Sora视频生成更强了；文心一言可以定制你自己的声音；天工 SkyMusic即将免费开放；比Suno好10倍AI音乐应用xgboost曝光

2024-04-08 15:15 · 稿源：站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解：https://top.aibase.com/

QQ截图20240408153205.png

🤖📱💼AI应用

北大Open Sora视频生成更强了!时长可达10秒，分辨率更高

QQ截图20240408092545.png

【AiBase提要:】
⭐️ Open-Sora-Plan v1.0.0模型发布显著提升视频生成质量和文本控制能力
⭐️ 支持华为昇腾910b芯片，提升运行效率和质量。
⭐️ 该模型能够生成10秒、24FPS的1024×1024高清视频，同时还支持生成高分辨率图像
项目地址:https://top.aibase.com/tool/open-sora-plan

文心一言APP上线定制专属声音功能

微信截图_20240407145259.png

【AiBase提要:】
⭐ 文心一言APP——选择创建智能体——创建我的声音，2秒打造专属定制声音
⭐ 在与智能体的每一次对话中，都可以使用自己合成的音色进行语音播报。
⭐ 还可以点击通话按钮，与你自己构建的数字分身实时对话
产品入口:https://top.aibase.com/tool/wenxinyiyan

Midreal AI互动小说游戏网页版本更新

【AiBase提要:】
⭐ Midreal AI互动小说游戏推出全新网页版本，无需在Discord平台操作
⭐ 网页版本的Midreal每一句话都可以生成对应的图片，支持视频小说制作
⭐ 更新为SD模型，图像质量更高，更遵循指令，逻辑也更强
产品入口:https://top.aibase.com/tool/midreal-ai

昆仑万维:天工 SkyMusic AI音乐生成大模型4月17日正式上线免费开放

【AiBase提要:】
⭐ 昆仑万维开发的AI音乐生成大模型「天工SkyMusic」将于4月17日正式上线免费开放。
⭐ 用户可以利用该应用将灵感转化为动听的歌曲，即使是零基础的用户也可以享受音乐创作的乐趣。
⭐ 使用「天工SkyMusic」创作音乐的步骤包括下载应用、写歌词、选择参考歌曲和分享作品。
内测地址:https://top.aibase.com/tool/tiangongskymusic

音乐圈的Sora要来了?AI音乐应用xgboost曝光据说比Suno好10倍!

QQ截图20240408103701.png

【AiBase提要:】
⭐ 博主@maxescu对参与内测的AI音乐应用xgboost评价极高，认为将划时代。
⭐ @maxescu表示这款AI音乐应用要比Suno好10倍，期待值达顶点。
⭐ 该AI音乐应用生成的音乐几乎与Spotify的歌曲无区别，让人震惊。

网易AI音乐网易天音开启内测仅白名单用户可用

QQ截图20240408094604.png

【AiBase提要:】
⭐ 网易天音是全新AI音乐创作工具，集成编曲、作词和歌曲创作功能。
⭐ 内测阶段仅限白名单用户使用，旨在收集反馈优化产品。
⭐ 工具提供丰富指南和快速开始教程，支持AI编曲和一键写歌功能。
产品入口:https://top.aibase.com/tool/wangyitianyin

Tara:一款可以将大模型哦接入Comfy UI的插件

QQ截图20240408140728.png

【AiBase提要:】
⭐️ 可以将大型语言模型（LLM）接入到Comfy UI中
⭐️ 通过简单的设置API，将节点用于优化提示词等工作
⭐️ TaraDaisyChainNode节点实现了复杂工作流程，方便操作优化等
项目地址:https://top.aibase.com/tool/tara

Hand Talk:利用AI自动将文本和音频翻译成手语

【AiBase提要：】
🤖 应用由人工智能驱动，自动翻译文本和音频成手语，服务全球4. 66 亿聋人和重听人士。
🌐 提供自动手语翻译功能和虚拟翻译者Hugo和Maya，帮助学习和交流更互动。
📚 除翻译外，还有学习和教育工具，支持个性化和互动功能，让交流更便捷和有趣。
官网:https://top.aibase.com/tool/hand-talk
下载地址:https://www.handtalk.me/en/app/

📰🤖📢AI新鲜事

ChatGPT 将提供动态模式Dynamic 可根据情况自动选择适合用户的模型

【AiBase提要:】
⭐ 系统将根据智能、能力和速度综合情况，自动选择最适合用户要求的模型。
⭐ Claude的新工具"Tool use"可以同时调用多个模型解决问题，具有灵活性和适应性。
⭐ ChatGPT的"Dynamic"功能和Claude的"Tool use"代表了AI技术的智能化、自动化进步。

认为GPT-4推理能力为0开发者悬赏1万美金被打脸

【AiBase提要:】
⭐️ 一名开发者认为GPT-4没有推理能力，悬赏1万美金挑战
⭐️ 网友用高能prompt让GPT-4几乎达到100%正确率
⭐️ Claude-3Opus展现惊人计算能力，成功率达到56%
详细内容:https://www.chinaz.com/2024/0408/1608624.shtml

OpenAI计划建立「数据市场」，训出GPT-5短缺20万亿 token

【AiBase提要:】
⭐️ 数据供不应求可能导致人工智能发展受阻
⭐️ 公司探索合成数据训练方法以解决数据短缺问题
⭐️ OpenAI计划建立「数据市场」来解决数据短缺问题，训练下一代强大模型

Fireworks.ai开源API使任何开发者都能使用生成式AI

【AiBase提要：】
⭐️ Fireworks开源API帮助开发者快速添加生成式AI功能，降低成本。
⭐️ Fireworks允许用户尝试多个模型，快速适应业务用例。
⭐️ CEO曾在Meta工作，带领AI平台团队，获得 2500 万美元融资。
Fireworks 入口：https://top.aibase.com/tool/fireworks-ai

亚马逊线下店AI训练失败:依赖千名审核人员手动审核

【AiBase提要:】
⭐ 亚马逊原计划实现无需收银员的“拿货即走”技术，但AI训练失败。
⭐ 亚马逊改为购物车模式，提供更便捷购物体验。
⭐ 亚马逊通过生成式AI功能帮助卖家创新，简化列表创建流程。

苹果斥资5000万美元授权数百万张Shutterstock图片用于训练AI模型

【AiBase提要:】
⭐ 苹果与Shutterstock达成协议，授权数百万张图片训练AI模型
⭐ 苹果预计花费5000万美元，类似谷歌、Meta和亚马逊的协议
⭐ 苹果计划在WWDC大会上宣布加入更多AI技术至操作系统中

商汤科技提出FouriScale 无需训练，生成高分辨率图像

【AiBase提要:】
⭐ 扩散模型逐渐超越GAN和自回归模型，成为生成式模型主流选择。
⭐ FouriScale通过空洞卷积和低通滤波操作实现不同分辨率下的图像生成。
⭐ 实验结果表明，FouriScale在生成高分辨率图像方面取得显著提升。
项目地址:https://top.aibase.com/tool/fouriscale
论文地址:https://arxiv.org/abs/2403.12963

————

每日midjourney prompt：鲜花与美女

3_1712560333122_ai2023_A_photo_of_a_Beautiful_Chinese_Girl_Exquisite_face_Orien_17d06869-cb08-4830-95fe-90e4149416ac.png

图源备注：图片由AI生成，图片授权服务商Midjourney

A photo of a Beautiful Chinese Girl ，Exquisite face， Oriental beauty，with shoulderlength curly hair， sitting in the back seat of a train surrounded by colorful flowers and smiling at camera. The scene is bathed in soft pastel colors reminiscent of film photography from the '70s. Shot on Kodak Film， the photograph captures her joyful expression amidst vibrant floral arrangements， creating a nostalgic atmosphere that evokes warm memories and joyous moments shared during travel --ar16:9

一张美丽的中国女孩的照片，精致的脸，东方美女，齐肩卷发，坐在火车后座上，周围是五颜六色的花朵，对着镜头微笑。场景沐浴在柔和的柔和色彩中，让人想起70年代的电影摄影。这张照片在柯达胶片上拍摄，捕捉到了她在充满活力的插花中的喜悦表情，营造出一种怀旧的氛围，唤起了她在旅行中分享的温暖回忆和欢乐时刻

（举报）

相关推荐
大家在看

关键词：

Sora

【腾讯云】11.11云上盛惠！云服务器首年1.8折起，买1年送3个月！

11.11云上盛惠！海量产品 · 轻松上云！云服务器首年1.8折起，买1年送3个月！超值优惠，性能稳定，让您的云端之旅更加畅享。快来腾讯云选购吧！

Docker容器镜像
去看看

Docker容器镜像 60元/15天

爆款产品组合购
去看看

爆款产品组合购低至1元

腾讯云x NVIDIA加速计划
去看看

腾讯云x NVIDIA加速计划最高获赠10万元扶持基金

2核2G云服务器
去看看

2核2G云服务器 112元/1年

查看更多相关信息>>

腾讯云 12-20

广告
QuestMobile报告：3家AI应用月活超千万蚂蚁支小宝、抖音豆包、文心一言分列前三

国内AIGC应用落地如火如荼，除了AI独立APP，现有APP内嵌的AI应用插件形式也逐渐崛起。8月13日，QuestMobile最新研究报告的监测数据显示，今年6月，以APP内嵌形式在支付宝上提供服务的“AI金融助理”支小宝用户量已达5908万，同期独立APP用户流量破千万则有2家，豆包、文心一言分别为2752万和1134万。在现有互联网生态的竞争下，插件类AI应用具有更高的突围概率。

AIGC应用 AI金融助理 APP内嵌
荐AI日报：新壹视频大模型2.0发布；LivePortrait支持用图片控制动画；AI腹肌软件Gigabody爆火；免费无水印的AI视频生成工具Hotshot

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、新壹视频大模型2.0发布:支持1080P60帧输出最高支持4K新壹科技最新发布的新壹视频大模型2.0在AI视频创作领域取得重大突破，实现全流程自动化创作，降低视频创作门槛和成本。v0�

新壹视频
荐AI日报：全球最快AI推理架构发布；夸克PC端AI全面升级；智谱开源CogVideoX-5B视频生成模型；OpenAI的“草莓”终于熟了

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、全球最快AI推理架构CerebrasInference速度提升20倍!CerebrasSystems推出的CerebrasInference将彻底改变AI推理，提供极低成本下20倍速度，为AI计算树立新标杆。报告强调企业需清晰展示生成式A

AI推理
荐AI日报：智谱开源清影同源“兄弟”CogVideoX；阿里通义App推出角色扮演功能；即梦视频生成推动效画板功能；OpenAI领导层大动荡！

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、智谱AI宣布开源「清影」同源视频生成模型——CogVideoX智谱AI宣布开源了CogVideoX视频生成模型，旨在推动视频生成技术的发展和应用。零一万物持续推出新工具，如RAG和FunctionCall，提供更易用、更深入、更安全稳定的解决方案。

CogVideoX
字节旗下即梦AI上架应用商店：支持AI视频创作效果直逼Sora

字节跳动旗下剪映团队研发的一站式AI创作平台即梦AI”移动版今天上架到苹果AppStore应用商店。即梦AI特别推出了会员服务体系，灵活满足用户的多样化需求。作为剪映业务的重要组成部分，脸萌科技在字节跳动及剪映业务负责人张楠的卓越领导下，正引领着AI创意表达的新风尚。

即梦AI 字节跳动 AI创作平台
荐AI日报：Captions推出AI视频API套件；国产人形机器人成养老新希望；百度已有18%搜索结果由AI生成

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、Captions公司发布AI视频生成和编辑API工具Captions公司最近推出了一套革命性的AI视频生成和编辑API工具，为社交媒体和营销活动注入新活力，为开发者和内容创作者提供前所未有的�

人形机器人
Supertone Shift有哪些功能免费吗？AI实时声音变换怎么使用方法详细教程指南

SupertoneShift是什么？SupertoneShift是一款桌面客户端软件，利用先进的实时变声技术，让用户能够即时切换到任何选择的声音。AIbase拥有一个全面的国内外AI产品数据库，收录了超过7000个出色的人工智能网站和产品，覆盖了40多个不同的领域。

SupertoneShift
视频生成控制提升几十倍，新一代轻量级ControlNeXt火了，贾佳亚团队正挑战Scaling Law

又一款国产AI神器吸引了众网友和圈内研究人员的关注!它就是全新的图像和视频生成控制工具——ControlNeXt，由思谋科技创始人、港科大讲座教授贾佳亚团队开发。X平台上知名AI博主「AK」推荐从命名来看，ControlNeXt「致敬」了斯坦福大学研究团队在2023年2月提出的ControlNet，通过引入一些额外的控制信号，让预训练的图像扩散模型根据预设的条件调整和优化，实现线稿生成全彩图能做语义分割、边缘检测、人体姿势识别。未来在持续技术创新的驱动下，我们将看到更多「小弥坚」的大模型成果出现。

ControlNeXt
荐AI日报：谷歌发布全新Gemma 2 2B模型；字节推AI音乐产品海绵音乐；Runway推Gen-3 Alpha Turbo 版本；华为Pura 70系列上线AI扩图

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/1、谷歌发布全新Gemma22B模型，性能超越GPT-3.5-Turbo与Mixtral-8x7B谷歌推出了性能卓越的Gemma22B模型，拥有20亿参数，在多种硬件环境下表现优异。报告提出多项建议，包括责任从分发未�

谷歌
医学影像AI新突破：获FDA批准，深智透医发布首款AI驱动生成加速软件SubtleSYNTH

深智透医获得FDA批准，推出业内首款AI驱动的MRI生成加速软件SubtleSYNTH™。这一软件已在美国与SubtleMR™结合，进一步加速临床磁共振扫描，重新定义AI增强MRI服务的速度及质量。深智透医作为中国AI医学影像企业的标志性企业之一，也将基于旗下AI解决方案在全球的广泛落地，革新存量市场、为医院及影像中心节本提效，持续推动AI医疗影像创新。

AI驱动MRI FDA批准医疗影像技术

BNA:多功能AI超级应用，涵盖社交、电商、娱乐和教育。

BNA AI Super App是一款集成了多种智能服务的超级应用，它不仅提供社交功能，如分享帖子、写博客、聊天和视频通话，还涵盖了AI电商和娱乐服务。此外，该应用还提供40种语言的AI教学服务，帮助用户学习不同的语言。BNA AI Super App以其强大的AI功能和多语言支持，满足了不同用户群体的需求。

AI 多语言学习社交

Elisi:高效能自主层级式计划助手

Elisi 是一款旨在帮助用户实现个人成长的终极组织者和指南。它通过直观的设计和用户友好的说明，帮助用户将梦想转化为清晰的结果，分解成可实现的里程碑，并通过AI技术理解并适应用户的个人需求，确保每一天都更有条理和高效。Elisi 致力于提供便捷服务，主要功能套件完全免费。

个人成长时间管理目标设定

Omi AI:个性化AI助手，记录每一刻，与AI对话获取反馈。

OMI APP是一个任务驱动的个性化AI助手，旨在通过语音和音频转录功能帮助用户提高记忆力和沟通效率。它是一个开源的AI记事本，提供提醒、建议等功能，同时注重用户隐私。

AI助手语音转录隐私保护

MeowMail:高送达率的AI电子邮件营销工具

MeowMail是一款集成在Shopify后台的电子邮件营销应用，利用AI技术自动选择最佳发送时间，提高邮件的送达率至98%以上。它支持拖放编辑、从Klaviyo导入邮件列表、使用Beefree编辑器创建新邮件，并通过设定支出限制来管理邮件营销活动。MeowMail还提供企业级支持和自动翻译文本功能，帮助商家以低成本实现高效的邮件营销。

邮件营销 AI技术 Shopify应用

Maia 100:微软定制AI加速器，专为大规模AI工作负载设计。

Maia 100是微软为Azure设计的首款定制AI加速器，专为大规模AI工作负载而打造，通过软硬件的协同优化，实现了性能、可扩展性和灵活性的最大化。它采用了TSMC N5工艺和COWOS-S互连技术，具备高达1.8TB/s的带宽和64GB的容量，支持高达700W的热设计功耗(TDP)，但以500W运行，确保了高效的能效比。Maia 100集成了高速张量单元、向量处理器、DMA引擎和硬件信号量，支持多种数据类型和张量切分方案，并通过以太网互连支持大规模AI模型。此外，Maia SDK提供了丰富的组件，支持快速部署PyTorch和Triton模型，并通过双编程模型确保高效的数据处理和同步。

AI加速器 Azure 大规模计算

LTM:超长上下文模型，革新软件开发

Magic团队开发的超长上下文模型（LTM）能够处理高达100M tokens的上下文信息，这在AI领域是一个重大突破。该技术主要针对软件开发领域，通过在推理过程中提供大量代码、文档和库的上下文，极大地提升了代码合成的质量和效率。与传统的循环神经网络和状态空间模型相比，LTM模型在存储和检索大量信息方面具有明显优势，能够构建更复杂的逻辑电路。此外，Magic团队还与Google Cloud合作，利用NVIDIA GB200 NVL72构建下一代AI超级计算机，进一步推动模型的推理和训练效率。

AI 软件开发上下文推理

EZ-work AI文档翻译:智能AI翻译，高效文档语言转换助手。

EZ-work AI文档翻译是一款专注于文档翻译的在线服务，支持多种语言的翻译，包括中文、英语、日语、俄语、阿拉伯语和西班牙语等。它使用先进的AI技术，如gpt-4o-mini和deepseek-chat模型，为用户提供快速、准确的翻译服务。该产品适用于需要文档翻译的个人和企业，尤其在国际交流和学术研究领域尤为重要。

翻译 AI 文档处理

Watson AI:会议助手，自动记录并总结会议要点。

Watson AI是一款会议助手应用程序，它通过录制系统音频和麦克风来转录和总结会议内容，自动提取行动项和会议摘要，帮助用户更高效地进行会议记录和回顾。

会议助手自动记录效率工具

PicTech AI: 免费在线AI图片翻译助力跨境电商

PicTech AI是由学以致用科技旗下的智能图像工具品牌，专注于为跨境电商提供AI驱动的图片翻译服务。该产品利用人工智能技术，实现高准确率和高清晰度的图片翻译，支持中文、英语到日语、韩语等多国语言的翻译。PicTech AI的智能抠图功能，能够准确检测图片主体边缘，一键去除背景，无需专业编辑。产品背景信息显示，其团队由来自百度、网易、阿里巴巴等行业巨头的顶尖高科技人才组成，具备强大的技术实力和产品能力。该产品定位于帮助跨境电商从业者简化工作流程，提高效率，无需懂外语或图像处理技能即可使用。

AI翻译跨境电商智能抠图

AnythingLLM:一站式AI应用，支持多种文档和模型。

AnythingLLM是一个多功能的桌面客户端，支持多种语言模型（LLM）和文档类型，提供完全私密的使用体验。用户可以根据自己的需求选择企业级模型、自定义模型或开源模型，如GPT-4、Llama、Mistral等。产品支持一键安装，本地运行，无需互联网连接，保护用户隐私。

AI 文档处理隐私保护

林哥的大模型野榜:更适合中国宝宝体质的大模型产品排行榜

林哥的大模型野榜是一个专注于中国用户需求的大模型产品排行榜，提供了多维度的评估和排名，帮助用户更好地了解和选择适合的大模型产品。

大模型排行榜多维度评估

Fluximg.com:AI文本到图像生成器，支持多尺寸和自动翻译。

Fluximg.com是一个基于Flux模型的AI图像生成网站，提供从文本到图像的转换服务。它支持多种语言，包括中文和英文，并且具有用户友好的界面。网站提供免费和专业版本，使用户能够根据自己的需求选择不同的服务级别。

AI图像生成多尺寸自动翻译

现代文转古文:将现代汉语转化为古汉语，提升文采。

现代文转古文是一款能够将现代汉语自动转换为古汉语的模型，它通过先进的自然语言处理技术，使得用户可以轻松地将现代文本转换成具有古典韵味的古文。这种转换不仅能够增加文本的文学价值，还能在教育、文学创作、文化传承等方面发挥重要作用。

古文文学转换

Zamba2-mini:先进的小型语言模型，专为设备端应用设计。

Zamba2-mini是由Zyphra Technologies Inc.发布的小型语言模型，专为设备端应用设计。它在保持极小的内存占用(<700MB)的同时，实现了与更大模型相媲美的评估分数和性能。该模型采用了4bit量化技术，具有7倍参数下降的同时保持相同性能的特点。Zamba2-mini在推理效率上表现出色，与Phi3-3.8B等更大模型相比，具有更快的首令牌生成时间、更低的内存开销和更低的生成延迟。此外，该模型的权重已开源发布(Apache 2.0)，允许研究人员、开发者和公司利用其能力，推动高效基础模型的边界。

AI日报：北大Open Sora视频生成更强了；文心一言可以定制你自己的声音；天工 SkyMusic即将免费开放；比Suno好10倍AI音乐应用xgboost曝光

今日大家都在搜的词：

热文

站长商机