首页 > 业界 > 关键词  > Sora最新资讯  > 正文

AI日报:北大Open Sora视频生成更强了;文心一言可以定制你自己的声音;天工 SkyMusic即将免费开放;比Suno好10倍AI音乐应用xgboost曝光

2024-04-08 15:15 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://top.aibase.com/

QQ截图20240408153205.png

🤖📱💼AI应用

北大Open Sora视频生成更强了!时长可达10秒,分辨率更高

QQ截图20240408092545.png

【AiBase提要:】

⭐️ Open-Sora-Plan v1.0.0模型发布 显著提升视频生成质量和文本控制能力

⭐️ 支持华为昇腾910b芯片,提升运行效率和质量。

⭐️ 该模型能够生成10秒、24FPS的1024×1024高清视频,同时还支持生成高分辨率图像

项目地址:https://top.aibase.com/tool/open-sora-plan

文心一言APP上线定制专属声音功能

微信截图_20240407145259.png

【AiBase提要:】

⭐ 文心一言APP——选择创建智能体——创建我的声音,2秒打造专属定制声音

⭐ 在与智能体的每一次对话中,都可以使用自己合成的音色进行语音播报。

⭐ 还可以点击通话按钮,与你自己构建的数字分身实时对话

产品入口:https://top.aibase.com/tool/wenxinyiyan

Midreal AI互动小说游戏网页版本更新

image.png

【AiBase提要:】

⭐ Midreal AI互动小说游戏推出全新网页版本,无需在Discord平台操作

⭐ 网页版本的Midreal每一句话都可以生成对应的图片,支持视频小说制作

⭐ 更新为SD模型,图像质量更高,更遵循指令,逻辑也更强

产品入口:https://top.aibase.com/tool/midreal-ai

昆仑万维:天工 SkyMusic AI音乐生成大模型4月17日正式上线免费开放

微信截图_20240408092756.png

【AiBase提要:】

⭐ 昆仑万维开发的AI音乐生成大模型「天工SkyMusic」将于4月17日正式上线免费开放。

⭐ 用户可以利用该应用将灵感转化为动听的歌曲,即使是零基础的用户也可以享受音乐创作的乐趣。

⭐ 使用「天工SkyMusic」创作音乐的步骤包括下载应用、写歌词、选择参考歌曲和分享作品。

内测地址:https://top.aibase.com/tool/tiangongskymusic

音乐圈的Sora要来了?AI音乐应用xgboost曝光 据说比Suno好10倍!

QQ截图20240408103701.png

【AiBase提要:】

⭐ 博主@maxescu对参与内测的AI音乐应用xgboost评价极高,认为将划时代。

⭐ @maxescu表示这款AI音乐应用要比Suno好10倍,期待值达顶点。

⭐ 该AI音乐应用生成的音乐几乎与Spotify的歌曲无区别,让人震惊。

网易AI音乐网易天音开启内测 仅白名单用户可用

QQ截图20240408094604.png

【AiBase提要:】

⭐ 网易天音是全新AI音乐创作工具,集成编曲、作词和歌曲创作功能。

⭐ 内测阶段仅限白名单用户使用,旨在收集反馈优化产品。

⭐ 工具提供丰富指南和快速开始教程,支持AI编曲和一键写歌功能。

产品入口:https://top.aibase.com/tool/wangyitianyin

Tara:一款可以将大模型哦接入Comfy UI的插件

QQ截图20240408140728.png

【AiBase提要:】

⭐️ 可以将大型语言模型(LLM)接入到Comfy UI中

⭐️ 通过简单的设置API,将节点用于优化提示词等工作

⭐️ TaraDaisyChainNode节点实现了复杂工作流程,方便操作优化等

项目地址:https://top.aibase.com/tool/tara

Hand Talk:利用AI自动将文本和音频翻译成手语

QQ截图20240408141246.png

【AiBase提要:】

🤖 应用由人工智能驱动,自动翻译文本和音频成手语,服务全球4. 66 亿聋人和重听人士。

🌐 提供自动手语翻译功能和虚拟翻译者Hugo和Maya,帮助学习和交流更互动。

📚 除翻译外,还有学习和教育工具,支持个性化和互动功能,让交流更便捷和有趣。

官网:https://top.aibase.com/tool/hand-talk

下载地址:https://www.handtalk.me/en/app/

📰🤖📢AI新鲜事

ChatGPT 将提供动态模式Dynamic 可根据情况自动选择适合用户的模型

【AiBase提要:】

⭐ 系统将根据智能、能力和速度综合情况,自动选择最适合用户要求的模型。

⭐ Claude的新工具"Tool use"可以同时调用多个模型解决问题,具有灵活性和适应性。

⭐ ChatGPT的"Dynamic"功能和Claude的"Tool use"代表了AI技术的智能化、自动化进步。

认为GPT-4推理能力为0开发者悬赏1万美金被打脸

【AiBase提要:】

⭐️ 一名开发者认为GPT-4没有推理能力,悬赏1万美金挑战

⭐️ 网友用高能prompt让GPT-4几乎达到100%正确率

⭐️ Claude-3Opus展现惊人计算能力,成功率达到56%

详细内容:https://www.chinaz.com/2024/0408/1608624.shtml

OpenAI计划建立「数据市场」,训出GPT-5短缺20万亿 token

【AiBase提要:】

⭐️ 数据供不应求可能导致人工智能发展受阻

⭐️ 公司探索合成数据训练方法以解决数据短缺问题

⭐️ OpenAI计划建立「数据市场」来解决数据短缺问题,训练下一代强大模型

Fireworks.ai开源API使任何开发者都能使用生成式AI

【AiBase提要:】

⭐️ Fireworks开源API帮助开发者快速添加生成式AI功能,降低成本。

⭐️ Fireworks允许用户尝试多个模型,快速适应业务用例。

⭐️ CEO曾在Meta工作,带领AI平台团队,获得 2500 万美元融资。

Fireworks 入口:https://top.aibase.com/tool/fireworks-ai

亚马逊线下店AI训练失败:依赖千名审核人员手动审核

【AiBase提要:】

⭐ 亚马逊原计划实现无需收银员的“拿货即走”技术,但AI训练失败。

⭐ 亚马逊改为购物车模式,提供更便捷购物体验。

⭐ 亚马逊通过生成式AI功能帮助卖家创新,简化列表创建流程。

苹果斥资5000万美元授权数百万张Shutterstock图片用于训练AI模型

【AiBase提要:】

⭐ 苹果与Shutterstock达成协议,授权数百万张图片训练AI模型

⭐ 苹果预计花费5000万美元,类似谷歌、Meta和亚马逊的协议

⭐ 苹果计划在WWDC大会上宣布加入更多AI技术至操作系统中

商汤科技提出FouriScale 无需训练,生成高分辨率图像

image.png

【AiBase提要:】

⭐ 扩散模型逐渐超越GAN和自回归模型,成为生成式模型主流选择。

⭐ FouriScale通过空洞卷积和低通滤波操作实现不同分辨率下的图像生成。

⭐ 实验结果表明,FouriScale在生成高分辨率图像方面取得显著提升。

项目地址:https://top.aibase.com/tool/fouriscale

论文地址:https://arxiv.org/abs/2403.12963

————

每日midjourney prompt:鲜花与美女

3_1712560333122_ai2023_A_photo_of_a_Beautiful_Chinese_Girl_Exquisite_face_Orien_17d06869-cb08-4830-95fe-90e4149416ac.png

图源备注:图片由AI生成,图片授权服务商Midjourney

A photo of a Beautiful Chinese Girl ,Exquisite face, Oriental beauty,with shoulderlength curly hair, sitting in the back seat of a train surrounded by colorful flowers and smiling at camera. The scene is bathed in soft pastel colors reminiscent of film photography from the '70s. Shot on Kodak Film, the photograph captures her joyful expression amidst vibrant floral arrangements, creating a nostalgic atmosphere that evokes warm memories and joyous moments shared during travel --ar16:9

一张美丽的中国女孩的照片,精致的脸,东方美女,齐肩卷发,坐在火车后座上,周围是五颜六色的花朵,对着镜头微笑。场景沐浴在柔和的柔和色彩中,让人想起70年代的电影摄影。这张照片在柯达胶片上拍摄,捕捉到了她在充满活力的插花中的喜悦表情,营造出一种怀旧的氛围,唤起了她在旅行中分享的温暖回忆和欢乐时刻

举报

  • 相关推荐
  • 大家在看
  • BNA:多功能AI超级应用,涵盖社交、电商、娱乐和教育。

    BNA AI Super App是一款集成了多种智能服务的超级应用,它不仅提供社交功能,如分享帖子、写博客、聊天和视频通话,还涵盖了AI电商和娱乐服务。此外,该应用还提供40种语言的AI教学服务,帮助用户学习不同的语言。BNA AI Super App以其强大的AI功能和多语言支持,满足了不同用户群体的需求。

  • Elisi:高效能自主层级式计划助手

    Elisi 是一款旨在帮助用户实现个人成长的终极组织者和指南。它通过直观的设计和用户友好的说明,帮助用户将梦想转化为清晰的结果,分解成可实现的里程碑,并通过AI技术理解并适应用户的个人需求,确保每一天都更有条理和高效。Elisi 致力于提供便捷服务,主要功能套件完全免费。

  • Omi AI:个性化AI助手,记录每一刻,与AI对话获取反馈。

    OMI APP是一个任务驱动的个性化AI助手,旨在通过语音和音频转录功能帮助用户提高记忆力和沟通效率。它是一个开源的AI记事本,提供提醒、建议等功能,同时注重用户隐私。

  • MeowMail:高送达率的AI电子邮件营销工具

    MeowMail是一款集成在Shopify后台的电子邮件营销应用,利用AI技术自动选择最佳发送时间,提高邮件的送达率至98%以上。它支持拖放编辑、从Klaviyo导入邮件列表、使用Beefree编辑器创建新邮件,并通过设定支出限制来管理邮件营销活动。MeowMail还提供企业级支持和自动翻译文本功能,帮助商家以低成本实现高效的邮件营销。

  • Maia 100:微软定制AI加速器,专为大规模AI工作负载设计。

    Maia 100是微软为Azure设计的首款定制AI加速器,专为大规模AI工作负载而打造,通过软硬件的协同优化,实现了性能、可扩展性和灵活性的最大化。它采用了TSMC N5工艺和COWOS-S互连技术,具备高达1.8TB/s的带宽和64GB的容量,支持高达700W的热设计功耗(TDP),但以500W运行,确保了高效的能效比。Maia 100集成了高速张量单元、向量处理器、DMA引擎和硬件信号量,支持多种数据类型和张量切分方案,并通过以太网互连支持大规模AI模型。此外,Maia SDK提供了丰富的组件,支持快速部署PyTorch和Triton模型,并通过双编程模型确保高效的数据处理和同步。

  • LTM:超长上下文模型,革新软件开发

    Magic团队开发的超长上下文模型(LTM)能够处理高达100M tokens的上下文信息,这在AI领域是一个重大突破。该技术主要针对软件开发领域,通过在推理过程中提供大量代码、文档和库的上下文,极大地提升了代码合成的质量和效率。与传统的循环神经网络和状态空间模型相比,LTM模型在存储和检索大量信息方面具有明显优势,能够构建更复杂的逻辑电路。此外,Magic团队还与Google Cloud合作,利用NVIDIA GB200 NVL72构建下一代AI超级计算机,进一步推动模型的推理和训练效率。

  • EZ-work AI文档翻译:智能AI翻译,高效文档语言转换助手。

    EZ-work AI文档翻译是一款专注于文档翻译的在线服务,支持多种语言的翻译,包括中文、英语、日语、俄语、阿拉伯语和西班牙语等。它使用先进的AI技术,如gpt-4o-mini和deepseek-chat模型,为用户提供快速、准确的翻译服务。该产品适用于需要文档翻译的个人和企业,尤其在国际交流和学术研究领域尤为重要。

  • Watson AI:会议助手,自动记录并总结会议要点。

    Watson AI是一款会议助手应用程序,它通过录制系统音频和麦克风来转录和总结会议内容,自动提取行动项和会议摘要,帮助用户更高效地进行会议记录和回顾。

  • PicTech AI: 免费在线AI图片翻译 助力跨境电商

    PicTech AI是由学以致用科技旗下的智能图像工具品牌,专注于为跨境电商提供AI驱动的图片翻译服务。该产品利用人工智能技术,实现高准确率和高清晰度的图片翻译,支持中文、英语到日语、韩语等多国语言的翻译。PicTech AI的智能抠图功能,能够准确检测图片主体边缘,一键去除背景,无需专业编辑。产品背景信息显示,其团队由来自百度、网易、阿里巴巴等行业巨头的顶尖高科技人才组成,具备强大的技术实力和产品能力。该产品定位于帮助跨境电商从业者简化工作流程,提高效率,无需懂外语或图像处理技能即可使用。

  • AnythingLLM:一站式AI应用,支持多种文档和模型。

    AnythingLLM是一个多功能的桌面客户端,支持多种语言模型(LLM)和文档类型,提供完全私密的使用体验。用户可以根据自己的需求选择企业级模型、自定义模型或开源模型,如GPT-4、Llama、Mistral等。产品支持一键安装,本地运行,无需互联网连接,保护用户隐私。

  • 林哥的大模型野榜:更适合中国宝宝体质的大模型产品排行榜

    林哥的大模型野榜是一个专注于中国用户需求的大模型产品排行榜,提供了多维度的评估和排名,帮助用户更好地了解和选择适合的大模型产品。

  • Fluximg.com:AI文本到图像生成器,支持多尺寸和自动翻译。

    Fluximg.com是一个基于Flux模型的AI图像生成网站,提供从文本到图像的转换服务。它支持多种语言,包括中文和英文,并且具有用户友好的界面。网站提供免费和专业版本,使用户能够根据自己的需求选择不同的服务级别。

  • 现代文转古文:将现代汉语转化为古汉语,提升文采。

    现代文转古文是一款能够将现代汉语自动转换为古汉语的模型,它通过先进的自然语言处理技术,使得用户可以轻松地将现代文本转换成具有古典韵味的古文。这种转换不仅能够增加文本的文学价值,还能在教育、文学创作、文化传承等方面发挥重要作用。

  • Zamba2-mini:先进的小型语言模型,专为设备端应用设计。

    Zamba2-mini是由Zyphra Technologies Inc.发布的小型语言模型,专为设备端应用设计。它在保持极小的内存占用(<700MB)的同时,实现了与更大模型相媲美的评估分数和性能。该模型采用了4bit量化技术,具有7倍参数下降的同时保持相同性能的特点。Zamba2-mini在推理效率上表现出色,与Phi3-3.8B等更大模型相比,具有更快的首令牌生成时间、更低的内存开销和更低的生成延迟。此外,该模型的权重已开源发布(Apache 2.0),允许研究人员、开发者和公司利用其能力,推动高效基础模型的边界。

  • InterTrack:无需对象模板的人体与物体交互跟踪技术

    InterTrack 是一种先进的跟踪技术,能够在单目RGB视频中跟踪人体与物体的交互,即使在遮挡和动态运动下也能保持跟踪的连贯性。该技术无需使用任何对象模板,仅通过合成数据训练即可在真实世界视频中实现良好的泛化。InterTrack 通过分解4D跟踪问题为每帧的姿态跟踪和规范形状优化,显著提高了跟踪的准确性和效率。

  • GenWarp:生成新视角的图像,保持语义信息。

    GenWarp是一个用于从单张图像生成新视角图像的模型,它通过语义保持的生成变形框架,使文本到图像的生成模型能够学习在哪里变形和在哪里生成。该模型通过增强交叉视角注意力与自注意力来解决现有方法的局限性,通过条件化生成模型在源视图图像上,并纳入几何变形信号,提高了在不同领域场景下的性能。

  • Qwen2-VL:新一代视觉语言模型,更清晰地看世界。

    Qwen2-VL是一款基于Qwen2打造的最新一代视觉语言模型,具备多语言支持和强大的视觉理解能力,能够处理不同分辨率和长宽比的图片,理解长视频,并可集成到手机、机器人等设备中进行自动操作。它在多个视觉理解基准测试中取得全球领先的表现,尤其在文档理解方面有明显优势。

  • Dressplay:个性化服装生成器,轻松变换你的装扮。

    Dressplay是一个创新的在线服装生成器,允许用户通过简单的步骤生成个性化的服装。它利用先进的图像处理技术,让用户能够选择服装区域、目标人物以及想要穿戴的服装,从而创造出逼真的服装效果。Dressplay背后的技术不仅提高了服装设计的效率,也为用户提供了一种全新的个性化体验。目前,Dressplay提供免费试用,用户可以通过网页访问并体验其功能。

  • GLM-4-Plus:国际领先的语言理解与长文本处理大模型。

    GLM-4-Plus是智谱推出的一款基座大模型,它在语言理解、指令遵循和长文本处理等方面性能得到全面提升,保持了国际领先水平。该模型的推出,不仅代表了中国在大模型领域的创新和突破,还为开发者和企业提供了强大的语言处理能力,进一步推动了人工智能技术的发展和应用。

  • Playground:专业的设计工具,让设计变得简单有趣。

    Playground是一个专业的在线设计平台,它提供了丰富的设计资源和工具,包括贴纸、壁纸、海报、T恤设计和社交帖子设计等。用户可以轻松地创建个性化的艺术作品,无论是个人使用还是商业用途。该平台以其易用性、丰富的设计元素和创新的设计理念,满足了不同用户的设计需求。

今日大家都在搜的词: