首页 > 业界 > 关键词  > Sora最新资讯  > 正文

AI日报:北大Open Sora视频生成更强了;文心一言可以定制你自己的声音;天工 SkyMusic即将免费开放;比Suno好10倍AI音乐应用xgboost曝光

2024-04-08 15:15 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://top.aibase.com/

QQ截图20240408153205.png

🤖📱💼AI应用

北大Open Sora视频生成更强了!时长可达10秒,分辨率更高

QQ截图20240408092545.png

【AiBase提要:】

⭐️ Open-Sora-Plan v1.0.0模型发布 显著提升视频生成质量和文本控制能力

⭐️ 支持华为昇腾910b芯片,提升运行效率和质量。

⭐️ 该模型能够生成10秒、24FPS的1024×1024高清视频,同时还支持生成高分辨率图像

项目地址:https://top.aibase.com/tool/open-sora-plan

文心一言APP上线定制专属声音功能

微信截图_20240407145259.png

【AiBase提要:】

⭐ 文心一言APP——选择创建智能体——创建我的声音,2秒打造专属定制声音

⭐ 在与智能体的每一次对话中,都可以使用自己合成的音色进行语音播报。

⭐ 还可以点击通话按钮,与你自己构建的数字分身实时对话

产品入口:https://top.aibase.com/tool/wenxinyiyan

Midreal AI互动小说游戏网页版本更新

image.png

【AiBase提要:】

⭐ Midreal AI互动小说游戏推出全新网页版本,无需在Discord平台操作

⭐ 网页版本的Midreal每一句话都可以生成对应的图片,支持视频小说制作

⭐ 更新为SD模型,图像质量更高,更遵循指令,逻辑也更强

产品入口:https://top.aibase.com/tool/midreal-ai

昆仑万维:天工 SkyMusic AI音乐生成大模型4月17日正式上线免费开放

微信截图_20240408092756.png

【AiBase提要:】

⭐ 昆仑万维开发的AI音乐生成大模型「天工SkyMusic」将于4月17日正式上线免费开放。

⭐ 用户可以利用该应用将灵感转化为动听的歌曲,即使是零基础的用户也可以享受音乐创作的乐趣。

⭐ 使用「天工SkyMusic」创作音乐的步骤包括下载应用、写歌词、选择参考歌曲和分享作品。

内测地址:https://top.aibase.com/tool/tiangongskymusic

音乐圈的Sora要来了?AI音乐应用xgboost曝光 据说比Suno好10倍!

QQ截图20240408103701.png

【AiBase提要:】

⭐ 博主@maxescu对参与内测的AI音乐应用xgboost评价极高,认为将划时代。

⭐ @maxescu表示这款AI音乐应用要比Suno好10倍,期待值达顶点。

⭐ 该AI音乐应用生成的音乐几乎与Spotify的歌曲无区别,让人震惊。

网易AI音乐网易天音开启内测 仅白名单用户可用

QQ截图20240408094604.png

【AiBase提要:】

⭐ 网易天音是全新AI音乐创作工具,集成编曲、作词和歌曲创作功能。

⭐ 内测阶段仅限白名单用户使用,旨在收集反馈优化产品。

⭐ 工具提供丰富指南和快速开始教程,支持AI编曲和一键写歌功能。

产品入口:https://top.aibase.com/tool/wangyitianyin

Tara:一款可以将大模型哦接入Comfy UI的插件

QQ截图20240408140728.png

【AiBase提要:】

⭐️ 可以将大型语言模型(LLM)接入到Comfy UI中

⭐️ 通过简单的设置API,将节点用于优化提示词等工作

⭐️ TaraDaisyChainNode节点实现了复杂工作流程,方便操作优化等

项目地址:https://top.aibase.com/tool/tara

Hand Talk:利用AI自动将文本和音频翻译成手语

QQ截图20240408141246.png

【AiBase提要:】

🤖 应用由人工智能驱动,自动翻译文本和音频成手语,服务全球4. 66 亿聋人和重听人士。

🌐 提供自动手语翻译功能和虚拟翻译者Hugo和Maya,帮助学习和交流更互动。

📚 除翻译外,还有学习和教育工具,支持个性化和互动功能,让交流更便捷和有趣。

官网:https://top.aibase.com/tool/hand-talk

下载地址:https://www.handtalk.me/en/app/

📰🤖📢AI新鲜事

ChatGPT 将提供动态模式Dynamic 可根据情况自动选择适合用户的模型

【AiBase提要:】

⭐ 系统将根据智能、能力和速度综合情况,自动选择最适合用户要求的模型。

⭐ Claude的新工具"Tool use"可以同时调用多个模型解决问题,具有灵活性和适应性。

⭐ ChatGPT的"Dynamic"功能和Claude的"Tool use"代表了AI技术的智能化、自动化进步。

认为GPT-4推理能力为0开发者悬赏1万美金被打脸

【AiBase提要:】

⭐️ 一名开发者认为GPT-4没有推理能力,悬赏1万美金挑战

⭐️ 网友用高能prompt让GPT-4几乎达到100%正确率

⭐️ Claude-3Opus展现惊人计算能力,成功率达到56%

详细内容:https://www.chinaz.com/2024/0408/1608624.shtml

OpenAI计划建立「数据市场」,训出GPT-5短缺20万亿 token

【AiBase提要:】

⭐️ 数据供不应求可能导致人工智能发展受阻

⭐️ 公司探索合成数据训练方法以解决数据短缺问题

⭐️ OpenAI计划建立「数据市场」来解决数据短缺问题,训练下一代强大模型

Fireworks.ai开源API使任何开发者都能使用生成式AI

【AiBase提要:】

⭐️ Fireworks开源API帮助开发者快速添加生成式AI功能,降低成本。

⭐️ Fireworks允许用户尝试多个模型,快速适应业务用例。

⭐️ CEO曾在Meta工作,带领AI平台团队,获得 2500 万美元融资。

Fireworks 入口:https://top.aibase.com/tool/fireworks-ai

亚马逊线下店AI训练失败:依赖千名审核人员手动审核

【AiBase提要:】

⭐ 亚马逊原计划实现无需收银员的“拿货即走”技术,但AI训练失败。

⭐ 亚马逊改为购物车模式,提供更便捷购物体验。

⭐ 亚马逊通过生成式AI功能帮助卖家创新,简化列表创建流程。

苹果斥资5000万美元授权数百万张Shutterstock图片用于训练AI模型

【AiBase提要:】

⭐ 苹果与Shutterstock达成协议,授权数百万张图片训练AI模型

⭐ 苹果预计花费5000万美元,类似谷歌、Meta和亚马逊的协议

⭐ 苹果计划在WWDC大会上宣布加入更多AI技术至操作系统中

商汤科技提出FouriScale 无需训练,生成高分辨率图像

image.png

【AiBase提要:】

⭐ 扩散模型逐渐超越GAN和自回归模型,成为生成式模型主流选择。

⭐ FouriScale通过空洞卷积和低通滤波操作实现不同分辨率下的图像生成。

⭐ 实验结果表明,FouriScale在生成高分辨率图像方面取得显著提升。

项目地址:https://top.aibase.com/tool/fouriscale

论文地址:https://arxiv.org/abs/2403.12963

————

每日midjourney prompt:鲜花与美女

3_1712560333122_ai2023_A_photo_of_a_Beautiful_Chinese_Girl_Exquisite_face_Orien_17d06869-cb08-4830-95fe-90e4149416ac.png

图源备注:图片由AI生成,图片授权服务商Midjourney

A photo of a Beautiful Chinese Girl ,Exquisite face, Oriental beauty,with shoulderlength curly hair, sitting in the back seat of a train surrounded by colorful flowers and smiling at camera. The scene is bathed in soft pastel colors reminiscent of film photography from the '70s. Shot on Kodak Film, the photograph captures her joyful expression amidst vibrant floral arrangements, creating a nostalgic atmosphere that evokes warm memories and joyous moments shared during travel --ar16:9

一张美丽的中国女孩的照片,精致的脸,东方美女,齐肩卷发,坐在火车后座上,周围是五颜六色的花朵,对着镜头微笑。场景沐浴在柔和的柔和色彩中,让人想起70年代的电影摄影。这张照片在柯达胶片上拍摄,捕捉到了她在充满活力的插花中的喜悦表情,营造出一种怀旧的氛围,唤起了她在旅行中分享的温暖回忆和欢乐时刻

举报

  • 相关推荐
  • 大家在看
  • Clay Filter AI:将您的角色照片转换成粘土动画风格的图像

    粘土 AI 是一款 AI 工具,可以将照片转换成粘土动画风格的图像。通过分析面部特征,生成逼真的效果,提供灵活的编辑功能。价格定位为免费使用。使用比较简单,上传你的照片并提交,稍等10-20 秒可以获得粘土动画风格的图像。

  • TopMixLabs:在线AI视频动画生成工具

    TopMixLabs 是一个 AI 动画制作工具,通过上传图片,用户可以轻松地将图像转换为专业级动画,适用于各种规模的企业,提升品牌形象。使用简单,只需要4张照片,上传稍等10 -20分钟左右,即可以生成高质量的动画,生成的动画支持下载mp4格式,而且在平台上创建的动画用于个人和商业目的。

  • StartKit.AI:快速搭建AI创业项目

    StartKit.AI是一个旨在帮助开发者快速构建AI项目的在线平台。它提供了一个包含所有所需功能来发布SaaS产品的AI样板,无需AI经验即可使用。该平台由James和Danielle开发,他们拥有超过10年的SaaS产品开发经验,并成功运营着AI产品Ellie。StartKit.AI集成了30多个模块和超过8000行代码,提供了先进的AI特性,如聊天、图像、文本、语音、翻译和内容审核等。此外,它还包括了OpenAI的所有功能,并支持创建自己的ChatGPT克隆体。产品定位于帮助开发者快速启动AI项目,保持技术领先,并支持通过Stripe进行产品变现。

  • Cressi:AI驱动的个性化购物助手

    Cressi是一个由AI驱动的个性化购物助手,旨在通过分析用户的搜索历史、兴趣、联系人和日历等信息,提供定制化的购物建议。Cressi不仅能够理解用户的偏好,而且能够随着用户生活方式的变化而不断进化,提供真正人性化的购物体验。Cressi致力于使购物更加个性化、高客户满意度,并减少浪费,以实现更有意义和可持续的购物方式。

  • Decks:一款专业的笔记应用,助你快速掌握任何学科

    Decks是一款专为学习设计的应用,它通过创新的笔记方式帮助用户更快地掌握知识。用户可以免费开始使用,并在14天后选择月度或年度订阅。Decks提供每月8美元或每年79美元的订阅选项。

  • AutoPilotI18n:AI驱动的国际化工具 简化i18n流程。

    AutoPilotI18n 是一款利用 AI 技术提供精确翻译的国际化工具,可自动化翻译任务,简化 i18n 流程。其主要优点在于精确翻译、多框架支持、高效工作流程,适用于 React、Vue、Angular 等。AutoPilotI18n 定价透明,提供免费和付费版本。

  • Docu Dig:AI驱动的智能文档搜索与洞察

    Docu Dig是一个利用尖端AI技术提供安全、高效的文档内容搜索和洞察的商业解决方案。它通过先进的加密技术保护数据安全,提供上下文智能搜索,与传统搜索方法相比,能够提供更准确的文档洞察,提高团队效率,并改善信息获取。此外,它还支持团队协作,允许团队成员在共享文档上协作,提高工作效率。适用于需要处理大量文档的行业,如法律、医疗和金融领域。

  • V-Express:生成受控于参考图像、音频和V-Kps序列的头像视频。

    V-Express是一个由腾讯AI实验室开发的头像视频生成模型,它通过一系列渐进式丢弃操作平衡不同的控制信号,使得生成的视频能够同时考虑姿态、输入图像和音频。该模型特别针对音频信号较弱的情况进行了优化,解决了在控制信号强度不同的情况下生成头像视频的挑战。

  • Frontly:无代码构建AI驱动的应用程序

    Frontly 是一个创新的平台,它允许用户通过简单的拖放操作和AI技术,无需编程知识即可创建功能强大的应用程序。它的主要优点在于快速开发、高度定制化和易于使用,非常适合初创公司、中型企业以及需要快速迭代和测试新想法的团队。

  • Roadway:为增长营销量身定制的分析和自动化平台

    Roadway是一个专注于增长营销的分析和自动化平台,旨在帮助企业快速、高效地扩大收入增长。它通过数据驱动的分析和洞察自动化,帮助企业专注于关键的增长指标和杠杆。Roadway提供了一个个性化的增长营销助手,使用AI技术进行自动化的指标和漏斗分析,并提供定制化的行动建议。此外,它还允许用户通过自助服务分析,快速创建仪表板、报告,并做出数据驱动的决策。Roadway的分析是仓库原生的,可以快速连接数据仓库中的基本表格,创建关键指标和增长杠杆的语义层。

  • Tykr:股票筛选和教育平台一体化,助您自信管理投资。

    Tykr是一个结合了股票筛选器和教育平台的应用程序,旨在帮助用户自信地管理自己的投资。自2020年以来,Tykr通过其产品、服务和教育帮助成千上万的投资者做出更好的投资决策。

  • SDXL Flash:高效能的文本到图像生成模型

    SDXL Flash是由SD社区与Project Fluently合作推出的文本到图像生成模型。它在保持生成图像质量的同时,提供了比LCM、Turbo、Lightning和Hyper更快的处理速度。该模型基于Stable Diffusion XL技术,通过优化步骤和CFG(Guidance)参数,实现了图像生成的高效率和高质量。

  • Jector:AI 创建工具,打造令人惊叹的产品照片。

    Jector是一个AI创作工具,专注于为产品摄影提供高质量的背景生成服务。它通过简化AI设置,提供独立的生成环境插槽,以及基于节点的图像生成历史记录,使得用户能够轻松创建和合成产品图像。Jector的主要优点包括无需复杂设置即可开始使用,提供简单但高度灵活的生成选项,自动产品合成,以及额外的清除和放大功能。此外,它还提供无限保存和下载功能,让用户可以轻松地为产品生成自己的心情历史。

  • Spon:一站式社区构建平台,管理活动、社区和成员。

    Spon是一个专为线下社区构建者设计的全功能平台,由人工智能提供支持。它允许用户从单一界面管理活动、社区和成员。它提供了多种工具来促进社区成员之间的互动,如即兴活动、有意义的讨论和专门的聊天。Spon还提供了社区发现、兴趣匹配和基于位置的搜索功能,帮助用户扩大社区影响力。此外,Spon还提供了一个内置钱包和真实奖励系统,鼓励社区领导者通过他们的努力获得认可和奖励。Spon的愿景是超越事件本身,强调社区的支持、友谊、勇气、好奇心、联系和爱。

  • ChatTTS:一个用于文本到语音转换的开源项目。

    ChatTTS是一个开源的文本到语音转换(TTS)模型,它允许用户将文本转换为语音。该模型主要面向学术研究和教育目的,不适用于商业或法律用途。它使用深度学习技术,能够生成自然流畅的语音输出,适合研究和开发语音合成技术的人员使用。

  • Doly for iPhone:快速轻松生成出色的3D产品视频。

    Doly是一款为iPhone 11及以上版本设计的应用程序,它允许用户通过简单的操作生成高质量的3D产品视频。这款应用通过提供一系列3D模板,使得用户能够快速创建出吸引人的产品展示视频,从而提升产品在社交媒体、广告或产品页面上的呈现效果。Doly的主要优点包括易用性、成本效益和高效的视频生成速度。

  • Streaks 66:66天习惯养成助手,AI智能指导。

    Streaks 66是一款习惯追踪应用程序,旨在帮助用户通过66天的挑战来建立持久的日常习惯。它提供了不同难度模式以适应不同用户的需求,并通过集成的AI习惯教练为用户提供个性化建议、激励和关于习惯和目标的洞察。此外,该应用程序还支持设置提醒、与朋友和家人分享习惯进展以及跨设备同步数据。

  • ChatGPT Notepad:在线文本编辑器,提供文本编辑、保存、复制、剪切等功能。

    ChatGPT Notepad是一款在线文本编辑器,旨在帮助用户高效地编辑和处理文本内容。它支持基本的文本编辑功能,如保存、复制、剪切等,同时提供全屏模式和大小写转换等高级功能。该产品重视用户隐私保护,不使用第三方跟踪工具,确保用户数据安全。

  • InternLM-Math-Plus:双语开源数学推理大型语言模型。

    InternLM-Math-Plus 是一个最新的双语(英文和中文)开源大型语言模型(LLM),专注于数学推理,具有解决、证明、验证和增强数学问题的能力。它在非正式数学推理(如思维链和代码解释)和正式数学推理(如LEAN 4翻译和证明)方面都有显著的性能提升。

  • Selfarama:用AI将孩子的肖像与画家相结合 生成书籍

    Selfarama 是一款教育图书产品,通过将孩子与历史上最伟大的画家联系起来,帮助他们学习艺术史知识。产品包含定制的孩子肖像画和通俗易懂的教育文本。

今日大家都在搜的词: