首页 > 业界 > 关键词  > MOKI最新资讯  > 正文

AI日报:美图发布AI视频神器MOKI;OpenAI靠ChatGPT半年赚34亿美元;斯坦福开发对口型视频模型PROTEUS

2024-06-14 15:14 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://top.aibase.com/

1、美图发布王炸产品MOKI 可一键生成AI视频短片

美图公司发布了名为MOKI的AI视频制作工具,实现了一键生成AI视频短片的功能,展示了其在AI领域的深入布局和创新能力。尽管实际效果有待用户评价,但市场已经对其潜力表示关注。

【AiBase提要:】

⭐MOKI是美图公司推出的AI短片创作工具,专注于网文短剧、故事绘本、动画短片和MV四种视频形式的创作。

⭐MOKI通过内置的视频生成模型和工作流,用户输入文本提示即可同时完成脚本、角色、视频和音效配音等内容的生成

⭐高度可控,能够实现一键生成AI视频短片,该产品将于 7 月 31 日开放体验

官网地址:https://top.aibase.com/tool/moki

2、斯坦福大学开发!对口型视频模型PROTEUS可让图片开口唱歌

斯坦福大学与Apparate Labs联合推出的AI模型PROTEUS实现了通过单张照片生成逼真虚拟人物,并实时唱歌和说话的功能。该模型具有实时生成逼真人物、高帧率视频流、多模态交互等特点,可应用于个性化虚拟助理、虚拟宠物、客户服务等多个领域。PROTEUS的愿景是提供可通过语音控制的视觉化体现,为用户带来自然的虚拟人物交互体验。

【AiBase提要:】

👩‍💻 实时生成逼真人物,展现复杂面部表情和身体动作。

🎥 支持高帧率视频流,实现流畅的互动体验。

💬 多模态交互,适用于语音、文本和图像等多种数据形式。

详情链接:https://apparate.ai/stream.html

3、FontStudio:轻松制作各种纹理炫酷字体效果

FontStudio是一种新方法,可以帮助制作漂亮的字体效果,让作品更有趣和独特。使用扩散模型技术在不规则形状的画布上生成字体效果,引入分割掩模技术保持形状一致性。用户偏好研究显示,FontStudio受到很多人喜爱,甚至比市面上的商业产品Adobe Firefly有优势,具有美学吸引力。

image.png

【AiBase提要:】

🎨 制作漂亮字体效果

🔍 使用扩散模型技术生成不规则形状字体效果

🔗 引入分割掩模技术保持形状一致性

产品入口:https://top.aibase.com/tool/fontstudio

4、OpenAI年化营收跃升至34亿美元 订阅版ChatGPT成主要推动力

OpenAI近期年化营收达到34亿美元,增长迅速。主要得益于ChatGPT订阅版和与微软的合作,收入来源多元。最新与苹果合作,将ChatGPT接入iPhone、iPad和Mac操作系统,提升用户体验。

【AiBase提要:】

📈 OpenAI年化营收达到34亿美元,增长迅速。

💡 主要得益于ChatGPT订阅版和与微软的合作,收入来源多元。

🤝 最新与苹果合作,将ChatGPT接入iPhone、iPad和Mac操作系统,提升用户体验。

5、VideoLLaMA 2: 上传视频可根据指令实时识别解读视频内容

随着人工智能技术的发展,VideoLLaMA2项目应运而生,旨在推进视频大语言模型时空建模和音频理解能力。该项目能够帮助用户更好地理解视频内容,识别速度快且精准。

image.png

【AiBase提要:】

🚢 高级多模态语言模型,提升视频内容理解能力。

⏰ 精确的时空建模,识别视频中的动作和事件顺序。

🔊 出色的音频理解能力,分析视频中的声音内容。

详情链接:https://top.aibase.com/tool/videollama-2

6、机器人会自己开车了!东京大学开发肌骨类人机器人Musashi

Musashi是一款肌骨类人机器人,具备自主驾驶能力,展示了自动驾驶领域的潜力。尽管在转弯速度和加速控制方面存在限制,但其硬件设计和软件系统结合的方式为未来智能化驾驶体验提供了新思路。研究成果已在论文中发表,为自动驾驶技术发展打下重要基础。

【AiBase提要:】

🤖 Musashi是肌骨类人机器人,具备视觉感知和驾驶操作能力。

🚗 Musashi能够驾驶小型电动车,遵守交通规则并识别交通信号灯、行人和其他车辆。

🔬 Musashi的工作原理包括硬件设计模仿人类肌肉骨骼结构和软件系统结合多种基于学习的模块。

详情链接:https://arxiv.org/pdf/2406.05573

7、指环王+赛博朋克2077!网友用AI制作电影预告片播放破百万

我对这篇文章感到非常兴奋和惊叹。一位网友利用AI技术创作了一部名为"Cyberlord of the Chips"的电影预告片,将《指环王》与《赛博朋克2077》进行大胆融合,展现出全新的赛博朋克风格中土世界。这展示了AI技术在图像生成领域的飞速发展,引发了关于技术进步与电影艺术独特性的讨论。

image.png

【AiBase提要:】

🎥 AI技术创作电影预告片《Cyberlord of the Chips》融合了《指环王》与《赛博朋克2077》的世界观,引起广泛关注。

🌟 利用Midjourney、Runaway和Elevenlabs等工具,重新想象了摧毁魔戒之旅成为寻找致命芯片的冒险,展现出赛博朋克风格的中土世界。

🔮 预告片视觉效果惊人,将中土世界的古老城堡和广袤大地转化为赛博朋克风格的高楼大厦和霓虹灯光,展示了AI技术在电影制作中的潜力。

8、特斯拉股东起诉马斯克将资源转移到其AI公司xAI

在最近的特拉华州诉讼中,特斯拉股东指控马斯克和董事会将公司资源转移到竞争人工智能公司xAI,违反信托义务。马斯克试图将特斯拉定位为机器人和人工智能强国,股价上涨,但股东认为其行为有失公平。股东还援引马斯克转移英伟达人工智能芯片的报道。另有机构投资者指控马斯克利用内幕信息赚取数十亿美元。

【AiBase提要:】

🔍 特斯拉股东起诉马斯克及董事会将资源转移到xAI公司,违反信托义务。

💡 马斯克试图将特斯拉定位为机器人和人工智能强国,股价上涨,但股东认为其行为有失公平。

💰 股东指控马斯克转移英伟达人工智能芯片至社交媒体公司,另有机构投资者指控其利用内幕信息赚取数十亿美元。

9、Spotify成立内部创意机构,测试生成式AI配音广告

Spotify成立内部创意机构Creative Lab,旨在帮助品牌定制营销活动并测试生成式AI广告。公司正致力于开发新的AI工具“Quick Audio”,以帮助广告商创建脚本和配音。通过吸引广告商和利用AI技术,Spotify致力于提升广告营销效果。

image.png

【AiBase提要:】

✨ Spotify成立Creative Lab内部创意机构,助力品牌定制营销活动。

🤖 Spotify推出新AI工具“Quick Audio”帮助广告商创建脚本和配音。

🔗 品牌可与Creative Lab团队合作制作视频、音频广告,提升互动广告形式。

10、Mozilla Solo AI更新:无代码 AI 网络生成器

Mozilla推出全新人工智能工具Solo AI,无需编码知识即可创建网站。Solo1.0版本引入动画效果,提升网站视觉吸引力,添加欧洲用户cookie通知横幅。支持最多三个文本和图像横幅部分,字符数限制和最多上传30张自定义图像。Solo AI承诺轻松创建和发布网站,帮助发展业务。市场上已有多种AI工具可帮助用户创建网站,Solo1.0标志着无编码网站建设进入新阶段。

QQ截图20240614095156.png

【AiBase提要:】

🤖 Solo1.0版本引入动画效果,提升网站视觉吸引力。

🍪 添加欧洲用户cookie通知横幅,保持固定标题在顶部。

🚀 支持最多三个文本和图像横幅部分,字符数限制和最多上传30张自定义图像。

举报

  • 相关推荐
  • 大家在看
  • H2O-Danube2-1.8B:开源小型语言模型,适用于企业级应用

    H2O-Danube2-1.8B是H2O.ai最新发布的开源小型语言模型,专为离线应用和企业级应用设计,具有经济高效的接口和训练成本,易于嵌入到移动电话、无人机等边缘设备中。该模型在Hugging Face Open LLM Leaderboard的<2B范围内排名第一,提供高达200倍的查询成本节省,同时在文档处理上提供更好的准确性,成本降低高达100%。H2O.ai平台还提供了成本控制和灵活性,支持超过30种大型语言模型(Large Language Models, LLMs)的混合使用,包括专有和开源的LLMs。

  • BlitzToksAi:AI驱动的TikTok视频生成器,快速、简单、震撼。

    BlitzToksAi是一个利用先进AI技术的视频生成器,能够将用户的想法轻松转化为吸引人、高质量的TikTok视频。它简化了视频创作流程,无需昂贵的视频编辑工具,节省时间并增强社交媒体影响力。用户只需点击一下即可生成视频,无需视频编辑技能,AI负责所有技术细节,让用户专注于内容和创意。

  • AI Image Extender:AI技术扩展图像边界,创造无限可能

    AI Image Extender是一款利用人工智能技术扩展图像边界的在线工具。它允许用户通过点击和拖动操作来扩大图像的背景,调整图像的长宽比,甚至在图像边缘创造新的视觉效果。这项技术的重要性在于它能够帮助设计师和摄影师在不损失图像质量的前提下,轻松实现图像的尺寸调整和视觉效果增强,为创意工作提供了极大的便利。

  • Claude Dev:智能代码助手,提升开发效率

    Claude Dev是一款VSCode扩展,利用Anthropic的Claude 3.5 Sonnet的代理编码能力,可以逐步处理复杂的软件开发任务。它不仅支持文件读写、创建项目和执行终端命令(在获得用户许可后),还提供了一个直观的GUI,使用户能够安全且容易地探索代理AI的潜力。

  • H2O Danube3:文本生成领域的先进模型

    H2O Danube3 是由 h2oai 公司开发的一系列文本生成模型,这些模型专注于提供高质量的文本生成服务,广泛应用于聊天机器人、内容创作等领域。它们具备强大的语言理解和生成能力,能够根据给定的上下文生成连贯、准确的文本。

  • exo:在家使用日常设备搭建自己的AI集群。

    exo是一个实验性的软件项目,旨在利用家中的现有设备,如iPhone、iPad、Android、Mac、Linux等,统一成一个强大的GPU来运行AI模型。它支持多种流行的模型,如LLaMA,并具有动态模型分割功能,能够根据当前网络拓扑和设备资源来最优地分割模型。此外,exo还提供了与ChatGPT兼容的API,使得在应用程序中使用exo运行模型仅需一行代码的更改。

  • StreamVC:实时低延迟语音转换技术

    StreamVC是由Google研发的实时低延迟语音转换解决方案,能够在保持源语音内容和韵律的同时,匹配目标语音的音色。该技术特别适合实时通信场景,如电话和视频会议,并且可用于语音匿名化等用例。StreamVC利用SoundStream神经音频编解码器的架构和训练策略,实现轻量级高质量的语音合成。它还展示了学习软语音单元的因果性以及提供白化基频信息以提高音高稳定性而不泄露源音色信息的有效性。

  • H2O AI Personal GPT:智能AI助手,本地处理数据,保护隐私。

    H2O AI Personal GPT是一款由H2O.ai开发的AI助手应用,旨在提供智能、对话式的AI服务,同时确保用户的隐私安全。该应用在本地处理数据,无需担心数据离开设备,支持无网络环境下使用,适合需要移动办公和隐私保护的用户。

  • GraphAi:链接全球热门科技企业、模型及应用

    GraphAi智能工具图谱是一个综合性的网络平台,旨在链接全球热门的科技企业、模型及应用。它通过构建图谱的方式,帮助用户探索和学习人工智能领域的最新动态和产品信息。该平台不仅涵盖了国内外众多知名企业的AI产品,还提供了丰富的行业资讯和学习资源,是技术爱好者和专业人士了解AI发展的重要渠道。

  • PNG Maker:在线免费将文本转换为带透明背景的PNG图片

    PNG Maker是一个创新的在线工具,利用AI技术将文本转换为PNG图片,特别适合网页设计师、市场营销人员和内容创作者。它提供了高级的文本到PNG的转换能力,用户可以轻松地自定义字体、大小和颜色,确保专业和视觉上吸引人的结果。

  • Phaie AI:设计系统管理与自动化插件

    Phaie AI 是一个专为设计系统内部工作设计的插件,旨在帮助识别和重命名现有设计系统中的样式。它允许设计师和设计团队节省时间,通过一键操作管理颜色、排版等设计元素,创建和更新设计系统。插件背景信息包括对内部设计系统工作的深入理解,以及Beta用户的高度成功反馈。

  • Easel AI:创意表达,一键分享给朋友

    Easel AI是一款设计类应用,专注于帮助用户通过简单的操作表达自己的风格,并快速分享给朋友。它可能利用人工智能技术简化设计流程,让用户即使没有专业设计背景也能轻松创作出个性化的作品。

  • 社交媒体图片生成器:智能设计,一键生成社交媒体图片封面

    社交媒体图片生成器是uBrand品牌创意工作室推出的一款在线设计工具,它能够帮助用户快速生成适合社交媒体的图片封面。该工具利用人工智能技术,简化了设计流程,提高了设计效率,使得即使是设计新手也能轻松制作出专业水准的图片。

  • Faceindex:互联网人脸搜索工具

    Faceindex是一个利用AI技术进行人脸搜索的网站,能够扫描互联网上的照片,提供详细的搜索结果和链接。它在安全、隐私保护和用户反馈方面表现良好,是背景调查和身份验证的有力工具。

  • CalmJobs:寻找平衡工作与生活的职位

    CalmJobs是一个AI驱动的职位聚合平台,专注于提供那些重视工作生活平衡的公司职位。它帮助求职者找到既能在专业上发展也能在个人生活中保持平静和平衡的工作机会。

  • AI Presentation Maker:智能在线演示文稿制作工具

    AI Presentation Maker是一个利用人工智能技术,将文本内容快速转化为结构化、视觉吸引的幻灯片的在线工具。它通过先进的算法自动创建专业幻灯片,提供多语言支持,确保全球用户都能制作出语言和文化上合适的演示文稿。该工具的主要优点包括免费在线访问、文本到演示文稿的转换、自动化幻灯片创建、可定制的设计模板、快速演示文稿生成等。

  • Nimble:智能网页数据抓取平台

    Nimble是一个为AI和BI应用提供数据的现代数据平台,通过其企业级的数据管道,提供准确、实时的网页数据。它拥有无与伦比的数据质量和准确性,完全由AI浏览器技术管理,具有全面的治理和信任度,是领先数据团队信赖的选择。

  • Tribe AI:低代码工具,快速构建和协调多智能体团队

    Tribe AI是一个低代码工具,它利用langgraph框架,让用户能够轻松自定义和协调智能体团队。通过将复杂任务分配给擅长不同领域的智能体,每个智能体可以专注于其最擅长的工作,从而更快更好地解决问题。

  • Mergeek:产品爱好者社区,免费发布你的产品

    Mergeek.com 是一个产品爱好者社区,发现并介绍全球优质产品和项目,允许免费发布产品,APP,软件,网站,硬件。该平台提供全球最优质的限免产品,并让用户第一时间发现优秀科技产品。Mergeek AI 搜索是数字世界的百事通。你可以问关于数字产品的一切,我会尽力帮你寻找,为你解答

  • vevy.ai:数字营销合作平台

    vevy.ai是一个面向创始人和数字营销人员的合作营销平台,旨在简化他们之间的联系,并参与营销活动。它提供了多种功能,如营销伙伴匹配、客座博客、链接交换和提供写作与营销服务,帮助用户快速建立数字存在和合作关系。

今日大家都在搜的词:

热文

  • 3 天
  • 7天