首页 > 业界 > 关键词  > 人工智能最新资讯  > 正文

AI日报:干翻AI PC!苹果M4芯片首发;GoEnhance可生成粘土风格视频;DeepSeek-V2模型已在魔搭社区开源;苹果将添加AI图片擦除功能

2024-05-08 15:06 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://top.aibase.com/

1、干翻AI PC!苹果M4芯片首发 新款iPad Pro顶配超2万

苹果公司在春季新品发布会上展示了最新技术和产品革新,包括配备M4芯片和双层OLED屏幕的新款iPad Pro,以及Apple Pencil Pro和更大尺寸的iPad Air。这次发布会的亮点在于iPad Pro的超薄设计、双层OLED屏幕和强大的M4芯片,以及软件和配件的升级。苹果通过这次升级提升了iPad的生产力,缩小了与Mac电脑的差距,展示了在AI领域的新进展。

image.png

【AiBase提要:】

📱 iPad Pro升级亮点: 超薄设计、双层OLED屏幕、强大的M4芯片。

💻 软件升级提升生产力: Final Cut Pro和Logic Pro2更新,增强了iPad Pro的功能。

✨ M4芯片性能突出: 10核GPU架构、神经网络引擎速度达每秒38万亿次,能效比优秀。

2、GoEnhance推出视频到视频的黏土卡通风格转化

最近,粘土风格的图片在全网风靡,网友们纷纷将多张粘土图片转为粘土风格视频,引起热议。抖音上一则将旅行Vlog处理成黏土风格的视频更是爆红,获得大量赞和转发。GoEnhance推出视频到视频的黏土卡通风格转化,降低了价格20%,受到用户好评。

QQ截图20240508135812.png

【AiBase提要:】

🌟 GoEnhance推出黏土卡通风格视频生成功能

🌟 为适应粘土风格,GoEnhance降低视频帧速率,价格也降低20%

🌟 GoEnhance AI可转换视频为多种风格,视觉效果丰富

官网地址:https://top.aibase.com/tool/goenhance-ai

视频效果点此查看:https://www.chinaz.com/2024/0508/1615055.shtml

3、幻方DeepSeek-V2系列模型已在魔搭社区开源

魔搭ModelScope社区宣布,DeepSeek-V2系列模型现已在魔搭ModelScope社区开源。该模型在性能和效率方面表现出色,引入了MLA架构和自研Sparse结构DeepSeekMoE,具有高吞吐量和节约训练成本的优势。用户可以通过魔搭ModelScope社区直接下载模型。

【AiBase提要:】

🚀 DeepSeek-V2系列模型在性能和效率方面表现出色,具有高吞吐量和节约训练成本的优势。

💡 DeepSeek-V2引入了MLA架构和自研Sparse结构DeepSeekMoE,推理的KV Cache节约了93.3%。

🔗 用户可以通过魔搭ModelScope社区直接下载DeepSeek-V2模型,支持128K上下文窗口,性能优异。

详情链接:https://modelscope.cn/models/deepseek-ai/DeepSeek-V2-ChatDeepSeek-V2

4、OpenAI正开发新的AI图像检测工具预测照片是否由DALL-E3生成

OpenAI近日宣布推出新的图像检测分类器,用于检测图像是否由DALL-E AI图像生成器生成,并引入不可见水印技术标记生成内容。他们还开发了溯源方法,使用人工智能确定照片是否由AI生成,并添加耐篡改的水印。工具在检测DALL-E生成图像方面表现良好,但在识别其他AI模型生成内容方面性能较差。OpenAI持续完善图像分类器和音频水印技术,需要用户反馈测试有效性。

【AiBase提要:】

🔍 新的图像检测分类器可预测照片是否由DALL-E3生成,准确率约98%。

🔒 引入不可见水印技术,清晰标记生成内容,包含有关图像所有者和创建方式的信息。

🔬 开发溯源方法,使用人工智能确定照片是否由AI生成,持续完善图像分类器和音频水印技术。

5、苹果将在照片应用中添加AI图片擦除功能

苹果正测试一款AI图片擦除功能,将在macOS15中推出,提供更全面的图片编辑选项。这一功能预计将取代现有的Retouch工具,允许用户从图片中删除特定对象,提升照片应用的实用性。

【AiBase提要:】

📸 苹果正在测试AI图片擦除功能,将在macOS15中推出

🖌️ 功能预计将取代现有的Retouch工具,允许用户删除特定对象

🚀 提升照片应用的实用性,满足用户对图片编辑的高标准需求

6、生成式人工智能岗位需求暴涨超300% 年薪超40万元

生成式人工智能(AIGC)的招聘市场异常火爆,岗位需求同比增长超过三倍,年薪超40万元,吸引了广泛关注。AIGC岗位成为行业内收入最丰厚之一,推动科技领域发展,为求职者提供更多机会。预计随着领域持续发展,AIGC岗位将继续成为热门选择。

【AiBase提要:】

🚀 生成式人工智能(AIGC)招聘市场异常火爆,需求增长超300%,年薪超40万元。

💼 AIGC岗位年薪超50万元,自然语言处理专家、图像算法工程师等成为收入最丰厚职位之一。

💡 AIGC的迅速崛起推动科技领域发展,为求职者提供更多机会,预计AIGC岗位将持续成为热门选择。

7、大模型卷爆数字人:一句话5分钟实现定制,跳舞主持带货都能hold住

本文介绍了百度智能云最新发布的文生数字人技术,通过大模型带来的革新,实现了分钟级定制高质量数字人的制作过程。文章探讨了数字人技术的全面AI化效率和落地能力的提升,以及大模型在数字人领域的关键作用。同时,文章指出大模型带来的应用范式变革,让数字人的应用和商业化迈入新阶段。

image.png

【AiBase提要:】

📈 最快 5 分钟打造上岗3D数字人

🔑 大模型可根据需求自动拆解,实现快速设计

💡 百度智能云实现自然语言对话形式的数字人定制

详情:https://www.chinaz.com/2024/0508/1615046.shtml

8、OpenAI加强ChatGPT搜索功能,可能本周发布

OpenAI加强了ChatGPT的搜索功能,使其可以从网络搜索并引用来源,直接竞争Google搜索引擎和Perplexity等AI初创公司。这一举措将为用户提供更全面、自包含的信息检索和任务辅助工具。新功能允许ChatGPT用户提出问题并从各种在线资源中提取信息,包括维基百科、博客文章等。

【AiBase提要:】

⭐ ChatGPT加强搜索功能,竞争Google和Perplexity

⭐ 新功能允许用户提问并从在线资源中提取信息

⭐ OpenAI整合搜索功能,提供更全面的信息检索和任务辅助工具

9、Hugging Face开源机器人代码库LeRobot,AI机器人研发迎来新纪元

我对Hugging Face开源机器人代码库LeRobot的举措感到振奋,这标志着AI机器人研发领域迎来了重大利好。通过降低入门门槛和促进资源共享,Hugging Face可能重新定义AI机器人领域,推动社区共同进步。

image.png

【AiBase提要:】

⭐ HuggingFace宣布开源LeRobot,推动AI机器人技术研发。

⭐ LeRobot是全面平台,可用于共享数据、训练模型。

⭐ LeRobot适配多种件,降低AI机器人研发门槛。

详情链接:https://top.aibase.com/tool/lerobotLeRobot

10、OpenAI打造媒体管理工具,让内容创作者可以选择退出AI训练

OpenAI正在开发名为媒体管理(Media Manager)工具,以回应对其数据采集方式的批评,同时保护知识产权和创作者利益。该工具允许内容创作者控制其作品在生成式人工智能训练中的使用,预计在2025年前推出。

【AiBase提要:】

⭐ OpenAI开发媒体管理工具,让创作者控制作品在AI训练中的使用。

⭐ 该举措回应对OpenAI数据采集方式的批评,保护知识产权和创作者利益。

⭐ 其他公司也在构建溯源和选择退出工具,以解决AI模型训练中的知识产权问题。

举报

  • 相关推荐
  • 大家在看
  • Mistly:自动记录和分析产品反馈,快速构建更好的产品。

    Mistly是一个AI产品管理工具,能够自动从Slack频道、Zoom通话等地方记录产品反馈,并通过AI技术提供深入的洞察。它可以帮助团队快速了解用户需求,提取功能请求和bug报告,从而加速产品迭代和改进。Mistly还提供每周反馈总结和发布更新通知功能,使客户感到被重视,增强产品与用户之间的联系。

  • Omi:智能合同和文档管理平台

    Omi是一个集中化的平台,提供对财务、合同和供应商的全面监督和管理。它简化了采购流程,实现了财务控制,并通过自动化和实时数据提供决策支持,帮助企业提高效率、节约成本,并确保合规性。

  • iPadOS 18:,带来全新的工作方式和个性化体验。

    iPadOS 18是苹果公司为iPad设备推出的最新操作系统,它通过Apple Pencil、应用程序体验和个性化定制等新功能,进一步增强了iPad的生产力和创造力。该系统利用Apple Intelligence技术,根据用户的个人上下文提供最有帮助和相关的智能服务。

  • 雅意信息抽取大模型:基于大规模数据的高质量信息抽取模型

    雅意信息抽取大模型(YAYI-UIE)由中科闻歌算法团队研发,是一款在百万级人工构造的高质量信息抽取数据上进行指令微调的模型。它能够统一训练信息抽取任务,包括命名实体识别(NER)、关系抽取(RE)和事件抽取(EE),覆盖了通用、安全、金融、生物、医疗、商业等多个场景的结构化抽取。该模型的开源旨在促进中文预训练大模型开源社区的发展,并通过开源共建雅意大模型生态。

  • macOS Sequoia:Mac体验新高度,智能化与生产力的飞跃。

    macOS Sequoia是苹果公司推出的下一代桌面操作系统,它通过iPhone镜像、Safari浏览器的更新、苹果智能技术以及一系列新游戏,为Mac带来了全新的工作方式和变革性的智能特性。它利用了苹果芯片和神经引擎的强大能力,提供了深度集成的个人智能系统,注重隐私保护,并简化了日常任务。

  • iOS 18:iPhone个性化、功能强大、智能化的新高度。

    iOS 18是苹果公司推出的最新操作系统,它通过全新的个性化选项、前所未有的照片应用重设计、强大的连接方式更新以及苹果智能(Apple Intelligence)个人智能系统,为iPhone带来更深层次的个性化体验和智能化功能。

  • Invisibility:您的个人助手,集成到您的操作系统中。

    Invisibility 是一款集成到操作系统中的个人助手应用程序,它通过简单的键盘快捷键,允许用户快速与AI进行交互,提高工作效率。该应用提供了一个平台,结合了所有最新的高级模型,用户无需为多个工具或订阅付费。Invisibility 的设计理念在于简化用户与技术的互动,提供流畅的体验,无需在不同的标签和应用程序之间切换。

  • TeamCreate AI:AI助手,快速构建理想团队

    TeamCreate AI是一个在线平台,提供AI助手来帮助企业在销售、市场、财务、产品和更多领域快速构建团队。这些AI助手是无代码且可定制的,可以快速适应并执行特定任务,帮助企业在没有财务限制和繁琐招聘流程的情况下迅速扩展。

  • Midjourney Personalization:个性化图像生成工具

    Midjourney是一个独立的研究实验室,专注于探索新的思想媒介和扩展人类想象力。它是一个自筹资金的小团队,专注于设计、人类基础设施和人工智能。Midjourney Personalization通过用户对图像对的评分来学习用户的偏好,并根据这些偏好生成个性化的图像。

  • YaFSDP:高效的分布式数据并行框架,专为大型语言模型设计。

    YaFSDP是一个分布式数据并行框架,专为与transformer类神经网络结构良好协作而设计。它在预训练大型语言模型(Large Language Models, LLMs)时比传统的FSDP快20%,并且在高内存压力条件下表现更佳。YaFSDP旨在减少通信和内存操作的开销。

  • Onboard:客户管理的AI邮件平台

    Onboard AI Email Platform是一个专为客户管理设计的AI邮件平台。它集成了先进的AI技术,帮助企业精准地将邮件发送到每个客户的主收件箱,提高邮件的到达率和客户的互动率。该平台通过AI技术对客户进行细分,自动生成个性化内容,并创建AI生成的落地页来驱动客户采取行动。

  • SmartEReply:智能提升您的LinkedIn™互动

    SmartEReply是一个AI驱动的助手,旨在增强您的LinkedIn™互动,通过个性化评论、优化帖子和轻松管理私信来提升您的网络机会。它通过AI生成的内容建议,帮助您快速创建更具吸引力和优化的内容。

  • Freepik Designer:在线设计编辑器,无需设计技能。

    Freepik Designer是一个在线设计编辑器,允许用户无需专业设计技能或软件即可创建或编辑设计作品。它提供了大量的可编辑模板,支持AI工具和功能,如AI写作助手、背景移除、AI翻译器等,以简化工作流程。Freepik Designer由Freepik Company S.L.开发,总部位于阳光明媚的马拉加。

  • Source.Plus:AI训练数据的搜索、整理和丰富工具

    Source.Plus是一个专业的AI训练数据搜索平台,它允许用户通过高级搜索操作符来精确地搜索、筛选和整理所需的数据集。它支持多种数据来源,包括Wikimedia Commons、NMNH - Botany Dept.等,提供广泛的图像和文档资源。平台还具备文件上传功能,使用户能够进一步自定义和丰富自己的数据集。Source.Plus的主要优点包括其强大的搜索能力、数据来源的多样性以及对AI训练数据的特别优化。

  • Awesome-ChatTTS:ChatTTS项目的入门指南和资源汇总。

    Awesome-ChatTTS是一个开源项目,旨在为ChatTTS项目提供常见问题解答和相关资源汇总,帮助用户快速入门并解决在使用过程中可能遇到的问题。该项目不仅整理了详细的安装指南和参数说明,还提供了多种音色种子的示例,以及视频教程等辅助材料。

  • DenseAV:一种自监督的视听特征对齐模型。

    DenseAV是一种新颖的双编码器定位架构,通过观看视频学习高分辨率、语义有意义的视听对齐特征。它能够无需明确定位监督即可发现单词的“意义”和声音的“位置”,并且自动发现并区分这两种关联类型。DenseAV的定位能力来自于一种新的多头特征聚合操作符,它直接比较密集的图像和音频表示进行对比学习。此外,DenseAV在语义分割任务上显著超越了先前的艺术水平,并且在使用参数少于一半的情况下,在跨模态检索上超越了ImageBind。

  • ChatTTS-Forge:基于ChatTTS模型的文本到语音转换项目

    ChatTTS-Forge是一个围绕TTS生成模型ChatTTS开发的项目,实现了API服务器和基于Gradio的WebUI,能够提供全面的API服务,支持生成1000字以上的长文本,保持一致性,并通过内置32种不同风格进行风格管理。

  • WorldDreamer:视频生成的前沿模型

    WorldDreamer是一个创新的视频生成模型,它通过预测遮蔽的视觉令牌来理解并模拟世界动态。它在图像到视频合成、文本到视频生成、视频修复、视频风格化以及动作到视频生成等多个方面表现出色。该模型借鉴了大型语言模型的成功经验,将世界建模视为一个无监督的视觉序列建模挑战,通过将视觉输入映射到离散的令牌并预测被遮蔽的令牌来实现。

  • VividDream:从单一图像或文本生成可探索的3D场景

    VividDream是一项创新技术,能够从单一输入图像或文本提示生成具有环境动态的可探索4D场景。它首先将输入图像扩展为静态3D点云,然后使用视频扩散模型生成动画视频集合,并通过优化4D场景表示来实现一致性运动和沉浸式场景探索。这项技术为生成基于多样真实图像和文本提示的引人入胜的4D体验提供了可能。

  • LlamaGen:自回归模型在可扩展图像生成领域的新突破

    LlamaGen是一个新的图像生成模型家族,它将大型语言模型的原始下一个token预测范式应用于视觉生成领域。该模型通过适当的扩展,无需对视觉信号的归纳偏差即可实现最先进的图像生成性能。LlamaGen重新审视了图像分词器的设计空间、图像生成模型的可扩展性属性以及它们的训练数据质量。

今日大家都在搜的词:

热文

  • 3 天
  • 7天