首页 > 业界 > 关键词  > GPTs最新资讯  > 正文

AI日报:GPTs免费向所有人开放;AI神器腾讯元宝APP上线;新SD加速模型PCM来了;Udio可生成两分钟音频了

2024-05-30 16:01 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://top.aibase.com/

1、GPTs向所有免费ChatGPT用户开放

作为免费ChatGPT用户,现在可以享受到以前仅对付费用户开放的功能,如GPTs、分析图表、提问照片等。但仍需付费才能创建自定义GPT。付费用户除了享有更少的消息限制外,还有其他优势。

image.png

【AiBase提要:】

⭐ ChatGPT免费用户可使用 GPTs 、数据分析、图表分析等 GPT-4o 新功能。

⭐免费用户可以使用GPTs,但仍无法创建自己的 GPT。

⭐付费用户仍有另一个优势:较少的消息限制。免费用户达到使用GPT-4o限制次数,系统将自动切换回 GPT-3.5。

详情访问:https://www.chinaz.com/2024/0530/1620095.shtml

2、AI神器腾讯元宝APP上线 基于腾讯混元大模型开发打造

腾讯元宝是基于腾讯混元大模型开发的AI产品,提供了AI搜索、AI总结、AI写作等核心功能,展现了全面的智能服务能力。除了强大的功能外,还注重用户体验的便捷性,提供口语陪练等特色AI应用。新增了创建个人智能体等玩法,为用户打造专属AI助手。

【AiBase提要:】

🔍 腾讯元宝提供AI搜索、AI总结、AI写作等核心功能,展现全面智能服务能力。

📚 用户可解析多种文档格式,提供极大便利,支持超长上下文窗口,提供流畅交互体验。

🎮 腾讯元宝新增创建个人智能体等玩法,支持克隆声音,为用户打造专属AI助手。

详情链接:https://top.aibase.com/tool/tengxunyuanbao

3、新SD加速模型!相比LCM模型PCM出图又快又稳

这篇文章介绍了最新的SD加速模型PCM,相比LCM模型,PCM在图像处理方面有着更快更稳定的表现。PCM针对LCM的问题进行了改进,扩展了模型的应用范围,提高了图像和动画生成的质量。对于动画制作者来说,PCM的优化意味着节省后期处理时间,加快制作流程。未来在扩散模型领域有望迎来更多创新和突破。

image.png

【AiBase提要:】

✨ 扩展了模型的应用范围,提高了图像的动态范围

🔍 使得在不同推理步骤下都能产生一致且清晰的结果

🎨 通过优化损失函数和训练过程,提高了在低推理步骤下生成图像的质量

详情链接:https://top.aibase.com/tool/pcm

4、Mistral AI推首个代码生成模型Codestral 支持多种编程语言

Mistral AI推出的Codestral是一个功能强大的代码生成模型,旨在提高开发者的编码效率和质量。它支持多种编程语言,提供代码辅助功能,拥有较大的上下文窗口,性能表现优秀。通过API端点和插件支持,可以灵活集成到各种开发环境中,满足不同开发者的需求。

image.png

【AiBase提要:】

⚙️ 支持多种编程语言: Codestral支持超过80种编程语言,包括Python、Java、C++等流行语言,提供更广泛的应用范围。

✨ 代码辅助功能: Codestral能够自动完成代码编写、辅助编写测试代码,填补未完代码,提高编码速度和质量。

🚀 技术优势与性能表现: Codestral拥有32k的上下文窗口,在多个基准测试中表现卓越,能处理更长的代码段,更好地理解上下文,提升开发效率。

详情链接:https://top.aibase.com/tool/codestral

5、百度发布AI原生应用“橙篇”APP 支持超长内容理解生成

百度在2024移动生态万象大会上推出了AI原生应用“橙篇”,为用户提供了超长内容理解、生成和编辑的能力,极大丰富了内容创作手段。

【AiBase提要:】

🔍 百度推出AI原生应用“橙篇”,支持用户应对超大、多格式、长内容的文件挑战。

📚 “橙篇”具有深度编辑和多模态自由创作能力,源自百度文库12亿内容积淀和上百项尖端AI技术融合。

💡 用户可享受AI全网智能检索和学术检索便捷,一键触及百度文库、百度学术及全网数十亿的专业信息和资料。

6、Udio推出新的udio-130音乐生成模型:可生成两分钟音频

Udio最新推出的udio-130音乐生成模型带来了许多令人振奋的功能,为用户创作音轨提供了更多可能性和便利性。

image.png

【AiBase提要:】

⭐ 新功能包括生成两分钟音频,有助于创作长期连贯性和结构的音轨

⭐ 添加了随机种子和剪辑开始时间控制功能,方便用户精准剪辑

⭐ 新增关注用户功能,让用户及时获取喜爱创作者的新歌曲动态

7、普华永道与 OpenAI 合作,为10万员工提供 ChatGPT 服务

普华永道与 OpenAI 合作,成为其最大客户和首家产品经销商,推广 ChatGPT 等产品,助力员工、客户降本增效。生成式 AI 应用已经从实验进入场景化落地阶段,帮助员工、客户实现降本增效。普华永道凭借全球庞大业务网络,成为 OpenAI 的首家产品经销商,帮助推广 AI 服务。

【AiBase提要:】

⭐ 普华永道成为 OpenAI 最大客户和首家经销商

⭐ 生成式 AI应用场景化落地,助力员工、客户降本增效

⭐ 普华永道推广 ChatGPT 等产品,并使用 GPT-4o 模型进行定制化应用

8、黑客发布破解版ChatGPT “Godmode GPT”

这篇文章报道了黑客发布了破解版的ChatGPT,名为"Godmode GPT",绕过了OpenAI的限制,允许用户进行非法咨询。尽管OpenAI已采取行动,但黑客们继续努力绕过AI模型的限制。

image.png

【AiBase提要:】

⚠️ 破解版ChatGPT“Godmode GPT”绕过了OpenAI限制,允许非法咨询。

🔒 OpenAI采取行动,但黑客持续努力绕过AI模型限制。

🚫 用户试图破解AI模型,GPT-4o被成功破解,采用Leetspeak绕过限制。

9、全球AI工具认知度调查:公众兴趣低迷

最新的调查中发现,尽管AI公司和投资者急于推广人工智能产品,但公众对这些工具的认知和使用率仍然相对较低。年轻人更倾向于使用生成式AI产品,而大多数人仅出于好奇或试验目的使用这些工具。

【AiBase提要:】

🔍 公众对AI工具认知度低:调查显示,20%至30%的受访者从未听说过流行的AI工具,如OpenAI的ChatGPT。

💡 国产大模型产品受欢迎:国内用户逐渐转向使用国产模型产品,如Kimi和通义千问,体验较好且能力不断提升。

🌍 年轻人是主要用户群体:调查显示,18-24岁人群中有56%至少使用过一次ChatGPT,而55岁及以上人群中仅有16%使用过。

详情链接:https://reutersinstitute.politics.ox.ac.uk/what-does-public-six-countries-think-generative-ai-news#header--3

举报

  • 相关推荐
  • 大家在看
  • 豆包 MarsCode:智能开发工具,一触即发

    豆包 MarsCode 是一款即将发布的智能开发工具,旨在通过AI技术激发开发者的创造力。它将为编程工作带来革命性的改变,提高开发效率,降低技术门槛。

  • Florence-2-base:先进的视觉基础模型,支持多种视觉和视觉-语言任务。

    Florence-2是由微软开发的高级视觉基础模型,采用基于提示的方法处理广泛的视觉和视觉-语言任务。该模型能够解释简单的文本提示,执行如描述、目标检测和分割等任务。它利用包含54亿个注释的5.4亿张图像的FLD-5B数据集,精通多任务学习。模型的序列到序列架构使其在零样本和微调设置中都表现出色,证明其为有竞争力的视觉基础模型。

  • Florence-2-large:先进的视觉基础模型,支持多种视觉和视觉-语言任务

    Florence-2-large是由微软开发的先进视觉基础模型,采用基于提示的方法处理广泛的视觉和视觉-语言任务。该模型能够解释简单的文本提示来执行如图像描述、目标检测和分割等任务。它利用包含54亿注释的5.4亿图像的FLD-5B数据集,精通多任务学习。其序列到序列的架构使其在零样本和微调设置中均表现出色,证明是一个有竞争力的视觉基础模型。

  • Multi:多人协作,提升软件开发效率

    Multi是一款专为软件开发团队设计的协作工具,它通过多人协作、共享控制、即时通讯和自动记录等功能,帮助团队成员更高效地沟通和工作。产品基于Zoom的高质量音视频基础设施,提供低延迟的共享控制体验,并通过AI技术自动生成会议摘要和行动项,进一步加速团队的软件开发流程。

  • 智能编码助手通义灵码:智能编码助手,提升开发效率

    通义灵码是一款专为开发者设计的智能编码助手,支持多种开发环境,包括JetBrains IDEs、Visual Studio Code、Visual Studio等。它通过集成先进的AI技术,帮助开发者快速完成编码任务,提高编码效率和质量,适用于各种编程语言和开发场景。

  • MOFA-Video:通过生成运动场适应实现单图像动画化

    MOFA-Video是一种能够将单张图片通过各种控制信号动画化的方法。它采用了稀疏到密集(S2D)运动生成和基于流的运动适应技术,可以有效地使用轨迹、关键点序列及其组合等不同类型的控制信号来动画化单张图片。在训练阶段,通过稀疏运动采样生成稀疏控制信号,然后训练不同的MOFA-Adapters来通过预训练的SVD生成视频。在推理阶段,不同的MOFA-Adapters可以组合起来共同控制冻结的SVD。

  • Duix:AI数字人智能交互平台

    DUIX是一个开源的AI数字人智能交互平台,由硅基智能打造。它允许开发者接入多种大模型和语音能力,实现数字人实时交互,并支持在Android和iOS多终端一键部署。DUIX适用于多种场景,包括地铁、银行、政务等,具有低成本快速部署、小网络依赖和功能多样化的特点。

  • SuperSonic:下一代BI平台,融合Chat BI和Headless BI。

    SuperSonic是一个集成了由大型语言模型(LLM)驱动的Chat BI和由语义层驱动的Headless BI的下一代商业智能(BI)平台。它确保Chat BI能够访问与传统BI相同的经过策划和治理的语义数据模型。此外,这两种范式的实现都从集成中受益:Chat BI的Text2SQL通过从语义模型中检索上下文得到增强;Headless BI的查询接口通过自然语言API得到扩展。SuperSonic提供了一个Chat BI界面,使用户能够使用自然语言查询数据,并以适当的图表可视化结果。要实现这种体验,唯一需要的就是通过Headless BI接口构建逻辑语义模型(定义指标/维度/标签及其含义和关系)。同时,SuperSonic被设计为可扩展和可组合的,允许使用Java SPI添加和配置自定义实现。

  • DB-GPT:AI原生数据应用开发框架

    DB-GPT是一个开源的AI原生数据应用开发框架,利用AWEL(Agentic Workflow Expression Language)和代理(agent)技术,简化了大型模型应用与数据的结合。它通过多模型管理、Text2SQL效果优化、RAG框架优化、多代理框架协作等技术能力,使企业和开发者能够以更少的代码构建定制化应用。DB-GPT在数据3.0时代,基于模型和数据库,为构建企业级报告分析和业务洞察提供了基础数据智能技术。

  • OpenAgents:一个开放平台,用于日常使用的语言代理。

    OpenAgents是一个开放平台,旨在使用户和开发者能够在日常生活中使用和托管语言代理。该平台已经实现了三种代理:数据分析的Data Agent、集成200+日常工具的Plugins Agent和自动网页浏览的Web Agent。OpenAgents通过优化的Web UI使普通用户能够与代理功能进行交互,同时为开发者和研究人员提供在本地设置上的无缝部署体验,为创新语言代理的构建和现实世界评估提供了基础。

  • ChattyUI:你的私人AI聊天工具,运行在浏览器中。

    Chatty是一个利用WebGPU技术在浏览器中本地且私密地运行大型语言模型(LLMs)的私人AI聊天工具。它提供了丰富的浏览器内AI体验,包括本地数据处理、离线使用、聊天历史管理、支持开源模型、响应式设计、直观UI、Markdown和代码高亮显示、文件聊天、自定义内存支持、导出聊天记录、语音输入支持、重新生成响应以及明暗模式切换等功能。

  • AsyncDiff:异步去噪并行化扩散模型

    AsyncDiff 是一种用于并行化扩散模型的异步去噪加速方案,它通过将噪声预测模型分割成多个组件并分配到不同的设备上,实现了模型的并行处理。这种方法显著减少了推理延迟,同时对生成质量的影响很小。AsyncDiff 支持多种扩散模型,包括 Stable Diffusion 2.1、Stable Diffusion 1.5、Stable Diffusion x4 Upscaler、Stable Diffusion XL 1.0、ControlNet、Stable Video Diffusion 和 AnimateDiff。

  • MacAIverse:macOS风格的开源React桌面环境

    MacAIverse是一个完全由AI生成代码,使用React构建的macOS风格的开源桌面环境。该项目由Claude AI助手初始创建,现在开放给其他Claude实例或其他开发者贡献新的应用。它遵循macOS设计原则,保持与整体桌面环境的一致性,并通过Tailwind CSS和framer-motion库实现流畅的动画和响应式布局。

  • EvTexture:视频超分辨率纹理增强技术

    EvTexture是一种基于事件的视觉驱动的视频超分辨率(VSR)技术,它利用事件信号中的高频细节来更好地恢复VSR中的纹理区域。该技术首次提出使用事件信号进行纹理增强,通过迭代纹理增强模块逐步探索高时间分辨率的事件信息,实现纹理区域的逐步细化,从而获得更准确、丰富的高分辨率细节。在四个数据集上,EvTexture达到了最先进的性能,特别是在Vid4数据集上,与最近的基于事件的方法相比,可以获得高达4.67dB的增益。

  • Telegraf:开源服务器代理,用于收集和报告指标

    Telegraf是一个开源的服务器代理,用于收集和发送来自数据库、系统和IoT传感器的所有指标和事件。它使用Go语言编写,编译成一个单一的二进制文件,无需外部依赖,占用的内存非常小。Telegraf拥有300多个插件,由社区成员编写,覆盖了云服务、应用程序、IoT传感器等多种数据源。它支持灵活的解析和序列化,适用于多种数据格式,如JSON、CSV、Graphite,并能将数据序列化为InfluxDB行协议和Prometheus等。Telegraf还具有稳健的交付保证,包括流量回压、调度器、时钟漂移调整、全流支持等。此外,Telegraf的自定义构建器允许用户选择特定插件包含在Telegraf二进制文件中,适合在资源受限的设备上使用。

  • iA Writer:纯净写作体验,专注流状态

    iA Writer是一款专注于写作的应用程序,旨在提供纯净的写作环境,帮助用户专注于内容创作。它通过简洁的界面设计和强大的功能,如语法检查、文本聚焦等,帮助用户提高写作效率和质量。iA Writer背后的设计理念是利用人工智能技术,让用户在写作时思考得更多,而不是更少,从而提升写作体验。

  • Groqnotes:使用Groq、Whisper和Llama3从音频生成有组织的笔记。

    Groqnotes是一个基于Streamlit的应用程序,它通过迭代解析和生成从转录的音频讲座中提取的笔记来构建结构化的讲座笔记。该应用程序混合使用了Llama3-8b和Llama3-70b模型,利用较大的模型生成笔记结构,较快的模型创建内容。Groqnotes的主要优点包括快速转录音频和生成文本,以及通过策略性地在两种模型之间切换来平衡速度和质量。此外,它还支持Markdown样式,可以在Streamlit应用程序中创建美观的笔记,包括表格和代码,并允许用户下载包含全部笔记内容的文本或PDF文件。

  • june:本地语音聊天机器人,保护隐私,无需联网。

    june是一个结合了Ollama、Hugging Face Transformers和Coqui TTS Toolkit的本地语音聊天机器人。它提供了一种灵活、注重隐私的解决方案,可以在本地机器上进行语音辅助交互,确保没有数据被发送到外部服务器。产品的主要优点包括无需联网即可使用、保护用户隐私、支持多种交互模式等。

  • Meilisearch:极速、高度相关的搜索引擎

    Meilisearch是一个灵活且强大的用户为中心的搜索引擎,可以轻松添加到任何网站或应用程序中。它以其极速的搜索响应(小于50毫秒)和即插即用的特性(智能预设,零配置启动)著称。Meilisearch还提供了先进的全文搜索引擎,具有出色的相关性,适用于各种用例。此外,它是一个开源项目,拥有一个友好且快速增长的社区。

  • nerve:无需编写代码即可创建智能代理的LLM工具。

    Nerve是一个可以创建具有状态的代理的LLM工具,用户无需编写代码即可定义和执行复杂任务。它通过动态更新系统提示和在多个推理过程中保持状态,使代理能够规划和逐步执行完成任务所需的操作。Nerve支持任何通过ollama、groq或OpenAI API可访问的模型,具有高度的灵活性和效率,同时注重内存安全。

今日大家都在搜的词: