首页 > 业界 > 关键词  > SD3最新资讯  > 正文

AI日报:SD3、SVD可以在Discord使用了;ElevenLabs Music发布;AI游戏让你无痛当爹;调光大师IC-Light ComfyUI节点发布

2024-05-10 15:03 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://top.aibase.com/

1、Stability AI加入Discord 用户可在线使用SD3、SVD功能

Stability AI推出了Stable Artisan Discord机器人服务,为用户提供更便捷的生成图片和视频的方式。该服务具有多项编辑和定制功能,包括搜索替换、去除背景、创意放大、内容延伸等。此外,Stability AI还在开发更大规模的交互式聊天机器人Stable Assistant,致力于满足不同用户群体的需求。

image.png

【AiBase提要:】

⭐ 用户可以通过Stable Artisan Discord机器人服务使用SD3生成图片和SVD生成视频,提供更便捷的方式。

⭐ Stable Artisan具有多项编辑和定制功能,如搜索替换、去除背景、创意放大、内容延伸等。

⭐ Stability AI正在开发Stable Assistant交互式聊天机器人项目,利用文本到图像和大型语言型技术,满足不同用户群体的需求。

详情链接:https://top.aibase.com/tool/stable-artisan

2、Suno新竞争对手ElevenLabs Music发布 音乐人饭碗被砸稀烂!

ElevenLabs最新推出的文本生成歌曲产品ElevenLabs Music在音乐领域展现出与Suno和Udio相媲美的表现,具有人声独唱优势、文本描述生成音乐和AI音乐潜力。该产品将改变普通人成为歌手的梦想,同时为专业音乐人提供创作灵感。

image.png

【AiBase提要:】

🎶 ElevenLabs Music效果媲美Suno和Udio,已发布多首文本生成音乐。

🎤 人声独唱效果优于Suno和Udio,ElevenLabs Music清晰度、拟人化和乐器融合度更高。

🎵 目前,ElevenLabs Music仍处于早期预览版,暂未开放全面测试

官网地址:https://top.aibase.com/tool/elevenlabs

视频点此查看:https://www.chinaz.com/2024/0510/1615475.shtml

3、AI游戏《换你来当爹》上线 结果,我把逆子室友养废了

这篇文章介绍了一款名为《换你来当爹》的AI游戏,利用最新的LLM技术实时生成剧情和图片,带来个性化和互动性体验。游戏预示了未来游戏和内容消费的新趋势,展示了AI技术在游戏领域的应用潜力。

image.png

【AiBase提要:】

🎮 利用LLM技术实时生成剧情和图片,提供个性化游戏体验。

👨‍👦‍👦 玩家可设定熟悉人物为“儿子”,互动影响游戏进程。

🚀 游戏展示了未来内容消费和创作形式的新趋势,推动游戏行业创新发展。

详情链接:https://top.aibase.com/tool/huannilaidangdie

4、IC-Light ComfyUI节点发布 商品图重绘表现出色

IC-Light ComfyUI节点发布的文章介绍了在视觉设计和图像处理领域中,光照和背景匹配的重要性,以及IC-Light ComfyUI节点带来的创新功能和提升效率的优势。

image.png

【AiBase提要:】

🌟 光照控制功能: IC-Light ComfyUI允许用户重新打光图像主体,使其与新背景的环境光匹配,特别适用于商品图合成。

🌟 背景生成模式: 支持两种操作模式,可分离主体并生成符合光照要求的新背景,确保主体与原图保持一致。

🌟 环境光融合技术: 自动生成环境光,确保背景和前景自然融合,在商品图重绘中表现出色。

详情链接:https://top.aibase.com/tool/comfyui-ic-light

5、苹果计划在云端使用 M2 Ultra 芯片进行人工智能处理

苹果计划利用M2Ultra芯片在云端运行更复杂的AI查询,并计划未来转向更先进的M4芯片用于AI处理。公司致力于提升生成式人工智能的性能和效率。

【AiBase提要:】

⭐ 苹果将利用M2Ultra芯片在云端运行更复杂的AI查询

⭐ 公司计划在未来转向更先进的M4芯片用于AI处理

⭐ 苹果旨在提升生成式人工智能的性能和效率

6、OpenAI 增强 Assistants API 引入视觉能力支持多种图像格式

OpenAI最近宣布其Assistants API现在支持视觉能力,这将为用户提供更丰富的交互体验。这项更新使API能够处理和理解图像内容,为开发者提供了新的工具,以创建结合视觉和文本信息的应用程序。增强的视觉能力有望带来新的创新和改进,推动AI技术在各个行业中的集成和应用。

image.png

【AiBase提要:】

🖼️ 支持多种图像格式: 用户可以提交PNG、JPG、GIF和WebP格式的图像供API分析和理解。

📊 数据使用限制: 每个组织有100GB使用限制,每个用户有10GB限制,确保服务的公平使用。

🔍 图像理解自由控制: API支持低保真度或高保真度的图像理解,开发者可以根据需求自由控制图像处理的精细程度。

7、Gemini将实现无缝播放YouTube Music功能

Gemini AI助手即将支持播放YouTube Music中的音乐,为用户带来更简单流畅的音乐体验。用户只需向Gemini发出指令,便能无缝播放所选音乐,省去繁琐的操作步骤,提高效率。这一更新将极大方便喜欢在YouTube Music上发现音乐的用户,也有望推动智能助手的普及应用。

image.png

【AiBase提要:】

🎵 Gemini AI助手将支持播放YouTube Music中的音乐,提升用户体验。

🔍 用户发出指令后,Gemini会自动查询并播放最匹配的音乐,简化操作流程。

⏩ 用户无需手动搜索和选择播放列表,从指令到音乐响起的过程变得更加简洁

8、TikTok新增 “AI生成” 标签,识别标注第三方生成的AI内容

TikTok宣布新增“AI生成”标签,为第三方平台生成的内容添加标识,提升内容真实性和透明度。这一举措不仅增加了用户对内容生成方式的了解,也促进了内容的可信度。

image.png

【AiBase提要:】

🤖 TikTok将为第三方平台生成的内容添加“AI生成”标签

🌐 支持Adobe的Content Credentials标记系统

📱 实现多阶段自动识别和标签功能

9、Stack Overflow 用户抗议不愿将其知识用于 AI 训练

在本文中,Stack Overflow 用户对其回答被用于 OpenAI 的 ChatGPT 训练表示抗议。用户试图删除或修改自己的帖子被全面禁止,引发了广泛关注。文章探讨了用户对数据使用的不满,以及 Stack Overflow 使用条款给予用户的回旋余地的问题。

【AiBase提要:】

👥 Stack Overflow 用户抗议回答被用于 AI 训练

🚫 用户试图删除或修改帖子被全面禁止

🤖 Stack Overflow 用户无法选择拒绝数据用于 AI 训练

10、OpenAI将推出基于生成式人工智能的搜索引擎

OpenAI计划推出基于生成式人工智能的搜索引擎,挑战谷歌在搜索领域的主导地位。该搜索引擎将基于ChatGPT AI技术,提供网络问题和查询的搜索结果,并引用相关文献。文章指出OpenAI面临提供准确及实时信息的挑战,但仍有望在竞争中脱颖而出。

【AiBase提要:】

🔍 OpenAI将于5月13日推出基于生成式人工智能的搜索引擎,挑战谷歌主导地位。

🤖 该搜索引擎将使用ChatGPT AI作为基础,提供网络问题和查询的搜索结果,并引用相关文献。

💡 OpenAI的搜索产品是ChatGPT的延伸,可以让ChatGPT直接从网络获取信息并包含引用,有望扩大用户群。

11、在AI需求驱动下,台积电四月销售额增长60%

在本文中,台积电四月销售额同比增长60%,达到新台币2360亿(约73亿美元,得益于持续增长的人工智能需求以及消费电子行业复苏。全球智能手机行业在今年三个月出现增长,包括中国市场,这可能带动对台积电传统主力移动芯片的订单增长。台积电在人工智能领域占据有利地位,是N公司最先进的训练芯片的唯一制造商,同时也为苹果和AMD等公司生产芯片。

【AiBase 提要:】

📈 台积电四月售额同比增长 60%,达到新台币 2360 亿(约 73 亿美元)。

📱 全球智能手机行业出现增长,带动对台积电传统主力移动芯片订单增长。

💻 台积电在人工智能领域占据有利地位,为多家公司生产高性能芯片。

12、OpenAI指控Reddit子版块使用ChatGPT的logo侵权

埃隆·马斯克指责OpenAI虚伪,称其在对Reddit子版块使用ChatGPT的logo提出版权投诉时显得虚伪。这是马斯克多次公开批评OpenAI,指责其窃取数据来源、将利润置于人类利益之上。

image.png

【AiBase提要:】

🔍 OpenAI对Reddit子版块使用ChatGPT的logo提出版权投诉,马斯克直怼虚伪行为。

🚀 马斯克指责OpenAI广泛使用受版权保护作品构建产品,却强制执行版权声明。

💥 马斯克起诉OpenAI及首席执行官,指控其背叛公司创立原则,建议开源人工智能技术或更改名称。

举报

  • 相关推荐
  • AI日报:美团AI编程工具NoCode将上线;火山引擎发布MCP Servers;腾讯混元上线游戏视觉生成平台

    本文汇总了近期AI领域的重要动态:1)美团将推出对话式编程工具"NoCode";2)火山引擎发布大模型生态平台MCP Servers;3)B站开源动画视频生成模型Index-AniSora;4)字节跳动升级AI耳机Ola Friend的英语学习功能;5)GitHub推出AI编程助手自动修复代码漏洞;6)腾讯混元上线游戏视觉生成平台;7)微软将VS Code转型为开源AI编辑器;8)Windows 11原生支持MCP协议;9)Anthropic发布AI代理开发指南;10)谷歌推出编程AI代理Jules;11)NotebookLM推出iOS版;12)Genspark创3600万美元ARR纪录;13)Bright Data发布开源MCP服务器;14)马斯克宣布Grok模型将登陆Azure平台。这些进展展示了AI技术在编程、内容生成、操作系统等领域的快速发展和应用创新。

  • AI日报:美团No Code平台免费开放;豆包App升级“一句话P图”功能;苹果Xcode 26内置ChatGPTAI功能

    本文介绍了AI领域多项重要进展:1)美团推出No Code平台和1680个AI应用;2)豆包App升级"一句话P图"功能;3)苹果发布内置ChatGPT的Xcode26开发工具;4)iOS26新增视觉智能功能;5)讯飞星火X1升级版即将发布;6)比亚迪接入阿里通义大模型;7)DeepSeek支持本地工具调用;8)开源框架Rowboat支持快速构建智能助手;9)X平台整合Grok AI优化内容推荐;10)港科大开发进化搜索技术提升小模型图像生成能力;11)硅基流动完成数亿元融资;12)港大与英伟达合作开发新型视觉注意力机制。这些创新展示了AI技术在各领域的快速发展和应用突破。

  • 格创东智CIM AI Insight实现“数据追人”,产能决策时间压缩90%

    半导体制造面临数据迷雾困境:晶圆生产涉及上千道精密工序,良率波动0.1%即可能造成千万级损失。传统数据分析依赖人工跨系统提取数据,效率低下且难实时联动。格创东智推出CIM+AI+Insight解决方案,通过自然语言交互、多智能体协作和动态仪表板三大创新,实现"数据找人"的智能化转型。该系统具备三大核心价值:1)自然语言查询替代SQL编写;2)ChatYMS等智能体自�

  • AI日报:通义千问开源Qwen3向量模型;字节跳动图像编辑模型SeedEdit 3.0;ElevenLabs推v3语音模型

    本文汇总了近期AI领域的重要动态:1)通义千问发布Qwen3-Embedding系列模型,在多语言文本处理表现优异;2)字节跳动推出图像编辑模型SeedEdit3.0,提升细节保持能力;3)ElevenLabs发布情感语音合成系统Eleven v3 Alpha;4)Anthropic推出面向国家安全的Claude Gov模型;5)可灵AI月收入连续两月超1亿元;6)Meta公布智能眼镜Aria Gen2技术细节;7)爱诗科技上线AI视频工具"拍我AI";8)富国银行预测2030年ChatGPT广告收入将达千亿美元。

  • AI日报:通义千问3大模型全球爆火;即梦图片3.0智能参考全量上线;智谱AI企业级超级助手Agent CoCo上线

    【AI日报】今日AI领域重要动态:1.通义千问3大模型全球下载量超1250万,衍生模型13万+;2.即梦图片3.0上线,AI设计进入"零门槛"时代;3.智谱AI发布企业级超级助手Agent CoCo;4.百度推出金融行业大模型"千帆慧金";5.小红书开源首个大模型dots.llm1,含1420亿参数;6.Hugging Face开源LeRobot项目,降低机器人研发门槛;7.ChatGPT语音功能升级,支持更自然对话翻译;8.Google Gemini应用下载量超ChatGPT但活跃度不足;9.轻量级文档解析模型MonkeyOCR表现优异;10.Google Veo3推出高速视频生成模式;11.Google调整AI Studio政策,限制Gemini2.5Pro免费访问。

  • AI日报ChatGPT支持MCP和会议记录功能;Cursor 1.0 版本重磅发布;Midjourney视频功能将在本月上线

    本期AI日报聚焦多项AI领域突破:1)OpenAI为ChatGPT新增企业数据连接和会议记录功能;2)Cursor 1.0发布集成BugBot等开发工具;3)Midjourney即将推出视频生成功能;4)秘塔AI搜索新增PPT导出功能;5)Manus推出文本生成视频工具挑战Sora;6)法国Mistral发布企业级编程助手;7)英伟达推出文档处理专用AI模型;8)腾讯公益引入大模型提升互动体验;9)Firecrawl推出网页抓取API工具;10)Bland AI实现超真实语音克隆;11)报告显示AI训练成本逼近百亿美元;12)开源设计工具Jaaz支持批量图像生成;13)《逆水寒》手游接入AI实现图片动效玩法。

  • AI日报:豆包大模型1.6发布;OpenAI推o3-pro模型、o3价格暴降80%;Figma官方MCP重磅上线

    【AI日报】今日AI领域重要动态:1)火山引擎发布豆包大模型1.6和视频生成模型Seedance1.0pro,性能显著提升;2)OpenAI推出o3-pro模型,专注可靠性但响应较慢;3)Figma推出Dev Mode MCP服务,实现设计到代码一键转换;4)Krea AI发布图像生成模型Krea1,解决传统AI绘图问题;5)火山引擎豆包日调用量突破16.4万亿次;6)法国Mistral发布推理模型Magistral;7)苹果系统整合ChatGPT图像生成功能;8)OpenAI大幅下调o3价格80%并推出o3-pro;9)Hugging Face开源榜单显示中国团队Qwen与DeepSeek进入全球前15;10)阿里开源MaskSearch框架,提升AI解决复杂问题能力。

  • AI日报:Anthropic推最强编码AI模型Claude4;苹果计划推AI智能眼镜;QQ浏览器上线首个高考Agent

    【AI日报】今日AI领域重要动态:1)Anthropic发布Claude4系列AI模型,编程能力超越竞争对手;2)苹果计划2026年推出集成AI技术的智能眼镜;3)字节跳动与清华合作推出时序多模态大模型ChatTS;4)3DTown框架实现单张照片生成逼真3D场景;5)OpenAI秘密开发无屏幕AI设备;6)商汤科技推出儿童AI下棋机器人;7)微软记事本新增AI写作功能;8)深圳设立70亿元基金支持AI硬件初创企业;9)谷歌发布3D视频通信平台Beam;10)阿联酋推出"星际之门"计划,免费提供ChatGPT服务;11)法国Mistral推出开源模型Devstral;12)Anthropic API新增四大功能;13)美国众议院通过法案限制各州监管AI;14)QQ浏览器推出高考AI助手。

  • AI日报:QQ浏览器升级为AI浏览器;OpenAI全新编程智能体Codex;B站团队推动漫视频生成模型AniSora

    本文介绍了AI领域多项最新进展:1)B站团队推出开源动漫视频生成模型AniSora,支持多种风格创作;2)OpenAI发布编程智能体Codex,提升开发效率;3)Google测试AI问答功能AI Mode;4)ChatGPT将整合MCP协议,支持第三方AI服务对接;5)阿里推出ZeroSearch框架,减少对搜索引擎的依赖;6)Stability AI与Arm合作推出手机端音频生成AI;7)Qwen发布WorldPM系列大模型;8)GPT-5将整合多款产品功能;9)ListenHub上线AI播客生成工具;10)QQ浏览器升级为AI浏览器;11)数学建模AI助手MathModelAgent面世;12)GenSpark推出全球首个智能下载代理;13)谷歌NotebookLM将推出视频摘要功能。这些创新展现了AI技术在各领域的快速发展和广泛应用。

  • AI日报:昆仑万维天工超级智能体发布;OpenAI核心API支持MCP;百度飞桨PaddleOCR 3.0开源

    【AI日报】汇总了近期AI领域重要动态:1)百度飞桨发布PaddleOCR3.0,提升文字识别精度13%;2)昆仑万维发布天工超级智能体,AI办公成本仅为OpenAI的40%;3)OpenAI API新增MCP支持简化开发流程;4)xAI推出实时网页搜索API;5)谷歌Sparkify可将问题秒变动画;6)Mistral发布高效代码模型Devstral;7)Video Ocean推出4K视频生成工具;8)谷歌推出AI内容识别工具SynthID;9)谷歌NotebookLM使用量半年增长56%;10)硅基流动升级128K长文本模型;11)DeepMind发布音乐生成模型Lyria2;12)多模态大模型MMaDA实现跨模态推理;13)微软发布网页智能体Magentic-UI;14)Framer推出AI建站套件。