首页 > 业界 > 关键词  > SD3最新资讯  > 正文

AI日报:SD3、SVD可以在Discord使用了;ElevenLabs Music发布;AI游戏让你无痛当爹;调光大师IC-Light ComfyUI节点发布

2024-05-10 15:03 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://top.aibase.com/

1、Stability AI加入Discord 用户可在线使用SD3、SVD功能

Stability AI推出了Stable Artisan Discord机器人服务,为用户提供更便捷的生成图片和视频的方式。该服务具有多项编辑和定制功能,包括搜索替换、去除背景、创意放大、内容延伸等。此外,Stability AI还在开发更大规模的交互式聊天机器人Stable Assistant,致力于满足不同用户群体的需求。

image.png

【AiBase提要:】

⭐ 用户可以通过Stable Artisan Discord机器人服务使用SD3生成图片和SVD生成视频,提供更便捷的方式。

⭐ Stable Artisan具有多项编辑和定制功能,如搜索替换、去除背景、创意放大、内容延伸等。

⭐ Stability AI正在开发Stable Assistant交互式聊天机器人项目,利用文本到图像和大型语言型技术,满足不同用户群体的需求。

详情链接:https://top.aibase.com/tool/stable-artisan

2、Suno新竞争对手ElevenLabs Music发布 音乐人饭碗被砸稀烂!

ElevenLabs最新推出的文本生成歌曲产品ElevenLabs Music在音乐领域展现出与Suno和Udio相媲美的表现,具有人声独唱优势、文本描述生成音乐和AI音乐潜力。该产品将改变普通人成为歌手的梦想,同时为专业音乐人提供创作灵感。

image.png

【AiBase提要:】

🎶 ElevenLabs Music效果媲美Suno和Udio,已发布多首文本生成音乐。

🎤 人声独唱效果优于Suno和Udio,ElevenLabs Music清晰度、拟人化和乐器融合度更高。

🎵 目前,ElevenLabs Music仍处于早期预览版,暂未开放全面测试

官网地址:https://top.aibase.com/tool/elevenlabs

视频点此查看:https://www.chinaz.com/2024/0510/1615475.shtml

3、AI游戏《换你来当爹》上线 结果,我把逆子室友养废了

这篇文章介绍了一款名为《换你来当爹》的AI游戏,利用最新的LLM技术实时生成剧情和图片,带来个性化和互动性体验。游戏预示了未来游戏和内容消费的新趋势,展示了AI技术在游戏领域的应用潜力。

image.png

【AiBase提要:】

🎮 利用LLM技术实时生成剧情和图片,提供个性化游戏体验。

👨‍👦‍👦 玩家可设定熟悉人物为“儿子”,互动影响游戏进程。

🚀 游戏展示了未来内容消费和创作形式的新趋势,推动游戏行业创新发展。

详情链接:https://top.aibase.com/tool/huannilaidangdie

4、IC-Light ComfyUI节点发布 商品图重绘表现出色

IC-Light ComfyUI节点发布的文章介绍了在视觉设计和图像处理领域中,光照和背景匹配的重要性,以及IC-Light ComfyUI节点带来的创新功能和提升效率的优势。

image.png

【AiBase提要:】

🌟 光照控制功能: IC-Light ComfyUI允许用户重新打光图像主体,使其与新背景的环境光匹配,特别适用于商品图合成。

🌟 背景生成模式: 支持两种操作模式,可分离主体并生成符合光照要求的新背景,确保主体与原图保持一致。

🌟 环境光融合技术: 自动生成环境光,确保背景和前景自然融合,在商品图重绘中表现出色。

详情链接:https://top.aibase.com/tool/comfyui-ic-light

5、苹果计划在云端使用 M2 Ultra 芯片进行人工智能处理

苹果计划利用M2Ultra芯片在云端运行更复杂的AI查询,并计划未来转向更先进的M4芯片用于AI处理。公司致力于提升生成式人工智能的性能和效率。

【AiBase提要:】

⭐ 苹果将利用M2Ultra芯片在云端运行更复杂的AI查询

⭐ 公司计划在未来转向更先进的M4芯片用于AI处理

⭐ 苹果旨在提升生成式人工智能的性能和效率

6、OpenAI 增强 Assistants API 引入视觉能力支持多种图像格式

OpenAI最近宣布其Assistants API现在支持视觉能力,这将为用户提供更丰富的交互体验。这项更新使API能够处理和理解图像内容,为开发者提供了新的工具,以创建结合视觉和文本信息的应用程序。增强的视觉能力有望带来新的创新和改进,推动AI技术在各个行业中的集成和应用。

image.png

【AiBase提要:】

🖼️ 支持多种图像格式: 用户可以提交PNG、JPG、GIF和WebP格式的图像供API分析和理解。

📊 数据使用限制: 每个组织有100GB使用限制,每个用户有10GB限制,确保服务的公平使用。

🔍 图像理解自由控制: API支持低保真度或高保真度的图像理解,开发者可以根据需求自由控制图像处理的精细程度。

7、Gemini将实现无缝播放YouTube Music功能

Gemini AI助手即将支持播放YouTube Music中的音乐,为用户带来更简单流畅的音乐体验。用户只需向Gemini发出指令,便能无缝播放所选音乐,省去繁琐的操作步骤,提高效率。这一更新将极大方便喜欢在YouTube Music上发现音乐的用户,也有望推动智能助手的普及应用。

image.png

【AiBase提要:】

🎵 Gemini AI助手将支持播放YouTube Music中的音乐,提升用户体验。

🔍 用户发出指令后,Gemini会自动查询并播放最匹配的音乐,简化操作流程。

⏩ 用户无需手动搜索和选择播放列表,从指令到音乐响起的过程变得更加简洁

8、TikTok新增 “AI生成” 标签,识别标注第三方生成的AI内容

TikTok宣布新增“AI生成”标签,为第三方平台生成的内容添加标识,提升内容真实性和透明度。这一举措不仅增加了用户对内容生成方式的了解,也促进了内容的可信度。

image.png

【AiBase提要:】

🤖 TikTok将为第三方平台生成的内容添加“AI生成”标签

🌐 支持Adobe的Content Credentials标记系统

📱 实现多阶段自动识别和标签功能

9、Stack Overflow 用户抗议不愿将其知识用于 AI 训练

在本文中,Stack Overflow 用户对其回答被用于 OpenAI 的 ChatGPT 训练表示抗议。用户试图删除或修改自己的帖子被全面禁止,引发了广泛关注。文章探讨了用户对数据使用的不满,以及 Stack Overflow 使用条款给予用户的回旋余地的问题。

【AiBase提要:】

👥 Stack Overflow 用户抗议回答被用于 AI 训练

🚫 用户试图删除或修改帖子被全面禁止

🤖 Stack Overflow 用户无法选择拒绝数据用于 AI 训练

10、OpenAI将推出基于生成式人工智能的搜索引擎

OpenAI计划推出基于生成式人工智能的搜索引擎,挑战谷歌在搜索领域的主导地位。该搜索引擎将基于ChatGPT AI技术,提供网络问题和查询的搜索结果,并引用相关文献。文章指出OpenAI面临提供准确及实时信息的挑战,但仍有望在竞争中脱颖而出。

【AiBase提要:】

🔍 OpenAI将于5月13日推出基于生成式人工智能的搜索引擎,挑战谷歌主导地位。

🤖 该搜索引擎将使用ChatGPT AI作为基础,提供网络问题和查询的搜索结果,并引用相关文献。

💡 OpenAI的搜索产品是ChatGPT的延伸,可以让ChatGPT直接从网络获取信息并包含引用,有望扩大用户群。

11、在AI需求驱动下,台积电四月销售额增长60%

在本文中,台积电四月销售额同比增长60%,达到新台币2360亿(约73亿美元,得益于持续增长的人工智能需求以及消费电子行业复苏。全球智能手机行业在今年三个月出现增长,包括中国市场,这可能带动对台积电传统主力移动芯片的订单增长。台积电在人工智能领域占据有利地位,是N公司最先进的训练芯片的唯一制造商,同时也为苹果和AMD等公司生产芯片。

【AiBase 提要:】

📈 台积电四月售额同比增长 60%,达到新台币 2360 亿(约 73 亿美元)。

📱 全球智能手机行业出现增长,带动对台积电传统主力移动芯片订单增长。

💻 台积电在人工智能领域占据有利地位,为多家公司生产高性能芯片。

12、OpenAI指控Reddit子版块使用ChatGPT的logo侵权

埃隆·马斯克指责OpenAI虚伪,称其在对Reddit子版块使用ChatGPT的logo提出版权投诉时显得虚伪。这是马斯克多次公开批评OpenAI,指责其窃取数据来源、将利润置于人类利益之上。

image.png

【AiBase提要:】

🔍 OpenAI对Reddit子版块使用ChatGPT的logo提出版权投诉,马斯克直怼虚伪行为。

🚀 马斯克指责OpenAI广泛使用受版权保护作品构建产品,却强制执行版权声明。

💥 马斯克起诉OpenAI及首席执行官,指控其背叛公司创立原则,建议开源人工智能技术或更改名称。

举报

  • 相关推荐
  • 用AI解锁技术公益,第五届Light创造营圆满收官

    第五届Light创造营圆满收官,19支团队从847个申报项目中脱颖而出。经过激烈角逐,11个优秀项目入围并获得资助,覆盖无障碍服务、非遗传承、儿童教育、乡村振兴、环保等多元领域。本届创造营特别关注AI技术应用,多个项目聚焦解决残障群体生活难题,如AR字幕手语眼镜帮助听障人士实现双向沟通,面部控制系统让手部障碍者操作数字设备。此外,AI还被应用于青少年心理健康干预、景区无障碍评分等场景。腾讯基金会持续支持AI技术在公益领域的创新应用,五年来已孵化上百个具有社会价值的项目,影响范围不断扩大。

  • AI日报:腾讯混元3D 2.1大模型开源;字节跳动AI Lab负责人李航卸任;OpenAI Codex 全新升级

    本文介绍了AI领域最新动态:1)腾讯开源混元3D2.1大模型,提升3D生成质量;2)OpenAI Codex升级,优化代码生成功能;3)字节跳动AI Lab负责人李航卸任;4)微软发布700个AI应用案例;5)微软推出Code Researcher工具,解决58%系统崩溃问题;6)Observer AI实现屏幕操作自动化;7)Genspark发布AI浏览器;8)麻省理工用AI技术3.5小时修复15世纪名画;9)蚂蚁集团推出开源多模态GPT-4o模型Ming-Omni;10)MagicTryOn视频换衣框架;11)字节跳动发布实时互动AI视频生成模型Seaweed APT2;12)ChatGPT搜索功能升级;13)字节跳动与老凤祥合作开发AI智能眼镜。

  • AI日报:即梦灰测图片3.1模型;ElevenLabs推出AI语音助理11ai;百度发布多智能体协同AI IDE

    本文介绍了AI领域多项最新进展:1)即梦灰测图片3.1模型增强电影感和艺术风格;2)ElevenLabs推出语音助手11ai;3)文心快码发布多模态AI开发工具Comate AI IDE;4)苹果采用"归一化流"技术开发新型AI生图模型;5)Grok将推出整合多类型文件管理功能;6)OmniGen2开源多模态模型重塑AI应用场景;7)ScholAI革新学术研究工具;8)豆包推出可视化AI编程功能;9)饿了么推出骑手AI助手"小饿";10)张雪峰认为AI可替代部分教育工作;11)微软发布3.3亿参数小模型Mu。这些创新展示了AI技术在各领域的快速发展和应用潜力。

  • 探索AI时代出海新范式!impact.com荣获TopDigital创新营销奖「年度营销技术公司」

    2025年7月1日,impact.com在第十三届TopDigital创新营销盛典上荣获"年度营销技术公司"大奖。该平台凭借技术能力、商业影响和全球化战略的综合表现获得认可,其AI技术正深刻改变品牌营销工作方式,尤其在效率提升与流程优化方面成效显著。impact.com通过智能推荐、智能审批等功能,将AI能力引入合作伙伴管理核心环节,帮助出海企业构建全球化合作网络。大中华区总裁Jennifer Zhang表示,AI不是替代营销人,而是释放其判断力与创造力。作为全球合作伙伴经济核心引擎,impact.com已服务众多中国出海品牌,未来将继续深化AI在营销管理平台的应用。

  • 喜临门发布宝褓·BrainCo 打造全球首款脑机接口AI床垫

    喜临门与强脑科技联合发布全球首款脑机接口AI床垫"宝褓·BrainCo"。该产品通过脑电技术实时监测用户睡眠状态,动态调整助眠参数,形成"床适应人"的主动式睡眠优化系统,显著提升助眠效果与深睡质量。产品搭载云动系统,集成三大功能模块,提供智能唤醒、远程控制等功能。此次合作突破行业技术瓶颈,将睡眠科技从"智能"推向"智慧"层面。618期间喜临门销售额超11亿,同比增长43%,印证市场对其创新技术的认可。未来双方计划联动医疗资源,构建睡眠生态,推动个性化睡眠解决方案落地。

  • 「6月26日AI日报」可灵AI推全球首部AIGC单元剧;谷歌开源AI智能体Gemini CLI

    AI行业近期动态汇总:1)豆包AI编程升级为"应用创作1.0",支持可视化编辑和实时预览,降低开发门槛;2)谷歌开源Gemini CLI工具,集成Gemini 2.5 Pro模型,提供免费编程助手;3)Anthropic推出"Artifacts"功能,用户无需编程即可在Claude中创建AI应用;4)出门问问发布TicNote+硬件产品,内置Shadow AI技术;5)OpenAI将Codex CLI重构为Rust语言以提升性能;6)谷歌发布Imagen4文生图模型,突�

  • AI日报:豆包大模型1.6发布;OpenAI推o3-pro模型、o3价格暴降80%;Figma官方MCP重磅上线

    【AI日报】今日AI领域重要动态:1)火山引擎发布豆包大模型1.6和视频生成模型Seedance1.0pro,性能显著提升;2)OpenAI推出o3-pro模型,专注可靠性但响应较慢;3)Figma推出Dev Mode MCP服务,实现设计到代码一键转换;4)Krea AI发布图像生成模型Krea1,解决传统AI绘图问题;5)火山引擎豆包日调用量突破16.4万亿次;6)法国Mistral发布推理模型Magistral;7)苹果系统整合ChatGPT图像生成功能;8)OpenAI大幅下调o3价格80%并推出o3-pro;9)Hugging Face开源榜单显示中国团队Qwen与DeepSeek进入全球前15;10)阿里开源MaskSearch框架,提升AI解决复杂问题能力。

  • Perplexity推出AI浏览器Comet:想用得开1400元/月的订阅

    由英伟达支持的Perplexity AI推出了一款名为Comet的AI驱动网络浏览器。 Comet浏览器的核心卖点是其AI驱动的交互体验,公司表示它将整个浏览会话转变为单一、无缝的交互,将复杂的工作流程简化为流畅的对话。

  • DigitalOcean 携手 AMD 推出 AMD Instinct MI300X GPU Droplet,加速 AI 创新

    DigitalOcean与AMD达成合作,将推出搭载AMD Instinct MI300X GPU的云服务器,支持AI/ML/HPC工作负载。该GPU具备192GB HBM3内存,能完整加载数十亿参数模型,显著提升训练和推理效率。服务定价每小时1.99美元起,支持1-8个GPU配置,并与Kubernetes无缝集成。未来还将推出MI325X GPU,并面向中国市场提供服务。此次合作旨在为开发者提供经济高效的AI开发解决方案,简化云端GPU部署流程。

  • AICosts.ai深度评测:一站式AI成本管理解决方案

    随着ChatGPT等大模型的爆发式发展,企业AI支出正成为新的财务黑洞。AICosts.ai应运而生,这款专为AI密集型团队设计的成本管理平台,能聚合所有AI服务商的账单数据,提供可视化分析和优化建议。核心解决三大痛点:1)碎片化账单管理;2)异常监控;3)跨平台优化。通过实时仪表盘、多维筛选和预算预警等功能,某客户使用三个月后总支出降低28%。专业版定价49.99美元/月,特别适合月AI支出超1000美元的团队和使用多个AI服务的开发者。平台计划Q3推出Slack/Teams实时通知和AI优化方案自动生成功能。