首页 > 原创 > 关键词  > SD3.5Medium最新资讯  > 正文

AI日报:SD轻量级3.5 Medium模型免费开放商用;Hedra 推出全新语音克隆功能;微信灰度测试AI问答功能;ComfyUI新神器ComfyUI-Detail-Daemon

2024-10-30 15:11 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、免费开放商用!Stability AI推轻量级AI绘画利器 Stable Diffusion3.5Medium模型

Stability AI推出全新Stable Diffusion3.5Medium模型,实现了高性能与普及性的完美平衡。这款AI绘画工具免费开放商用,采用MMDiT-X架构,解决了普通用户的硬件门槛问题,实现了人人可用的愿景。技术创新方面整合了三种预训练文本编码器,引入QK标准化技术提升训练稳定性,前12个变换层中的双重注意力模块设计显著提升图像质量和排版效果。

111.jpg

【AiBase提要:】

🚀 高性能与普及性完美平衡,免费开放商用,人人可用的AI绘画工具。

💡 MMDiT-X架构,解决普通用户硬件门槛问题,25亿参数设计,9.9GB显存流畅运行。

🔑 技术创新整合三种预训练文本编码器,引入QK标准化技术,双重注意力模块设计显著提升图像质量和排版效果。

详情链接:https://huggingface.co/stabilityai/stable-diffusion-3.5-medium

2、美团出品!新晋AI玩图工具“妙刷”:上传图片生成荒诞效果,秒变小黄人、方块人

近日,美团出品了一款名为“妙刷”的AI图片工具悄然走红,这是一款提供新奇、好玩、荒诞的AI视觉体验工具。

光影魔术手拼图.jpg

【AiBase 提要:】

✨ “妙刷” 是一款趣味 AI 图片工具,提供多种荒诞效果。

🎃 用户可上传图片,生成不同主题的创意效果。

🌟 功能包括图像修饰、音频与视频生成,体验简单易用。

3、Hedra推出全新语音克隆功能,AI虚拟形象发音更真实

最近,备受欢迎的AI角色制作工具Hedra推出了令人激动的语音克隆功能,用户只需录制少量声音即可克隆、存储并应用到所创建或上传的角色上。操作简单易懂,对口型表现优异,嘴部动作准确。付费用户可享受此功能,最低订阅费用为每月10美元。

image.png

【AiBase提要:】

✨ 只需录制少量声音即可准确克隆自己的声音,简单易用。

🎨 图像生成器效果出色,生成的角色与真实人脸几乎无法区分,但动物角色的唇同步效果较差。

💰 付费用户可享受语音克隆功能,最低订阅费用为每月10美元。

4、微信被曝灰度测试AI问答功能 官方回应:优化用户搜索体验

近日,微信正在进行灰度测试AI问答功能,旨在优化用户搜索体验并提升搜索效率。该功能整合了腾讯内部的技术资源,包括混元大模型。

【AiBase提要:】

🔍 AI问答功能灰度测试中,用户可通过微信搜索触发,生成约400字回答和5个参考资料。

🔧 测试旨在优化用户搜索体验,提升搜索效率,整合腾讯内部技术资源。

💡 腾讯混元大模型基于Transformer神经网络,拥有万亿参数规模,具备强大的中文创作能力和逻辑推理能力。

5、ComfyUI新神器ComfyUI-Detail-Daemon:一键提升AI绘画细节,Flux模型画质再升级

我对最近引起轰动的ComfyUI-Detail-Daemon插件进行了深入了解。这款由Jonseed开发的工具在AI绘画圈内备受瞩目,它巧妙地将sd-webui-Detail-Daemon移植到ComfyUI平台,为创作者们带来了前所未有的细节优化体验。最令人惊叹的是其强大的细节增强能力,以及对Flux模型作品的出色处理表现。

image.png

【AiBase提要:】

⚙️ 强大的细节增强能力,精确调控sigma参数提升图像细节,智能去除散景和背景模糊,特别适用于Flux模型作品。

🔍 配备四个功能各异的核心节点,包括Detail Daemon Sampler、Detail Daemon Graph Sigmas、Multiply Sigmas和Lying Sigma Sampler,简化参数调节流程,提高用户效率。

🚀 简化工作流程,减少技术门槛,通过简单几步实现过去繁琐节点组合所需的效果,提高创作效率。

详情链接:https://github.com/Jonseed/ComfyUI-Detail-Daemon

6、Meta 推出新一代视频生成模型 MarDini,搞定填补视频缺失帧任务

Meta 与 KAUST 合作推出的 MarDini 模型让视频创作变得更简单灵活,支持多种任务,如填补视频缺失帧、图像转视频等。该模型采用先进的视频生成技术,灵活性高效率高,能够从零开始训练,处理多种视频任务。

【AiBase提要:】

✨ MarDini 是 Meta 与 KAUST 合作推出的新一代视频生成模型,能够轻松完成多种视频创作任务。

🎥 通过规划和生成模型的结合,MarDini 实现了高效的视频插值和图像转视频生成。

💡 MarDini 以较少的步骤生成高质量视频,提升了创作的灵活性与效率。

详情链接:https://mardini-vidgen.github.io/

7、告别聊天记录混乱!ChatGPT网页版推出聊天记录搜索功能

OpenAI在ChatGPT网络版推出了令人期待的新功能,用户现在可以轻松搜索聊天记录,为用户提供了便利。用户反应积极,期待功能的逐步推出。未来或许会有更多功能更新,提高用户体验。

image.png

【AiBase提要:】

🌟 Plus 和 Team 用户将在一天内体验聊天记录搜索功能。

📅 Enterprise 和 Edu 用户一周内获得访问权限,免费用户下月开启。

💻 AI 优先的拉取请求审阅者为开发者提供更智能的支持。

8、可爱暴击!AI生成Jellycat联名爱马仕玩偶走红,网友直呼梦醒了

一场始料未及的联名梦在社交媒体上掀起热议。小红书博主小奶油心利用AI生成的Jellycat与爱马仕联名玩偶图片成功制造了甜蜜的乌龙。网友们对AI创作的奢侈品与萌系玩偶的碰撞充满兴趣,但转化为实物可能面临版权挑战。

image.png

【AiBase提要:】

😍 AI生成的Jellycat与爱马仕联名玩偶引发网友热议,展现了奢侈品与萌系玩偶的独特碰撞。

🤔 虚拟联名走红引发现实市场关注,商家表达实体化生产意向,但面临品牌授权等版权挑战。

🚀 AI技术在创意设计领域展示潜力,消费者对萌系奢侈品偏好凸显,但商业化仍需考虑法律与市场约束。

9、X用户利用美国选举相关虚假信息和 AI 图像轻松月赚数千美元

在社交媒体平台X上,一些用户利用虚假信息和AI生成的图片,声称每月赚取数千美元。他们通过发布有争议的内容增加曝光和收入,得到高额收入的同时也引发关注和争议。X平台改变收益规则,鼓励用户创作更具争议性的内容,进一步提升用户收益。

【AiBase提要:】

🌟 用户在社交媒体X上分享选举虚假信息,声称每月赚取数千美元。

🤝 X平台改变收益规则,鼓励用户创作更具争议性的内容。

💰 部分用户通过AI生成图像和各种内容,获得了高额收入。

10、GitHub引入多款模型和 Spark 平台:人人都能用自然语言开发 AI 应用

GitHub在Universe '24开发者大会上推出了全新平台GitHub Spark,旨在帮助开发者利用自然语言轻松创建微型应用。同时,提供多种AI模型选择,如Claude3.5Sonnet、Gemini1.5Pro和GPT-4o等。Python超越JavaScript成为GitHub上最流行的编程语言,公共AI项目增长98%。

image.png

【AiBase提要:】

✨ GitHub Spark平台助力开发者用自然语言创建AI微型应用。

🛠️ C o p i l o t助理支持多种AI模型选择,可灵活切换。

📈 Python超越JavaScript,成为GitHub上最流行的编程语言,公共AI项目增长98%。

11、马斯克的 xAI 势头不减,计划再融资数十亿美元、估值400亿美元

马斯克旗下的人工智能公司 xAI 正在蓬勃发展,计划再次融资数十亿美元,估值预计将达到400亿美元。新的融资将进一步提升公司在市场上的地位和竞争力。

【AiBase提要:】

🚀 xAI 正在寻求数十亿美元的新融资,估值预计将达到400亿美元。

💼 公司在5月完成了60亿美元的 B 轮融资,新的融资将大幅提升其市场估值。

🔍 xAI 正在利用大量的 Nvidia GPU 训练新模型,同时 X 平台的隐私政策调整也助力数据利用。

12、亚马逊推AI 编码助手 Q Developer 可集成到开发环境中

我认为这篇文章介绍了亚马逊推出的 AI 编码助手 Q Developer,它可以集成到开发者的 IDE 中,帮助提高编写代码的效率。这款助手基于 Anthropic 的 Claude3.5Sonnet 模型,能够自动处理代码重构和文档生成,提升开发者工作效率。

image.png

【AiBase提要:】

💻 亚马逊推出 Amazon Q Developer AI 助手,支持 IDE 内的直接操作,提升开发者效率。

🤖 Q Developer 基于 Claude3.5Sonnet 模型,能够自动化处理代码重构和文档生成。

🚀 Q Developer 的内联聊天功能在代码重构和文档生成方面表现突出,帮助开发者快速整合修改并保持专注。

详情链接:https://aws.amazon.com/cn/blogs/devops/amazon-q-developer-inline-chat/

举报

  • 相关推荐
  • 因为GPT-5,这群人决定在Reddit上起义。

    ​这个周末,对OpenAI的抗诉,好像从未如此热闹过。 起因自然还是因为GPT-5。 OpenAI上了GPT-5当天,做了一个非常神奇的操作,他们只保留了GPT-5,然后把GPT-4.5、GPT-4o、o3什么的,全都砍掉了。

  • SSD Fans评测:忆联消费级SSD AM541|强性能 高可靠 长守护

    国内知名技术社区SSD Fans对忆联消费级SSD AM541进行了深度评测。这款PCIe4.0固态硬盘采用3D NAND闪存颗粒和最新主控芯片,1TB版本顺序读取速度达7143MB/s,写入6037MB/s,远超标称值。评测显示AM541在性能、压力测试和可靠性方面表现优异,采用无缓存DRAM-Less设计配合智能SLC缓存机制,在CDM、SNIA标准测试中均展现业界领先水平。游戏实测《FF14》加载仅7.445秒,《黑神话:悟空》启动快40%,充分满足消费级用户对高性能存储的需求,展现了忆联在存储领域的技术实力。

  • 小米智能摄像机4C 3.5K发布:支持600万像素 售价199元

    小米8月8日发布智能摄像机4C 3.5K,售价199元,8月11日开售。该产品搭载600万像素传感器,支持3.5K高清画质,配备8颗940nm红外补光灯,夜间成像清晰。创新性加入物理隐私遮蔽功能,镜头可收入机身实现物理遮挡,支持定时自动遮蔽。内置1T算力AI芯片,支持人形追踪、宠物检测等功能,识别更快更准。支持双频Wi-Fi6技术,内置米家安全芯片保障数据安全。深度接入米家生态,可智能联动空调、灯具等设备,提升家居智能化体验。

  • 报价345亿美元!AI新贵公司计划收购谷歌旗下Chrome浏览器

    美国AI搜索新贵Perplexity正考虑以高达345亿美元的全现金方式,收购谷歌旗下拥有逾30亿用户的Chrome浏览器。 成立仅三年、总部位于旧金山的Perplexity(由阿拉温德斯里尼瓦斯等人创立),专注于生成式AI搜索引擎,直接挑战谷歌和微软必应。 截至2024年4月,其月活跃用户约1500万,主要依靠付费订阅盈利。这家初创公司已从英伟达、软银集团等巨头筹集约10亿美元融资,最新估值

  • 15天快装开业,Lamett乐迈石晶地墙品类投资模式解析

    贝壳研究院数据显示,2025年中国存量房装修市场规模将达3.34万亿元,消费者对健康环保、便捷高效的家装需求持续攀升。乐迈石晶作为全球石晶品类开创者,推出"100㎡开店、10余万投资、15天极速开业"轻资产模式,携手经销商掘金"新房整装+旧房改造"市场。其首创的石晶地板和石晶柜板技术,实现从地面材料向墙面、柜体等全屋空间应用的跨越,构建"地墙柜一体化"健康整装系统。凭借"零醛添加、防水防潮"等核心性能优势,石晶材料正加速替代传统建材。目前乐迈石晶在全球拥有10余家工厂及销售机构,业务遍及80多个国家和地区,为高端住宅及商业空间提供整体解决方案。

  • 淘宝天下入选《TopDigital2025全球AI营销图谱》

    7月29日,淘宝天下凭借AI服务平台"淘宝AI智+"的创新实践,成功入选《TopDigital2025全球AI营销图谱》"智能分析与决策"赛道。该平台整合淘宝生态数据资源,构建覆盖数据分析、智能营销、内容生成等全链路的AI解决方案体系,通过模块化设计降低使用门槛,帮助商家实现降本增效。平台还提供深度定制开发服务,推动AI能力与业务场景有机融合。此次入选标志着淘宝天下在AI技术创新与商业应用方面的成果获得行业认可。团队表示将持续聚焦AI技术实用价值转化,拓展电商营销领域的创新应用场景。

  • 20周年庆 | 小渔夫×Linkedin领英中国:为中国企业出海加速!

    小渔夫与领英(LinkedIn)合作20年,共同助力中国企业出海。文章回顾了双方合作历程:从2005年萌芽到2025年,小渔夫坚持科技创新,以"AI+数字科技"赋能企业全球化。针对中国企业出海面临的品牌难立、市场难察、营销难准三大痛点,双方构建"破局组合拳":1)领英提供全球10亿+职场网络资源,搭建海外"信任背书场";2)小渔夫运用AI营销技术+全案策略,精准触达目标客群;3)结合领英的全球商业数据与小渔夫的本土化经验,实现从"盲目出海"到"精准布局"。未来,双方将继续携手,推动中国品牌在海外扎根生长。

  • 马斯克称正在训练新FSD模型:约十倍参数 最快下月底发布

    马斯克今日在X上发文表示,特斯拉正在训练新的十倍参数FSD模型,如果一切顺利则可能会在下个月底准备好面向公众发布。

  • Custouch市场易AI技术入选Topdigital2025全球AI营销图谱

    《TopDigital2025全球AI营销图谱》近日发布,Custouch市场易入选"内容智能生成"板块。该图谱为AI技术重构营销提供全链路产业地图,整合企业官网、学术报告、专利库等多维度信息。Custouch凭借AI技术在B2B营销领域的创新应用入选,其智能解决方案能有效满足企业实际需求。作为数字营销技术服务商,Custouch已为300+国际头部企业提供一站式营销管理体系,涵盖内容、活动、线索等全流程,助力企业实现高质量增长。此次入选既是对其AI成果的肯定,也是对其未来发展的激励。

  • 荣耀Magic V Flip2 35万次折叠折痕低于50μm 5年使用依旧平整

    荣耀将于8月21日发布全新小折叠旗舰Magic V Flip2。该机采用超坚韧UTG玻璃,宣称35万次折叠后折痕仍低于50微米,五年使用依旧平整。配备5500mAh青海湖电池,支持80W有线快充和50W无线快充,续航能力突出。提供晨曦紫、月影白、钛空灰、织梦蓝四款配色,外屏采用大尺寸设计。荣耀表示,新机将在外观、影像、技术体验等方面全面突破,再攀小折叠品类高峰。

今日大家都在搜的词: