首页 > 原创 > 关键词  > SD3.5Medium最新资讯  > 正文

AI日报:SD轻量级3.5 Medium模型免费开放商用;Hedra 推出全新语音克隆功能;微信灰度测试AI问答功能;ComfyUI新神器ComfyUI-Detail-Daemon

2024-10-30 15:11 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、免费开放商用!Stability AI推轻量级AI绘画利器 Stable Diffusion3.5Medium模型

Stability AI推出全新Stable Diffusion3.5Medium模型,实现了高性能与普及性的完美平衡。这款AI绘画工具免费开放商用,采用MMDiT-X架构,解决了普通用户的硬件门槛问题,实现了人人可用的愿景。技术创新方面整合了三种预训练文本编码器,引入QK标准化技术提升训练稳定性,前12个变换层中的双重注意力模块设计显著提升图像质量和排版效果。

111.jpg

【AiBase提要:】

🚀 高性能与普及性完美平衡,免费开放商用,人人可用的AI绘画工具。

💡 MMDiT-X架构,解决普通用户硬件门槛问题,25亿参数设计,9.9GB显存流畅运行。

🔑 技术创新整合三种预训练文本编码器,引入QK标准化技术,双重注意力模块设计显著提升图像质量和排版效果。

详情链接:https://huggingface.co/stabilityai/stable-diffusion-3.5-medium

2、美团出品!新晋AI玩图工具“妙刷”:上传图片生成荒诞效果,秒变小黄人、方块人

近日,美团出品了一款名为“妙刷”的AI图片工具悄然走红,这是一款提供新奇、好玩、荒诞的AI视觉体验工具。

光影魔术手拼图.jpg

【AiBase 提要:】

✨ “妙刷” 是一款趣味 AI 图片工具,提供多种荒诞效果。

🎃 用户可上传图片,生成不同主题的创意效果。

🌟 功能包括图像修饰、音频与视频生成,体验简单易用。

3、Hedra推出全新语音克隆功能,AI虚拟形象发音更真实

最近,备受欢迎的AI角色制作工具Hedra推出了令人激动的语音克隆功能,用户只需录制少量声音即可克隆、存储并应用到所创建或上传的角色上。操作简单易懂,对口型表现优异,嘴部动作准确。付费用户可享受此功能,最低订阅费用为每月10美元。

image.png

【AiBase提要:】

✨ 只需录制少量声音即可准确克隆自己的声音,简单易用。

🎨 图像生成器效果出色,生成的角色与真实人脸几乎无法区分,但动物角色的唇同步效果较差。

💰 付费用户可享受语音克隆功能,最低订阅费用为每月10美元。

4、微信被曝灰度测试AI问答功能 官方回应:优化用户搜索体验

近日,微信正在进行灰度测试AI问答功能,旨在优化用户搜索体验并提升搜索效率。该功能整合了腾讯内部的技术资源,包括混元大模型。

【AiBase提要:】

🔍 AI问答功能灰度测试中,用户可通过微信搜索触发,生成约400字回答和5个参考资料。

🔧 测试旨在优化用户搜索体验,提升搜索效率,整合腾讯内部技术资源。

💡 腾讯混元大模型基于Transformer神经网络,拥有万亿参数规模,具备强大的中文创作能力和逻辑推理能力。

5、ComfyUI新神器ComfyUI-Detail-Daemon:一键提升AI绘画细节,Flux模型画质再升级

我对最近引起轰动的ComfyUI-Detail-Daemon插件进行了深入了解。这款由Jonseed开发的工具在AI绘画圈内备受瞩目,它巧妙地将sd-webui-Detail-Daemon移植到ComfyUI平台,为创作者们带来了前所未有的细节优化体验。最令人惊叹的是其强大的细节增强能力,以及对Flux模型作品的出色处理表现。

image.png

【AiBase提要:】

⚙️ 强大的细节增强能力,精确调控sigma参数提升图像细节,智能去除散景和背景模糊,特别适用于Flux模型作品。

🔍 配备四个功能各异的核心节点,包括Detail Daemon Sampler、Detail Daemon Graph Sigmas、Multiply Sigmas和Lying Sigma Sampler,简化参数调节流程,提高用户效率。

🚀 简化工作流程,减少技术门槛,通过简单几步实现过去繁琐节点组合所需的效果,提高创作效率。

详情链接:https://github.com/Jonseed/ComfyUI-Detail-Daemon

6、Meta 推出新一代视频生成模型 MarDini,搞定填补视频缺失帧任务

Meta 与 KAUST 合作推出的 MarDini 模型让视频创作变得更简单灵活,支持多种任务,如填补视频缺失帧、图像转视频等。该模型采用先进的视频生成技术,灵活性高效率高,能够从零开始训练,处理多种视频任务。

【AiBase提要:】

✨ MarDini 是 Meta 与 KAUST 合作推出的新一代视频生成模型,能够轻松完成多种视频创作任务。

🎥 通过规划和生成模型的结合,MarDini 实现了高效的视频插值和图像转视频生成。

💡 MarDini 以较少的步骤生成高质量视频,提升了创作的灵活性与效率。

详情链接:https://mardini-vidgen.github.io/

7、告别聊天记录混乱!ChatGPT网页版推出聊天记录搜索功能

OpenAI在ChatGPT网络版推出了令人期待的新功能,用户现在可以轻松搜索聊天记录,为用户提供了便利。用户反应积极,期待功能的逐步推出。未来或许会有更多功能更新,提高用户体验。

image.png

【AiBase提要:】

🌟 Plus 和 Team 用户将在一天内体验聊天记录搜索功能。

📅 Enterprise 和 Edu 用户一周内获得访问权限,免费用户下月开启。

💻 AI 优先的拉取请求审阅者为开发者提供更智能的支持。

8、可爱暴击!AI生成Jellycat联名爱马仕玩偶走红,网友直呼梦醒了

一场始料未及的联名梦在社交媒体上掀起热议。小红书博主小奶油心利用AI生成的Jellycat与爱马仕联名玩偶图片成功制造了甜蜜的乌龙。网友们对AI创作的奢侈品与萌系玩偶的碰撞充满兴趣,但转化为实物可能面临版权挑战。

image.png

【AiBase提要:】

😍 AI生成的Jellycat与爱马仕联名玩偶引发网友热议,展现了奢侈品与萌系玩偶的独特碰撞。

🤔 虚拟联名走红引发现实市场关注,商家表达实体化生产意向,但面临品牌授权等版权挑战。

🚀 AI技术在创意设计领域展示潜力,消费者对萌系奢侈品偏好凸显,但商业化仍需考虑法律与市场约束。

9、X用户利用美国选举相关虚假信息和 AI 图像轻松月赚数千美元

在社交媒体平台X上,一些用户利用虚假信息和AI生成的图片,声称每月赚取数千美元。他们通过发布有争议的内容增加曝光和收入,得到高额收入的同时也引发关注和争议。X平台改变收益规则,鼓励用户创作更具争议性的内容,进一步提升用户收益。

【AiBase提要:】

🌟 用户在社交媒体X上分享选举虚假信息,声称每月赚取数千美元。

🤝 X平台改变收益规则,鼓励用户创作更具争议性的内容。

💰 部分用户通过AI生成图像和各种内容,获得了高额收入。

10、GitHub引入多款模型和 Spark 平台:人人都能用自然语言开发 AI 应用

GitHub在Universe '24开发者大会上推出了全新平台GitHub Spark,旨在帮助开发者利用自然语言轻松创建微型应用。同时,提供多种AI模型选择,如Claude3.5Sonnet、Gemini1.5Pro和GPT-4o等。Python超越JavaScript成为GitHub上最流行的编程语言,公共AI项目增长98%。

image.png

【AiBase提要:】

✨ GitHub Spark平台助力开发者用自然语言创建AI微型应用。

🛠️ C o p i l o t助理支持多种AI模型选择,可灵活切换。

📈 Python超越JavaScript,成为GitHub上最流行的编程语言,公共AI项目增长98%。

11、马斯克的 xAI 势头不减,计划再融资数十亿美元、估值400亿美元

马斯克旗下的人工智能公司 xAI 正在蓬勃发展,计划再次融资数十亿美元,估值预计将达到400亿美元。新的融资将进一步提升公司在市场上的地位和竞争力。

【AiBase提要:】

🚀 xAI 正在寻求数十亿美元的新融资,估值预计将达到400亿美元。

💼 公司在5月完成了60亿美元的 B 轮融资,新的融资将大幅提升其市场估值。

🔍 xAI 正在利用大量的 Nvidia GPU 训练新模型,同时 X 平台的隐私政策调整也助力数据利用。

12、亚马逊推AI 编码助手 Q Developer 可集成到开发环境中

我认为这篇文章介绍了亚马逊推出的 AI 编码助手 Q Developer,它可以集成到开发者的 IDE 中,帮助提高编写代码的效率。这款助手基于 Anthropic 的 Claude3.5Sonnet 模型,能够自动处理代码重构和文档生成,提升开发者工作效率。

image.png

【AiBase提要:】

💻 亚马逊推出 Amazon Q Developer AI 助手,支持 IDE 内的直接操作,提升开发者效率。

🤖 Q Developer 基于 Claude3.5Sonnet 模型,能够自动化处理代码重构和文档生成。

🚀 Q Developer 的内联聊天功能在代码重构和文档生成方面表现突出,帮助开发者快速整合修改并保持专注。

详情链接:https://aws.amazon.com/cn/blogs/devops/amazon-q-developer-inline-chat/

举报

  • 相关推荐
  • 忆联首款消费级QLC SSD AE531重磅发布!以超强可靠性与广泛兼容性,强力打造用户极致TCO

    忆联近日推出首款消费级QLC SSD产品AE531,基于QLC NAND技术,具备卓越生态兼容性与全生命周期成本优化。产品采用新一代控制器与智能IO加速模块,实现高达6800/5600MB/s顺序读写速度,性能媲美TLC产品。通过超低延迟架构、动态资源调度与持久性能保障三大核心技术,显著提升混合读写效率。支持国密加密算法,适配多平台操作系统,单位容量成本较TLC下降30%,功耗低于2.5mW。历经7000+项严苛测试验证,平均无故障工作时间超200万小时,为消费级PC、笔记本电脑等终端提供高性价比存储解决方案。

  • 响应国家AI+号召,开放微表情SDK

    近日,上海步施网络科技宣布对外开放微表情识别SDK,响应国家推动人工智能与实体经济深度融合的号召。该技术原仅用于内部项目,现面向各行业开放,助力产业智能化升级。微表情识别可捕捉人类瞬间流露的真实情绪,在医疗、教育、安防、商业等领域具有广泛应用前景。公司提供多种合作模式,支持本地化部署,确保数据安全。此举将促进AI技术创新,推动行业智能化发展。

  • 硬核创新比肩华为,Momenta首度荣膺WNEVC 2025全球新能源创新技术

    9月27日,2025世界新能源汽车大会在海口开幕。会上,Momenta凭借其全场景量产辅助驾驶方案Mpilot,荣获“全球新能源汽车创新技术”奖项。该方案基于全国首个量产“端到端大模型”,实现全场景智能驾驶,覆盖复杂道路环境,极大减轻驾驶员负担。目前,Momenta合作车型超160款,覆盖奔驰、宝马、丰田等全球主流车企。未来,公司将持续推动无人驾驶技术规模化落地,助力智能出行产业发展。

  • 真我GT8 Pro镜头模组支持DIY!可拆、可拼、可换

    真我GT8+Pro手机公布镜头模组创新设计,采用可拆卸、可拼装、可更换的Deco模块,提供圆形、方形及机器人造型供用户DIY。搭载2亿像素潜望长焦“Ultra之眼”,配备对称双扬声器、X轴线性马达及3D超声波屏下指纹。全系配备2K+144Hz京东方Q10+发光材料屏幕,峰值亮度达4000nit。首批搭载骁龙8至尊版处理器,并配备电竞独显芯片R1,实现“王炸双芯”配置。

  • 下一代旗舰!Nordic54L绝鲨MAX方案ATK A9大师版重磅登场

    ATK A9大师版鼠标在经典模具基础上深度优化,搭载自研Nordic54L绝鲨MAX方案,实现极致操控与超长续航。58项模具优化提升手感,按键延迟低至0.263ms,配备PAW3950传感器,满足职业电竞需求。内置800mAh电池配合低功耗方案,续航达600小时,大幅减轻充电焦虑。该产品延续A9系列热销基因,首发起售价199元,9月25日20:00正式开售,是面向玩家的全新力作。

  • AI日报:腾讯重磅发布混元图像3.0;快手发布KAT系列Agentic Coding大模型;苹果悄然研发ChatGPT式应用

    快手发布KAT系列代码大模型,腾讯推出“混元图像3.0”实现多模态突破,苹果研发类ChatGPT应用升级Siri,谷歌更新Gemini 2.5 Flash Lite提升效率。苹果还推出Manzano图像模型,YouTube Music测试AI音乐主播功能,VideoFrom3D框架简化3D视频生成,Moondream 3.0在多项基准测试中超越GPT-5等顶尖模型,展现强大性能。

  • 双雄联袂登场 世纪华通旗下Century Games确认参展2025东京电玩展

    世纪华通旗下Century Games将携《Whiteout Survival》与《Kingshot》两款游戏亮相东京电玩展2025。展台位于Hall5-C04,面积达300平方米,设有裸眼3D巨屏展示、主题展区及丰富互动活动。两款游戏市场表现强劲:《Whiteout Survival》连续15个月位居中国手游出海收入榜首,《Kingshot》上线后收入快速增长,7月两款游戏包揽中国手游出海收入榜冠亚军。此次参展旨在向全球玩家展示中国游戏的创新实力,拓展国际合作。

  • Reviews.ai 依托 DigitalOcean 高效实现 AI 业务扩展

    Reviews.ai是一个消费者反馈聚合平台,帮助品牌将客户评论转化为可执行的洞察。该平台专注于评论分析,通过AI驱动功能(如按需报告、主题分类和智能代理)提升产品与服务。近期从Review Monitor更名后,团队迁移至DigitalOcean云平台,解决了原有专用服务器架构的扩展瓶颈。迁移过程在合作伙伴Aquazeel支持下高效完成,仅用数周,成本降低近30%。新架构采用Droplets、托管数据库和负载均衡器,支持灵活扩展。未来计划利用GPU Droplets增强AI能力,进一步优化大型语言模型处理效率。

  • 微算法科技(NASDAQ: MLGO)融合二次矩阵变换模型,研发基于区块链的可溯源IP版权保护算法

    微算科技(NASDAQ: MLGO)研发基于区块链的可溯源IP版权保护算法,解决现有技术效率低、可追溯性差等痛点。该方案融合二次矩阵变换、分布式随机嵌入与位置映射函数,实现版权从产生到交易流转的全链路精准追踪与安全保护。凭借区块链的不可篡改特性,算法有效抵御重放攻击,确保版权信息稳定可靠,有望拓展至专利、商标等知识产权领域,推动全球版权保护生态健全高效。

  • Joyme完成从AWS到腾讯云迁移,成本减半、运维压力降八成

    在2025年腾讯全球数字生态大会上,出海企业Joyme宣布完成从AWS到腾讯云的全面迁移,成效显著:IT成本降低50%,运维压力下降80%,数据处理时效提升3倍,并实现分钟级容灾恢复。旗下社交直播平台LiveMe和拼图应用PhotoGrid已服务全球1800万创作者,累计分成超5亿美元。通过引入腾讯云WeData一体化Data+AI平台及EMR托管服务,Joyme优化了数据开发与治理流程,团队更专注于业务价值挖掘。此次合作展示了中国技术出海的新模式,腾讯云凭借强大产品能力助力企业应对全球化运营挑战。

今日大家都在搜的词: