11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
腾讯云
12-20
本期AI日报聚焦多项技术突破:DeepSeek发布V3.2-exp模型,通过稀疏注意力机制降低API成本50%;Anthropic推出Claude Sonnet 4.5,在编码任务表现卓越;ChatGPT新增即时结账功能,实现对话界面直接购物;OpenAI将推出AI版TikTok,所有内容由Sora2模型生成;百度地图升级小度想想2.0,提供智能出行服务;蚂蚁集团开源万亿参数模型Ring-1T-preview;DeepMind提出“帧链”概念,推动视频模型实现全面�
【AI日报】主要内容: 1. B站测试"花生AI"视频工具,3分钟可成片,同时推进自研大模型和多语言翻译功能 2. 昆仑万维开源多模态模型Skywork UniPic 2.0,实现高效统一的多模态生成能力 3. 马斯克指责苹果偏袒OpenAI,苹果回应称平台设计公平公正 4. 腾讯混元发布52B参数多模态理解模型Large-Vision,支持任意分辨率输入 5. DeepSeek官方否认8月发布R2模型的传闻 6. OpenAI推出超值ChatGPT Go套餐,仅399卢比降低使用门槛 7. AI新贵Perplexity豪掷345亿美元收购谷歌Chrome 8. Anthropic的Claude Sonnet 4模型支持100万token上下文 9. ChatGPT重大更新:恢复GPT-4o默认模式,为GPT-5引入多模式选择,优化交互体验
硅谷光互连芯片设计公司AyarLabs宣布,完成由AdventGlobalOpportunities和LightStreetCapital领投的1.55亿美元融资。目前公司累计融资额达到3.7亿美元,估值超过10亿美元,成为新晋芯片独角兽。此次融资的领投方AdventGlobalOpportunities和LightStreetCapital对AyarLabs的光互连技术充满信心,认为其将彻底改变AI基础设施的未来。
根据彭博社马克·古尔曼的最新报道,苹果正在寻求通过增加对PlayStationVR控制器的支持,来吸引更多的游戏玩家和开发者,以提升其VisionPro混合现实设备的市场吸引力。虽然VisionPro目前更多被视为生产力和媒体消费工具非游戏设备,部分原因在于它依赖眼睛和手部控制非独立控制器。通过这种方式,苹果不仅能提升游戏控制的精度可能推动更多软件应用,如FinalCutPro和AdobePhotoshop等,也能在VisionPro上顺利运行,为专业用户提供更多功能。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、告别昂贵动捕!Runway推生成式角色表演工具Act-One视频秒变动画,多风格随意切换!我被Runway最新推出的Act-One工具深深震撼!这项革命性技术利用生成式AI模型,仅凭演员的视频和语音
近期提出的VisionLLaMA架构在视觉任务领域取得了突破性进展。该架构致力于解决视觉和语言模态之间的架构差异,通过引入类似于LLAMA的统一接口,将视觉任务推向了一个新的高度。VisionLLaMA架构的提出标志着视觉任务的新一轮技术革新,将为未来的研究和应用带来更多可能性和机遇。
欢迎来到【今日AI】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
ComfyUI的LayerDiffusion透明图层生成插件也已经发布了,目前还只支持生成。该插件主要包含两个节点,其中一个遮罩节点需要安装comfyui-tooling-nodes插件。使用LayerDiffusion生成的透明图像在质量上可媲美真实的商业级透明素材,例如AdobeStock提供的素材。
LayerDiffusion是一种使大规模预训练潜在扩散模型能够生成透明图像的方法。该方法允许生成单个透明图像或多个透明图层。现在就体验LayerDiffusion,享受其带来的便利和创造力!
用于生成图像的大规模模型已经成为计算机视觉的基础图形,令人惊讶的是,很少有研究关注分层内容生成或透明图像生成。这种情况与巨大的市场需求形成鲜明对比。用户还表示,生成的透明图像在质量上可媲美真实的商业级透明素材,例如AdobeStock提供的素材,展现出技术的强大和实用性。