11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
本文汇总了AI领域的最新动态:腾讯升级混元生图模型至2.1版,支持2K分辨率与中英文输入;爱诗科技获阿里领投6000万美元融资,聚焦AI视频生成;Freepik上线Seedream 4.0图像模型,提供高分辨率生成选项;阿里千问新模型通过MoE架构提升推理效率10倍;微软在Office 365中集成Anthropic技术,调整AI供应商策略;首款AI Agent浏览器Fellou CE发布,简化工作流程;清华团队开源GUAVA技术,实现
本文汇总了AI领域最新动态:1)英伟达开源语音识别模型Parakeet-TDT-0.6B-V2,提升转写效率;2)Suno音乐平台v4.5版本支持8分钟歌曲生成;3)Runway推出图像一致性参考功能Gen-4 References;4)Midjourney V7新增"Omni-Reference"图像控制功能;5)Claude将引入MCP协议提升集成能力;6)iOS18.6或为中国用户启用AI功能;7)OpenAI宣布回归非营利模式;8)Freepik发布版权安全的F-Lite图像模型;9)OpenAI以30亿美
【AI日报】栏目聚焦人工智能领域最新动态:1) OpenAI推出ChatGPT图像生成API,开发者可轻松集成AI绘图功能,已生成超7亿张图片;2) 谷歌Gemini月活用户突破3.5亿,但仍落后于ChatGPT的6亿用户;3) OpenAI预测2029年收入将达1250亿美元,AI代理业务成主要增长点;4) Ostris发布8B参数扩散模型Flex.2-preview,优化ComfyUI工作流;5) 英伟达推出多模态LLM模型Describe Anything,支持指定区域生成详细描�
根据TechCrunch报道,由一位华人创始人WeberWong开发的AI创意工具Flora于3月1日正式上线。AI图像与视频赛道的产品和格局已经有点固化了,能够有新鲜产品加入是华人创始人,确实很令人惊喜。Flora刚刚上线,未来我们也会持续关注用户对这款产品的反馈,以及它后续发展的情况。
2月13日,一起关于手机屏幕出现异常的情况引起了广泛关注。据了解,一名女生在使用手机时,因连续六小时不间断地播放同一视频内容,导致手机屏幕出现了难以消除的电子烙印,即业界常说的“烧屏”现象。据该女生描述,她当时正在使用手机观看一段感兴趣的视频,由于内容引人入胜,她不自觉地连续观看了长达六个小时。在此期间,手机屏幕长时间显示相同画面,最�
【新智元导读】北京大学的研究人员开发了一种新型多模态框架FakeShield,能够检测图像伪造、定位篡改区域,并提供基于像素和图像语义错误的合理解释,可以提高图像伪造检测的可解释性和泛化能力。随着生成式人工智能的迅猛发展,图像编辑与合成技术变得愈加成熟与普及。表3:FakeShield与主流IFDL方法的定位性能比较另外,图4的主观结果对比也表明,FakeShield能够生成更加�
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、速度提升六倍!黑森林实验室发布Flux1.1Pro:速度与画质双重升级!黑森林实验室最新推出的图像生成模型Flux1.1Pro在速度和画质方面取得了巨大突破。训练效果优于现有数据集,表现出超强的学习能力。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、文生图卷起来了!智谱开源图像生成模型CogView3生成速度比SDXL快10倍!智谱AI最新开源的CogView3和CogView-3Plus-3B为文生图领域注入新活力,CogView3采用独特的级联扩散方法,生成质量超越SDXL,且推理速度快10倍。清言科技推出大会员体系,19元/月享受多项权益,让更广泛用户群体负担得起高级AI功能。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、商汤科技推出Vimi视频生成大模型C端应用Vimi相机开放内测商汤科技在2024年世界人工智能大会上推出了Vimi视频生成大模型,为用户提供精准的表情和肢体控制,支持多种驱动方式
在CVPR2024上,美国英特尔研究院的蔡志鹏博士及其团队提出了一种名为L-MAGIC的新技术。这项技术通过结合语言模型和图像扩散模型,实现了高质量、多模态、零样本泛化的360度场景生成。技术应用:L-MAGIC还能够利用深度估计模型生成场景的沉浸式视频和三维点云,为场景理解和可视化提供了更多可能性。