11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
很多小伙伴在使用SD3.5、DALL·E3、Midjourney、豆包等文生图模型时,总是感觉生成的图片和预期的相差甚远。今天就用Stability.ai发布的SD3.5官方教程为大家解读一下,如何用最贴切的文本提示词来生成精准的图片。文本提示案例:采用鸟瞰视角,从天空向下看一座繁华的城市夜景,街道灯火通明,车流不息,霓虹灯牌闪烁,给人一种现代都市的活力感。
上海科技大学、宾夕法尼亚大学、Deemos科技和NeuDim科技的研究人员联合推出了一个创新模型DressCode。用户通过DressCode只需要输入文本就能生成各种精美的3D服装模型,例如,一件法式蕾丝边的连衣裙;红色丝绸的睡衣等。所有预览都是可视化操作,用户可以通过简单的操作旋转、缩放、平移3D模型,从多个角度审视服装细节,这对于那些非专业设计人员来说非常有帮助。
西湖大学工学院张岳教授领导的文本智能实验室开发了一种名为Fast-DetectGPT的新文本检测方法。该方法能高效识别AI生成的文本,并且Fast-DetectGPT无需训练,即可准确检测包括ChatGPT、GPT-4在内的多种AI语言模型生成的文本。尽管Fast-DetectGPT能提供文本为机器生成的概率,但鲍光胜博士指出,它无法100%准确识别,尤其是当文本混合了机器和人工撰写的部分时。
iOS18中的一项AppleIntelligence功能是Genmoji,它允许iPhone用户通过AI根据文本输入生成全新的表情符号角色。根据iOS18在WWDC会议上的介绍,Genmoji看起来类似于传统的表情符号,但它们是根据用户的输入自定义生成的。Genmoji和AppleIntelligence将在今年秋季向公众开放,但仅限于iPhone15Pro机型以及配备M系列芯片的iPad和Mac。
浙江大学、蚂蚁集团、深圳大学联合推出了创新模型MaPa。与传统纹理方法不同的是,MaPa通过文本能直接生成高分辨率、物理光照、超真实材质的3D模型,可以极大提升游戏、VR、AR、影视等行业的开发效率。MaPa使用了连续迭代的方法,可以为模型的每个部分生成一致且真实的材质,即便是那些非常复杂的3D模型架构也没问题。
StabilityAI今天发布了StableAudioOpen1.0,这是其音频领域的新一款生成AI模型。StabilityAI以稳定扩散文本到图像生成AI技术闻名,但这只是该公司产品组合的一部分。我们期待进一步发布商业和开放模型,以反映我们研究的进展。
StableAudioOpen是什么?StableAudioOpen是一个开源的文本到音频模型,专为生成短音频样本、音效和制作元素优化。AIGC网站,AI工具尽在AIbase!
6月6日,著名开源大模型平台Stability.ai在官网宣布,开源最新文生音频模型StableAudioOpen。用户通过文本就能生成最多47秒,钢琴、笛子、鼓点、模拟人声等不同类型的44.1kHz音效。StableAudioOpen目前只能用于学术研究无法商业化。
探索ChatTTS能为你带来哪些改变为什么选择ChatTTS?ChatTTS不仅仅是一个模型——它是一个开源的文本到语音转换技术,致力于为语音技术研究和教育提供支持。通过AIbase,您可以轻松发现最适合您需求的人工智能工具,解锁AI的力量。
划重点:⭐️全新功能:Elevenlabs发布文本生成音乐特效功能,帮助用户轻松制作逼真音效。⭐️免费试用:用户可免费试用该功能,享受强大的音效生成体验。值得期待的是,随着技术的不断进步,这类AI音乐平台将会在未来发展出更多创新的功能,为用户带来更多惊喜和乐趣。