11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
Dolphin2.9.1Mixtral1x22b是由CognitiveComputations团队创建的一个多功能文本生成模型。这个模型具备以下特点:多功能文本生成:它能够处理指令、对话和编码任务,具有广泛的应用能力。模型的设计理念是提供一个没有审查和道德限制的文本生成工具,但这种开放性也带来了一定的风险,特别是当用户提出不道德的请求时,模型可能会遵循这些请求。
智谱AI发布了高质量、低成本的评分模型CritiqueLLM,用于评估文本生成模型的性能。传统的评价指标如BLEU和ROUGE主要基于n-gram重合度来计算评分,缺乏对整体语义的把握。通过这些步骤,可以得到适用于含参考文本和无参考文本设定的两种CritiqueLLM模型,用于评估文本生成模型的性能。
西湖大学工学院张岳教授领导的文本智能实验室开发了一种名为Fast-DetectGPT的新文本检测方法。该方法能高效识别AI生成的文本,并且Fast-DetectGPT无需训练,即可准确检测包括ChatGPT、GPT-4在内的多种AI语言模型生成的文本。尽管Fast-DetectGPT能提供文本为机器生成的概率,但鲍光胜博士指出,它无法100%准确识别,尤其是当文本混合了机器和人工撰写的部分时。
iOS18中的一项AppleIntelligence功能是Genmoji,它允许iPhone用户通过AI根据文本输入生成全新的表情符号角色。根据iOS18在WWDC会议上的介绍,Genmoji看起来类似于传统的表情符号,但它们是根据用户的输入自定义生成的。Genmoji和AppleIntelligence将在今年秋季向公众开放,但仅限于iPhone15Pro机型以及配备M系列芯片的iPad和Mac。
浙江大学、蚂蚁集团、深圳大学联合推出了创新模型MaPa。与传统纹理方法不同的是,MaPa通过文本能直接生成高分辨率、物理光照、超真实材质的3D模型,可以极大提升游戏、VR、AR、影视等行业的开发效率。MaPa使用了连续迭代的方法,可以为模型的每个部分生成一致且真实的材质,即便是那些非常复杂的3D模型架构也没问题。
StabilityAI今天发布了StableAudioOpen1.0,这是其音频领域的新一款生成AI模型。StabilityAI以稳定扩散文本到图像生成AI技术闻名,但这只是该公司产品组合的一部分。我们期待进一步发布商业和开放模型,以反映我们研究的进展。
StableAudioOpen是什么?StableAudioOpen是一个开源的文本到音频模型,专为生成短音频样本、音效和制作元素优化。AIGC网站,AI工具尽在AIbase!
6月6日,著名开源大模型平台Stability.ai在官网宣布,开源最新文生音频模型StableAudioOpen。用户通过文本就能生成最多47秒,钢琴、笛子、鼓点、模拟人声等不同类型的44.1kHz音效。StableAudioOpen目前只能用于学术研究无法商业化。
探索ChatTTS能为你带来哪些改变为什么选择ChatTTS?ChatTTS不仅仅是一个模型——它是一个开源的文本到语音转换技术,致力于为语音技术研究和教育提供支持。通过AIbase,您可以轻松发现最适合您需求的人工智能工具,解锁AI的力量。
划重点:⭐️全新功能:Elevenlabs发布文本生成音乐特效功能,帮助用户轻松制作逼真音效。⭐️免费试用:用户可免费试用该功能,享受强大的音效生成体验。值得期待的是,随着技术的不断进步,这类AI音乐平台将会在未来发展出更多创新的功能,为用户带来更多惊喜和乐趣。
设计平台Canva推出了一系列更新,旨在使其设计生态系统对专业团队和工作空间更具吸引力。该公司重新设计了平台,使新的和现有的编辑工具更易于找到,并宣布推出企业版,为大型组织提供更多的协作、品牌管理和安全性控制。Layouts:快速获得多种符合品牌形象的布局建议,可以选择合适的使用。
随着ChatGPT的火热,国产大模型开始呈现爆发式增长态势,科技巨头、垂直场景玩家纷纷入局。在AI技术跃进式发展的趋势下,“从文本生成到AI聊天机器人”“从网站、软件App到智能终端”“从AI视频,到AI游戏”……AIGC无处不在,并开始席卷一切。七麦数据后期也将持续关注AI类产品的动向趋势,希望能给大家一些助力。
4月27日,在2024中关村论坛-未来人工智能先锋论坛上,清华大学联合生数科技正式发布了,中国首个长时间、高一致性、高动态性视频大模型——Vidu。Vidu采用了原创的Diffusion与Transformer融合的架构U-ViT,支持文本生成长达16秒、分辨率高达1080P的高清视频内容。生数科技致力打造世界领先的多模态大模型,融合文本、图像、视频、3D等多模态信息,探索生成式AI在艺术设计、游戏�
知名生成式AI平台BlockadeLabs在官网重磅发布了全新模型——Model3。与Model2相比,Model3的生成效果实现质的提升,原生支持超高清8192x4096分辨率,增强了文本提示器能更好的描述生成世界,并且大幅度减少了生成世界的灰度值,使建筑、风景、人物等看起来更加高清、细腻。经过一年多的技术创新与业务积累,Blockade的用户超过150万,生成的作品超过1000万,成为很多游戏开发工作室、3D建模等常用工具,尤其是与Unity开发引擎集成后,迎来了一波用户增长高峰。
Meta与德国慕尼黑工业大学研发出创新模型ViewDiff,旨在帮助用户通过文本、图像或二者结合使用,快速生成高质量多视角3D图像。该模型解决了传统文本生成多视角3D图像领域的三大难点:无法生成真实背景环境、图像质量和多样性不理想、缺乏多视角和一致性。该模型的推出不仅在技术层面上具有重大意义,也将为未来的3D图像生成领域带来更多创新可能。
Mixtral-8x22B是一个预训练的生成式稀疏专家语言模型,由MistralAI团队开发。该模型拥有141B个参数,支持多种优化部署方式,旨在推进人工智能的开放发展。
InstantStyle是一个通用框架,旨在在文本到图像生成过程中实现风格与内容的有效分离。该框架采用了两种简单但强大的技术,以实现对风格和内容的有效解耦。InstantStyle还将继续改进和扩展,为用户提供更多功能和选择,助力他们在图像生成领域取得更大的成功。
随着人工智能技术的发展,视频生成领域取得了长足的进步。在现有的文本到视频生成模型中,对镜头姿势的精确控制往往被忽视镜头姿势在视频生成中扮演着表达更深层叙事细微差别的影视语言角色。这一技术的应用前景广阔,有望在视频生成领域发挥重要作用。
4月4日,著名开源大模型平台Stability.ai在官网正式发布了,音频模型StableAudio2.0。StableAudio2.0支持用户通过文本或音频,一次性可生成3分钟44.1kHz的摇滚、爵士、电子、嘻哈、重金属、民谣、流行、乡村等20多种类型的高质量音乐。StableAudio2.0免费赠送20积分,生成的音乐可以商业化,这对于抖音、快手、B站的视频自媒体用户来说挺有帮助的。
AnimagineXL3.1是一款能够基于文本提示生成高质量动漫风格图像的文本到图像生成模型。它建立在稳定扩散XL的基础之上,专门针对动漫风格进行了优化。AnimagineXL3.1的产品特色:从文本提示生成动漫风格图像提升手部解剖和图像细节质量优化提示解析和概念理解能力支持多种图像长宽比例美学标签和提示模板优化输出结果如果您对动漫文本到图像生成工具感兴趣,不妨前往AnimagineXL3.1官网了解更多信息。
2月29日,著名AI平台Lightricks在官网宣布,推出生成式AI电影制作平台—LTXStudio。用户只需要输入文本就能生成超25秒的微电影视频,同时可对镜头切换、角色、场景一致性、摄像机、灯光等进行可视化精准控制。1927年的巡回嘉年华会上俯拍走钢丝的表演者,他在钢丝上保持平衡,下面的人群紧张地注视着他,柔和的漫射光,聚光灯打在表演者身上,戏剧性的阴影,温暖的棕褐色
GoogleGemmaChatFree是由Google开发的前沿轻量级开放模型。这些模型分为2B和7B参数版本,包括基础和调优版本。要了解更多关于GoogleGemmaChatFree的信息并开始您的文本生成和摘要之旅,请访问GoogleGemmaChatFree官网。
StableDiffusion3是stability公司推出的新一代文本到图像生成AI模型,相比早期版本在多主体提示、图像质量和拼写能力等方面都有了极大提升。该模型采用了diffusiontransformer架构和flowmatching技术,参数量范围从800M到8B不等,提供了从个人用户到企业客户多种部署方案。相比早期版本,该AI助手具有更强大的理解和创作能力,是新一代安全、开放、普惠的生成式AI典范。
最近发布的Sora是一款由OpenAI推出的文本生成视频模型。用户可以输入文本描述,生成高清视频,支持长达60秒的视频生成,提供多角度镜头切换,模拟物理效果如咬痕或踩奶效果,甚至可以从图片生成视频,包括动画、音乐视频、宣传片、教育视频、游戏、短片等。Sam之前提到,加入红队可以获得测试《Sora》的机会。
OpenAISora是一个由OPENAI推出的AI模型,被称为文本到视频模型,能够根据文本命令生成生动富有想象力的场景。它能够根据用户提供的文本提示创建复杂的场景,其中包含多个角色、动态环境和精确细节。如欲了解更多详情,请访问OpenAISora官方网站。
AI SORA TECH 是一款革命性的内容创作工具,利用先进的视频生成技术,将文本和图像转化为动态视频,并支持视频到视频的创作。它可以根据输入的文本或图像生成整个视频或延长现有视频的长度,满足各种视频制作需求。AI SORA TECH的功能丰富,操作简便,适用于专业人士和初学者。点击前往AI SORA TECH官网体验入口谁可以从AI SORA TECH中受益?AI SORA TECH适用于广告、社交媒体内容�
SpeakingAI是一款采用先进的大语言模型技术实现的文本到语音转换工具。它以自然的情感进行对话,实现零样本语音克隆,捕捉个体独特的音调、音高和调节。欲了解更多详细信息并开始您的语音克隆之旅,请访问SpeakingAI官方网站。
GPT-SoVITS是一个强大的零样本语音转换和文本到语音WebUI。它具有零样本TTS、少样本TTS、跨语言支持和WebUI工具等功能。访问GPT-SoVITS官方网站,开启零样本语音转换和文本到语音的全新体验之旅。
在谷歌一项项名为“MobileDiffusion”的研究中,Google的研究员介绍了一种新颖的移动设备上文本生成图像的方法。传统的文本生成图像模型通常需要庞大的参数和强大的计算能力MobileDiffusion则专为移动设备设计,具有在半秒内生成高质量图像的潜力。MobileDiffusion的研究展示了在移动设备上实现快速文本生成图像的潜在前景,并承诺在应用该技术时遵循Google的负责任人工智能实践�