11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
本文汇总了AI领域最新动态:1)中国信通院发布智能体开发标准,推动AI商业化进程;2)阿里推出QwenLong-L1-32B长文本推理模型,性能媲美Claude-3;3)GPT-4o语音模式升级,新增唱歌功能;4)秘塔AI搜索推出极速模型,响应速度达400tokens/秒;5)谷歌发布LMEval评估框架,统一大模型评测标准;6)Chrome浏览器集成Gemini AI助手;7)阿联酋全民免费使用ChatGPT Plus;8)苏州成立60亿元AI产业基金;9)法国Kyutai实验室推出10秒定制语音的Unmute系统;10)UAV-Flow项目实现无人机语音精准控制;11)Claude将升级支持百万字上下文和记忆功能;12)百度心响iOS版上线;13)夸克推出高考深度搜索功能;14)Chrome v137开发者工具升级;15)美团AI业务接近GPT-4o水平;16)Direct3D-S2实现3D生成速度提升10倍;17)OpenAI计划2026年推出首款AI硬件。
5月20日,火山引擎推出豆包·语音播客模型,实现文本秒转专业播客内容。该模型三大优势:1)自然流畅的双人对话效果,语音拟真度高;2)支持热点话题即时生成,5秒产出最新资讯播客;3)提供端到端创作链路,支持超长文本/网页链接转播客。相比传统AI播客,解决了内容重复、机械感强等问题。模型即将登陆豆包APP及PC端,6月11日将在火山引擎大会上展示更多功能。
很多小伙伴在使用SD3.5、DALL·E3、Midjourney、豆包等文生图模型时,总是感觉生成的图片和预期的相差甚远。今天就用Stability.ai发布的SD3.5官方教程为大家解读一下,如何用最贴切的文本提示词来生成精准的图片。文本提示案例:采用鸟瞰视角,从天空向下看一座繁华的城市夜景,街道灯火通明,车流不息,霓虹灯牌闪烁,给人一种现代都市的活力感。
快科技12月20日消息,近日快手可灵AI宣布基座模型再升级,视频生成推出可灵1.6模型。据快手官方介绍,1.6模型在文本响应度、画面美感及运动合理性上均有明显提升,画面更稳定更生动,对运动、时序类动作、运镜等文字描述响应更好。并且动态质量进一步增强,运动更加合理,人物表情更自然;同时1.6模型画面质量也再次进化,色彩、光影、细节表现均明显提升,提供支持标准和高品质模式,图生视频效果提升同样显著。此前在今年9月份,可灵AI 1.5模型上线,当时就已经支持高品质模式,与可灵1.0模型只能生成最高720P的视频不同,可灵1.5模型则
【新智元导读】Meta最近开源了一个7B尺寸的SpiritLM的多模态语言模型,能够理解和生成语音及文本,可以非常自然地在两种模式间转换,不仅能处理基本的语音转文本和文本转语音任务能捕捉和再现语音中的情感和风格。在纯文本大模型取得进展的同时,其他模态数据,如语音与文本结合的语言模型也成为了一个热门的研究领域,但现有的模型要么在仅包含语音的数据上进行训练,要么是关注特定任务,如文本转语音、自动语音识别或翻译,在其他模态数据和任务上的泛化能力十分有限。研究人员还直接评估了模型对输入提示的处理能力,结果发现,无论是哪种提示,模型都能得到很高的评分,表明还有很大的空间来进一步提高模型在保持情感表达方面的能力,也意味着,智能体在理解和生成情感丰富的内容方面还有很大的潜力可以挖掘。
【新智元导读】LLM训练速度还可以再飙升20倍!英伟达团队祭出全新架构归一化Transformer,上下文越长,训练速度越快能维持原有精度。AI的未来,或许就此改写......最近,英伟达团队抛出的一枚重磅炸弹,提出了全新神经网络架构——归一化Transformer,基于超球面进行表示学习。下图6展示了,注意力模块和MLP模块的特征学习率,应用于MLP中间状态的缩放因子,应用于QK点积之前�
国产手机最近都开始跃跃欲试,新旗舰即将出击,AI是重磅提升点。日前发布的ColorOS15就加入了不少AI能力,小布助手可以理解语义,一句话帮助用户实现复杂操作可以实现AI影像创作等等,类似功能也将成为安卓旗舰标配。这个功能国行机型是完全无法使用的,此前业内推测国内将更换文心一言等合作商,实现类似功能。
它早已不是一家单纯的通信运营商是通过构建多模态基座大模型,打造全要素“AI”服务运营体系,成为通用人工智能时代的供给者、汇聚者和运营者。
【新智元导读】近日,一向画风精致的「苹果牌AI」,也推出了升级版的多模态大模型,从1B到30B参数,涵盖密集和专家混合模型,密集文本、多图理解,多项能力大提升。多模态大语言模型如今已是大势所趋。最后一栏表明,作者优化的组合实现了最佳的整体性能,平衡了基准测试中的所有功能。
Luma刚宣布即将发布1.5版本,没想到今天就正式上线了,这速度真可以啊。根据「AIGC开放社区」实际使用体验来看,与1.0相比,1.5最大提升就是生成视频的质量,尤其是清晰度、光影、饱和度、构图、运镜等方面,基本可以媲美OpenAI的Sora。Luma1.5每天是可以免费试用的但是有限额,超过之后第二天会恢复。