11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
本文汇总了AI领域最新动态:1)中国信通院发布智能体开发标准,推动AI商业化进程;2)阿里推出QwenLong-L1-32B长文本推理模型,性能媲美Claude-3;3)GPT-4o语音模式升级,新增唱歌功能;4)秘塔AI搜索推出极速模型,响应速度达400tokens/秒;5)谷歌发布LMEval评估框架,统一大模型评测标准;6)Chrome浏览器集成Gemini AI助手;7)阿联酋全民免费使用ChatGPT Plus;8)苏州成立60亿元AI产业基金;9)法国Kyutai实验室推出10秒定制语音的Unmute系统;10)UAV-Flow项目实现无人机语音精准控制;11)Claude将升级支持百万字上下文和记忆功能;12)百度心响iOS版上线;13)夸克推出高考深度搜索功能;14)Chrome v137开发者工具升级;15)美团AI业务接近GPT-4o水平;16)Direct3D-S2实现3D生成速度提升10倍;17)OpenAI计划2026年推出首款AI硬件。
5月20日,火山引擎推出豆包·语音播客模型,实现文本秒转专业播客内容。该模型三大优势:1)自然流畅的双人对话效果,语音拟真度高;2)支持热点话题即时生成,5秒产出最新资讯播客;3)提供端到端创作链路,支持超长文本/网页链接转播客。相比传统AI播客,解决了内容重复、机械感强等问题。模型即将登陆豆包APP及PC端,6月11日将在火山引擎大会上展示更多功能。
iOS18.3正式版会在下周上线,该版本主要有两大变化,一是苹果默认启用AI,二是苹果禁用了通知摘要功能。去年10月苹果推送了iOS18.1,AI功能首次在这一版系统上线,同年12月iOS18.2上线,Siri接入了ChatGPT,在iOS18.1和iOS18.2上,苹果会询问用户是否启用AI,只有用户确认后才能使用。iOS18.3升级视觉智能,iPhone16用户通过相机控制按钮启动相机,它便能够对相机所捕捉到的画面展开分析,比如将手机对准海报,系统可以将活动日期添加到日历之中。
据报道,苹果推送了iOS18.3Beta3版本,新版iOS禁用了新闻娱乐类应用的通知摘要功能。苹果打造通知摘要的目的是为用户节省阅读时间,但是这项功能被英国广播公司投诉,因为通知摘要会曲解文章内容,导致用户被误解。当用户打开通知摘要”时,苹果会提醒这是一项测试版功能,可能存在错误。
英国一家新闻媒体机构向苹果公司投诉AppleIntelligence的通知摘要功能。作为AppleIntelligence功能的一部分,通知摘要利用人工智能技术对信息和邮件等应用的通知内容进行总结,帮助用户更直观、更快速地掌握重要信息。当事媒体表示,苹果必须尽快解决这个问题,因为这种情况出现很多次了。
很多小伙伴在使用SD3.5、DALL·E3、Midjourney、豆包等文生图模型时,总是感觉生成的图片和预期的相差甚远。今天就用Stability.ai发布的SD3.5官方教程为大家解读一下,如何用最贴切的文本提示词来生成精准的图片。文本提示案例:采用鸟瞰视角,从天空向下看一座繁华的城市夜景,街道灯火通明,车流不息,霓虹灯牌闪烁,给人一种现代都市的活力感。
快科技12月20日消息,近日快手可灵AI宣布基座模型再升级,视频生成推出可灵1.6模型。据快手官方介绍,1.6模型在文本响应度、画面美感及运动合理性上均有明显提升,画面更稳定更生动,对运动、时序类动作、运镜等文字描述响应更好。并且动态质量进一步增强,运动更加合理,人物表情更自然;同时1.6模型画面质量也再次进化,色彩、光影、细节表现均明显提升,提供支持标准和高品质模式,图生视频效果提升同样显著。此前在今年9月份,可灵AI 1.5模型上线,当时就已经支持高品质模式,与可灵1.0模型只能生成最高720P的视频不同,可灵1.5模型则
【新智元导读】Meta最近开源了一个7B尺寸的SpiritLM的多模态语言模型,能够理解和生成语音及文本,可以非常自然地在两种模式间转换,不仅能处理基本的语音转文本和文本转语音任务能捕捉和再现语音中的情感和风格。在纯文本大模型取得进展的同时,其他模态数据,如语音与文本结合的语言模型也成为了一个热门的研究领域,但现有的模型要么在仅包含语音的数据上进行训练,要么是关注特定任务,如文本转语音、自动语音识别或翻译,在其他模态数据和任务上的泛化能力十分有限。研究人员还直接评估了模型对输入提示的处理能力,结果发现,无论是哪种提示,模型都能得到很高的评分,表明还有很大的空间来进一步提高模型在保持情感表达方面的能力,也意味着,智能体在理解和生成情感丰富的内容方面还有很大的潜力可以挖掘。
苹果计划为AppStore引入用户评论摘要功能,旨在帮助用户更容易识别应用程序是否未能兑现其在AppStore中的承诺。该功能将使用AppStore上的所有用户评论来创建一份摘要,重点介绍每款应用的“最常见的客户反馈”。2023年,该公司处理了超过11亿条评论,删除了约1.52亿条欺诈性评论。
【新智元导读】LLM训练速度还可以再飙升20倍!英伟达团队祭出全新架构归一化Transformer,上下文越长,训练速度越快能维持原有精度。AI的未来,或许就此改写......最近,英伟达团队抛出的一枚重磅炸弹,提出了全新神经网络架构——归一化Transformer,基于超球面进行表示学习。下图6展示了,注意力模块和MLP模块的特征学习率,应用于MLP中间状态的缩放因子,应用于QK点积之前�