11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
本文汇总了近期AI领域的重要动态:1)谷歌推出249.99美元/月的AI Ultra订阅计划,提供最强AI模型和高级功能;2)腾讯混元模型升级,新增视觉推理T1-Vision和语音对话模型;3)美图获阿里2.5亿美元投资,将在电商和AI领域合作;4)豆包推出语音播客模型,实现文本快速转音频;5)百度文心X1 Turbo获信通院最高评级;6)谷歌发布Flow AI剪辑工具,集成Veo3等三大模型;7)谷歌Veo3支持4K视频生成;8)Imagen4图像模型发布;9)Gemini2.5 Pro新增并行推理功能;10)谷歌推出虚拟试衣工具;11)公测AI编程助手Jules;12)苹果计划在iOS19开放AI模型;13)京东云推五大免费AI营销工具;14)字节开源多模态模型BAGEL;15)英伟达发布物理推理模型Cosmos-Reason1。
5月20日,火山引擎推出豆包·语音播客模型,实现文本秒转专业播客内容。该模型三大优势:1)自然流畅的双人对话效果,语音拟真度高;2)支持热点话题即时生成,5秒产出最新资讯播客;3)提供端到端创作链路,支持超长文本/网页链接转播客。相比传统AI播客,解决了内容重复、机械感强等问题。模型即将登陆豆包APP及PC端,6月11日将在火山引擎大会上展示更多功能。
近日,全球知名财经杂志《财富》在其官网上推出了一项AI语音播报功能,有网友发现,其中文朗诵的口音有浓重河南味”。该AI语音播报功能提供了英语、德语、法语、西班牙语、中文、意大利语可选,其中打开中文播报之后,并非标准的普通话是带有河南味”的河普。《财富》杂志自1954年推出全球500强排行榜,历来都成为经济界关注的焦点,影响巨大。
推送语音播报简介语音播报是一种通知方式,在收到通知的时候,用户不用拿起手机查看,直接通过语音播报方式了解通知内容,节省时间提高工作效率。主要适用于商家交易收费通知,用户之间转账通知、公交车到站等场景。以下是一个示例:#voice_value字段里配置语音文件名,不需要带后缀".mp3",多个语音文件中间用英文符号“,”隔开“,以#开头的数字串是需要后台解析组包的数值,只能数字和“.”组成,“.”只支持两位小数。
一段高铁到站播报的视频近期在网上引起了广泛关注。一位乘务员手持播报话筒,并使用手机播放录音来完成播报任务。人工播报在某些情况下仍然是必不可少的,它能够提供更加灵活、亲切和及时的服务,同时也作为自动播报系统的补充。
OpenAI针对ChatGPT的新朗读功能ReadAloud现在已经支持在ChatGPT的网络版本以及iOS和AndroidChatGPT应用程序上使用。ReadAloud可以讲37种语言,但会自动检测正在阅读的文本的语言,并且该功能适用于GPT-4和GPT-3.5。网络版本在文本下方显示一个扬声器图标。
河南濮阳一按摩行业盲人反映自己用的是iPhone14ProMax,因为眼睛看不见,用旁白功能收付费会出现播报错误的情况。其用微信给别人转账158元,但语音播报150元。苹果中国官方客服回应表示:确实有这样的异常,现在查询到这个问题有相关的反馈,接下来帮您做一下升级,提交到工程部会有专人跟进,最晚周二回复。
在河南濮阳,小康是一位盲人从事按摩行业,他反映他使用的是iPhone14ProMax,因为眼睛看不见,在使用旁白功能收付款时,播报会出现错误。在现场他用微信向他人转账158元,语音却播报150元,收转账100元时,语音却播报130.300元,有的金额则播报正常,很多盲友都反映遇到过这种情况。苹果中国官方客服回应:确实有这样的异常,现在查询到这个问题有相关的反馈,接下来帮您做一下升级,提交到工程部会有专人跟进,最晚周二回复。
突然有很多人在朋友圈晒出和AI问答的“惊艳”截图,这些都来自美国OpenAI公司发布的名为"ChatGPT"的AI机器人,让大家感受到人工智能的强大,甚至有人认为其是足以挑战互联网搜索霸主谷歌的存在。即便是获奖的《太空歌剧院》,作者也声称,“这幅画最终完成经过了900多次调整,耗费了近300个小时。