11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
2024年1月18日凌晨,三星在举办了GalaxyAI全球新品发布会,宣告GalaxyS24系列的登场,应用了谷歌Gemininano大模型共同迎接“GalaxyAI时代”的到来。除了这个模型,GalaxyS24的一些功能还受益于谷歌Imagen2模型,将文本到图像的能力植入手机。S24、S24的起售价为115.5万韩元、135.3万韩元Ultra版则以169.84万韩元起售。
在商汤技术交流日活动上,商汤科技董事长兼首席执行官徐立宣布推出大模型体系商汤日日新大模型”。日日新”取自《礼记大学》,汤之盘铭:苟日新,日日新,又日新。基于大装置,商汤已构建了计算机视觉、自然语言处理、AI内容生成、多模态、决策智能等多个领域的大模型,持续演进能力并广泛支持各种应用。
谷歌昨日发布博文称,其相机即时翻译功能已增加至27种语言,另外其实时语音翻译功能也更加快速和流畅。
出门旅行必备什么工具?除了钱,恐怕就是翻译类应用了,而谷歌翻译应该是很多人的第一选择。今天,谷歌更新了翻译应用,新增加了几十种语言支持,并且为低速网络环境优化了APP。现在,谷歌翻译APP的视觉翻译功能更强大,可通过照片翻译37种语言,通过
三星在伦敦发布了新一代旗舰手机Galaxy S III。除了硬件之外,Galaxy S III新添加的S Voice等软件服务也是这款手机的卖点。
·GQL是自1987年发布SQL标准以来,ISO组织发布的第二个数据库标准语言·悦数图数据库v5.0版本原生支持GQL,已有首批企业用户采用经过行业多年的讨论和行动,图查询语言GQL在2024年4月12日正式发布。GQL是由国际标准化组织和国际电工委员会共同制定的图数据库查询语言标准,正式编号为ISO/IEC39075。我们的专家乐于和您详细交流。
第135届广交会现已开幕,来自200多个国家的采购商齐聚广州。蚂蚁集团发布五大新服务,全力支持广交会,为入境宾客提供便利、顺畅与丰富的参会与消费体验。支付宝表示,未来还将联合各方继续优化服务质量,助力入境宾客畅游中国,加深中外经贸往来。
AlComicFactory是一个独特的项目,它运用先进的技术自动生成具有情感和故事性的漫画内容。这个项目的核心是大型语言模型和SDXL技术,它们共同工作,根据用户提供的简单文本提示,自动创建出包含人物对话和场景描述的漫画。无论你是漫画创作者是只是想为你的创意添加视觉元素,AlComicFactory都能为你提供帮助。
Cohere团队于2024年3月11日发布了Command-R,一款旨在实现生产规模人工智能的新型检索增强生成模型。该模型专注于检索增强生成和工具使用,是可扩展的生成模型,旨在帮助企业从概念验证迈向实际生产。期待用户对Command-R的反馈,并期待在未来提供更多可扩展的模型,助力企业成功迈向生产规模的人工智能应用。
无论是开源的LLaMA2还是闭源的GPT系列模型,功能虽然很强大,但对语言的支持和扩展比较差,例如,二者都是以英语为主的大模型。为了提升大模型语言的多元化,慕尼黑大学、赫尔辛基大学等研究人员联合开源了,目前支持语言最多的大模型之一MaLA-500。相比原始LLaMA2模型,MaLA-500在主题分类等评测任务上的准确率提高了12.16%,这说明MaLA-500的多语言优于,现有的众多开源大语言模型。
GoogleBard今天宣布进行全球更新,将GeminiPro大语言模型功能扩展到40种语言,并为其添加图像生成功能。Bard还获得了来自领先基准的新质量认可。此次更新是Bard发展过程中的重要一步,它将使Bard更加易于使用和更具竞争力。
智谱AI开源了CogAgent,它是一个视觉语言模型,拥有180亿参数规模。该模型在GUI理解和导航方面表现出色,在多个基准测试上取得了SOTA的通用性能。CogAgent还支持OCR相关任务,通过预训练和微调,其能力得到了显著提升。
GoogleCloud和巴黎的生成型AI初创公司MistralAI当地时间周三联合宣布合作,允许这家初创公司在科技巨头的基础设施上分发其语言模型。根据双方的联合声明,「根据协议,MistralAI将使用GoogleCloud的AI优化基础设施,包括TPU加速器,以进一步测试、构建和扩大其大型语言模型,同时受益于GoogleCloud的安全和隐私标准。该公司周一表示,在七个月内第二轮融资中筹集了3.85亿欧元,由Andreessen-Horowitz和LightSpeedVentures等投资者领投。
首尔地铁正在积极测试一项创新的实时面对面AI翻译服务,以改善外国游客和地铁站工作人员之间的沟通,借助透明屏幕提供对13种语言的支持。该服务目前正在韩国首都的明洞站进行试点测试。如果试点期取得成功,计划在明年将该服务扩展到其他五个同样受欢迎的车站,包括首尔站、梨泰院站、金浦国际机场站、光化门站和弘益大学站。
微软的SeeingAI应用如今已经登陆安卓平台,为盲人和视障用户提供更多便利。这款应用最初仅支持iOS平台,但如今在一篇博客文章中,SeeingAI的创始人兼领导者SaqibShaikh宣布了对安卓平台的扩展,并强调了一些新功能。微软计划在2024年扩展到支持36种语言。
TTSMaker是一款免费的文本转语音工具,它不仅提供了强大的语音合成服务支持50多种语言,包括中文、英语、日语、韩语、法语、德语、西班牙语、阿拉伯语等。这款工具采用了先进的AI神经网络推理模型,能够在短时间内将文本转换为自然流畅的语音。TTSMaker是一款功能强大、应用广泛且免费的文本转语音工具,为用户提供了高效、便捷的语音合成服务。
亚马逊的AWS公司宣布,其语音转文本服务AmazonTranscribe现在采用生成式人工智能技术,能够识别并转录来自100种语言的语音,相较于2022年底的79种语言有了显著的提升。据AWS称,Transcribe通过对超过100种语言的数百万小时未标记音频数据进行自监督训练,使用算法学习不同语言和口音的语音模式,且在训练中确保了频率较低的语言得到适当的平衡。这反映了云服务领域的竞争趋势,即通过整合先进的AI技术,不断提升产品性能,以满足用户对更高水平服务的需求。
印度初创公司CoRover.ai近日成为Google重点投资对象,计划获得400万美元的资金支持。CoRover.ai是印度的人工智能工作室,推出了基于大型语言模型的人工智能解决方案BharatGPT。这一投资表明,全球科技巨头对印度人工智能领域的发展充满信心,也为印度在大型语言模型领域的创新和竞争提供了有力支持。
亚马逊宣布推出全新一代语音基础模型驱动的ASR系统,将自动语音识别服务扩展到支持100多种语言。AmazonTranscribe是一项完全托管的ASR服务,使您能够轻松地将语音转换为文本,并在应用程序中添加语音到文本的功能。要了解本文讨论的功能的更多信息,请查看功能页面和新功能帖子。
联发科今晚正式发布天玑9300旗舰5G生成式AI移动芯片,支持在端侧生成式AI、游戏、影像等方面定义旗舰新体验。天玑9300集成MediaTek第七代AI处理器APU790,为生成式AI设计,其性能和能效得到显著提升,整数运算和浮点运算的性能是前一代的2倍,功耗降低了45%。MediaTek的AI开发平台NeuroPilot构建了丰富的AI生态,支持Android、MetaLIama2、百度文心一言大模型、百川智能百川大模型等前沿主流AI大模型,完整的工具链助力开发者在端侧快速且高效地部署多模态生成式AI应用,为用户提供文字、图像、音乐等终端侧生成式AI创新体验。
抖音宣布正式上线地方方言自动翻译功能。创作者可以使用该功能,“一键”将多种方言视频转化出普通话字幕,方便公众观看。本次上线的地方方言自动识别及翻译功能由火山引擎技术团队提供技术支持,采用了自研的自监督预训练模型和多语言翻译模型,实现了极少量标注数据条件下识别方言的能力,且训练效率提升一倍,有效有效提升了多语言翻译的性能,同时大幅降低了模型训练的资源消耗。
PareaAI提供了一个领先的LLMops平台,帮助开发者将AI视野转化为现实。通过PareaAI强大的promptengineering工作流,开发者可以优化prompt的表现,从打造令用户惊叹的AI应用。使用PareaAI,开发者可以无忧开启AI应用创新的新篇章。
Flot.ai是一款人工智能写作助手,能够帮助用户在任何应用或网站上获得AI的帮助,无需复制粘贴就可以使用ChatGPT。Flot.ai使用OpenAI最新的GPT-4模型,支持200多种语言,真正做到一键使用AI。用户可以让Flot.ai帮助构思提纲、提高写作创造力、进行语法纠正、改进语调、帮助写作内容等内置了专业测试过的提示,可以最大限度发挥AI的潜力。
作业帮最近在2023中国国际服务贸易交易会上正式发布了自研银河大模型。银河大模型支持AI解题、多语言AI问答等能力,号称精通诗词字句和课文常识;并支持AI写作功能,可用于提高写作技巧、优化写作结构,并提供文章润色、语法纠错和创意启发等场景。作业帮表示,银河大模型即将在作业帮App等学习工具、旗下智能硬件及智能图书、教育数字化等多种场景中得到应用。
FreeSubtitles.AI是一个免费的在线字幕生成服务,可以将任何语言的任何内容转录成任何语言,旨在消除语言障碍。免费用户可上传最大300MB,最长30分钟的文件,付费用户可上传最大10GB,最长10小时的文件。付费用户可以永久保存媒体文件,保证用户的隐私和安全。
Elevenlabs推出了新模型“ElevenMultilingualv2”,可自动识别28种语言,并将文本转换为语音。Elevenlabs表示,与其前一代模型相比,新模型“ElevenMultilingualv2”实现了更高的语音真实性。英语、波兰语、德语、西班牙语、法语、意大利语、印地语和葡萄牙语过去和现在均受支持。
8月23日,全球社交、科技巨头Meta在官网宣布,开源多语音、语言,翻译、转录大模型SeamlessM4T。据Meta介绍,SeamlessM4T是首个一体化AI翻译大模型,支持100种语音、语言翻译,可执行语音到文本、语音到语音、文本到语音和文本到文本的多模式翻译任务。Meta还显着提高了所支持的中低资源语言的性能,并保持了高资源语言的强劲性能。
人工智能初创公司ElevenLabs日前宣布其语音合成技术最新版本,现已支持30种语言。该公司声称,通过这个升级,它的AI可以生成更加逼真、富有情感色彩的多语种语音。这场关乎创作者权利的辩论,或将随着该技术的日益成熟持续发酵。
ResembleAI是一款可以生成人类声音的人工智能工具。它可以从你提供的语音数据中克隆声音,只需要5分钟的数据就可以开始。ResembleAI的应用范围广泛,从为广告创建人工智能生成的文本,到交互式语音应答系统,再到视频游戏开发。
RaskAI是一款一站式本地化视频翻译工具,内容创作者只需上传视频、点击几下即可把视频翻译成60多种语言。RaskAI借助"文字转语音"和"语音克隆"技术,你不再需要请配音演员就可以在视频里添加专业的画外音。39美金月费权益翻译和配音25分钟/月;您可以以1美元/分钟的价格添加额外的分钟数;提供60多种语言;8种语言的语音克隆99美金月费权益翻译和配音100分钟/月;您可以以1美元/分钟的价格添加额外的分钟数;提供60多种语言;8种语言的语音克隆;抢先体验LipSync功能。