11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
阿里巴巴集团旗下通义科技发布了产品“通义听悟”的最新升级版本,新增了6项重要功能。其中最重要的更新是推出了音视频问答助手“小悟”,它可以进行单条音视频内的自由问答,也支持跨多个音视频记录进行问题回答。今日的升级再次提升了其在音视频内容管理和多语言问答助手等方面的能力,为用户提供更智能化的服务。
Apollo项目由FreedomIntelligence组织维护,旨在通过提供多语言医学领域的大型语言模型来民主化医疗AI,覆盖6亿人。该项目包括模型、数据集、基准测试和相关代码。欢迎访问Apollo官方网站获取更多信息。
医疗人工智能技术正在迅速发展,旨在利用大型语言模型的巨大潜力彻底改变医疗保健交付方式。这些技术进步承诺提高诊断准确性,个性化治疗方案,并解锁全面医学知识的获取,从根本上改变患者护理。该倡议弥补了全球医疗沟通中的重要差距,并为未来的多语言医疗AI创新奠定了基础。
MyShell公司宣布其多语言、多口音的文本转语音库MeloTTS正式开源。这一消息在开源社区引起了广泛关注。MeloTTS的开源无疑为文本转语音领域带来了新的可能性,我们期待看到更多的创新和应用。
ReadWeb.ai是一个提供即时多语言网页翻译和双语查看服务的平台,旨在简化全球信息获取。用户可以一键将任何网页转换成多语言资源,提供独特的双语阅读体验,并简化内容分享,促进跨语言的全球连接和沟通。要了解更多信息并开始使用ReadWeb.ai,请访问官方网站。
在当今日益全球化的时代,准确高效的跨多语言翻译需求前所未有的增长。传统的翻译方法虽然有效,但在可扩展性和多样性方面仍有待提升,这促使研究人员探索更为动态的解决方案。通过弥合语言多样性和任务特定功能之间的鸿沟,TOWER提升了LLMs的能力,重新定义了翻译技术的可能性。
随着大模型的崛起,RNN模型Eagle7B挑战了Transformer的霸主地位。该模型在多语言基准测试中表现卓越,同时推理成本降低数十倍。通过不断探索和创新,人工智能技术将更好地为人类社会和个体提供服务。
Qwen1.5是Qwen系列的下一个版本,提供了基础和聊天模型的开源版本,覆盖了0.5B到72B的多个规模。它是一个多语言的AI工具,可以实现语言理解、聊天、翻译和对话等任务。欢迎访问Qwen1.5网站了解更多信息,并体验其出色的功能与性能。
HitPawOnlineAIVideoTranslator是一款先进的AI视频翻译服务,支持多种语言选择,使您的视频内容能够触达全球观众。它还提供语音转文字和文字转语音的在线工具,能够准确地将音频转录为多种语言。点击前往HitPawOnlineAIVideoTranslator官网体验入口,立即体验多语言视频翻译的便捷与高效。
Surya是一个多语言文档OCR工具包,它能够实现准确的逐行文本检测和识别。逐行文本检测功能可以自动识别文档中每一行文字的位置。这使得Surya成为一个非常实用的多语言文档处理工具。
TooltipsAI是一款先进的插件,专为解释文本中的突出词语设计,并能在100多种语言中回答跟进问题。此插件支持PDF文件,且使用方便,无需注册。要开始使用TooltipsAI并提高您的阅读和研究效率,请访问TooltipsAI官方网站。
AnyText图文融合是一种基于扩散的多语言视觉文本生成和编辑模型,专门用于在图像中渲染准确且连贯的文本。它能够根据提供的图像和文本输入生成自然且逼真的合成图像。如需了解更多或下载AnyText,请访问AnyText网站介绍。
微软研究员最近发布了名为“EmotionPrompt”的研究成果,旨在增强多语言模型的情感智能。情感智能被认为是人类素质的一个关键组成部分,它涵盖了情感理解、情感处理以及如何利用情感数据来指导逻辑和分析过程,如问题解决和行为管理。这项研究为多语言模型的情感智能潜力提供了初步的研究,有望在各种应用领域取得进展。
纽约市市长亚当斯最近引发了一场争议,因为他使用人工智能工具向市民发送多语言电话推广活动,包括西班牙语、意第绪语、普通话、广东话和海地克里奥尔语。据《TheCity》报道,这些电话推广活动数量众多,其中包括数千通西班牙语电话、250多通意第绪语电话、160多通普通话电话、89通广东话电话和23通海地克里奥尔语电话。他说:“这在伦理上是对还是错?我只有一件事,那就是管理这座城市,我必须能够用市民理解的语言与他们交流...我只能说‘你好’。
AI视频编辑初创公司Captions发布了一款名为"Lipdub"的新应用,用于将视频片段翻译成28种语言。该应用支持多种语言,包括法语、印地语、西班牙语、意大利语、葡萄牙语、日语等,甚至可以将视频翻译成德克萨斯俚语、Z世代用语、海盗语和婴儿语。AI配音的初创公司引起了众多投资者的兴趣,像英国的Papercup和以色列的Deepdub等初创公司已筹集了数百万美元。
AltDiffusion是一种创新的多语言文本到图像的扩散模型,旨在解决现有文本到图像模型仅支持有限语言的问题。它支持18种不同语言,通过多种巧妙的训练技巧,如知识蒸馏和与已经预训练的仅支持英语的模型的结合,以及概念对齐和质量提升等步骤,实现了多语言文本到图像的转化。这一研究为多语言人工智能领域的进一步研究和应用提供了有力支持。
抖音宣布正式上线地方方言自动翻译功能。创作者可以使用该功能,“一键”将多种方言视频转化出普通话字幕,方便公众观看。本次上线的地方方言自动识别及翻译功能由火山引擎技术团队提供技术支持,采用了自研的自监督预训练模型和多语言翻译模型,实现了极少量标注数据条件下识别方言的能力,且训练效率提升一倍,有效有效提升了多语言翻译的性能,同时大幅降低了模型训练的资源消耗。
微信iOS版本于9月19日发布了8.0.42正式版更新,尽管官方并未公布具体更新内容,但据IT之家和用户的测试,该版本带来了多项改进。在微信聊天、朋友圈、网页及图片中使用翻译功能时,文字就会被翻译为所选语言,支持简体中文、繁体中文、英语、韩语、日语等多种语言,用户可以自行体验。此外,据用户@妇产科主任的发现,微信iOS版8.0.42正式版还有以下三项细节改进: 1、长按翻译结果,新增了一个“更换语言”按钮; 2、点击微信-我-钱包,新增了一个“经营账户”的入口,专为商家推出的收款账户; 3、点击小程序-右上角小人图标,新增了“我的评价”入口,这里可以看到对所有小程序的评价。
微信iOS版正式升级至8.0.42版本,虽然更新日志依旧简洁明了,仅提及“解决了一些已知问题”,但此次升级后,微信新增了多语言翻译功能,这一改变将为海外旅游、涉外工作等人群带来便利。在新版微信中,用户只需点击“我”-“设置”-“通用界面”,即可找到新增的翻译功能。这一功能的加入,无疑为用户提供了更多可能性和便利。
微信iOS版近日推出了8.0.42正式版更新,新版本中加入了一项实用的新功能:多语言翻译。在最新版本的微信中,点击“我”-“设置”-“通用”界面,就能看到新增的“翻译”功能。用户在微信聊天、朋友圈、网页及图片中使用翻译功能时,文字会被翻译成所选语言。
作业帮最近在2023中国国际服务贸易交易会上正式发布了自研银河大模型。银河大模型支持AI解题、多语言AI问答等能力,号称精通诗词字句和课文常识;并支持AI写作功能,可用于提高写作技巧、优化写作结构,并提供文章润色、语法纠错和创意启发等场景。作业帮表示,银河大模型即将在作业帮App等学习工具、旗下智能硬件及智能图书、教育数字化等多种场景中得到应用。
周二,Meta宣布推出SeamlessM4T,一种用于语音和文本翻译的多模态人工智能模型。作为一种能够处理文本和音频的神经网络,它可以执行文本到语音、语音到文本、语音到语音和文本到文本的翻译,支持「最多100种语言」,Meta表示,它的目标是帮助说不同语言的人更有效地交流。关于SeamlessM4T如何运作的更多技术细节可以在Meta的网站上获得,其代码和权重可以在HuggingFace上找到�
在当今互联互通的世界中,语言障碍对于有效沟通来说是一个重要挑战。随着人工智能和自然语言处理的快速发展,我们正在见证一系列开创性解决方案,彻底改变了我们与技术互动的方式。要探索这些新功能,只需在Azure上注册语音服务并访问SpeechStudioVoiceGallery即可。
元象XVERSE公司宣布开源其百亿参数的高性能通用大模型XVERSE-13B,可免费商用。XVERSE-13B是由深圳元象科技自主研发的支持多语言的大语言模型,基于它生成的服务包括了文本生成、自动化写作、数据分析、知识问答等方面。训练框架:经过对算子、通信、并行策略及调度等的优化,千卡集群上的峰值算力利用率达到58.5%,达到业界前列。
2023年7月18日至20日,第二届自然语言生成与智能写作大会在新疆乌鲁木齐召开。中译语通科技股份有限公司作为大会战略合作伙伴,向与会嘉宾展示了公司格物大模型技术和工业实践。中国中文信息学会自然语言生成与智能写作专委会为中译语通等8家企业颁发感谢奖牌,表达各企业对本届大会的特别支持。
瑞士苏黎世大学的研究人员开发了一种名为SwissBERT的多语言语言模型,用于瑞士的四种官方语言。瑞士研究人员在多语言任务上面临困难,因为每种语言都需要单独的语言模型其中一种语言甚至没有独立的神经语言模型。通过微调下游任务,该模型在未来的研究和非商业用途中可能具有潜力。
5+月+16+日,腾讯搜狗输入法发布多语言输入解决方案,支持英语、西班牙语、阿拉伯语和法语等+100+多个语种,可适配各类终端屏幕,并提供跟随系统语种智能切换的能力,以专业的多语言输入技术能力,助力中国企业开拓海外市场。在国内企业出海过程中,特别是家电、汽车和智能穿戴类等制造类企业,针对目标市场,提供当地语言的人机交互方式是获得海外订单的必要条件,但多数企业并不具备自研定制输入及多终端适配的专业能力接入开源键盘则面临数据安全、产品更新、服务维护、标准认证等一系列问题。已有近+200+家企业与腾讯搜狗输入法达成合作,如理邦医疗、科沃斯、美的、海信等,将多语言输入解决方案应用到家电、车载、平板和电视等智能终端产品中,助推其出海业务增长。
这周对于微软的+Bing+Chat+来说是重要的一周。微软公司周四宣布不再需要等待名单来尝试聊天机器人+AI+服务。目前几乎可以肯定微软会在+5+月晚些时候作为其年度+Build+开发者大会的一部分,公布更多有关微软+Bing+Chat+及其+AI+开发计划的信息。
联发科研究院宣布推出全球首个繁体中文AI+LLM,多语言模型+BLOOM-zh+在大多数繁体中文基准测试中优于其前身,同时保持其英语能力。BLOOM-zh+起源于+BigScience+于2022年推出的开源+BLOOM+模型。联发科表示,BLOOM-zh+在大多数繁体中文基准测试中的表现优于其前身,同时保持其英语能力。