站长之家(ChinaZ.com) 10月29日 消息:据亿欧报道,今日,云从科技宣布在语音识别技术上取得突破,在全球最大的开源语音识别数据集Librispeech上刷新了世界纪录,错词率降到了2.97%,将Librispeech的WER指标提升了25%,超过阿里、百度、约翰霍普金斯大学等企业及高校。
(举报)
站长之家(ChinaZ.com) 10月29日 消息:据亿欧报道,今日,云从科技宣布在语音识别技术上取得突破,在全球最大的开源语音识别数据集Librispeech上刷新了世界纪录,错词率降到了2.97%,将Librispeech的WER指标提升了25%,超过阿里、百度、约翰霍普金斯大学等企业及高校。
(举报)
11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
快科技4月21日消息,日前,2024世界内燃机大会在天津开幕,大会上,由我国自主研制的全球首款本体热效率53.09%的柴油机正式亮相。据央视新闻报道,经过全球第三方权威认证机构认定,这款柴油机创造了当今世界内燃机领域最高的有效热效率。TV南德意志集团北亚区副总裁何诺贝表示,经过严格规范的测试和现场目击试验,发动机最高有效热效率为53.09%,而且这是不带任何余热回收装置的本体热效率。热效率是衡量内燃机燃油利用效率的重要指标,热效率越高,油耗就越少。据了解,按照目前我国柴油机保有量测算,与平均45%~46%热效率水平相比,53
AssemblyAI最新研究成果展示了他们的Universal-1模型在多语言环境中的表现,该模型在准确性和鲁棒性方面均取得了行业领先地位。Universal-1比WhisperLarge-v3更准确,比fastWhisper更快,38秒可以处理60分钟音频。值得一提的是,非开源,仅提供API调用。
“笔墨若干,结局即定。”近来,夹在S+大剧的话题和战火中,腾讯视频上,一部名为《执笔》的古装微短剧火了。该剧由知乎盐选作者“林言年”创作的同名故事改编,播出首日,站内热度达19683,打破腾讯微短剧首日热度最高纪录。上线第三天站内热度破21000,刷新腾讯视频微短剧站内热度纪录,在猫眼拿下短剧热度榜周冠;开播两周分账破1000万。口碑方面,其当前豆瓣评分
华擎正式发布了两款超级强悍的ITX迷你主板,Z790ILightningWiFi、B760ILightningWiFi,内存、CPU极限超频都小菜一碟,已经轻松创造了四大世界纪录。Z790I/B760LightningWiFi主板设计机会如出一辙,都有1411相110ASPS顶级供电规格有服务器级低损耗的8层2盎司铜箔PCB、2万小时超长寿命的20K黑金电容。背部接口有一个HDMI、一个DisplayPort1.4、一个USB-C3.2Gen2、一个USB-A3.2Gen2、四个USB3.2Gen1。
回顾最近的手机发布会,几乎所有手机都选择了更轻薄的OLED屏,但仍有一部分LCD屏幕的忠实用户在期待一款适合他们的手机。对于LCD屏幕爱好者来说,LCD这种屏幕的护眼特性是他们的主要考虑因素之一。值得一提的是,除了iQOOZ9x,明天还将同时发布iQOOZ9、iQOOZ9Turbo等机型。
由灯塔专业版数据显示,宫崎骏的最新动画电影《你想活出怎样的人生》在今日上映之际,首日票房突破9724万元大关。这一成绩不仅超越了《雷霆沙赞!这部电影不仅是宫崎骏导演情感深沉的创意之作,也是吉卜力工作室精湛制作技术的再次展现,为全球影迷带来了一场视觉与情感的盛宴。
黄金市场继续展现出其强劲的走势,再次刷新历史纪录,最高至2353.74美元/盎司。上周国际金价开盘报于2237.13美元/盎司,周中国际金价再次刷新历史新高,并最高报于2330.26美元/盎司,最低价为2228.33美元/盎司,并最终报收于2329.46美元/盎司。市场环境复杂多变,黄金作为一种重要的避险资产,其价格受到多种因素的影响,百利好将持续关注国际黄金价格走势,深入研究黄金市场的走势,为客户提供及时的市场分析和判断,以及有价值的投资建议。
今日晚间,vivoXFold3折叠屏手机正式露面。这款新品的重量为219克,是目前最轻的大折叠屏旗舰,比起直板手机iPhone15ProMax的221克还要轻。vivoXFold3提供了两款经典配色,轻若鸿羽的轻羽白,薄如蝉翼的薄翼黑,简单典雅。
AI技术的迅速发展,在给人们提供便利的同时,也给诈骗分子留下可乘之机,为“AI诈骗”犯罪提供了土壤。一些不法分子利用AI深度伪造等新工具,实施电信诈骗、散布虚假信息,其陌生的”新面孔“,让很多人因不了解而对其放下戒备之心,更让人“防不胜防”。因此,维信金科要说的是,只有了解AI诈骗的实施过程和常用手法,才能更有针对性对其进行防范和处置。作为一
今年清明档从4月4日开始,至4月6日结束,共有三天。截止今天21时,2024清明节票房破3.53亿,超过2021年清明档首日票房,创影史新高。《草木人间》由顾晓刚执导,吴磊、蒋勤勤、陈建斌、王佳佳主演,电影围绕家庭情感缔连展开,覆以犯罪等剧情元素,以当下社会现实主义题材,尝试转译中国古典传说《目莲救母》。
硅基智能是一款数字化虚拟人与 AI 技术相结合的产品,主要应用于智能交互领域。其主要优点包括领先的 AI 技术、智能交互体验、商业化场景应用等。
星火网文助手是一款 AI 创作辅助工具,提供创作灵感、润色续写等功能,帮助作家更高效地写作。背靠强大的 AI 技术支持,定位于提升小说写作体验,提高作品质量。
商汤日日新 SenseNova 大模型体系提供多种大模型及能力,助力各行业智能化创新,以大算力引领通用人工智能发展。
Khroma 利用人工智能学习您喜欢的颜色,并为您创建无限的调色板,帮助您快速发现、搜索和保存色彩组合。Khroma 的个性化算法训练神经网络,生成您喜欢的颜色,过滤您不喜欢的颜色。同时,还可以搜索和保存颜色组合,并获取颜色名称、hex 代码、RGB 值、CSS 代码以及 WCAG 辅助功能评分。
笔灵 AI 写作是一款专业的 AI 论文写作助手,通过人工智能技术帮助用户撰写高质量的论文。其主要优点包括快速生成论文大纲、节省写作时间、提供各类论文模板和服务。产品定位于提高论文写作效率和质量,适用于学生、研究人员等写作需求。
IDM-VTON是一种新型的扩散模型,用于基于图像的虚拟试穿任务,它通过结合视觉编码器和UNet网络的高级语义以及低级特征,生成具有高度真实感和细节的虚拟试穿图像。该技术通过提供详细的文本提示,增强了生成图像的真实性,并通过定制方法进一步提升了真实世界场景下的保真度和真实感。
PhotoMagic 是一款使用人工智能技术的图片处理工具,通过简单操作即可快速生成商业级图片。其主要优点包括快速高效、大幅降低图片处理成本,定位于帮助用户在电商等场景下快速生成吸引人的图片。
京东羚珑是一站式内容生产与管理服务平台,提供商品主图设计、广告 banner 设计、店铺首页设计等功能。其主要优点包括丰富的模板选择、免费设计服务、高效便捷的操作流程。产品定位于为商家提供设计合作伙伴服务。
Overleaf 是基于 LaTeX 的在线协作编辑器,无需安装,支持实时协作、版本控制、数百种 LaTeX 模板等。适用于科学和技术领域的文档写作。
Continue是一个专为软件开发者设计的开源IDE扩展,它通过提供自动化和智能化的工具来加速AI软件的开发流程。它允许开发者在构建软件时保持流畅的工作状态,通过插件和系统整合,轻松开始并加速开发过程。Continue支持多种编程语言的代码自动完成,提供代码段的重写功能,并允许通过自然语言指令来优化代码。它还支持与多种AI模型和开发环境的整合,使得开发者能够构建一个随着新功能出现而进化的软件系统。
Cohere Toolkit是一个开源的AI应用程序开发工具包,它提供了一套生产就绪的应用程序,可以在云服务提供商上部署。这些应用程序可以访问Cohere的Command、Embed和Rerank模型,并且可以连接到企业数据和特定团队,以提高生产力。该工具包包含用于构建独特应用程序并可扩展部署的组件。
Bunny 是一系列轻量级但功能强大的多模态模型,提供多种即插即用的视图编码器和语言主干网络。通过从更广泛的数据源进行精选选择,构建更丰富的训练数据,以补偿模型尺寸的减小。Bunny-v1.0-3B 模型在性能上超越了同类大小甚至更大的 MLLMs(7B)模型,并与 13B 模型性能相当。
llava-llama-3-8b-v1_1是一个由XTuner优化的LLaVA模型,它基于meta-llama/Meta-Llama-3-8B-Instruct和CLIP-ViT-Large-patch14-336,并通过ShareGPT4V-PT和InternVL-SFT进行了微调。该模型专为图像和文本的结合处理而设计,具有强大的多模态学习能力,适用于各种下游部署和评估工具包。
ID-Animator是一种零样本人类视频生成方法,能够在不需要进一步训练的情况下,根据单个参考面部图像进行个性化视频生成。该技术继承了现有的基于扩散的视频生成框架,并加入了面部适配器以编码与身份相关的嵌入。通过这种方法,ID-Animator能够在视频生成过程中保持人物身份的细节,同时提高训练效率。
HiDiffusion是一个预训练扩散模型,通过仅添加一行代码即可提高扩散模型的分辨率和速度。该模型通过Resolution-Aware U-Net (RAU-Net)和Modified Shifted Window Multi-head Self-Attention (MSW-MSA)技术,动态调整特征图大小以解决对象复制问题,并优化窗口注意力以减少计算量。HiDiffusion能够将图像生成分辨率扩展到4096×4096,同时保持1.5-6倍于以往方法的推理速度。
Snowflake Arctic 是一款专为企业级人工智能任务设计的大规模语言模型(LLM),它在 SQL 生成、编码以及指令遵循等基准测试中表现出色,即使与计算预算更高的开源模型相比也毫不逊色。Arctic 通过其高效的训练和推理,为 Snowflake 客户以及广大 AI 社区提供了一种成本效益极高的定制模型创建方式。此外,Arctic 采用 Apache 2.0 许可,提供无门槛的权重和代码访问,并通过开源数据配方和研究洞察,进一步推动了社区的开放性和成本效益。
OpenVoice V2是一款文本到语音(Text-to-Speech, TTS)的模型,它在2024年4月发布,包含了V1的所有功能,并进行了改进。它采用了不同的训练策略,提供了更好的音质,支持英语、西班牙语、法语、中文、日语和韩语等多种语言。此外,它还允许商业用途的免费使用。OpenVoice V2能够精确地克隆参考音调色彩,并在多种语言和口音中生成语音。它还支持零样本跨语言语音克隆,即生成语音的语言和参考语音的语言不需要在大规模多语种训练数据集中出现。
超会 AI 是一款基于人工智能的爆款内容制造机,能够以 10 倍速度智能生产商品内容和自动化营销,帮助企业提高流量和销售额。产品背景信息丰富,价格适中,定位于为企业提供内容制造和营销解决方案。
OpenELM是由苹果公司开发的语言模型家族,旨在为开源研究社区提供先进的语言模型。这些模型基于公开可用的数据集训练,不提供任何安全保证,可能产生不准确、有害、有偏见或令人反感的输出。因此,用户和开发者需要进行彻底的安全测试,并实施适当的过滤机制。
豆绘商拍是一款利用先进 AI 技术提供商品图和服装图生成服务的工具,能快速实现抠图、背景更换和模特换脸等功能,帮助企业提升品牌形象和市场竞争力。