科大讯飞开发出语音新专利：通过声音可识别身份

2019-12-26 08:59 · 稿源：站长快讯

12月26日据环球网消息，科大讯飞称，该公司开发出新型人工智能技术，可以通过声音准确识别身份，进而可以将此技术用于执法。科大讯飞研究中心副主任傅中华说，该公司预计将在两到三年内在全国推出声纹识别系统。

（举报）

相关推荐
大家在看

关键词：

【腾讯云】11.11云上盛惠！云服务器首年1.8折起，买1年送3个月！

11.11云上盛惠！海量产品 · 轻松上云！云服务器首年1.8折起，买1年送3个月！超值优惠，性能稳定，让您的云端之旅更加畅享。快来腾讯云选购吧！

Docker容器镜像
去看看

Docker容器镜像 60元/15天

爆款产品组合购
去看看

爆款产品组合购低至1元

腾讯云x NVIDIA加速计划
去看看

腾讯云x NVIDIA加速计划最高获赠10万元扶持基金

2核2G云服务器
去看看

2核2G云服务器 112元/1年

查看更多相关信息>>

腾讯云 12-20

广告
科大讯飞：讯飞星火等16个App启动华为鸿蒙原生应用开发

科大讯飞与华为举行鸿蒙合作签约仪式，正式宣布旗下讯飞星火、讯飞同传、讯飞语记、智学网、讯飞AI学、羚羊等16个App启动鸿蒙原生应用开发，加上已经合作的讯飞输入法、讯飞听见App，迄今讯飞旗下主流产品均已启动鸿蒙原生应用开发。双方强强合作，将为鸿蒙生态注入更强大的AI能力，共同推动人工智能技术的创新与应用，将AI技术更广泛地应用于智能家居、智能驾驶、智能医疗等诸多领域，为用户带来更加智能、便捷的生活体验。双方也将发挥各自的技术优势，共同推动智能应用的创新发展。

科大讯飞华为鸿蒙系统
蚂蚁集团、OpenAI、科大讯飞等联合编制大模型安全国际标准发布

第27届联合国科技大会在瑞士日内瓦召开。世界数字技术院发布了一系列突破性成果，包括《生成式人工智能应用安全测试标准》和《大语言模型安全测试方法》两项国际标准。蚂蚁集团在公司内成立了科技伦理委员会和专门团队来评估和管理生成式AI的风险，公司所有AI产品均需通过科技伦理评测机制，确保AI安全可信。
全面对标GPT4！科大讯飞副总裁：星火大模型V4.0预计6月发布

快科技3月27日消息，据媒体报道，科大讯飞副总裁、研究院院长刘聪在博鳌2024年会现场接受采访时表示，对标GPT-4当前能力的讯飞星火大模型V4.0正在训练中，预计今年6月发布。刘聪透露，讯飞星火大模型从去年5月6日首次发布以来，已迭代到星火V3.5，已经逼近GPT-4的当前水平。此前科大讯飞董事长刘庆峰曾表示，今年讯飞星火大模型将继续快速升级，不过还是要科学理性正视�

科大讯飞讯飞星火大模型 GPT-4
全面对标GPT4 Turbo！科大讯飞刘聪：6月发布星火大模型V4.0版本

科大讯飞副总裁、研究院院长刘聪在博鳌2024年会现场表示：科大讯飞计划在今年6月，正式发布对标GPT-4当前能力的星火大模型V4.0版本。讯飞星火大模型V4.0目前正在训练中。刘庆峰表示，星火大模型的背后，是科大讯飞多年的研究和技术积累，多年来研发团队不断探索和改进各种算法和模型，以解决语言理解和推理中的挑战。

科大讯飞 V4.0版本 GPT-4
华为智驾新专利公布：可识别唇语并报警！

快科技3月24日消息，据天眼查显示，华为技术有限公司近日公开了一项报警方法、装置以及智能驾驶设备”的新专利，可识别唇语并报警。据显示，该专利申请人为华为技术有限公司，申请号为CN202211115088.2，申请日期为2022-09-14。摘要显示，本申请提供了一种报警方法、装置以及智能驾驶设备。智能驾驶设备中的报警装置根据第一唇部图像信息确定用户的第一唇部特征信息，所述第一唇部图像信息是第一相机获取的。所述报警装置将所述第一唇部特征信息输入到唇语报警模型中，得到第一报警信息。所述报警装置根据所述第一报警信息进行报警。通过?

华为技术有限公司专利智能驾驶设备
苹果开发出新款AI：可“看懂”屏幕内容并语音回复

苹果公司近日宣布，成功研发出一款前沿的人工智能系统ReALM。该系统具备卓越能力，能够精准解析屏幕上模糊的内容，同时深入理解相关对话及背景环境，从为用户提供更为自然流畅的语音助手交互体验。苹果预计将推出一系列创新成果，包括全新大语言模型框架、AppleGPT”聊天机器人及其生态系统中的其他AI功能。

人工智能系统苹果公司语言建模
马里兰大学开发出“隐形斗篷” 可让监控无法识别到你

马里兰大学帕克分校与FacebookAI的研究人员合作，开发了一种能够在物理和数字环境中有效降低对象检测器性能的对抗性模式。这项技术通过在物体上覆盖特定图案来欺骗检测器，使其无法正确识别对象，类似于一种“隐形斗篷”。更多信息和论文可以在马里兰大学的相关项目网站和arXiv上找到。

监控
苹果折叠屏iPhone 新专利获批：引入弹簧层概念

根据最新公开的信息，美国商标和专利局近期披露了一份清单，苹果公司成功获得了一项关于折叠屏幕手机的创新专利。这项专利的核心在于引入了一种新颖的弹簧层概念，旨在显著减轻折叠屏在折叠过程中所承受的压力。这一创新设计显著提高了折叠屏设备的耐用性，为用户带来了更加可靠和耐用的使用体验。

折叠屏手机创新专利弹簧层
苹果新专利引粉丝狂喜！iPhone有望配备可拆卸电池

苹果公司最近获得了一项关于充电系统的专利，这项专利允许模块化可拆卸电池的设计，旨在使设备更具灵活性以适应各种使用场景。根据专利描述，这些模块可拆卸电池包括A、B、C、D等不同规格，电芯部分采用常规的可充电电池，外层配有专用的接口，采用标准化连接。不过也有观点认为，可拆卸电池可能会对设备的防尘防水功能造成影响，这与当前智能手机的设计理念不符，同时也可能会影响官方售后服务。

苹果公司充电系统专利
苹果折叠屏iPhone新专利获批：内嵌弹簧层屏幕不怕摔了

虽然苹果迟迟未能推出折叠屏iPhone，但其实内部已经研发多年，只是尚未解决一些硬性问题没有量产，比如屏幕折痕、不耐摔等。不过最新专利信息显示，苹果已经找到了提升屏幕耐摔性的方法。种种迹象都表明，苹果折叠屏技术储备正在趋于完善，在折叠屏iPhone问世之后或许会大幅领先友商。

折叠屏手机苹果专利技术

School AI:个性化AI学习助手，提升学习效率

School AI是一个专为K12学生设计的AI平台，提供个性化学习体验和即时反馈，支持多语言环境，帮助学生以母语进行互动，增强教育的普遍性和包容性。平台对教师免费开放，内置监控和控制工具，帮助教育工作者设计更好、更个性化的课堂体验。

个性化学习 AI助手即时反馈

MetaAI:使用 Meta AI 助手完成任务、创建免费 AI 生成图像和获取任何问题的答案

Meta AI 是一款功能强大的 AI 助理,建立在 Meta 的先进 AI 技术之上。它可以帮助您完成各种任务,如创建备忘单、润色电子邮件写作、回答问题等。同时它还具有图像生成功能,可以根据您的文字描述生成相应的图像。Meta AI 免费使用,致力于为用户提供高效、智能、多功能的 AI 体验。

AI助手生产力工具图像生成

Meta Llama 3:Meta 新一代开源大型语言模型,性能卓越

Meta Llama 3是Meta公司推出的新一代开源大型语言模型,性能卓越,在多项行业基准测试中表现出色。它可支持广泛的使用场景,包括改善推理能力等新功能。该模型将在未来支持多语种、多模态,提供更长的上下文窗口和整体性能提升。Llama 3秉承开放理念,将被部署在主要云服务、托管和硬件平台上,供开发者和社区使用。

大模型开源自然语言处理

HuggingChat App:连接先进AI与用户的革命性平台

HuggingChat是一款iOS应用程序,旨在促进用户与多家提供商(如Mistral AI、Meta和Google)的多个顶尖大型语言模型之间的无缝沟通。它可以满足多种场景需求:激发创意,提供专家指导,促进教育与自我提升,提高工作效率,快速响应日常问题等。作为变革性AI技术的先锋采用者,HuggingChat将让您体验与先进大语言模型对话的无限可能。

人工智能大语言模型虚拟助手

SpeedLegal:个人AI合同谈判助手

SpeedLegal是一个利用机器学习技术（特别是深度学习、大型语言模型和通用AI）来突出合同中的条款和关键风险的技术初创公司。我们分析您的文档并发送给您一个简化的报告，以便您在签名前做出更明智的决策。

AI合同助手风险分析合同管理

FCK.School:AI写作工具

FCK.School是一个为学生提供AI写作工具的在线平台。它可以帮助学生改善写作技巧，提升学术表现。通过FCK.School的AI驱动工具，学生可以进行文本改写、文摘、语法纠错等操作，还能生成各种写作素材，如标题、论点、大纲等。FCK.School提供免费工具以供试用，同时还有付费订阅计划。

学生写作 AI工具

CompliantChatGPT:AI医疗助手，HIPAA合规

CompliantChatGPT是一款专为医疗保健行业设计的AI助手，它通过HIPAA合规的方式，帮助医疗工作者安全、高效地处理医疗相关任务。产品具备以下特点： - 保护患者数据安全，通过令牌化技术确保个人健康信息（PHI）的安全。 - 提供个性化的医疗模式，包括血液分析、PHI匿名化、诊断和治疗规划等。 - 用户友好的界面设计，支持语音到文本的笔记功能，便于记录和回顾。 - 定价策略灵活，提供免费试用，以及多种付费套餐选择。 - 适用于医疗提供者、专业人士、医疗机构、研究中心和健康科技初创企业。

医疗保健 AI助手 HIPAA合规

Healax:AI驱动的心理健康解决方案

Healax是一款创新的AI驱动的心理健康解决方案，专为学生设计，帮助他们主动应对日常生活中的压力和焦虑。该产品通过建立学生、行政人员和提供者之间的信任沟通渠道，提供定制化活动和内容，以促进更全面的教育体验。

心理健康学生支持 AI测试

Snowflake Arctic Embed:开源的先进文本嵌入模型

Snowflake Arctic Embed是一系列基于Apache 2.0许可开源的文本嵌入模型，专为检索用例设计。这些模型在Massive Text Embedding Benchmark (MTEB)检索基准测试中提供了领先的检索性能，为组织在结合专有数据集与大型语言模型（LLMs）进行检索增强生成（RAG）或语义搜索服务时提供了新的优势。这些模型的尺寸从超小型（xs）到大型（l），具有不同的上下文窗口和参数数量，以满足不同企业的延迟、成本和检索性能需求。

文本嵌入检索 AI

DuerOS X:全球首个AI原生操作系统

DuerOS X是小度基于百度文心大模型推出的全球首个AI原生操作系统。它彻底颠覆了传统的人适应系统的模式，实现了端到端连接用户的意图与任务，极大地拓展了操作系统的边界。DuerOS X全面应用了文心大模型，通过模型路由架构，能够灵活调度不同的文心模型去解决不同难度的问题，更高效、更精准、更经济。个性化长短记忆的存储、提取和理解能力，使得DuerOS X能够更清楚地记住历史内容与用户个性化偏好。此外，多模态感知技术的应用，让DuerOS X产生更丰富的感知力，无论是通过语音、文字还是表情与小度沟通，都能准确地理解用户的意图，并给出恰当的回应。

AI原生智能助手操作系统

abab 6.5:万亿参数MoE文本大模型

abab 6.5系列包含两个模型：abab 6.5和abab 6.5s，均支持200k tokens的上下文长度。abab 6.5包含万亿参数，而abab 6.5s则更高效，能在1秒内处理近3万字的文本。它们在知识、推理、数学、编程、指令遵从等核心能力测试中表现出色，接近行业领先水平。

人工智能文本处理大模型

mistral-common:Mistral模型工具集

mistral-common是一套帮助您处理Mistral模型的工具。它不仅包含文本到token的转换，还增加了工具解析和结构化对话。目前发布了三个版本的tokenizer，分别适用于不同的模型集合。

自然语言处理 Mistral模型 tokenizer

AI Grammar Checker & Paraphraser – LanguageTool:提供语法检查和改写的工具

AI语法检查与改写工具- LanguageTool是一款免费的语法检查工具，可以检测文本中的语法错误并提供改写建议。它能够检测出拼写错误、语法问题、常见词汇混淆和标点符号错误，并提供改写建议、同义词替换和简洁句子重写。该工具适用于多种语言，支持多个平台和应用场景，如社交媒体、电子邮件和网页。

语法检查改写工具免费

Spline AI 3D Generation:快速生成三维模型的AI工具

AI 3D Generation是Spline推出的一款3D设计工具，它支持文本到3D生成和图像到3D生成，允许用户通过简单的文本提示或2D图像自动创建出详细且精确的3D模型。该工具具有生成变体与混合、直观且适合初学者、创建独特的3D库、平台集成与实时协作、易于集成和发布等功能。

3D设计 AI生成文本到3D

FocuSee:轻松录屏软件会自动跟踪光标移动美化录屏效果

FocuSee 自动跟踪光标移动，应用动态缩放效果，为您节省宝贵时间和额外的努力。适用于演示，教程，推广视频等多种场景。

屏幕录制视频制作自动化编辑

Ai-to-pptx:使用AI技术来自动生成PPTX 支持在线修改

Ai-to-pptx 是一个使用 AI 技术 (ChatGpt 和 Gemini) 制作 PPTX 的助手，支持在线修改和导出 PPTX。主要功能包括使用 ChatGPT 等大语言模型生成大纲、允许用户再次修改内容、选择不同模板、在线修改 PPTX 的文字、样式、图片等，支持导出 PPTX、PDF、PNG 等多种格式。价格为付费，商业授权价格为 22000 元人民币或 3000 美元。

PPTX AI 技术在线修改

CodeQwen1.5:开源代码助手，高效编程新选择

CodeQwen1.5是一个基于Qwen语言模型的代码专家模型，拥有7B参数，支持92种编程语言，最长支持64K的上下文输入。它具备代码生成、长序列建模、代码修改和SQL能力等，旨在提高开发人员的工作效率，简化软件开发流程。

代码生成长序列处理代码优化

PixArt-Sigma:4K文本到图像生成的扩散变换器

PixArt-Sigma是一个基于PyTorch的模型定义、预训练权重和推理/采样代码的集合，用于探索4K文本到图像生成的弱到强训练扩散变换器。它支持从低分辨率到高分辨率的图像生成，提供了多种功能和优势，如快速体验、用户友好的代码库和多种模型选择。

AI图像生成文本到图像 4K分辨率

InstantMesh:高效3D网格生成框架

InstantMesh是一个基于LRM架构的前馈框架，用于从单张图像高效生成3D网格。它支持低内存GPU环境，并能生成具有纹理映射的3D网格模型。

3D建模图像处理机器学习

MagicClothing:基于LDM的服装驱动图像合成AI

MagicClothing是一种基于潜在扩散模型（LDM）的新型网络架构，专门用于服装驱动的图像合成任务。它能够根据文本提示生成穿着特定服装的定制化角色图像，同时确保服装细节的保留和对文本提示的忠实呈现。该系统通过服装特征提取器和自注意力融合技术，实现了高度的图像可控性，并且可以与ControlNet和IP-Adapter等其他技术结合使用，以提升角色的多样性和可控性。此外，还开发了匹配点LPIPS（MP-LPIPS）评估指标，用于评价生成图像与原始服装的一致性。

科大讯飞开发出语音新专利：通过声音可识别身份

今日大家都在搜的词：

热文

站长商机