谷歌收购语多项音识别技术专利围堵苹果Siri

2013-07-23 09:27 · 稿源：资讯索引

《谷歌收购语多项音识别技术专利围堵苹果Siri》文章已经归档，不再展示相关内容，编辑建议你查看最新于此相关的内容：

世界搜索引擎巡航之：亚洲各地搜索引擎

继续上次的世界各地搜索引擎之旅，这次我们从遥远的非洲大陆回到我们的亚洲，下面是亚洲各地的搜索引擎。包括中国香港，日本，韩国，泰国，沙特，以色列等地的搜索引擎。看看他们的搜索引擎都有那些自己的特色吧，国内的搜索引擎又有哪些该借鉴的吧。

谈谈容易被人忽视的几种常见的搜索引擎优化技巧

网站优化技术在各位站长朋友看来是各有千秋的，我最擅长的是软文优化，就是通过原创软文来引导潜在用户，以及有针对性的引导搜索引擎进入抓取采集我的网站内容，并且获得搜索引擎的认可，这种方法的实用性很强。

没谈资、怕OUT？有搜悦随时随地满血复活

在如今这个信息大爆炸的时代，快速获取热门资讯变得易如反掌，各种资讯类客户端在人们的移动终端设备上如雨后春笋般涌现，各种八卦新闻、时事资讯借助移动互联网的传播迅速渗透到人们生活的各个场景，并用碎片化的方式得以呈现。在这样的大背景下，“一日不看，OUT三秋”不再是危言耸听，随时随地掌握各种新闻资讯几乎成为人们在社交生活中的一项必备技能。

搜索引擎最近的变化

关注搜索引擎的网友们一定会发现，今年搜索引擎的变化特别多，尤其是下半年，百度和Google频繁更改排名算法，着实让人摸不清思路。

王雪涛：各搜索引擎路在何方

搜索引擎领域，各大门派厮杀多年，终无人一统江湖。雪涛曾欲邀请各派掌门华山谈判，另其各划一域治之，莫要纷争，以保网络和谐。但近日观各路英雄皆做市场细分，不谋全局而谋一域。哈哈，华山之会取消，雪涛不必费力矣。

搜索引擎不该成为侵犯版权的“替罪羊”

雅虎搜索被判败诉了。北京市第二中级人民法院4月23日就环球唱片有限公司等十一大国际知名唱片公司联合起诉雅虎网站侵犯著作邻接权纠纷系列案件进行了一审宣判，判决雅虎网站删除与原告主张权利的２２９首涉案歌曲有关的搜索链接；赔偿原告人民币２１万余元。同样的案

优化各搜索引擎对待外链的不同态度

目前在国内做网站优化，第一是百度，第二是google，再者是雅虎，尤其捉住前两者意义更大，这三者相信对于有过实际优化经验的人来说，都能体会到这三者对待反向链接的不同立场。由于我们通过各种站长工具检查外链时，显著感觉他们存在着巨大差异。

关于搜索引擎的五个简单基本类型

元搜索是meta search的翻译，这是从技术上分得，它的数据来源也是来自搜索引擎，通过提供某些功能或者与某些信息进行整合。

搜索引擎针对SPAM的五大判断

这方面就涉及到了搜索引擎对于SPAM的判断了。今天在这里，笔者就这块简单地分析一下。一般会引擎通过以下几个方面来判断网站是否为SPAM。

搜索引擎的新浪潮：I2I

百度做说吧，网上有两种讨论的声音，媒体或社区？简哲创意实验室的研究看法，百度做说吧，可以是一个简单的社区故事，也可以是一个带有复杂动机的故事，它的最终目的不是要一个媒体或社区型的微博。从搜索引擎的发展趋势来预测，我们认为下一轮的浪潮是I2I。

（举报）

相关推荐
大家在看

关键词：

【腾讯云】11.11云上盛惠！云服务器首年1.8折起，买1年送3个月！

11.11云上盛惠！海量产品 · 轻松上云！云服务器首年1.8折起，买1年送3个月！超值优惠，性能稳定，让您的云端之旅更加畅享。快来腾讯云选购吧！

Docker容器镜像
去看看

Docker容器镜像 60元/15天

爆款产品组合购
去看看

爆款产品组合购低至1元

腾讯云x NVIDIA加速计划
去看看

腾讯云x NVIDIA加速计划最高获赠10万元扶持基金

2核2G云服务器
去看看

2核2G云服务器 112元/1年

查看更多相关信息>>

腾讯云 12-20

广告
苹果新AI模型研究Ferret-UI：或将提升Siri，读懂屏幕内容

尽管苹果在生成式AI热潮开始后并未推出任何AI模型，但近期公司正在着手一些AI项目。苹果研究人员分享了一篇揭示公司正在研发的新语言模型的论文，内部消息称苹果正在研发两款AI驱动的机器人。由于模型对用户应用屏幕的全面理解以及执行某些任务的知识，Ferret-UI可以用于强化Siri，让其为用户执行任务。

AI模型 Ferret-UI Siri
华为智驾新专利公布：可识别唇语并报警！

快科技3月24日消息，据天眼查显示，华为技术有限公司近日公开了一项报警方法、装置以及智能驾驶设备”的新专利，可识别唇语并报警。据显示，该专利申请人为华为技术有限公司，申请号为CN202211115088.2，申请日期为2022-09-14。摘要显示，本申请提供了一种报警方法、装置以及智能驾驶设备。智能驾驶设备中的报警装置根据第一唇部图像信息确定用户的第一唇部特征信息，所述第一唇部图像信息是第一相机获取的。所述报警装置将所述第一唇部特征信息输入到唇语报警模型中，得到第一报警信息。所述报警装置根据所述第一报警信息进行报警。通过?

华为技术有限公司专利智能驾驶设备
80M参数打平GPT-4！苹果发超强上下文理解模型ReALM，聪明版Siri马上就来

【新智元导读】苹果公司发布了一款参数量仅为80M的最新模型——ReALM，能够将各种形式的上下文转换为文本进行理解，包括解析屏幕、多轮对话以及上下文引用，提升了Siri等智能助手的反应速度和智能程度。会读心的Siri想不想要?今天，苹果发布了自家的最新模型ReALM，仅需80M参数，就能在上下文理解能力上打平甚至超越GPT-4!论文地址:https://arxiv.org/pdf/2403.20329.pdfReALM可以将任何形式的上下文转换为文本来进行理解，比如解析屏幕、多轮对话、以及上下文中的引用。随着模型大小的增加，所有数据集的性能都有所提高屏幕相关数据集的差异最为明显，因为这项任务在本质上更加复杂。

ReALM Siri
荐苹果为了AI，上了谷歌的船

苹果公司CEO蒂姆·库克现身上海，成了各大社交媒体的焦点事件。除了和男演员郑恺在上海外滩漫步并品尝传统上海早餐、参加苹果公司在上海的第8家直营店“Apple静安店”的揭幕仪式外，库克还接受了媒体的采访，赞扬了中国地区的苹果供应链。是无奈地选择谷歌GeminiNano?还是成功发布改变市场用户认知的杀手级端侧大模型?到了九月份的iPhone16发布日，一切都清晰明了。

苹果
谷歌宣布Gemini 1.5 Pro开放API 新增多项功能

Google宣布开放其AI模型Gemini1.5Pro的API，这一版本在原有基础上进行了大幅度的功能扩展，现已在180多个国家提供。Gemini1.5Pro引入了对原生音频的理解能力，以及文件API和系统指令等新功能。这个新模型在MTEB基准测试中取得了更强的检索性能，超过了具有可比维度的所有现有模型。

Gemini1.5Pro AI头条
谷歌推Scenic：可识别视频内容并生成详细描述

Scenic是谷歌推出的模型，一个专注于计算机视觉领域的代码库，主要用于研究基于注意力的模型。该库提供了一系列共享的轻量级库，解决训练大规模视觉模型时常见的任务，并包含了几个使用这些库的问题特定训练和评估循环的项目。只有当功能被证明在许多模型和任务中广泛有用时，才可能将其上游到Scenic的共享库中。

Scenic AI头条
TCL实业盘古实验室发布全域光晕控制等多项创新显示技术

TCL实业盘古实验室在显示技术领域上再次取得新突破，发布了多项创新显示技术，包括备受瞩目的全域光晕控制技术、超大屏领域的MicroLED显示技术等，盘古实验室的深厚技术底蕴和创新能力，也为TCL实业的电视新品发布提供了有力的技术支持。其中全域光晕控制技术是TCL实业盘古实验室自主研发的一项创新技术，解决了长期困扰行业的MiniLED电视光晕问题。TCL实业也将以盘古实验室为技术载体，继续秉承“创新敢为”的精神，为全球消费者带来更多具有划时代意义的产品，推动显示行业不断向前发展。

TCL实业盘古实验室显示技术
悦享控股（CHR.US）区块链技术再获国家发明专利

2024年4月2日，悦享控股有限公司，一家以技术驱动的新一代移动互联网基础设施与平台服务提供商今天宣布，公司自主研发的《一种NFT交易方法及系统》获得国家知识产权局颁发的发明专利证书。该发明解决了数字藏品交易过程中的交易安全问题和未对数字藏品的内容保护的缺陷，实现对交易的安全保护与对数字藏品的内容保护，安全实现了对不可替代代币的交易和转移，这代表公司在区块链技术领域的雄厚实力。悦享控股致力于以"悦享"为核心的产业生态布局，巩固和强化核心竞争力，实现长期可持续的规模化发展。

区块链技术 NFT交易数字藏品交易
苹果今年或推出低价AirPods 率先在印度工厂组装

苹果即将在今年晚些时候推出一款价格更为亲民的AirPods耳机，这一消息来自于供应链分析师JeffPu的透露。这款新耳机将由富士康的子公司负责制造，并率先在印度的工厂进行组装工作。还透露出可能将增加一项与健康相关的新功能。

苹果 AirPods 价格亲民
“iPhone闹钟不会识别调休”多次上热搜！苹果官方客服回应

每逢节假日结束，iPhone闹钟不会识别调休”话题总是能登上微博热搜。今天清明假期结束，虽然是星期日，但由于调休安排今天也是工作日，又有不少网友抱怨称，iPhone闹钟无法识别调休，闹钟又没有响。国产安卓手机的闹钟智能识别节假日已经成为了标配功能。

iPhone 闹钟调休

SpeedLegal:个人AI合同谈判助手

SpeedLegal是一个利用机器学习技术（特别是深度学习、大型语言模型和通用AI）来突出合同中的条款和关键风险的技术初创公司。我们分析您的文档并发送给您一个简化的报告，以便您在签名前做出更明智的决策。

AI合同助手风险分析合同管理

FCK.School:AI写作工具

FCK.School是一个为学生提供AI写作工具的在线平台。它可以帮助学生改善写作技巧，提升学术表现。通过FCK.School的AI驱动工具，学生可以进行文本改写、文摘、语法纠错等操作，还能生成各种写作素材，如标题、论点、大纲等。FCK.School提供免费工具以供试用，同时还有付费订阅计划。

学生写作 AI工具

CompliantChatGPT:AI医疗助手，HIPAA合规

CompliantChatGPT是一款专为医疗保健行业设计的AI助手，它通过HIPAA合规的方式，帮助医疗工作者安全、高效地处理医疗相关任务。产品具备以下特点： - 保护患者数据安全，通过令牌化技术确保个人健康信息（PHI）的安全。 - 提供个性化的医疗模式，包括血液分析、PHI匿名化、诊断和治疗规划等。 - 用户友好的界面设计，支持语音到文本的笔记功能，便于记录和回顾。 - 定价策略灵活，提供免费试用，以及多种付费套餐选择。 - 适用于医疗提供者、专业人士、医疗机构、研究中心和健康科技初创企业。

医疗保健 AI助手 HIPAA合规

Healax:AI驱动的心理健康解决方案

Healax是一款创新的AI驱动的心理健康解决方案，专为学生设计，帮助他们主动应对日常生活中的压力和焦虑。该产品通过建立学生、行政人员和提供者之间的信任沟通渠道，提供定制化活动和内容，以促进更全面的教育体验。

心理健康学生支持 AI测试

Snowflake Arctic Embed:开源的先进文本嵌入模型

Snowflake Arctic Embed是一系列基于Apache 2.0许可开源的文本嵌入模型，专为检索用例设计。这些模型在Massive Text Embedding Benchmark (MTEB)检索基准测试中提供了领先的检索性能，为组织在结合专有数据集与大型语言模型（LLMs）进行检索增强生成（RAG）或语义搜索服务时提供了新的优势。这些模型的尺寸从超小型（xs）到大型（l），具有不同的上下文窗口和参数数量，以满足不同企业的延迟、成本和检索性能需求。

文本嵌入检索 AI

DuerOS X:全球首个AI原生操作系统

DuerOS X是小度基于百度文心大模型推出的全球首个AI原生操作系统。它彻底颠覆了传统的人适应系统的模式，实现了端到端连接用户的意图与任务，极大地拓展了操作系统的边界。DuerOS X全面应用了文心大模型，通过模型路由架构，能够灵活调度不同的文心模型去解决不同难度的问题，更高效、更精准、更经济。个性化长短记忆的存储、提取和理解能力，使得DuerOS X能够更清楚地记住历史内容与用户个性化偏好。此外，多模态感知技术的应用，让DuerOS X产生更丰富的感知力，无论是通过语音、文字还是表情与小度沟通，都能准确地理解用户的意图，并给出恰当的回应。

AI原生智能助手操作系统

abab 6.5:万亿参数MoE文本大模型

abab 6.5系列包含两个模型：abab 6.5和abab 6.5s，均支持200k tokens的上下文长度。abab 6.5包含万亿参数，而abab 6.5s则更高效，能在1秒内处理近3万字的文本。它们在知识、推理、数学、编程、指令遵从等核心能力测试中表现出色，接近行业领先水平。

人工智能文本处理大模型

mistral-common:Mistral模型工具集

mistral-common是一套帮助您处理Mistral模型的工具。它不仅包含文本到token的转换，还增加了工具解析和结构化对话。目前发布了三个版本的tokenizer，分别适用于不同的模型集合。

自然语言处理 Mistral模型 tokenizer

AI Grammar Checker & Paraphraser – LanguageTool:提供语法检查和改写的工具

AI语法检查与改写工具- LanguageTool是一款免费的语法检查工具，可以检测文本中的语法错误并提供改写建议。它能够检测出拼写错误、语法问题、常见词汇混淆和标点符号错误，并提供改写建议、同义词替换和简洁句子重写。该工具适用于多种语言，支持多个平台和应用场景，如社交媒体、电子邮件和网页。

语法检查改写工具免费

Spline AI 3D Generation:快速生成三维模型的AI工具

AI 3D Generation是Spline推出的一款3D设计工具，它支持文本到3D生成和图像到3D生成，允许用户通过简单的文本提示或2D图像自动创建出详细且精确的3D模型。该工具具有生成变体与混合、直观且适合初学者、创建独特的3D库、平台集成与实时协作、易于集成和发布等功能。

3D设计 AI生成文本到3D

FocuSee:轻松录屏软件会自动跟踪光标移动美化录屏效果

FocuSee 自动跟踪光标移动，应用动态缩放效果，为您节省宝贵时间和额外的努力。适用于演示，教程，推广视频等多种场景。

屏幕录制视频制作自动化编辑

Ai-to-pptx:使用AI技术来自动生成PPTX 支持在线修改

Ai-to-pptx 是一个使用 AI 技术 (ChatGpt 和 Gemini) 制作 PPTX 的助手，支持在线修改和导出 PPTX。主要功能包括使用 ChatGPT 等大语言模型生成大纲、允许用户再次修改内容、选择不同模板、在线修改 PPTX 的文字、样式、图片等，支持导出 PPTX、PDF、PNG 等多种格式。价格为付费，商业授权价格为 22000 元人民币或 3000 美元。

PPTX AI 技术在线修改

CodeQwen1.5:开源代码助手，高效编程新选择

CodeQwen1.5是一个基于Qwen语言模型的代码专家模型，拥有7B参数，支持92种编程语言，最长支持64K的上下文输入。它具备代码生成、长序列建模、代码修改和SQL能力等，旨在提高开发人员的工作效率，简化软件开发流程。

代码生成长序列处理代码优化

PixArt-Sigma:4K文本到图像生成的扩散变换器

PixArt-Sigma是一个基于PyTorch的模型定义、预训练权重和推理/采样代码的集合，用于探索4K文本到图像生成的弱到强训练扩散变换器。它支持从低分辨率到高分辨率的图像生成，提供了多种功能和优势，如快速体验、用户友好的代码库和多种模型选择。

AI图像生成文本到图像 4K分辨率

InstantMesh:高效3D网格生成框架

InstantMesh是一个基于LRM架构的前馈框架，用于从单张图像高效生成3D网格。它支持低内存GPU环境，并能生成具有纹理映射的3D网格模型。

3D建模图像处理机器学习

MagicClothing:基于LDM的服装驱动图像合成AI

MagicClothing是一种基于潜在扩散模型（LDM）的新型网络架构，专门用于服装驱动的图像合成任务。它能够根据文本提示生成穿着特定服装的定制化角色图像，同时确保服装细节的保留和对文本提示的忠实呈现。该系统通过服装特征提取器和自注意力融合技术，实现了高度的图像可控性，并且可以与ControlNet和IP-Adapter等其他技术结合使用，以提升角色的多样性和可控性。此外，还开发了匹配点LPIPS（MP-LPIPS）评估指标，用于评价生成图像与原始服装的一致性。

AI 图像合成服装设计

FireCrawl:无需站点地图，一键抓取网站所有子页面

FireCrawl 是一款由 Mendable.ai 开发的开源项目，它能够无需站点地图即可抓取任何网站的所有可访问子页面，并将这些内容转换为干净、格式化的Markdown文档。它特别适合数据科学家、机器学习工程师、内容创作者和市场分析师使用，以从网站内容中提取有价值的信息。FireCrawl 能够处理使用JavaScript动态渲染的内容，提供API服务，支持自托管，并与多种开发者工具和框架集成。

数据抓取内容转换动态内容处理

Atlas:下一代电动机器人

Atlas是波士顿动力公司开发的一款先进的人形机器人，它结合了数十年的研究和实际经验，旨在解决当今工业领域中最艰巨的挑战。新一代的Atlas机器人是全电动的，比以往的液压版本更强大，动作范围更广，能够更高效地完成各种任务。Atlas机器人配备了新的AI和机器学习工具，如强化学习和计算机视觉，以确保它们能够适应复杂的现实世界情况。此外，Atlas将与波士顿动力公司的Orbit™软件集成，该软件提供了一个集中的平台来管理整个机器人车队、站点地图和数字化转型数据。

人形机器人 AI 机器学习

Stable Diffusion 3 API:先进的文本到图像生成系统

Stable Diffusion 3是一款先进的文本到图像生成系统，它在排版和提示遵循方面与DALL-E 3和Midjourney v6等顶尖系统相匹敌或更优。该系统采用新的多模态扩散变换器(MMDiT)架构，使用不同的权重集来改善图像和语言的表示，从而提高文本理解和拼写能力。Stable Diffusion 3 API现已在Stability AI开发者平台上线，与Fireworks AI合作提供快速可靠的API服务，并承诺在不久的将来通过Stability AI会员资格开放模型权重以供自托管。

AI生成图像生成文本到图像

奇布塔:AI一站式儿童有声绘本创作平台

奇布塔是基于人工智能生成技术的绘本创作平台，提供各种风格的有声绘本创作功能，帮助用户创作优质的绘本内容。定价灵活多样，定位于绘本创作者和儿童阅读者市场。