首页 > AI头条  > 正文

Perplexity语音助手全新升级,智能交互再创新高

2025-04-24 10:43 · 来源: AIbase基地

Perplexity AI在其iOS应用中推出全新语音助手功能,进一步增强了AI助手的实用性与交互体验。据AIbase了解,新功能支持设置闹钟、查找路线、发送消息、预订餐厅等多项任务,结合强大的实时搜索与多应用集成,为用户带来无缝的智能生活体验。相关更新已在App Store上线,社区反响热烈,标志着Perplexity向综合AI助手领域的强势迈进。

image.png

核心功能:多任务处理与实时交互

Perplexity语音助手通过多模态输入与应用联动,显著提升了日常任务的自动化能力。AIbase梳理了其主要功能:  

语音驱动任务执行:用户可通过语音指令设置闹钟、发送短信、拨打电话或管理日历,如“明天早上7点设个闹钟”或“给Sarah发送会议邀请”。  

实时路线规划:结合高德地图等地理服务,语音助手可根据指令查找并规划路线,如“找去附近咖啡店的最快路线”,并提供实时交通更新。  

多应用集成:支持与Spotify、YouTube Music等媒体服务联动,播放音乐、播客或视频;还可通过第三方应用预订餐厅或叫车服务。  

屏幕与摄像头交互:支持“Live View”摄像头查询与“On-Screen Context”功能,可分析屏幕内容或现实物体,如扫描路牌翻译或总结网页文本。  

多语言支持:新增日语、西班牙语等语言的语音交互,结合自然语言处理,确保跨语言对话的流畅性。  

AIbase注意到,社区测试中,用户通过语音指令“查找今晚的餐厅并预订四人桌”完成了搜索、筛选与预订的全流程,整体体验直观高效,媲美Siri与Google Assistant。

技术架构:多模态AI与上下文感知

Perplexity语音助手基于其核心AI模型(如Claude3.7Sonnet、GPT-4o、Gemini2.5Pro)与多模态技术栈。AIbase分析,其关键技术包括:  

自动语音识别(ASR):采用深度神经网络,精准识别多语言语音输入,支持复杂指令与口音解析,响应延迟低至毫秒级。  

上下文感知引擎:通过记忆对话历史,助手可无缝处理后续指令,如在查找餐厅后直接预订,无需重复上下文。  

多模态处理:整合视觉(摄像头输入)、音频(语音指令)与文本(屏幕内容),支持跨模态任务,如“翻译这张图片上的法语路牌”。  

实时搜索与引用:结合Perplexity的搜索技术,提供带来源的答案,确保信息准确性,如查询“巴塞罗那今日天气”时附带气象网站链接。  

安全与隐私:运行于沙箱环境,数据加密传输,语音查询在隐身模式下仍记录历史,需用户手动清除。  

目前,语音助手已登陆iOS(需iOS16.0+),Android版本部分功能需通过2.37.0更新启用,Mac版即将推出。AIbase认为,其开源API与多模型选择为开发者提供了灵活的定制空间。

应用场景:从日常便捷到专业辅助

Perplexity语音助手的多功能性使其覆盖了从个人生活到工作场景的多种需求。AIbase总结了其主要应用:  

日常生活管理:设置提醒、发送消息、播放媒体或预订服务,简化日常任务,如“今晚8点提醒我看Netflix新剧”。  

旅行与导航:实时查找路线、翻译路牌或预订酒店,适合旅行者与跨国用户,如“找去东京塔的公交路线”。  

工作效率提升:管理日历、起草邮件或总结通知,助力专业人士高效办公,如“总结我的未读邮件并标记优先级”。  

教育与研究:通过语音查询学术资料或分析屏幕内容,支持学生与研究人员,如“总结这篇PDF的要点”。  

无障碍支持:为视障或行动不便用户提供语音控制与环境感知,增强设备可访问性。  

社区反馈显示,语音助手的上下文记忆与多语言支持在跨文化交流中表现突出,被誉为“iPhone用户的Siri替代品”。AIbase观察到,其与Telegram Bot的集成进一步扩大了跨平台使用场景。

上手指南:简单启用,快速体验

AIbase了解到,Perplexity语音助手现已通过iOS版Perplexity应用向所有用户开放,Android用户需更新至2.37.0版本。用户可按以下步骤快速上手:  

从App Store或Google Play更新Perplexity应用(iOS16.0+或Android10+);  

打开应用,点击首页横幅或进入设置启用语音助手(Settings > Enable Assistant);  

授予必要权限(麦克风、摄像头、位置、联系人等),通过手势(如按电源键)或界面激活助手;  

使用语音指令,如“设个明天9点的闹钟”或“找去巴黎的路线”,实时查看结果。

社区建议启用“Hands-Free Mode”以实现连续对话,并明确指令以优化多任务处理。AIbase提醒,Android用户可能需侧载2.37.0APK以获取完整功能,iOS用户需关注隐私设置以管理查询历史。

社区反响与改进方向

语音助手发布后,社区对其多应用集成与自然交互给予高度评价。开发者称其“将搜索与任务自动化完美结合”,尤其在路线规划与媒体播放中的表现超越Google Assistant。日语用户特别赞赏其UI反馈与语音流畅性,带来“安心感”。 然而,部分用户指出,助手缺少类似“Hey Google”的热词唤醒,且隐身模式下查询仍记录历史,可能引发隐私担忧。社区还期待支持更多语言(如中文)与视频分析功能。Perplexity回应称,未来更新将优化热词唤醒并增强隐私控制。AIbase预测,助手可能与Comet浏览器或企业版API整合,构建跨设备的AI生态。

未来展望:智能助手的生态演进

Perplexity语音助手的推出彰显了其从搜索工具向综合AI助手的转型雄心。AIbase认为,其多模态交互与实时搜索的结合为挑战Siri、ChatGPT等巨头奠定了基础。社区已在探讨将其与Home Assistant或MCP协议集成,构建智能家居与自动化工作流。长期看,Perplexity可能推出“AI助手市场”,提供定制化语音模型与第三方插件,类似Alexa Skills的生态模式。AIbase期待2025年助手的Android与Mac版全面上线,以及在多模态任务与低功耗设备支持上的突破。

  • 相关推荐
  • 日本2025年应届生平均起薪1.3万元,再创新高

    不过,全球经济的不确定性,也让部分企业可能因业绩恶化而下调招聘计划。

  • 腾讯“物种之眼”AI全新升级 效识别数千物种

    AI系统“物种类辨”通过少量数据学习,显著提升了对多种生物的识别准确率与召回率,尤其在高精度识别多类生物方面表现出色,推动生态保护与智能技术发展。腾讯开放平台“野生生物多态数据协作”项目助力野生动物监测及保护工作,促进公众科学参与。

  • 百利好环球APP全新升级 以科技力量助力投资者

    当前金融市场正呈现出复杂多变的局面。以近期黄金市场的走势为例,全球经济格局中,各国之间的政策博弈正深刻影响着金融市场走向,尤其是黄金价格走势,年内冲击 3500 美元并非毫无可能。在这样的市场环境中,投资者面临着诸多痛点。一直以来,百利好专注为全球投资者提供多元的投资产品、稳健可靠的交易平台以及安全高效的金融服务。2025年 3 月,百利好凭借环球

  • 自猎智聘招聘求职Agent发布,全新智能化、自主化、轻量化交互体验

    4月28日,自猎科技发布"自猎智聘"AI招聘求职应用。该平台基于大模型和深度学习算法,打造L4级全流程自动化智能招聘系统,覆盖企业和求职者两端。企业端可智能执行全流程招聘,降本增效;求职端提供公平客观的求职体验。系统具备高精度人岗匹配、AI数字人智能面试、一键背景调查等功能,实现从筛选到入职的全流程自动化。自猎智聘突破传统招聘工具局限,通过多模态认知架构构建动态企业画像,实现从"功能模块化堆砌"到"目标牵引式自主决策"的范式跃迁。该产品标志着招聘领域正式进入"自主决策"的智能体时代。

  • 小度智能屏mini发布:家居颜值实力派,智能交互让生活更“简单”

    小度智能屏mini是一款4英寸智能家居新品,主打精致设计与智能交互体验。产品采用全贴合屏幕设计和纯白极简外观,能适配多种家居风格。内置渐变多彩UI界面和丰富屏保资源,包括AI生成动态壁纸和创意主题。支持蓝牙Mesh+红外遥控双模互联,可语音控制智能家居设备,还能通过红外遥控改造老家电。搭载DuerOS系统,支持多轮对话、方言识别和知识问答。特别配备睡眠管理功能,提供3000K色温暖光、白噪音和鼾声监测,帮助改善睡眠质量。此外还整合海量娱乐资源,支持微信通话和家庭广播等功能。

  • AI日报:昆仑万维开源SkyReels-V2;讯飞星火X1全新升级;扣子空间Coze Space内测

    本文介绍了多个前沿的人工智能产品和技术动态,包括SkyReels-V2视频生成模型、讯飞星火大模型升级、宇树科技人形机器人比赛计划、Coze Space AI协作平台、Gemma3 QAT优化模型、英特尔AI Playground工具、Reachy2人形机器人发布、ChatTS-14B语音研究项目、Figma推出AI设计工具以及MarkItDown MCP文档转换工具,展示了AI技术在多领域的广泛应用与创新发展潜力。

  • “奥迪助手”来了!全新AUDI车型接入豆包大模型

    2025年4月24日上海车展期间,上汽奥迪发布全新A5L Sportback和首款量产车型E5 Sportback。同时推出与火山引擎合作开发的"奥迪助手"智能交互系统,基于豆包大模型实现自然对话体验。该系统将搭载于两款新车,并同步部署在车载端和手机APP端,支持跨设备对话记录同步。火山引擎为系统提供大模型技术支持,实现语音指令控制、车辆功能讲解等智能服务,并整合抖音、汽水音乐等内容生态。上汽奥迪表示,该合作将助力品牌打造更智能、个性化的产品矩阵。

  • 山石网科发布全新Open XDR解决方案:开启安运营范式

    山石网科发布全新Open XDR解决方案,以"开放融合、AI赋能、智慧运维"为核心理念,突破传统安全架构局限。该方案通过南北向开放架构实现全领域数据采集与异构设备联动,打破数据孤岛;集成云端/本地AI大模型,降低安全运维门槛,实现日志精准解读和威胁深度分析;创新"案件调查"功能构建完整攻击链路,结合可视化剧本编排实现闭环安全运维。方案支持多源数据接入和无代码插件扩展,构建灵活可扩展的安全生态,助力企业从被动防御转向主动研判,为数字化转型提供智能化安全运营保障。

  • 听脑 AI:重新定义语音处理效率的助手

    听脑AI是一款专注于语音/视频转文本的智能助手,具备三大核心功能:1)实时语音转写,支持会议、课堂等多场景录音转文字,自动区分发言人;2)音视频解析,可提取本地文件或平台链接内容生成可编辑文档;3)AI问答辅助,能基于语音内容生成摘要、PPT大纲等二次创作。其优势在于毫秒级响应、125种语言互译、智能降噪,适用于商务会议、教育学习、内容创作等场景,显著提升工作效率。支持多端同步与加密存储,提供20分钟免费试用体验。

  • 五年磨一剑!全新小鹏P7官图正式发布:能超越P7的只有P7

    小鹏汽车5月15日正式发布全新P7车型,创始人何小鹏表示这是团队历时5年、经过上千版设计方案打造的力作。新车在延续现款轿跑基因基础上,对外观细节进行全面升级:前脸线条更锐利强化视觉冲击力,车身腰线处理更精妙突出立体感,轮毂采用独特几何切割设计,贯穿式尾灯造型更修长。官方强调新车实现了从简约科技到精致运动的进阶,既保持品牌辨识度,又以更富张力的设计语言满足消费者对个性化和运动感的追求。作为国内新势力代表车型,全新P7凭借全面升级的设计获得广泛好评。

今日大家都在搜的词: