凤凰网科技讯10月20日消息,讯飞输入法总经理程坤今日在北京宣布讯飞输入法更新至10.0版。上线了全新的A.I.语音输入引擎,使通用语音识别率98%的基础上再获大幅提升。
值得一提的是,新版本还首创唇形辅助输入,在语音输入中让输入法看得清发音人的唇形动作,从而提高嘈杂环境及近距离多人说话的识别效果。并针对领域词识别进行专项优化,可全方位提升用户在语音输入场景下的产品体验。
(举报)
凤凰网科技讯10月20日消息,讯飞输入法总经理程坤今日在北京宣布讯飞输入法更新至10.0版。上线了全新的A.I.语音输入引擎,使通用语音识别率98%的基础上再获大幅提升。
值得一提的是,新版本还首创唇形辅助输入,在语音输入中让输入法看得清发音人的唇形动作,从而提高嘈杂环境及近距离多人说话的识别效果。并针对领域词识别进行专项优化,可全方位提升用户在语音输入场景下的产品体验。
(举报)
11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
国内软件安全创领者开源网安正式对外发布开源组件安全及合规管理平台SourceCheckV3.5。SourceCheck可对企业第三方组件进行安全分析与管控,避免软件带病上线。开源网安将通过持续的技术创新与实践,将AI技术融入安全产品中,为企业提供更加智能化、个性化的安全产品和服务,助力企业打造高质量的开源治理体系。
小米汽车App安卓端推出了1.6版本的升级,带来了一系列新功能和优化改进,iOS端已于3天前更新至1.6.1版本。此次更新后,用户可以根据自己的喜好自定义车控页面上的各种功能的顺序,使操作更加高效便捷。车外唤醒防御功能也正式上线小米SU7,该功能基于小米自研的声音大模型,针对车外语音唤醒行为的抑制率达到了99%。
苹果公司今天发布了面向iPhone和iPad设备的iOS/iPadOS18系统更新。在兼容性方面,iOS18正式版支持从第二代iPhoneSE开始的24款设备,包括最新的iPhone16系列,后者出厂时已预装了iOS18。AppleIntelligence预计将在10月份的iOS/iPadOS18.1正式版更新中首次亮相,初期将仅对美国用户开放。
今日,苹果面向iPhone用户推送iOS18正式版更新,带来全新UI设计,并支持自定义桌面等多项新功能。iOS18正式版还新增车辆运动提示”功能,可帮助乘车用户减少晕车,有助于缓解晕动症。车辆运动提示功能开启方式:进入手机设置”-选择辅助功能”-点击动态效果”-打开显示车辆运动提示”。
OpenAI向所有开发者推出GPT-4o数据微调功能,可以使用自己的数据打造准确率、输出模式更好的个性化ChatGPT助手。韩国最大电信运营商SKTelecom通过OpenAI的数据微调功能,打造了特定的AI助手,使对话总结准确率提高了35%,意图识别率提升了33%,客户满意度大幅度提升。Distyl的微调GPT-4o模型在排行榜上实现了71.83%的执行准确率,并在查询重构、意图分类、思维链和自我纠正等任务中表现出色,尤其是在SQL生成方面表现尤为突出。
苹果公司已经为腾讯旗下的微信应用在iOS平台上的更新开了绿灯。苹果在即将发布的iPhone16中批准了微信的更新,这为双方就苹果要求的调整争取到了更多时间。随着iPhone16的发布日益临近,用户们将不必在两者之间做出艰难选择。
中关村在线消息:介绍完智能穿戴产品后,AirPods4等音频产品随后亮相,苹果官方称其为迄今为止最舒适的AirPods,它搭载AppleH2芯片,低音增强,支持个性化的空间音频等功能。这款产品还新增了支持主动降噪的版本,降噪算法来自AirPodsPro2。头戴式耳机AirPodsMax更新了配色,并改用USB-C接口,售价549美元。
网络安全研究员Konstantin发现了苹果iOS的一个Bug:在应用库搜索栏、Spotlight搜索中输入”::这四个字符后,iPhone会立刻崩溃。iOS17、iOS18以及iOS18.1等操作系统上都会复现这个错误,iPad设备也未能幸免。尽管苹果没有作出回应,但通常该公司会在下一个版本中修复错误。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、全新ComfyUI0.2.0版本重磅来袭,为设计师带来工作流程革命ComfyUI0.2.0版本带来了设计工作流程的变革,引入了FluxControlNets技术和优化队列管理功能,大幅提升了设计师的创作工具�
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、《黑神话:悟空》震撼上线,英伟达AI技术立功!《黑神话:悟空》的上线引发了全球玩家的热烈关注,创造了中国游戏史上的奇迹,销售额达3.9亿元,刷新了国产游戏的预售纪录。Procreate的决定为科技与艺术辩论增添新维度,凸显挑战平衡创新与传统创作价值观的问题。
OneGen是一个为大型语言模型(LLMs)设计的高效单遍生成和检索框架,用于微调生成、检索或混合任务。它的核心思想是将生成和检索任务整合到同一上下文中,通过将检索任务分配给以自回归方式生成的检索令牌,使得LLM能够在单次前向传递中执行两种任务。这种方法不仅降低了部署成本,还显著减少了推理成本,因为它避免了对查询进行两次前向传递计算的需求。
Open Source LLM Tools是一个专注于收集和展示开源大型语言模型(LLM)工具的平台。它提供了一个更新频繁的资源库,帮助开发者和研究者发现和利用最新的开源AI工具。该平台的主要优点在于其高更新频率和对活跃开源AI开发者的聚焦,使得用户能够及时获取到行业的最新动态和技术进展。
Open-MAGVIT2是由腾讯ARC实验室开源的一个自回归图像生成模型系列,包含从300M到1.5B不同规模的模型。该项目复现了Google的MAGVIT-v2分词器,实现了在ImageNet 256×256数据集上达到1.17 rFID的先进重建性能。通过引入不对称分词技术,将大词汇表分解为不同大小的子词汇表,并引入'下一个子标记预测'来增强子标记间的交互,以提高生成质量。所有模型和代码均已开源,旨在推动自回归视觉生成领域的创新和创造力。
GVHMR是一种创新的人体运动恢复技术,它通过重力视角坐标系统来解决从单目视频中恢复世界定位的人体运动的问题。该技术能够减少学习图像-姿态映射的歧义,并且避免了自回归方法中连续图像的累积误差。GVHMR在野外基准测试中表现出色,不仅在准确性和速度上超越了现有的最先进技术,而且其训练过程和模型权重对公众开放,具有很高的科研和实用价值。
Adobe Express QR 码生成器是一个在线工具,允许用户无需下载任何软件即可快速生成可扫描的二维码。用户可以自定义二维码的颜色和样式,以匹配其品牌或个人风格。该工具支持多种文件格式下载,适用于商业营销、个人品牌推广等多种场景。Adobe Express 提供了大量模板和设计资源,使得即使是设计新手也能轻松创建引人注目的二维码。
Gauth AI是一个专注于帮助学生解决各科目作业问题的AI平台。它利用先进的算法和人工智能技术,提供数学、物理、化学、生物、商业、写作等科目的解题服务。用户可以通过上传图片或PDF文件,让Gauth AI帮助解答问题。此外,Gauth AI还提供24/7的真人导师服务,确保用户能够快速获得解答。Gauth AI的主要优点包括清晰的解题步骤、详细的解释、快速的解决方案以及高满意度的专家服务。
FreedomGPT是一个提供多种AI模型的平台,包括无审查限制的模型,用户可以在一个熟悉的界面中轻松切换开源和专有模型。它允许用户在浏览器或直接在计算机上运行这些模型,无需注册,无需技术专长。此外,它还支持离线使用,保证了用户隐私和数据安全。FreedomGPT还提供了一个开放源代码的AI平台,鼓励社区成员共同参与构建。
AI Music Generator Free Online是一个创新的音乐生成平台,利用先进的深度学习技术,将用户输入的文本转化为充满情感和高质量的音乐作品。该平台能够覆盖广泛的音乐风格,从古典音乐的复杂和声到现代电子音乐的动态节奏,都能轻松创作。它不仅能够生成完整的歌曲,而且在音质上能够与专业录音室制作相媲美。AI Music Generator的核心优势在于其出色的适应性和广泛的音乐范围,使其成为生成无与伦比音质的强大工具。它的庞大音乐库包含了多种风格,确保每首音乐作品不仅质量上乘,而且能够独特地符合用户的创意愿景。这种个性化的音乐生成方法保证了每首作品都是独特的艺术品,反映了创作者的特定意图和艺术感觉。
Microsoft PowerPoint 是一款功能强大的演示文稿制作工具,它允许用户创建、编辑和共享演示文稿。作为 Microsoft 365 套件的一部分,PowerPoint 提供了丰富的模板、图形和协作功能,支持用户在不同设备上进行实时协作。该产品以其易用性、强大的功能和广泛的兼容性而闻名,是全球数百万用户进行商务演示、教育讲座和个人演讲的首选工具。
FastAgency是一个面向开发者和企业用户的AI模型构建和部署平台,它通过提供易用的界面和强大的后端支持,使得用户能够快速地开发和部署AI模型,从而加速产品从概念到市场的转化过程。该平台的主要优点包括快速迭代、高效率和易于集成,适合需要快速响应市场变化的企业和开发者。
InstantDrag是一个优化自由的流程,它通过仅使用图像和拖拽指令作为输入,增强了交互性和速度。该技术由两个精心设计的网络组成:拖拽条件的光流生成器(FlowGen)和光流条件的扩散模型(FlowDiffusion)。InstantDrag通过将任务分解为运动生成和运动条件图像生成,学习了基于真实世界视频数据集的拖拽图像编辑的运动动态。它能够在不需要掩码或文本提示的情况下,快速执行逼真的编辑,这使得它成为交互式、实时应用的有前景的解决方案。
JanitorAI是一个提供多样化聊天机器人的平台,用户可以在这个平台上找到各种类型的聊天机器人,包括虚构角色、动漫角色、游戏角色等。这些聊天机器人可以用于娱乐、教育、心理支持等多种场景。JanitorAI平台以其丰富的角色选择、灵活的交互方式和高自由度的对话体验而受到用户的喜爱。
DrawingSpinUp是一个创新的系统,它能够将单一角色绘画转换为3D动画。该技术通过去除视图依赖的轮廓线并重新渲染,以及基于骨架的细化变形算法,解决了业余角色绘画在外观和几何形状上的挑战。它不仅提高了角色绘画的视觉效果,还赋予了绘画以动态的生命力,使其能够自由旋转、跳跃甚至表演街舞。
Void是一个开源的代码编辑器,是Visual Studio Code的分支,它允许用户利用AI工具编写代码,同时完全控制自己的数据。它提供了丰富的AI特性,如自动补全、内联编辑、文件搜索和生成等。此外,它还支持本地模型托管和直接与大型语言模型通信,无需通过中间人。Void的定位是为开发者提供一个高效、安全且功能丰富的编程环境。
Copilot in Excel是微软推出的一款集成在Excel中的智能助手,它通过自然语言处理和机器学习技术,帮助用户更高效地分析和理解数据。Copilot in Excel的主要优点包括简化数据格式化、自动化重复性任务、提供公式建议、执行条件格式化、进行数据分析和可视化等。它支持Python编程语言,使得用户无需具备专业的编程技能,也能进行高级数据分析。Copilot in Excel的推出,标志着数据分析和决策支持工具的重大进步,它将数据分析的门槛降低,使得更多非技术背景的用户也能轻松地从数据中获取洞见。
Beacons.ai是一个面向创作者的综合服务平台,提供从在线商店、电子邮件营销到品牌合作等一系列工具,帮助创作者建立自己的品牌并实现商业化。该平台利用人工智能技术,简化了创作者在社交媒体上推广和管理自己业务的过程。创作者可以通过Beacons.ai创建个性化的链接,集成所有在线活动,并通过自动化工具提高效率。此外,平台还提供分析功能,帮助创作者更好地理解他们的受众并优化内容策略。Beacons.ai致力于成为创作者成功的加速器,通过提供必要的工具和资源,使创作者能够专注于创作内容,同时实现商业价值的最大化。
Copilot Pages 是微软为其知识工作新设计系统推出的第一步。它是一个动态的、持久的画布,位于Copilot聊天中,专为多人AI协作设计。用户可以将Copilot的有洞察力的响应转化为持久的内容,并通过并排页面进行编辑和分享,以便于团队协作。Copilot Pages 支持多人协作,允许团队成员一起提示Copilot,改进和扩展响应,相互学习提示技巧,并组织复杂信息。
Brainly 是一个在线学习平台,旨在为学生提供作业帮助和学习支持。它汇集了数百万学生和专家,形成一个庞大的知识共享社区。通过 AI 辅导和实时专家支持,Brainly 帮助学生更好地理解课程内容,从而提高学习效果。该平台免费提供基础服务,用户可以通过注册获取更多个性化的学习体验。
PhotoApp是一款利用尖端AI技术的照片编辑应用,能够对模糊、老旧或低质量的照片进行修复和增强,使其达到高清质量。它提供了一键式的解决方案,使用户能够轻松地改善照片细节、颜色和清晰度,同时支持放大图片而不损失质量。PhotoApp适用于社交媒体发布、社区内容分享、打印图像、电子商务产品展示、教育材料制作和杂志图片编辑等多种场景。该应用以其快速、简单和一致的卓越成果赢得了全球数百万用户的喜爱。
Bobble AI是一款面向消费者的智能手机应用,通过其独特的键盘即平台(Keyboard-as-a-platform)技术,为用户提供实时的创意表达和推荐服务。它通过表情、推荐和体验增强用户的智能手机使用体验。Bobble AI拥有超过1亿用户,分享了超过40亿的表情,并且使用了超过30亿次的推荐。它为公司提供了广告和营销、数据服务等商业解决方案,同时也为消费者提供了高级订阅服务和个性化商品。Bobble AI的技术包括表情键盘、个性化头像生成、语言套件等,致力于通过人工智能和创意知识产权为用户带来创新体验。