微信“发送语音过程转文字”功能并未在安卓版7.0.5上线

2019-07-01 10:06 · 稿源：站长快讯

近日，微信7.0.5安卓版本在腾讯应用宝发布。在本次更新中，订阅号信息流界面改版，原先灰色边框的卡片整体变为白色，公众号名称变蓝。不过此前的“发送语音过程”转文字功能，并未在该版本中上线。

相关推荐
大家在看

关键词：

【腾讯云】11.11云上盛惠！云服务器首年1.8折起，买1年送3个月！

11.11云上盛惠！海量产品 · 轻松上云！云服务器首年1.8折起，买1年送3个月！超值优惠，性能稳定，让您的云端之旅更加畅享。快来腾讯云选购吧！

Docker容器镜像
去看看

Docker容器镜像 60元/15天

爆款产品组合购
去看看

爆款产品组合购低至1元

腾讯云x NVIDIA加速计划
去看看

腾讯云x NVIDIA加速计划最高获赠10万元扶持基金

2核2G云服务器
去看看

2核2G云服务器 112元/1年

查看更多相关信息>>

腾讯云 12-20

广告
图像转文字工具2txt 可识别图像中文字并转换为可编辑文本

2txt是一个基于AI的图像转文字工具，使用ClaudeHaiku和VercelAISDK创建。这个工具不仅可以将任意图像上的文字识别出来能将其转换成可编辑的文本格式。用户只需上传图片，系统就会自动识别图片中的文字，并将其转换成可编辑的文本格式，极大地提高了工作效率。

2txt AI头条
安卓 15 新设计！音量调节面板功能大改

在最新的Android15开发者预览版中，谷歌带来了全新的音量调节面板设计。这一设计与之前版本相比有了明显的变化。“一键静音”功能的引入可能会对一些用户造成困扰，因为这需要他们手动设置是否开启静音模式。

Android15开发者预览版音量调节面板设计滑块形式
安卓端微信手表版上线：支持独立登录，OPPO Watch X首发搭载

3月27日，OPPOWatchX获得系统推送更新，全新微信手表版功能正式上线。区别于当前多数智能手表搭载的微信软件，全新的微信手表版支持独立联网登录，OPPOWatchX也成为了安卓手表中首款支持可脱离蓝牙限制、独立登录微信的智能手表。智能手表诞生至今，在手表端独立登录微信是广大用户的迫切需求，此前仅有AppleWatch系列产品可在手表联网的状态下独立使用微信，OPPO与微信深度合作推出的全新安卓端微信手表版，成为安卓手表社交生态一大突破。

OPPO Watch X
支付宝发布五大新服务：支持16种语言翻译拍照、文字、语音都能互译

第135届广交会现已开幕，来自200多个国家的采购商齐聚广州。蚂蚁集团发布五大新服务，全力支持广交会，为入境宾客提供便利、顺畅与丰富的参会与消费体验。支付宝表示，未来还将联合各方继续优化服务质量，助力入境宾客畅游中国，加深中外经贸往来。

广交会蚂蚁集团电子钱包
手机被黑客入侵后会自动息屏？安卓15新功能绝了

根据最近发布的Android15DeveloperPreview2代码，一项隐藏特性被发现：检测用户是否正在使用手机，如果处于未使用状态，则自动关闭屏幕。默认情况下，在30秒内未使用手机时会自动息屏，再过5秒后会自动锁定屏幕。然代码并没有提及实现方式，可能是借助前置摄像头来判断用户当前是否正在使用手机。

Android 15 Developer
钉钉直播上线「智能封面」功能妙鸭相机加入钉钉个人版

最新版本带来了一系列功能升级，让用户工作更高效:1.视频会议画面一键旋转:现在用户可以在视频会议中一键旋转参会成员的画面，保持正确的方向，提升会议体验。2.AI做封面:钉钉直播新增智能封面功能，系统能智能生成封面，用户还可自定义修改风格，提升直播宣传效果。这些功能升级旨在让用户工作更高效、沟通更便捷，提升工作效率和体验。

钉钉视频会议智能封面
百度文心一言“新花样”！上线语音定制功能：2秒完美复刻个人声音

百度日前官方宣布文心一言语音定制功能上线，只需2秒钟，AI就能完美重建任何一个人的声音，每个人都能拥有自己的AI声优。用户只需打开文心一言App，选择创建智能体，点击创建自己的声音，随后系统会给出一句话，只需用平时说话的语气念一遍。很多时候甚至能理解文本中的情绪，最大程度上保持原声的情感、风格和自然度，因此只需要极短的样本，几秒钟就能完成。

百度语音识别 AI
腾讯广告妙思上线AI图生图能力可一键继承参考图素材文字

腾讯广告一站式AI广告创意平台“腾讯广告妙思”上线图生图能力。通过上传一张参考图，妙思的AI模型便能迅速生成相似图片，实现所见即所得，让创意素材焕发新生。在游戏行业和网服行业中，CTR分别提升了19%和18%，展现出强大的市场竞争力。

腾讯广告 AI广告创意妙思
一帧秒创发布“秒创AI视频”功能支持文字生成4-12秒视频

新壹科技在第十一届中国网络视听大会AIGC和数字人发展论坛上发布了名为“秒创AI视频”的新产品。该产品使用了前沿的DiffusionTransformer技术，实现了从“文本到视频”、“图像到视频”以及“文本图像到视频”的全流程创作。新壹科技将继续优化技术，推出更流畅、更长时长、更符合逻辑的AI视频，同时致力于降低视频模型的训练与生成成本，让更多用户享受AI视频带来的便利和乐趣。

人工智能视频创作 AI技术
曝iOS 17.5即将登场：侧载功能又升级了

iOS17.5Beta1预计将在本周或下周的某个时间上线。苹果承诺在今年春季的某个时间进一步升级侧载功能。另外值得一提的是，苹果iOS18系统正在紧锣密鼓准备中，它将在6月份的开发者大会上正式亮相。

iOS 17.5 Beta1

Continue:一个开源的IDE扩展，旨在提升AI软件开发系统的模块化和可进化性。

Continue是一个专为软件开发者设计的开源IDE扩展，它通过提供自动化和智能化的工具来加速AI软件的开发流程。它允许开发者在构建软件时保持流畅的工作状态，通过插件和系统整合，轻松开始并加速开发过程。Continue支持多种编程语言的代码自动完成，提供代码段的重写功能，并允许通过自然语言指令来优化代码。它还支持与多种AI模型和开发环境的整合，使得开发者能够构建一个随着新功能出现而进化的软件系统。

自动化 AI 开发工具

Cohere Toolkit:是一套开源的AI应用程序开发工具包，旨在加速开发并部署到云平台。

Cohere Toolkit是一个开源的AI应用程序开发工具包，它提供了一套生产就绪的应用程序，可以在云服务提供商上部署。这些应用程序可以访问Cohere的Command、Embed和Rerank模型，并且可以连接到企业数据和特定团队，以提高生产力。该工具包包含用于构建独特应用程序并可扩展部署的组件。

AI 开源云部署

Bunny:轻量级但功能强大的多模态模型家族。

Bunny 是一系列轻量级但功能强大的多模态模型，提供多种即插即用的视图编码器和语言主干网络。通过从更广泛的数据源进行精选选择，构建更丰富的训练数据，以补偿模型尺寸的减小。Bunny-v1.0-3B 模型在性能上超越了同类大小甚至更大的 MLLMs（7B）模型，并与 13B 模型性能相当。

多模态学习机器学习人工智能

llava-llama-3-8b-v1_1:一款由XTuner优化的LLaVA模型，结合了图像和文本处理能力。

llava-llama-3-8b-v1_1是一个由XTuner优化的LLaVA模型，它基于meta-llama/Meta-Llama-3-8B-Instruct和CLIP-ViT-Large-patch14-336，并通过ShareGPT4V-PT和InternVL-SFT进行了微调。该模型专为图像和文本的结合处理而设计，具有强大的多模态学习能力，适用于各种下游部署和评估工具包。

人工智能多模态学习深度学习

ID-Animator:零样本身份保持人类视频生成技术

ID-Animator是一种零样本人类视频生成方法，能够在不需要进一步训练的情况下，根据单个参考面部图像进行个性化视频生成。该技术继承了现有的基于扩散的视频生成框架，并加入了面部适配器以编码与身份相关的嵌入。通过这种方法，ID-Animator能够在视频生成过程中保持人物身份的细节，同时提高训练效率。

人工智能视频生成身份保持

HiDiffusion:，解锁预训练扩散模型中的高分辨率创作与效率。

HiDiffusion是一个预训练扩散模型，通过仅添加一行代码即可提高扩散模型的分辨率和速度。该模型通过Resolution-Aware U-Net (RAU-Net)和Modified Shifted Window Multi-head Self-Attention (MSW-MSA)技术，动态调整特征图大小以解决对象复制问题，并优化窗口注意力以减少计算量。HiDiffusion能够将图像生成分辨率扩展到4096×4096，同时保持1.5-6倍于以往方法的推理速度。

图像合成人工智能机器学习

Snowflake Arctic:高效的企业级人工智能模型，低成本实现高质量定制模型。

Snowflake Arctic 是一款专为企业级人工智能任务设计的大规模语言模型（LLM），它在 SQL 生成、编码以及指令遵循等基准测试中表现出色，即使与计算预算更高的开源模型相比也毫不逊色。Arctic 通过其高效的训练和推理，为 Snowflake 客户以及广大 AI 社区提供了一种成本效益极高的定制模型创建方式。此外，Arctic 采用 Apache 2.0 许可，提供无门槛的权重和代码访问，并通过开源数据配方和研究洞察，进一步推动了社区的开放性和成本效益。

人工智能机器学习自然语言处理

OpenVoice V2:是一款支持多语言的语音合成模型，提供高质量的语音克隆与风格控制功能。

OpenVoice V2是一款文本到语音（Text-to-Speech, TTS）的模型，它在2024年4月发布，包含了V1的所有功能，并进行了改进。它采用了不同的训练策略，提供了更好的音质，支持英语、西班牙语、法语、中文、日语和韩语等多种语言。此外，它还允许商业用途的免费使用。OpenVoice V2能够精确地克隆参考音调色彩，并在多种语言和口音中生成语音。它还支持零样本跨语言语音克隆，即生成语音的语言和参考语音的语言不需要在大规模多语种训练数据集中出现。

语音合成多语言音质优化

超会 AI:AI 驱动的爆款内容制造机，提供图片生成、文案生成、带货图文生成，帮助企业智能生产商品内容，提高流量与销售额。

超会 AI 是一款基于人工智能的爆款内容制造机，能够以 10 倍速度智能生产商品内容和自动化营销，帮助企业提高流量和销售额。产品背景信息丰富，价格适中，定位于为企业提供内容制造和营销解决方案。

内容制作营销自动化人工智能

OpenELM:是一套高效的语言模型家族，具备开源训练和推理框架。

OpenELM是由苹果公司开发的语言模型家族，旨在为开源研究社区提供先进的语言模型。这些模型基于公开可用的数据集训练，不提供任何安全保证，可能产生不准确、有害、有偏见或令人反感的输出。因此，用户和开发者需要进行彻底的安全测试，并实施适当的过滤机制。

语言模型自然语言处理机器学习

豆绘商拍:专业 AI 商品图和服装图生成工具

豆绘商拍是一款利用先进 AI 技术提供商品图和服装图生成服务的工具，能快速实现抠图、背景更换和模特换脸等功能，帮助企业提升品牌形象和市场竞争力。

AI 商品图生成服装图生成

Intellisay:使用你的声音创建一个最佳的每日计划，通过语音轻松创建任务和事件。

intellisay是一个通过语音输入创建每日计划的生产力工具。它使用人工智能技术，将语音转录和分析，然后提供一个优化的计划来实现成功。它能够帮助用户节省时间，从而更高效地完成任务。该产品背后的主要优点是快速设置和使用，以及跟踪任务和习惯的能力。

生产力语音输入任务管理

Grimo AI:是一个结合Obsidian、Github和Quora的平台，可以构建、增长和整理知识。将分享的见解分叉到你的仓库中，或从YouTube或Twitter导入内容。

Grimo AI是一个帮助用户构建、增长和整理知识的平台。它集合了Obsidian、Github和Quora的优点，提供了简单易用的界面和功能。用户可以通过查询获取来自任何人、任何地方的见解，并将这些见解分叉到自己的工作区。Grimo AI的核心优点包括：1. 将知识整理成精华；2. 从任何地方学习；3. 构建一个强大的知识社区。Grimo AI的定位是帮助用户更高效地获取和组织知识。

知识管理笔记查询

Bland AI:Bland是用于构建规模化AI电话呼叫应用程序的基础架构。

Bland是一个用于构建AI电话呼叫应用程序的平台，它提供了简单易用的API接口，使开发者能够轻松地创建自己的智能电话代理。Bland的主要优点是快速搭建和部署，可扩展性强，同时提供了丰富的文档和支持。无论是用于销售呼叫中心、客服代理、营销自动化还是其他领域，Bland都能帮助企业提高效率，节省时间和资源。

AI电话智能电话代理 API接口

Cici, browser AI assistant:GPT强化的网页和视频的内联翻译及快速摘要

Cici是您的AI朋友和浏览器助手。她可以回答您的问题，摘要网页内容，提供快速的词语翻译，并执行智能搜索。她可以为您做到这一切。

AI助手翻译摘要

MVSEP:能够将音频中的语音和音乐部分分离。

MVSEP是一款在线音频处理工具，利用先进的音频分离技术可将音乐和语音从音频文件中分离出来，适用于音乐制作、音频编辑、广播、电影后期制作等领域。优点包括高质量的音频输出、快速的处理速度和用户友好的操作界面。提供不同模型选择。

音频处理音乐制作音频编辑

NovaMSS:基于AI的新一代音乐源分离工具，一键提取伴奏、人声等。

NovaMSS是一款基于最顶级的AI模型调优后的新一代音乐源分离工具，可以一键提取伴奏、人声、贝斯、鼓点、分离音轨等。它的强大算法基于MSS领域最顶级的算法，并经过上千首歌曲的训练与调优，实现音轨分离的高效率和高质量。产品提供简单易用的界面，支持多种音频格式，包括MP3、Flac、Wave、AIFF等，并且支持批量上传和处理，内置音频播放器，方便用户即时查看分离结果。此外，产品分为社区版和专业版，社区版永久免费，而专业版提供更专业的算法模型和更高品质的音频输出格式。

AI音乐分离一键处理批量上传

ChatMIX智能对话-AIGC系统:一款集成AI技术的智能对话系统，提供多语言翻译、编程代码生成等功能。

ChatMIX智能对话-AIGC系统是一款利用人工智能技术构建的在线聊天系统，旨在通过AI技术提升用户交互体验。产品支持智能翻译、工作周报生成、编程代码编写等功能，满足用户在不同场景下的需求。它的优势在于能够快速响应用户指令，提供准确、高效的服务，同时具备良好的用户界面和操作体验。

AI 智能对话翻译

AI对话鸭:一键发起AI机器人对话，集成多款国产大模型。

AI对话鸭是一个领先的AI聊天对话平台，它集成了多款国产大模型，提供了丰富的对话场景和功能，满足不同用户的需求。该平台以其高效的对话生成能力和多样的应用场景，在提高工作效率和娱乐互动方面具有显著优势。

AI聊天文案生成教育辅助

讯飞A.I.智能客服解决方案:基于科大讯飞语音技术，实现智能客服的多渠道解决方案。

A.I.智能客服解决方案是科大讯飞基于其先进的语音技术，为企业提供的一套完整的客户服务系统。该系统通过电话、Web、APP、小程序、自助终端等多种渠道，实现智能外呼、智能接听、语音导航、在线文字客服、质检分析、坐席辅助等功能。它通过高识别率的语音识别引擎、自然流畅的语音合成技术、智能打断能力、IVR导航以及客服平台中间件等技术，帮助企业提高客服效率，降低人力成本，同时提升客户服务体验。

微信“发送语音过程转文字”功能并未在安卓版7.0.5上线

今日大家都在搜的词：

热文

站长商机