近日,网易有道词典宣布推出明星语音功能。数据显示,截至 2019 年 12 月底,网易有道词典的用户总量已经达到 8 亿。
(举报)
近日,网易有道词典宣布推出明星语音功能。数据显示,截至 2019 年 12 月底,网易有道词典的用户总量已经达到 8 亿。
(举报)
11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
有道推出的虚拟人口语私教HiEcho正式上线开放下载。这款产品提供了一对一的专属教练,让用户随时随地练习口语。HiEcho还提供发音标准纯正、地道美式口音的教练,让学习者轻松练习口语,无压力地克服社交恐惧。
OpenAI宣布将在ChatGPT中推出新的语音和图像功能。这些功能可以通过语音对话或展示图片的方式与ChatGPT进行交互。语音功能将在iOS和Android平台上使用图像功能将在所有平台上提供。
网易公司CEO丁磊在2023中国数字音乐产业大会上分享了他对中国数字音乐产业未来发展的思考和建议。在下一个十年,中国数字音乐产业要建立更公平、合理的分配规则,让版权的价值回归音乐本身,让红利交还给音乐人。丁磊介绍了网易云音乐在AI音乐领域的前沿布局,并表示网易云音乐将推动这些技术工具的发展,来激发产业灵感,服务产业创作需要。
苹果在9月19日凌晨推送了iOS17正式版,在该版本中电话、信息、FaceTime通话迎来了重大更新,同时还有新功能“待机显示”,以及音乐、小组件、Safari浏览器的升级。以下为iOS17正式版更新日志内容:iOS17为“电话”、“信息”和FaceTime通话带来了重大更新,让你在沟通过程中通过全新方式表达自己。兼容机型iOS17需要运行A12Bionic及后续芯片机型,这意味着iPhone8,iPhone8Plus和iPhoneX无缘获得升级。
当地时间周一,美国人工智能研究公司OpenAI宣布,其AI聊天机器人工具ChatGPT现在可以“看、听、说”,这暗指这款广受欢迎的聊天机器人可以同时接收图像和语音输入,并通过语音对话进行回复。ChatGPT是OpenAI于2022年11月30日推出的一种新型AI聊天机器人工具,可根据用户的要求快速生成文章、故事、歌词、散文、笑话,甚至代码,并回答各类疑问。它是一个多模态大型语言模型,支持图像和文本输入,以文本形式输出;扩写能力增强,能处理超过25000个单词的文本;更具创造力,并且能够处理更细微的指令。
微信推出了一项新功能,允许用户在搜索栏中输入“头像制作”、“中秋头像”、“节日头像”等关键词,然后选择三种官方特别头像挂件之一进行装饰。这三种装饰分别是“祖国万岁”、“瑞兔伴月”和“节后再说”。如果想要将制作好的头像分享给微信好友或者收藏到微信中,也可以轻松实现。
亚马逊在其2023年秋季硬件发布会上宣布了一项重大更新,将推出全新的Alexa语音助手,它将搭载全新的Alexa大语言模型技术,从带来更智能、更具对话性的家居控制体验。根据亚马逊设备与服务部门的高级副总裁戴夫·林普的介绍,新的Alexa将能够理解对话内容,更准确地解释上下文,并能够从单一指令中完成多个请求。这一更新将推动智能家居领域的发展,为用户提供更便捷�
苹果公司于9月19日凌晨1点左右正式发布了iOS17的正式版升级。适用于iPhoneXs及后续机型。辅助功能更新包括辅助访问,这个可自定义的交互界面帮助患有认知障碍的用户更轻松独立地使用iPhone;实时语音功能帮助无法讲话的用户在面对面交谈、打电话或进行FaceTime通话时将所输入的文字朗读出来;个人声音能帮助面临失语风险的用户创建与自己声音相仿的语音;指字即读可帮助失明及低视力用户朗读设备指向的实体物品上的文字。
Spotify正在进行AI语音翻译试点项目,将博主的播客翻译成用户的母语。该功能使用了OpenAI最近发布的语音生成技术,可以保持原始发言者的风格和特点,提供更真实、自然的听觉体验。Spotify希望通过这个功能帮助博主将他们的故事传递给全球更多的听众,同时也会根据用户和博主的反馈不断改进和扩展。
在周三的活动中,亚马逊发布了一系列新的设备,并为语音助手Alexa增加了生成式人工智能功能,旨在巩固其在人工智能竞赛中的地位。新功能“Letschat”将在未来几周内提供给现有Echo用户进行早期预览,使Alexa的声音更像人类,进行更自然的对话,无需唤醒词提示,并能够通过每次交互增进对用户了解。还有儿童版平板电脑、智能家居控制器、路由器、流媒体播放器和户外安防摄像头等新品。
Make-Your-Anchor是一个基于扩散模型的2D虚拟形象生成框架。它只需一段1分钟左右的视频素材就可以自动生成具有精确上身和手部动作的主播风格视频。该系统采用了一种结构引导的扩散模型来将3D网格状态渲染成人物外观。通过两阶段训练策略,有效地将运动与特定外观相绑定。为了生成任意长度的时序视频,将frame-wise扩散模型的2D U-Net扩展到3D形式,并提出简单有效的批重叠时序去噪模块,从而突破推理时的视频长度限制。最后,引入了一种基于特定身份的面部增强模块,提高输出视频中面部区域的视觉质量。实验表明,该系统在视觉质量、时序一致性和身份保真度方面均优于现有技术。
Garment3DGen是一个基于网络的工具,它允许用户通过简单的拖放界面来创建和预览3D服装模型。用户可以选择不同的服装类型,调整尺寸和颜色,然后生成可以用于进一步设计或打印的3D模型。
LOOI Robot提供一种将智能手机转化为互动桌面机器人的创新方式,拓展了技术和连接的新领域。
TextCraftor是一种创新的文本编码器微调技术,能够显著提升文本到图像生成模型的性能。通过奖励函数优化,它改善了图像质量与文本对齐,无需额外数据集。
SunoAI.ai是一款革命性的AI音乐生成器,可以即时创建独特的AI MP3歌曲,免费使用。立即下载并享受创新的音乐!
Grok-1.5是一种先进的大型语言模型,具有出色的长文本理解和推理能力。它可以处理高达128,000个标记的长上下文,远超以前模型的能力。在数学和编码等任务中,Grok-1.5表现出色,在多个公认的基准测试中获得了极高的分数。该模型建立在强大的分布式训练框架之上,确保高效和可靠的训练过程。Grok-1.5旨在为用户提供强大的语言理解和生成能力,助力各种复杂的语言任务。
Hoory提供了两种类型的AI助手,用于客户支持自动化。规则型助手遵循结构化的方法,使用动态流程图指导用户交互,而知识型助手则利用语言模型技术提供智能和情境相关的客户查询响应。用户可以根据需要选择和训练适合自己产品的AI助手。
Talkie AI是一个基于AI的对话平台,它允许用户轻松创建和部署智能对话助手。这些助手可以用于客户服务、销售支持、内容创作等多种场景,提供自然流畅的对话体验。
LMSYS Org 是一个组织,旨在使大型模型及其系统基础设施的技术民主化。他们开发了 Vicuna 聊天机器人,其在 7B/13B/33B 规模下可以印象 GPT-4,实现了 90% ChatGPT 质量。同时,还提供 Chatbot Arena 以众包和 Elo 评级系统进行大规模、游戏化评估 LLMs。SGLang 提供了复杂 LLM 程序的高效接口和运行时环境。LMSYS-Chat-1M 是一个大规模真实世界 LLM 对话数据集。FastChat 是一个用于训练、提供服务和评估基于 LLM 的聊天机器人的开放平台。MT-Bench 是一个用于评估聊天机器人的一组具有挑战性、多回合、开放式问题。
Alice App是一款桌面应用程序,提供与各种AI模型交互的最快GPT体验。用户可以选择市场上最佳模型,包括GPT-4、Vision、Perplexity、Claude和Groq,以及本地模型如Ollama。Alice App支持创建个人助理,专注于营销、销售、法律等任务,并能够与您的应用程序进行通信,执行命令。
ObjectDrop是一种监督方法,旨在实现照片级真实的物体删除和插入。它利用了一个计数事实数据集和自助监督技术。主要功能是可以从图像中移除物体及其对场景产生的影响(如遮挡、阴影和反射),也能够将物体以极其逼真的方式插入图像。它通过在一个小型的专门捕获的数据集上微调扩散模型来实现物体删除,而对于物体插入,它采用自助监督方式利用删除模型合成大规模的计数事实数据集,在此数据集上训练后再微调到真实数据集,从而获得高质量的插入模型。相比之前的方法,ObjectDrop在物体删除和插入的真实性上有了显著提升。
Jamba是一款基于SSM-Transformer混合架构的开放语言模型,提供顶级的质量和性能表现。它融合了Transformer和SSM架构的优势,在推理基准测试中表现出色,同时在长上下文场景下提供3倍的吞吐量提升。Jamba是目前该规模下唯一可在单GPU上支持14万字符上下文的模型,成本效益极高。作为基础模型,Jamba旨在供开发者微调、训练并构建定制化解决方案。
Arteus AI Image Generator是一款由Arteus AI开发的尖端工具,利用先进的人工智能技术从文本提示中创建图像。只需描述您想生成的内容,Arteus AI就能产生出来。该工具采用了生成对抗网络(GANs)或变分自编码器(VAEs)等复杂的深度学习算法,通过学习数据集中的模式并根据输入参数生成图像,从而确保高质量输出。Arteus AI Image Generator非常灵活,可以创建各种类型的图像,包括逼真的照片、抽象艺术、风景、肖像等。用户可以通过调整参数或提供具体指令来定制生成的图像。
ApyHub是一个拥有100多个API的目录,从简单的工具到复杂的AI解决方案。找到、测试和管理最适合您应用程序的API。
SumyAI是一款AI驱动的视频摘要工具,可以将冗长的视频压缩成关键要点,以便更快地吸收,节省时间并增强记忆力。定价:免费试用。
AI女友Emma是一个可以与你进行交流的虚拟伴侣。她可以陪伴你聊天,提供情感支持和娱乐,为你带来温暖和快乐。免费用户每周可以发送30条消息,付费用户享受无限制的沟通。价格为1.99美元/周。
Emplibot是一个自动将高质量文章发布到WordPress博客的AI工具。它通过进行关键词研究、插入图片和内部链接等方式,自动完成文章的生成。它能为您的目标用户量身定制内容,提升博客的SEO效果,促进业务增长。
DocTranslator 是世界上最好的 AI 翻译工具,支持超过 100 种语言,可快速翻译大型 PDF、Word、Excel、PPT 文件。提供免费试用计划和存储计划,支持 MS Word、Excel 和 PDF 格式,保留原始格式和布局。价格从 0.005 美元 / 单词起,满足各种用户需求。
ポケトーク是一款梦幻的 AI 翻译机,可以让无法交流的人进行对话,具有高度实用性和便携性,是旅行、商务等场景的理想助手。
chichi-pui(ちちぷい)是一家 AI 画像专用的投稿和生成网站,用户可以在此分享和生成 AI 插画、AI 照片等作品。该网站拥有丰富的 AI 画像投稿和生成内容,适合对 AI 艺术感兴趣的用户使用。用户可在网站上参与不同的活动和投稿企划,与其他用户分享作品并获取灵感。