9月30日消息,谷歌在近日推出了一项新的娱乐性功能,在谷歌上搜索猫咪等关键词之后,出现了对应的猫咪信息,用户可以通过手机摄像头进行AR观看猫咪的样子,用户还可在手机上调整猫咪的大小,以满足自己吸猫的爱好。
(举报)
9月30日消息,谷歌在近日推出了一项新的娱乐性功能,在谷歌上搜索猫咪等关键词之后,出现了对应的猫咪信息,用户可以通过手机摄像头进行AR观看猫咪的样子,用户还可在手机上调整猫咪的大小,以满足自己吸猫的爱好。
(举报)
11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
当下AR赛道正呈现出百家争鸣的局面。这些AR头显厂商中明显各有不同侧重点,有主打游戏外设的、有主打空间计算的、也有主打AI的……可以说,这些厂商头显设备主打“泛娱乐”化。”黄海透露,当前INAIRPro销量在稳步增长中,未来INAIR将会更加聚焦,围绕商务办公领域继续深耕,进一步加深AI与AR深度融合,在产品方面将不断更新迭代,尤其在便携性、系统流畅性、高效方面进行不断深化。
近日,一则大学校园中发现一条疑似三头蛇的视频引发广泛传播和关注。据悉,涉事高校为成都文理学院。网传视频显示,一条花蛇盘踞在树下草丛中,昂首张嘴,与一只猫咪对峙。期间,这条蛇不断发出攻击动作,吓得在场的学生发出尖叫。视频中,这条蛇看起来像是有三个头”,但视频清晰度有限,无法仔细分辨。经过一段时间对峙后,猫咪转身走开。在另外一段视频中,学校保安拿出专用的捕蛇工具将其捕获。对于网传三头蛇”的说法,成都文理学院工作人员表示,学生手机拍摄问题造成视觉误差。只是一条普通的蛇。不是三个头,学生手机拍摄问题,蛇
腾讯智影推出了新功能“动态漫画”,让用户可以零基础制作高流量的AI漫画视频。这种AI漫画视频在短视频平台上流行,画面精美、剧情精彩,吸引了很高的流量和点赞数。智影的动态漫画功能让用户无需绘画基础,就能制作出高质量的AI漫画视频,为想要成为漫画家的用户提供了便利的创作工具。
有消息称Google将推出一款集多种功能于一体的AI视频工具——GoogleVids。这款工具旨在帮助用户轻松创作故事板,并通过AI技术协助编辑内容,选择适合的场景、图片和音乐,自动生成一个完整的类似PPT的宣讲视频。GoogleVids将于6月份登陆GoogleWorkspace,届时用户将能够更加便捷地使用这一工具,为自己的工作和学习带来更多便利。
一段温馨的家庭监控视频在广东引起了网友的广泛关注。一个11个月大的婴儿在没有大人陪伴的情况下独自爬出了客厅家中的猫咪则表现出了极高的警觉性,始终守护在婴儿的旁边,确保他的安全。它也提醒家长们要时刻关注孩子的安全,确保他们在家中也能健康快乐地成长。
备受瞩目的剪辑软件剪映再次迎来了重大更新,推出了全新的视频翻译功能。这一功能的推出,无疑将进一步巩固其在视频编辑领域的领先地位,为用户提供更加便捷、智能的服务。在翻译过程中,用户需要通过声音认证环节,以确保视频内容的真实性和安全性。
人工智能聊天机器人平台Poe由问答网站Quora推出,近期迅速扩展,旨在成为用户访问各种对话AI模型的一站式平台。Poe最新的重要功能是“多机器人聊天”,允许用户在单个对话线程中同时与多个AI模型交互。各行各业的公司都应密切关注Poe,并考虑对话AI可能如何在未来几年重塑他们的业务。
新壹科技在第十一届中国网络视听大会AIGC和数字人发展论坛上发布了名为“秒创AI视频”的新产品。该产品使用了前沿的DiffusionTransformer技术,实现了从“文本到视频”、“图像到视频”以及“文本图像到视频”的全流程创作。新壹科技将继续优化技术,推出更流畅、更长时长、更符合逻辑的AI视频,同时致力于降低视频模型的训练与生成成本,让更多用户享受AI视频带来的便利和乐趣。
谷歌的研究人员最近推出了一款名为VLOGGER的多模态扩散模型,能够自动生成带语音、丰富动作的人物视频。用户只需向VLOGGER输入图像和语音,就可以获得逼真的视频效果。VLOGGER的推出为虚拟数字人的制作提供了更便捷、高效的解决方案,同时也在多模态视频生成领域取得了重要的技术突破。
Grammarly近日推出了一项新的AI功能,旨在在您发送之前审查您的商业写作,并提供“战略性建议”,以使您的消息更清晰、更具影响力。无论您是在Gmail标签、文字处理器还是像Slack这样的聊天工具中撰写,这一新功能都旨在检测您何时大致完成一篇商业写作。他说:“在一天结束时,我们最关心的是我们用户对这项工具有多大帮助的感知。
FCK.School是一个为学生提供AI写作工具的在线平台。它可以帮助学生改善写作技巧,提升学术表现。通过FCK.School的AI驱动工具,学生可以进行文本改写、文摘、语法纠错等操作,还能生成各种写作素材,如标题、论点、大纲等。FCK.School提供免费工具以供试用,同时还有付费订阅计划。
CompliantChatGPT是一款专为医疗保健行业设计的AI助手,它通过HIPAA合规的方式,帮助医疗工作者安全、高效地处理医疗相关任务。产品具备以下特点: - 保护患者数据安全,通过令牌化技术确保个人健康信息(PHI)的安全。 - 提供个性化的医疗模式,包括血液分析、PHI匿名化、诊断和治疗规划等。 - 用户友好的界面设计,支持语音到文本的笔记功能,便于记录和回顾。 - 定价策略灵活,提供免费试用,以及多种付费套餐选择。 - 适用于医疗提供者、专业人士、医疗机构、研究中心和健康科技初创企业。
Healax是一款创新的AI驱动的心理健康解决方案,专为学生设计,帮助他们主动应对日常生活中的压力和焦虑。该产品通过建立学生、行政人员和提供者之间的信任沟通渠道,提供定制化活动和内容,以促进更全面的教育体验。
Snowflake Arctic Embed是一系列基于Apache 2.0许可开源的文本嵌入模型,专为检索用例设计。这些模型在Massive Text Embedding Benchmark (MTEB)检索基准测试中提供了领先的检索性能,为组织在结合专有数据集与大型语言模型(LLMs)进行检索增强生成(RAG)或语义搜索服务时提供了新的优势。这些模型的尺寸从超小型(xs)到大型(l),具有不同的上下文窗口和参数数量,以满足不同企业的延迟、成本和检索性能需求。
DuerOS X是小度基于百度文心大模型推出的全球首个AI原生操作系统。它彻底颠覆了传统的人适应系统的模式,实现了端到端连接用户的意图与任务,极大地拓展了操作系统的边界。DuerOS X全面应用了文心大模型,通过模型路由架构,能够灵活调度不同的文心模型去解决不同难度的问题,更高效、更精准、更经济。个性化长短记忆的存储、提取和理解能力,使得DuerOS X能够更清楚地记住历史内容与用户个性化偏好。此外,多模态感知技术的应用,让DuerOS X产生更丰富的感知力,无论是通过语音、文字还是表情与小度沟通,都能准确地理解用户的意图,并给出恰当的回应。
abab 6.5系列包含两个模型:abab 6.5和abab 6.5s,均支持200k tokens的上下文长度。abab 6.5包含万亿参数,而abab 6.5s则更高效,能在1秒内处理近3万字的文本。它们在知识、推理、数学、编程、指令遵从等核心能力测试中表现出色,接近行业领先水平。
mistral-common是一套帮助您处理Mistral模型的工具。它不仅包含文本到token的转换,还增加了工具解析和结构化对话。目前发布了三个版本的tokenizer,分别适用于不同的模型集合。
AI语法检查与改写工具- LanguageTool是一款免费的语法检查工具,可以检测文本中的语法错误并提供改写建议。它能够检测出拼写错误、语法问题、常见词汇混淆和标点符号错误,并提供改写建议、同义词替换和简洁句子重写。该工具适用于多种语言,支持多个平台和应用场景,如社交媒体、电子邮件和网页。
AI 3D Generation是Spline推出的一款3D设计工具,它支持文本到3D生成和图像到3D生成,允许用户通过简单的文本提示或2D图像自动创建出详细且精确的3D模型。该工具具有生成变体与混合、直观且适合初学者、创建独特的3D库、平台集成与实时协作、易于集成和发布等功能。
FocuSee 自动跟踪光标移动,应用动态缩放效果,为您节省宝贵时间和额外的努力。适用于演示,教程,推广视频等多种场景。
Ai-to-pptx 是一个使用 AI 技术 (ChatGpt 和 Gemini) 制作 PPTX 的助手,支持在线修改和导出 PPTX。主要功能包括使用 ChatGPT 等大语言模型生成大纲、允许用户再次修改内容、选择不同模板、在线修改 PPTX 的文字、样式、图片等,支持导出 PPTX、PDF、PNG 等多种格式。价格为付费,商业授权价格为 22000 元人民币或 3000 美元。
CodeQwen1.5是一个基于Qwen语言模型的代码专家模型,拥有7B参数,支持92种编程语言,最长支持64K的上下文输入。它具备代码生成、长序列建模、代码修改和SQL能力等,旨在提高开发人员的工作效率,简化软件开发流程。
PixArt-Sigma是一个基于PyTorch的模型定义、预训练权重和推理/采样代码的集合,用于探索4K文本到图像生成的弱到强训练扩散变换器。它支持从低分辨率到高分辨率的图像生成,提供了多种功能和优势,如快速体验、用户友好的代码库和多种模型选择。
InstantMesh是一个基于LRM架构的前馈框架,用于从单张图像高效生成3D网格。它支持低内存GPU环境,并能生成具有纹理映射的3D网格模型。
MagicClothing是一种基于潜在扩散模型(LDM)的新型网络架构,专门用于服装驱动的图像合成任务。它能够根据文本提示生成穿着特定服装的定制化角色图像,同时确保服装细节的保留和对文本提示的忠实呈现。该系统通过服装特征提取器和自注意力融合技术,实现了高度的图像可控性,并且可以与ControlNet和IP-Adapter等其他技术结合使用,以提升角色的多样性和可控性。此外,还开发了匹配点LPIPS(MP-LPIPS)评估指标,用于评价生成图像与原始服装的一致性。
FireCrawl 是一款由 Mendable.ai 开发的开源项目,它能够无需站点地图即可抓取任何网站的所有可访问子页面,并将这些内容转换为干净、格式化的Markdown文档。它特别适合数据科学家、机器学习工程师、内容创作者和市场分析师使用,以从网站内容中提取有价值的信息。FireCrawl 能够处理使用JavaScript动态渲染的内容,提供API服务,支持自托管,并与多种开发者工具和框架集成。
Atlas是波士顿动力公司开发的一款先进的人形机器人,它结合了数十年的研究和实际经验,旨在解决当今工业领域中最艰巨的挑战。新一代的Atlas机器人是全电动的,比以往的液压版本更强大,动作范围更广,能够更高效地完成各种任务。Atlas机器人配备了新的AI和机器学习工具,如强化学习和计算机视觉,以确保它们能够适应复杂的现实世界情况。此外,Atlas将与波士顿动力公司的Orbit™软件集成,该软件提供了一个集中的平台来管理整个机器人车队、站点地图和数字化转型数据。
Stable Diffusion 3是一款先进的文本到图像生成系统,它在排版和提示遵循方面与DALL-E 3和Midjourney v6等顶尖系统相匹敌或更优。该系统采用新的多模态扩散变换器(MMDiT)架构,使用不同的权重集来改善图像和语言的表示,从而提高文本理解和拼写能力。Stable Diffusion 3 API现已在Stability AI开发者平台上线,与Fireworks AI合作提供快速可靠的API服务,并承诺在不久的将来通过Stability AI会员资格开放模型权重以供自托管。
奇布塔是基于人工智能生成技术的绘本创作平台,提供各种风格的有声绘本创作功能,帮助用户创作优质的绘本内容。定价灵活多样,定位于绘本创作者和儿童阅读者市场。
VASA-1是由微软研究院开发的一个模型,专注于实时生成与音频相匹配的逼真人脸动画。该技术通过深度学习算法,能够根据输入的语音内容,自动生成相应的口型和面部表情,为用户提供一种全新的交互体验。VASA-1的主要优势在于其高度逼真的生成效果和实时响应能力,使得虚拟角色能够更加自然地与用户进行互动。目前,VASA-1主要应用于虚拟助手、在线教育、娱乐等领域,其定价策略尚未公布,但预计将提供免费试用版本供用户体验。