11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
欢迎来到【今日AI】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
WhisperKit是一个基于Whisper项目的推理工具包,由Argmax公司推出。它允许在iOS和macOS应用程序中进行语音识别和转录。欲了解更多信息,请访问WhisperKit官方网站。
B站UP主“佛辣西威”借助国产电视剧《亮剑》中的“有胜阅兵”视频片段,成功制作了一支引人注目的AI识别情绪视频。该视频在B站上的播放量已经达到186万,吸引了大量网友参与评论,形成了一场“梗上加梗”的热潮。值得一提的是,UP主“佛辣西威”此前已经成功制作了多个AI情绪识别的视频作品,包括今年2月爆火的AI情绪识别《上春山》。
ImagenATexto是一个在线工具,可以将图像转换为可编辑的文本。它使用先进的OCR技术,确保准确提取图像中的文本。通过先进的OCR技术,ImagenATexto能够准确识别图像中的文字,并提供编辑功能。
Google最近开源了一款名为Magika的文件类型识别系统,该系统由AI驱动,能够在毫秒级内准确识别超过100种不同的文件类型,包括二进制文件和文本文件。在Google内部,Magika被广泛应用于提升用户安全,主要用于对Gmail、Drive和安全浏览中的文件进行适当的安全检查和内容策略扫描。详细介绍和演示可以在其网站和GitHub页面上找到。
Magika是一款由谷歌研发的快速准确的文件类型识别工具,基于深度学习模型,可以在毫秒级时间内识别二进制文件和文本文件类型。它的准确率明显高于其他现有工具,尤其在识别代码文件和配置文件时效果更佳。想了解更多Magika的信息,请访问其官网进行深入了解。
Bumble今天宣布推出一款新的人工智能功能,名为DeceptionDetector,旨在帮助识别垃圾邮件、诈骗和欺骗个人数据。这一创新工具将在用户发现恶意内容之前自动采取行动,有效提高用户在线安全体验。这一举措进一步强化了Bumble在体验和在线安全方面的领先地位,为用户提供更加可靠和真实的社交交流平台。
WhisperKit是一个专为自动语音识别模型压缩与优化设计的强大工具。它不仅支持对模型进行压缩和优化提供详细的性能评估数据。通过WhisperKit官网,您可以详细了解该工具的功能和应用,并体验其卓越的自动语音识别模型优化能力。
2024年1月18日凌晨,三星在举办了GalaxyAI全球新品发布会,宣告GalaxyS24系列的登场,应用了谷歌Gemininano大模型共同迎接“GalaxyAI时代”的到来。除了这个模型,GalaxyS24的一些功能还受益于谷歌Imagen2模型,将文本到图像的能力植入手机。S24、S24的起售价为115.5万韩元、135.3万韩元Ultra版则以169.84万韩元起售。
AIGC时代,人人都可以使用Midjourney、StableDiffusion等AI产品生成高质量图片,其逼真程度肉眼难以区分真假。这种虚假照片有时会对社会产生不良影响,例如,生成公众人物不雅图片用于散播谣言;合成虚假图片用于金融欺诈,造成信任危机等。华为团队认为,该领域未来值得努力的方向是不断提升检测器在GenImage数据集上的准确率,并进提升其在真实世界面对虚假信息的能力。
在CES2024上亮相的一款智能镜将童话中的短语“镜子镜子,告诉我,谁是最美的人”带入现实。Baracoda的BMind智能镜搭载生成式人工智能,宣称能够判断用户的情绪,并随之提供肯定的话语、图像等,以改善用户的心情。BMind智能镜将于2024年底上市,售价在500美元至1000美元之间。
领先的开源对话AI工具包NVIDIANeMo宣布推出ParakeetASR模型系列,这是一系列最先进的自动语音识别模型,能够以出色的准确性转录英语口语。ParakeetASR模型与Suno.ai合作开发,是语音识别领域的一大突破,为实现更自然高效的人机交互铺平了道路。要在本地访问模型并探索工具包,请访问NVIDIANeMo的Github页面。
【新智元导读】10年前,「地震预测」在圈内还是如尼斯湖水怪一般的奇谈怪论,但机器学习的发展,已经让「准确预测地震」的可能性,又往前迈进了一步。最近一段时间,世界各地地震频发。可以确定的是,AI确实让某些东西变得不一样了。
美国联邦贸易委员会周二表示,RiteAid被禁止使用人工智能面部识别来遏制入店行窃,为期五年。根据FTC的指控,该药品连锁公司未能在数百家店内使用面部识别技术时实施合理程序,防范对消费者的伤害。司法部宣布起诉RiteAid,指控其在阿片类药物流行期间填写数十万张“存在明显红旗”的受控物质处方。
Meta公司最新宣布将在其Ray-Ban智能眼镜上推出引人注目的多模态AI功能,为用户提供更智能、交互式的体验。该功能利用眼镜的摄像头和麦克风,使Meta的AI助手能够感知用户周围的视听信息,并做出相应的反应。对于智能眼镜市场言,这一步或许将开创更为多元化的应用场景,为用户带来更加便捷和智能的生活体验。
Meta宣布将开始推出其多模态AI功能的早期访问测试,这些功能将应用于MetaRay-Ban智能眼镜,能够通过眼镜的摄像头和麦克风告知用户所看和所听的内容。马克·扎克伯格在Instagram的一个视频中展示了这次更新,他询问眼镜建议哪种裤子与他手里拿着的衬衫相配。有关如何加入的说明可以在此处找到。
近期一项前沿的类脑研究登上了Nature子刊,研究人员利用活人脑细胞构建了一个新型AI系统,这一突破意味着语音识别准确率有望大幅提升。这个系统可以进行无监督学习,并具有类似神经网络的功能。通过使用活人脑细胞构建AI系统,语音识别准确率得到提升,这一突破将为未来AI技术的发展带来重要启示。
同方知网数字出版技术股份有限公司申请了名为“一种AI生成文本的检测方法、装置、介质及设备”的专利。该专利通过多种特征分析,可以自动判断一篇文本是否为AI生成,从检测代写论文等学术不端行为。这项专利有助于知网进一步提升代写论文检测的效率与质量,维护学术诚信。
站长之家12月5日消息:Google在其安全博客上宣布,Gmail的垃圾邮件过滤功能经历了近年来最大规模的升级。这一升级主要体现在一种名为RETVec的新文本分类系统上。RETVec已在内部测试了一年时间,并已经部署到用户的Gmail账户中。
一项由马丁·路德大学哈勒-维滕贝格、约翰内斯·古腾堡大学迈因茨分校和迈因茨应用科学大学团队开发的新型人工智能软件如今能够解读难以辨认的楔形文字。与以往依赖照片的方法不同,该AI系统利用楔形文字片的3D模型,传递的结果比先前的方法更加可靠。该软件还可能有助于解读受损的铭文,例如在墓地中的三维楔形文字。
一项新技术引起了人们的关注,它使用OpenAI多项技术,能够以令人信服的方式自动生成体育比赛的解说。这个技术可以自动识别比赛中的场景,包括球员的位置和行动、球的位置和轨迹,甚至比赛的得分等等。在体育游戏领域,这项技术可以帮助游戏开发者更好地模拟真实比赛的情景,为玩家带来更加逼真的游戏体验。
维也纳大学的生物学家SoniaKleindorfer博士,现任KonradLorenz行为与认知研究中心主任,最近发起了一项突破性研究。继承了著名的奥地利生物学家KonradLorenz研究灰雁鹅群行为的遗产,Kleindorfer博士及其团队开发了一种用于灰鹅面部识别的人工智能工具,旨在提高对鹅群个体识别的准确性。但她也提醒,要对鹅友善,因为它们也会记住人类的面孔。
支付宝小程序云服务又升级了,全新推出文字识别、智能视觉和自然语言处理等3项智能应用功能,让小程序服务商和开发者通过开箱即用的云AI产品,实现全面、便捷、高效的人工智能服务,提高服务效率和用户体验,降低人工成本。针对小程序信息交互场景下,文字手动输入麻烦、图片信息真伪难辨、文本信息分析难度大等痛点,支付宝小程序云在此次升级中上线了「文字�
OpenAI最近宣布正在研发一种工具,旨在高度准确地检测由人工智能生成的图像。该工具的可靠性高达99%,由OpenAI的首席技术官MiraMurati确认。这一消息引发了业界的关注,展示了OpenAI在人工智能领域的持续创新。
在在线购物的广阔领域中,辨别真实的产品评论和虚假评论变得越来越困难,这让消费者对某些意见是否真正可靠感到困惑,导致购物决策中充满了不确定性。针对这一关键问题,Mozilla的Firefox已经采取了一个重大的步骤,即将评论检查工具整合到其浏览器Firefox中,从彻底改变了在线购物体验。Fakespot凭借其先进的人工智能方法,成为这一普遍问题的强有力解药。
澳大利亚联邦警察最近宣布,他们正在运用人工智能技术分析监视许可数据,旨在帮助识别潜在的洗钱和欺诈活动。尽管他们的AI使用迄今有限,但AFP表示,他们希望这项技术将有助于改进警务工作。他们强调无论是内部工具还是商业产品,都会确保数据得到保护,不会进入公共数据集,以保护隐私和敏感信息。
软件公司Digimarc推出了一项新的技术DigimarcValidate,允许内容版权持有者在数字资产中嵌入版权归属信息,以便AI模型训练时能识别哪些内容受版权保护、不应擅自使用。Digimarc表示,新的DigimarcValidate服务能在数字内容的元数据中加入版权归属标识。正当GENERATEDAI引发争议之际,DigimarcValidate或可约束AI训练行为,让数字资产版权受到应有尊重。
同方知网宣布推出“AIGC检测服务系统”。该系统以知网结构化、碎片化和知识元化的高质量文献大数据资源为基础,按照预训练大语言模型的算法逻辑,首次提出“知识增强AIGC检测技术”和若干检测算法,从语言模式和语义逻辑两条链路,用AI对抗AIGC,最终实现了快速、准确识别学术文本中的AI生成内容。还可支持期刊论文、学位论文、会议论文以及图书专著、科研成果、科技报告、课程作业检测等多个应用场景。
小米宣布其自研声音识别算法在国际排名中取得了第一的成绩。该算法在Google发布的音频标记任务中取得突破,成为性能最好的模型。小米声音识别算法还应用于智能家居设备,如宝宝哭声监测功能、家用报警器识别等。
研究人员利用一种称为图神经网络的深度学习算法,建立了一种模型,能够将化合物的结构映射到气味描述。该模型已成功预测人类小组如何描述新的气味,这可能是沿着长路征程中的重要一步,最终实现气味的数字化。要实现像通过互联网共享气味这样的可能性需要做更多工作。