11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
贝勒大学经济学院的PhamHoangVan和ScottCunningham两位教授,基于OpenAI的GPT-3.5、GPT-4深度研究了大模型对事情的预测能力。研究人员使用了直接预测和未来叙述两种提示方法,进行了100次提示。ChatGPT模型的预测能力也受限于其训练数据的截止日期和范围,以及在生成预测时可能受到伦理和法律的限制。
谷歌AI团队最近发布了一项名为MUSCATEL的全新时间感知框架,旨在对抗概念漂移问题,提升图像识别准确率。概念漂移一直是机器学习领域的难题,即数据分布随时间变化,影响模型持续有效性。谷歌发布的MUSCATEL方法为机器学习领域的概念漂移问题提供了一种创新的解决方案,为模型在大规模、动态数据集中持续准确地进行分类提供了新的思路和方法。
对于“三高”,相信大家都再熟悉不过。那你是否又知道“第四高”——高尿酸呢?据相关资料显示,尿酸是人体内嘌呤代谢的最终产物,当血液中尿酸浓度高于正常时,就会以尿酸盐结晶的方式析出,沉积在关节、心血管、肾脏和胰腺等处长期高尿酸,或将引发严重的痛风症状,通常表现为突发性的关节红肿热痛,让人痛苦不堪。一款准确率高的尿酸检测仪加上正确的使用方法能够更好地帮助我们准确地了解自己的尿酸状况,并进行身体健康的管理,从更有效的防治痛风的发作。
当移动互联网进入存量时代,如何更高效地进行用户全生命周期管理、提升用户生命周期价值,变得尤为重要。TT语音是国内领先的兴趣社交平台,累计注册用户数高达数亿。个推也将持续与更多领域的APP开展合作,以丰富的行业经验和持续进阶的产品服务能力,为APP的运营增长提效增能。
华为Pocket2发布会今日盛大召开,引领手机科技新风潮。此次发布会,华为为我们带来了三款精美绝伦的配色选择,分别是洛可可白、芋紫与雅黑,为用户提供了更多的个性化选择。无论是检测防晒霜的涂抹情况是了解皮肤晒斑状况,华为Pocket2都为她提供了极大的帮助。
【新智元导读】大模型幻觉问题还有另一种解法?斯坦福联手OpenAI研究人员提出「元提示」新方法,能够让大模型成为全能「指挥家」,汇聚不同专家模型精华,让GPT-4的输出更精准。当你让大模型写一首「莎士比亚十四行诗」,并以严格的韵律「ABABCDCDEFEFGG」执行。在加入微软研究院之前,他曾在乔治亚理工学院和丰田工业大学芝加哥分校担任计算机科学助理教授。
在最新发布的非十科技的FittenCode中,一款国产编程神器在速度、准确率和功能上均超越了Copilot。这款神器支持80多种编程语言,包括Python、Javascript、Java等,并且完全免费。FittenCode以其超越同类产品的速度、准确率和功能,以及简单易用的特点,成为一款备受关注的国产编程神器。
【新智元导读】在社交媒体上发照片要谨慎了,AI工具一眼就能识破你的位置!随手在网络上发布的一张照片,能暴露多少信息?外国的一位博主@rainbolt就长年接受这种「照片游戏」的挑战,网友提供照片,他来猜测照片的具体拍摄地,有些照片甚至还能猜到具体的航班细节。是不是细思极恐?但「照片挑战」也同样抚慰了很多人心中的遗憾,比如拿着一张父亲年轻时候拍的照片,
一群斯坦福大学研究生发布了一个新项目,他们的AI模型经过了10万个随机位置、50万个街景图片以及其他图片的训练。这个模型能够快速准确地找出图片中的位置,目前的准确率达到了92%。所以对于普通用户来说,保护好隐私是至关重要的。
**划重点:**1.🚀WikiChat通过维基百科检索数据,有效阻止大型语言模型的幻觉。2.🌐项目使用ColBERT进行信息检索,并通过七阶段流程确保响应准确。通过WikiChat,我们有望有效应对大型语言模型的幻觉问题,使得这些模型在提供信息时更加可靠和准确。
美国最大非营利医疗机构之一,麻省布里格姆医院,近日发布了一份关于ChatGPT在临床医疗决策中应用的研究论文。该研究显示,ChatGPT在整个临床决策中的准确率达到了惊人的71.7%。随着模型获得更多可用的临床信息,其在医疗决策中的表现将进一步提升。
科技公司Entrupy宣称其AI技术能够以几乎完美的准确率检测二手奢侈品的真伪。该公司表示,其设备可鉴定来自品牌如路易威登和香奈儿的手袋等奢侈品。这一合作正值生成式AI工具如OpenAI的ChatGPT风靡全球之际。
丹麦研究人员成功研发了一款名为“life2vec”的机器学习模型,被戏称为“死亡计算器”,能够准确预测数百万人的死亡情况。该模型通过综合考虑个体的年龄、健康状况、教育、职业、收入等多个方面的数据,成功预测了截至2020年的死亡情况,其准确率达到了78%。”他认为,虽然这种技术在防止死亡方面具有潜力,但也存在将生活中的未知因素剥夺的风险,这并不一定是一�
一种名为Life2vec的人工智能工具,现能预测个人的寿命,其准确率高达78%。该工具基于对600万丹麦人数据的研究,能够基于收入、职业和医疗记录等因素来预测寿命,并且能估算出个人在去世时的资金状况。该工具目前尚未向公众开放。
快科技12月21日消息,据媒体报道,韩国延世大学医学院近日发布了一项研究成果:可用深度学习后的人工智能算法,对儿童的视网膜照片进行分析,从而检测儿童是否患有自闭症谱系障碍(ASD)。据悉,在本次实验中,研究人员共召集了900多名年龄在7-8岁的儿童,其中有一半的儿童都患有了自闭症。随后,研究人员拍摄了所有参与者的视网膜照片。随后,研究人员使用深度学�
由儿童和青少年心理学家、行为科学家、眼科医生和生物医学系统信息学专家组成的韩国多机构团队发现,基于深度学习的人工智能系统能准确诊断患有自闭症的儿童。在发表于《JAMANetworkOpen》期刊的研究中,该团队使用基于学习的AI系统创建了一个自闭症诊断工具,并在人类受试者上进行了测试。该团队计划通过进行更多实验来找出答案。
谷歌日前发布了MedLM生成式人工智能模型,专门为医疗保健领域设计。根据公司发布的博客文章,该模型的前两个版本已经面向美国谷歌云客户开放,通过谷歌的VertexAI平台提供,该平台使用机器学习工作流来指导用户进行生成式人工智能模型的训练、评估和部署。未来将继续在医疗保健领域推出新的MedLM模型,以进一步提升其在人工智能领域的影响力。
近期一项前沿的类脑研究登上了Nature子刊,研究人员利用活人脑细胞构建了一个新型AI系统,这一突破意味着语音识别准确率有望大幅提升。这个系统可以进行无监督学习,并具有类似神经网络的功能。通过使用活人脑细胞构建AI系统,语音识别准确率得到提升,这一突破将为未来AI技术的发展带来重要启示。
在NeurIPS2023上,UCLA等机构发布的Chameleon框架吸引了广泛关注。该框架通过融合多种工具,包括LLMs、视觉模型、搜索引擎、Python功能及基于规则的模块,解决了大型语言模型在实时信息获取和数学推理方面的不足。其灵活性、适应性和用户友好性使其在学术界和开发者社区中受到瞩目。
近期微软的研究成果展示了通过「提示工程」成功将GPT-4转化为医学专家的威力。在医学专业领域,GPT-4使用最新提示策略Medprompt在MultiMedQA九个测试集中取得了超过90%的准确率,首次超越其他高度微调的模型,如BioGPT和Med-PaLM。目前我们仍未触及提示的极限,也未达到微调的极限,为未来研究和发展提供了更多的探索空间。
在2023科技领域,大语言模型的应用日益广泛,但其在回答问题时存在的问题引起了关注。Meta团队提出的新注意力机制S2A通过解决LLM容易受到上下文虚假相关性的问题,显著提升了模型的准确性和客观性。通过引入更深思熟虑的注意力机制,S2A为解决LLM的问题提供了一种可行的方法,为大型语言模型的进一步发展铺平了道路。
国际气象服务评测机构ForecastWatch公布了全球气象企业在中国区预报准确率评测结果,墨迹天气凭借过硬的技术能力在一众国际气象巨头中脱颖出,再次斩获了中国区综合预报准确率全球之首的成绩,且在高温、晴雨、风速等单项预测中准确率均排名首位,其精准且稳定的天气预报能力又一次得到了肯定。这也正代表着墨迹天气在气象服务领域的“护城河”效应愈发显著,其品牌实力再次得以印证。墨迹天气也将以提供高质量气象服务为导向,以科技创新为依托,不断提升气象监测、预报和服务水平,为行业合作伙伴提供更精准的预报、更专业的气象场景解决方案,助力气象现代化迈上新台阶;同时,墨迹天气也将持续深耕气象服务领域,并以“新气象、新作为”激发气象市场主体活力,携手各界同仁聚力同行,共同成长。
最近的研究表明,GPT-4在图形推理任务上表现不佳,仅有33%的准确率,引发了对大型语言模型图形处理能力的关注。通过使用ConceptARC数据集,研究者对451名人类受试者进行了图形推理任务测试,结果显示人类在这方面表现卓越,平均准确率达到91%。这项研究突显了目前大型语言模型在某些特定任务上的局限性,并提出了对研究方法的进一步审视的需求。
一款名为SciMatch的应用声称通过"AI社会科学"的方法,帮助用户找到高度匹配的灵魂伴侣,准确率达到87%。用户只需上传一张自拍照,应用的"A.I.Ruby"算法会分析面部特征,识别性格特质,然后推荐相应的潜在约会对象。应用的高匹配度计算和"科学准确匹配"的宣传使它成为寻找约会对象的另一种选择。
DeepMind最新发布的AlphaFold版本取得了蛋白质结构预测准确性的显著提升,准确率提高了近10%。这一技术还扩展了预测的范围,包括RNA结构和其他生物分子结构的预测能力。新一代AlphaFold的发布标志着数字生物学时代的开启,将为生物医学研究、药物设计以及科学探索带来革命性的变革。
最新医学研究表明,人工智能可以通过仅仅听取患者说话6-10秒的声音来检测2型糖尿病。这一突破性研究由KlickLabs进行,结果显示在女性中的准确率达到89%在男性中为86%。这一消息紧随麻省理工学院最近的突破性研究,该研究开发了一种能更顺畅地适应人体的生物植入物,有助于胰岛素等药物的传递。
一项最新研究发现:大模型的“人肉搜索”能力简直不可小觑。例如一位Reddit用户只是发表了这么一句话:尽管这位发帖者无意透露自己的坐标,但GPT-4还是准确推断出TA来自墨尔本。但仔细一看,它拒绝的都是明显包含敏感内容的文本,作者指出,这应该是激发了模型中原有的安全过滤器。
谷歌联合多所高校的一项最新研究,让大模型开始拥有了人类的“心智”。在新的提示策略下,大模型不仅能推测出人类所面临的问题学会了用推测的结论调整自己的行为。来自谷歌、卡耐基梅隆大学和的芝加哥大学的学者也参与了本项目。
大型语言模型在推理任务上表现出令人惊艳的能力,特别是在给出一些样例和中间步骤时。prompt方法往往依赖于LLM中的隐性知识,当隐性知识存在错误或者与任务不一致时,LLM就会给出错误的回答。对于GPT3.5来说,这种改进并不显著,因为在处理文本输入时,它经常产生除规则幻觉以外的错误。
由于Transformer的出现,使得ChatGPT等大语言模型在处理自然语言任务上的能力得到了大幅度提升。但生成的内容却包含大量错误或过时的信息,同时缺乏事实性评估体系,来验证内容的真伪。FRESHPROMPT对提升大语言模型的动态适应能力具有重要意义,这也是大语言模型未来技术研究的一个重要方向。