11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
相信大家都被GPT-4满分轻松拿下MIT本科数学考试的事儿给刷屏了。给先不知情的小伙伴们说一下,这次的测试是MIT、波士顿大学和康奈尔大学的研究团队共同根据MIT所有获得学位所需的数学、电气工程和计算机科学课程整理出来了4550个问题。关于GPT的相关研究和衍生风波,都还会持续再刮一阵子。
万万想不到啊,MIT数学考试,被GPT-4攻破了?!突然有人在最新论文工作中高调宣布:GPT-4在MIT的数学和EECS本科学位考试中,表现出的能力完全满足毕业要求。且妥妥地拿下满分!要知道,测出这个结果的不是别人,正是来自MIT和波士顿大学、康奈尔大学的研究团队。不仅比模型更大的LLaMA-65B高出近10个百分点,就连MITfine-tuing过后的LLaMA-30B要高。
2024QS世界大学学科排名出炉了!在计算机科学专业排名中,MIT、卡内基梅隆大学、斯坦福大学占领了世界前三席,中国大陆有8所高校进入百强,清华大学排名最高,并列第11。2024QS世界大学学科排名来了!总体和23年变化不大。国际研究网络国际研究网络指数反映了院校通过与其他高等教育机构建立可持续的研究合作关系,使其国际研究网络地域多样化的能力。
在当今人工智能时代,计算机可以通过扩散模型生成自己的“艺术”,逐步向嘈杂的初始状态添加结构,直到清晰的图像或视频出现。扩散模型突然变得异常受欢迎:输入几个词,即可体验现实与幻想交汇的梦幻景象。当前版本使用StableDiffusionv1.5作为教师模型,学生继承了一些限制,如渲染文本和小脸部的细节描绘,这表明更先进的教师模型可能进一步提升DMD生成的图像。
VisionPro又现火爆新玩法,这回还和具身智能联动了~就像这样,MIT小哥利用VisionPro的手部追踪功能,成功实现了对机器狗的实时控制。不仅开门这样的动作能精准get:也几乎没什么延时。作者本人也在论文中写道:最后,提醒一下,如果你想上手试一试这个开源项目,那么除了必备一台VisionPro之外需要准备:苹果开发者账户VisionPro开发者配件安装了Xcode的Mac电脑嗯,看样子还是得先让苹果赚一笔了。
MIT博士生利用VisionPro开源项目成功实现了对机器狗的实时训练。TrackingSteamer这一应用程序通过追踪人类动作,并将数据传输到其他机器人设备,为未来与机器人互动提供了新方式。虽然项目需要使用VisionPro设备和开发者配件,但这不影响人们对其开源项目的兴趣和关注,展现了对未来科技发展的热切期待。
TRON在麻省理工学院桑伯格会议中心举行的MIT金融科技大会上精彩亮相,并在该校成功举办开发者社区活动TRONBuilderTour,吸引了包括金融时报、美联社及费加罗报等在内的全球知名媒体高度关注。这一活动是TRON黑客松大赛第六季启动以来的首场,也预示着TRON将在全球范围内进一步扩大其开发者活动,以促进学术机构更广泛地了解和参与区块链技术。TRON拥有全球领先的USDTether稳定币流通量,自2021年4月以来超越以太坊,进一步巩固了其在区块链领域的领先地位。
MIT计算机科学与人工智能实验室的研究人员进行了一项有趣的研究,通过评估语言模型的视觉能力,揭示了纯文本模型训练视觉概念表征的新可能性。他们使用代码非图像进行渲染和表示,成功地教会语言模型生成和理解复杂的视觉概念。这为未来发展更强大的纯文本模型提供了启示,有望推动语言模型在视觉领域的更广泛应用。
【新智元导读】MIT计算机科学与人工智能实验室的一项研究发现:不用担心视觉AI会很快淘汰人类打工人,因为对于企业来说,它们实在是太贵了。人工智能会抢走我们的工作吗?如果你每天都看硅谷高管谈论着当今尖端的AI技术,可能会觉得答案是肯定的,并且会很快发生。AI对于就业和劳动力市场的影响,短时间内还很难达成共识。
MIT和Google的研究人员共同提出了一种名为Health-LLM的新型人工智能框架,旨在将大语言模型应用于健康预测任务,利用可穿戴传感器的数据。该框架的提出标志着健康领域在可穿戴技术和人工智能的交叉点上取得了重大突破。这为以更加可访问和可扩展的方式应用先进的医疗保健分析打开了新的可能性,从为个性化医疗的更广泛目标做出了贡献。
随着人工智能技术的飞速发展,人们对工作安全性的担忧也逐渐升温。麻省理工学院的一项新研究表明,目前部署这项技术的成本可能使得雇主更倾向于保留现有员工,至少在当前情况下是这样。尽管这项研究未考虑其他AI用途,如文本生成,但研究人员设想他们的框架可以用于研究计算机视觉以外的其他领域。
随着细菌不断进化以抵抗抗生素的影响,细菌感染的治疗变得更加具有挑战性。过度和滥用抗生素使“抗生素耐药”问题变得更加严重。根据MIT研究的主要合著者之一FelixWong的说法,该研究将帮助“打开黑匣子”,帮助其他研究人员了解深度学习模型的工作原理。
何恺明与MIT合作推出的自条件图像生成框架RCG在学术圈引起关注。这一框架成功填补了长期存在的有条件和无条件生成任务性能差距,取得了ImageNet-1K数据集上无条件图像生成的新SOTA成绩。何恺明与MIT的合作研究为无条件图像生成领域带来了新的突破,RCG框架的成功应用表明自条件图像生成模型具有巨大的潜力,可能预示着这一领域新时代的到来。
最新研究指出,经过过度训练,中度的Transformer模型能够展现出结构性泛化能力,这一现象被称为"结构顿悟"。在自然语言处理中,先前的研究认为像Transformer这样的神经序列模型在泛化到新的结构输入时难以有效地捕捉句子的层级结构。这一发现有望在未来的深度学习研究中引起更多关注,为模型设计和训练策略提供指导。
MIT和Adobe的研究人员最近提出了一种新颖的人工智能方法,称之为分布匹配蒸馏,该方法旨在将扩散模型转化为一步图像生成器,从显著提高图像生成的效率和质量。据称他们的一步生成器在生成逼真图像方面不仅与StableDiffusionv1.5相媲美速度更快30倍。这一研究为图像生成领域带来了崭新的可能性,通过创新的方法,使得生成模型在效率和质量方面都取得了显著提升。
LiquidAI,一家由MIT孵化的新兴公司,近日成功完成了一轮接近4千万美元的种子轮融资,其目标是构建一种全新类型的人工智能,被称为液态神经网络。这一创新性的技术基于液态神经网络架构,旨在提供更为精简、可解释且动态适应的人工智能系统。该公司希望通过商业化液态神经网络技术,竞争构建GPT模型的基础模型公司,致力于打造超越传统GPT的最佳新型Liquid基础模型。
MIT和Google的研究人员近期开发了一项名为StableRep的新技术,旨在利用由AI生成的图像来训练更加详细和高效的AI图像模型。这项技术被应用于开源文本到图像模型StableDiffusion,取得了一系列显著的成就。MIT和Google的这一研究成果代表着AI图像生成领域的一次创新,尽管存在一些缺陷,但其对于高质量图像的生成提供了新的方法和思路。
MIT的研究人员在力学和材料建模领域取得了重要突破,推出了一款名为MechGPT的语言模型。该模型不仅能够桥接各种尺度、学科和模态能够高效地从科学文本中提取关键信息。作为语言模型领域的先锋,MechGPT的出现标志着语言模型动态演变的里程碑,为知识提取开辟了新的领域。
欧洲工程院官方eae.edu.eu公布,BerntSchiele当选2023欧洲工程院院士。BerntSchiele是德国领先的计算机科学家,也是计算机视觉和感知计算方面的权威。他们需要积极参与欧洲工程院的各项活动和项目,为全球工程界的协作和创新做出贡献;他们需要积极参与欧洲工程院的各项报告和建议,为全球各界政府和社会提供科技智慧支持和政策指导;他们需要积极参与全球工程教育和人才培养,为培养下一代的工程师和科学家做出努力;他们需要积极参与国际交流和合作,为促进全球工程科技的发展和创新做出贡献。
清华大学、中国科学院、MIT的科研人员联合研究人员对于大语言模型在人机交互领域中的应用进行了研究,设计了一种名为Co-Pilot的人机交互框架。该研究首次尝试用语言模型作为辅助驾驶,以描述的方式来控制行动轨迹,同时能够符合用户的轨迹意图。这表明了Co-Pilot架构在自动驾驶人机交互领域具有良好的应用前景。
研究人员来自麻省理工学院、CohereforAI以及其他11个机构,他们共同发布了DataProvenancePlatform,旨在应对AI领域的数据透明危机。这一平台的推出旨在解决AI模型训练数据集的来源和使用透明度不足的问题,这是当前AI领域亟待解决的挑战之一。这一举措也将有助于减少AI模型中的潜在问题,如偏见、数据泄漏和法律风险,为AI技术的广泛应用提供更可靠的基础。
【新智元导读】MIT等学者的「世界模型」第二弹来了!这次,他们证明了LLM能够分清真话和假话通过「脑神经手术」,人类甚至还能给LLM打上思想钢印,改变它的信念。大语言模型是世界模型,又添新证据!前不久,MIT和东北大学的两位学者发现,在大语言模型内部有一个世界模型,能够理解空间和时间。下一步LLM还会给我们带来何种惊喜,实在令人期待。
最新研究发现,传统的提示工程在AI领域正逐渐被一种新型机器学习框架所替代,这一框架名为GATE。GATE允许大型模型主动向人类提问,以更好地理解用户的偏好,从不再依赖用户提供的提示信息。提示工程是否会消失,以及如何应对这一变化,仍有待进一步讨论和观察。
【新智元导读】大模型上下文从此不再受限!港中文贾佳亚团队联手MIT发布了全新超长文本扩展技术LongLoRA,只需2行代码,让LLM看小说,读论文,轻松拿捏。中途迷失、模型偷懒、上下文越长大模型越笨……体验过LLM的人,多少都会对文本输入长度带来的限制有所感触:实际上,这些都是典型的大语言模型对话缺陷。相距不过短短两个月,不得不说,这研究速度和能力跟LongLoRA一样惊人。
麻省理工学院的物理学家MaxTegmark教授发出警告,指出人工智能科技公司正处于一场“失控竞赛”,使得他们无法停下来考虑潜在的AI风险。他是未来生命研究所的共同创始人,于2023年3月组织了一封开放信,呼吁将巨大AI系统的开发暂停六个月。Tegmark警告称,描述数字“上帝般的通用智能”的发展为长期威胁可能不恰当,他援引了一些AI从业者认为这可能在几年内发生。
自动摘要技术取得了长足的进步,这主要归功于范式的转变——从在标注数据集上进行有监督微调转变为使用大语言模型进行零样本prompt,例如GPT-4。不需要额外的训练,细致的prompt就能实现对摘要长度、主题、风格等方面特征的精细控制。更多论文细节,可参考原论文。
来源:MITCEEPR,2023年6月作者:ChristianStoll,LenaKlaaßen,UlrichGallersdörfer,AlexanderNeumüller编译:WEEX交易所摘要关于比特币挖矿对气候的影响,学者和比特币支持者的观点大相径庭。我们验证了双方的论点,并为美国比特币挖矿的范围和能源来源提供了经验证据。透明度是教育比特币用户,让公众、监管机构和政策制定者了解与比特币挖矿相关的气候效益和成本的重要第一步。
有了3D-语言模型,去重庆导航也不在「话」下!大型语言模型和视觉语言模型在各种评测基准中都展现出了强大的性能,比如可以看图说话、进行常识推理。但这些模型的训练过程并没有引入3D物理世界,也就无法理解更丰富的现实概念,包括空间关系、布局、物体反馈等。还可以发现,以单视角图像或多视角图像作为输入,二维VLM的性能会比三维VLM下降很多,也就是说多视角�
自然语言编程,在Jupyter里就能直接完成了!这款由MIT华人博士生打造的插件,实现了编程工具与GPT-4的无缝衔接。加载好之后,只要「说」出自己想要的程序,就能得到代码并直接调试运行。在HCI领域,Shen也在研究人类与AI模型的交互方式。
麻省理工学院和微软的研究学者发现,GPT-4在自修复方面表现出了有效能力GPT-3.5则没有。GPT-4还能够对GPT-3.5生成的代码提供反馈。类似的能力在论文《ImprovingLanguageModelNegotiationwithSelf-PlayandIn-ContextLearningfromAIFeedback》中也有提及。