11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
StefanoRivera分享了利用AI工具制作交互式“MR木偶秀”。利用ChatGPT进行创意和内容策划。Stefano表示将很快发布该项目的详细工作流程,以供他人参考和学习。
北京时间9月22日,小米手机在北京召开了小米4c的媒体沟通会。作为小米4i在国内发售的兄弟机型,小米4c拥有与4i几乎相同的外观造型设计,但硬件搭配和功能却有更符合国内消费者口味的调整。该机售价为1299与1499元,并分为高、低硬件配置两个版本。配置高通骁龙808六核处理器、Type-C接口、五种颜色的类肤质后盖、全网通2.0、夏普/友达/LG所提供的5英寸的1080P显示屏。
MIT博士生利用VisionPro开源项目成功实现了对机器狗的实时训练。TrackingSteamer这一应用程序通过追踪人类动作,并将数据传输到其他机器人设备,为未来与机器人互动提供了新方式。虽然项目需要使用VisionPro设备和开发者配件,但这不影响人们对其开源项目的兴趣和关注,展现了对未来科技发展的热切期待。
谷歌Chrome浏览器今天推出了新的人工智能写作生成器,该工具可以帮助用户写各种文本内容,例如电子邮件、评论、文章等。该工具由Gemini驱动,Gemini是Google最新的人工智能模型之一。谷歌明确指出,这些信息“用于改进此功能,其中包括生成模型研究和机器学习技术”,其中包括人类参与的审查过程。
欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
近期AI社区掀起了一场关于Mistral-Medium模型的讨论,该模型意外泄露并与一个名为"Miqu"的新模型有关。Miqu在EQ-Bench基准上的表现引起关注,直接击败除GPT-4之外的所有大模型,得分接近Mistral-Medium。对于AI研究者来说,需要更多的信息和证据来解开这场引人注目的谜团。
马里兰大学与北卡教堂山合作发布了Mementos,这是专为多模态大语言模型设计的图像序列基准测试,旨在全面测试这些模型对于真实世界、机器人和动漫图像序列的推理能力。测试结果令人震惊,GPT-4V和Gemini等MLLM在漫画数据集上的准确率不足20%。这对于推动MLLM在图像领域的发展提出了挑战,并强调了进一步研究和优化的迫切性。
欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
谷歌旗下的DeepMind研究团队最近推出了名为AlphaGeometry的人工智能系统,该系统在解决几何奥林匹克问题方面表现出色,几乎可与人类金牌得主相媲美。这一成就代表着在大学预科数学困难领域中复杂自动推理能力的显著进步。AlphaGeometry的发布标志着在计算机程序领域中首次实现了比IMO平均候选程序更有效地证明欧几里得平面几何定理的突破,推动了数学竞赛顶峰推理的自动化�
欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
阿里云通义千问APP近日上线了一项名为“通义舞王”的免费功能,用户只需在APP内输入相应口令并上传照片,系统即可生成个性化的舞蹈视频。Meta发布生成式AI调试工具HawkEyeMeta发布了一款名为HawkEye的生成式AI调试工具,旨在解决机器学习模型在生产中面临的挑战。它能够帮助模型更好地理解和分析图像内容。
【新智元导读】谷歌放出的Gemini,在对标GPT的道路上似乎一直处于劣势,Gemini真的比GPT-4弱吗?最近,斯坦福和Meta的学者发文为Gemini正名。Gemini的推理能力,真的比GPT-4弱吗?此前,谷歌憋出的重磅复仇神器GeminiPro,被发现在常识推理任务中落后于OpenAI的GPT模型。这表明模型已经掌握了空间关系和物理后果,具备了类似人类认知的复杂视觉信息能力。
近日苹果公司切断了BeeperMini对iMessage的访问权限,这是一款允许Android用户向iPhone用户发送加密消息的应用程序。BeeperMini是Beeper公司的产品,它通过对iMessage进行逆向工程,使Android用户能够向iPhone用户发送加密的蓝色气泡消息。苹果方面尚未对终止访问做出任何解释。
最新研究指出,经过过度训练,中度的Transformer模型能够展现出结构性泛化能力,这一现象被称为"结构顿悟"。在自然语言处理中,先前的研究认为像Transformer这样的神经序列模型在泛化到新的结构输入时难以有效地捕捉句子的层级结构。这一发现有望在未来的深度学习研究中引起更多关注,为模型设计和训练策略提供指导。
谷歌推出多模态大模型Gemini1.0,具备处理文本、代码、音频、图像和视频等多种信息的能力,分为Ultra、Pro和Nano三种规模,性能超越领先模型,GeminiUltra在多任务语言理解中首次超越人类专家水平,计划明年初向开发者推出。苹果发布MLX模型框架苹果公司悄悄发布了MLX模型框架,表明可能加大在人工智能领域的投入,推动生成式人工智能应用程序的发展。与传统方法相比,FaceSt
在AMD周三的投资者活动上,最新的人工智能芯片——InstinctMI300X\">Meta、OpenAI和微软宣布,他们将使用AMD最新的人工智能芯片——InstinctMI300X。这是迄今为止科技公司寻找替代Nvidia昂贵图形处理器的最大迹象,Nvidia的这些处理器一直是创建和部署人工智能程序的关键。我们可以从中分得一杯羹。
随着游戏、电影和XR行业对3D模型需求的不断增加,Meshy作为一款由胡渊鸣创立的在线生成AI工具,迎合了市场对3D内容快速生成的需求。Meshy的创始人兼CEO胡渊鸣是计算机图形学知名学者,Meshy是他创立的独立新品牌。对于对3D内容设计感兴趣的用户,Meshy提供了加入Discord和注册WebApp的方式,分别能享受无限的免费生成机会和每天20个免费生成机会。
在最新的《自然》杂志上发表的一篇论文中,研究人员展示了一种名为「游戏学习者」的新算法,这一人工智能程序结合了引导式搜索、机器学习和博弈论,成功在多种棋盘游戏中取得胜利。这一成就标志着AI技术在策略游戏领域的又一重大进步。它不仅拥有坚实的理论基础能够随着计算资源的增加提高性能。
MIT的研究人员在力学和材料建模领域取得了重要突破,推出了一款名为MechGPT的语言模型。该模型不仅能够桥接各种尺度、学科和模态能够高效地从科学文本中提取关键信息。作为语言模型领域的先锋,MechGPT的出现标志着语言模型动态演变的里程碑,为知识提取开辟了新的领域。
一项重大漏洞使得ChatGPT3.5用户能够免费升级至GPT-4Plus,作者通过链接测试并确认漏洞实锤。不过目前该漏洞似乎已经被补上。项目地址:https://github.com/abi/screenshot-to-code多模态语言模型新基准AMBER评估和降低模型中的幻觉问题AMBER项目是为多模态语言模型设计的新基准,致力于评估和减少模型在生成文本、图像或音频等多模态数据时可能产生的幻觉问题,并提供开源库支持。
说起大语言模型所展示的令人印象深刻的能力,其中之一就是通过提供上下文中的样本,要求模型根据最终提供的输入生成一个响应,从实现少样本学习的能力。这一点依靠的是底层机器学习技术「Transformer模型」,并且它们也能在语言以外的领域执行上下文学习任务。更多研究细节,可参考原论文。
谷歌DeepMind的研究人员进行了实验,旨在探讨Transformer模型是否能够在超出预训练数据范围之外泛化出新的认知和能力。他们的研究发现,几乎不可能要求模型在超出预训练数据范围之外解决新问题。这对于机器学习和人工智能领域的研究和发展具有重要意义。
Transformer模型在自然语言处理和计算机视觉领域取得了巨大成功,但它的高成本、复杂性以及依赖于注意力机制和多层感知机等组件使得人们开始寻求替代方案。一篇题为《比Transformer更好,无Attention、MLPs的BERT、GPT反更强了》的文章介绍了一种名为MonarchMixer的全新模型架构,这个架构在序列长度和模型维度上都表现出次二次复杂度的特点,同时在现代硬件加速器上具有出色的�
Meta的AI首席研究员YannLeCun近日警告称,对AI的过早监管可能会加强科技巨头的主导地位,抑制创新竞争。AI研究和开发的监管可能会适得其反,因为在AI安全的幌子下,可能导致“监管被掌握”。他认为当前的AI被高估了,但也相信未来更强大的AI系统将有助于解决气候变化和疾病控制等重大挑战。
Adobe公司今日宣布推出PhotoshopElements2024版和PremiereElements2024版,展示了众多新的人工智能工具,将进一步提高照片和视频编辑平台的生产力。Adobe的最新AI功能得到了公司新推出的SenseiAI平台的支持。PhotoshopElements2024版和PremiereElements2024版均可在Adobe官网在线商店购买。
GoogleDeepMind与33家其他研究机构合作推出了一个令人瞩目的新项目,旨在解决机器人领域的一个重大挑战:为每个机器人、任务和环境训练机器学习模型所需的巨大工作量。这个项目的目标是创建一个通用型AI系统,能够与不同类型的物理机器人协同工作,并执行多种任务。机器人领域的未来在于使机器人能够相互学习,让研究人员互相学习。
Transformer架构已经在现代机器学习领域得到了广泛的应用。注意力是transformer的一大核心组件,其中包含了一个softmax,作用是产生token的一个概率分布。对于使用ReLU的S/8模型,这种门控机制会将实验所需的核心时间增多大约9.3%。
在诸多国产手机厂商中,主攻非洲市场,被称为非洲之王”的传音,绝对是其中最特殊的一个。近日,根据91Mobile消息,传音计划在手机业务之外,开始乏力桌面市场,推出迷你主机MegaMini”。尚不清楚MegaMini的其他详细规格,以及最终的售价和发售日期。
杀疯了!Meta开源史上最强代码工具CodeLlamaMeta宣布推出CodeLlama,这是一款用于辅助编写计算机代码的AI模型,旨在与微软的代码编写工具GitHubCopilot进行竞争。CodeLlama可以根据文本提示来生成代码,支持代码补全和调试。第二批XiaomiMIXFold2XiaomiMIX4Xiaomi11系列XiaomiCivi系列RedmiK40系列RedmiNote12系列RedmiNote11系列奇安信发布奇安信大模型Q-GPT可降低数据安全风险奇安信集团发布了Q-GPT安全机�
欢迎来到站长之家的[每周AI大事件],这里记录了过去一周值得关注的AI领域热点内容,帮助大家更好地了解人工智能领域的动态和发展风向。