11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
一款名为Ameca的人形机器人现在可以说多种语言,这得益于ChatGPT的支持。Ameca的开发商Engineered+Arts发布了一段视频,展示了这款机器人说英语、日语、德语、中文和法语的能力。“行走对于机器人来说是一项艰巨的任务,尽管我们已经进行了研究,但我们还没有创造出完全的行走人形机器人。
一直以来,在线少儿用于教育平台GoGoKid始终依托教育学界前沿理论,对标北美教学体系,坚持打造全方位沉浸式英语学习环境。近日,更是宣布与蓝思Lexile达成战略合作,将GoGoKid原创英语教材中的阅读短文及自研绘本正式纳入蓝思分级体系,经过权威定级的内容为学员们带来更为量化、有效的阅读体验。据了解,蓝思分级阅读系统是美国MetaMetrics教育测评研究机构受美国国家卫生研究院(National Institute of Health)资助,历时十余?
翻译活动是人类社会最古老的交流行为之一。自古以来,世界上存在各种不同的语言,为了便不同语言人群之间的交流,翻译活动(包括口译和笔译)发挥了重要的作用。在社会发展的过程中,翻译行为在政治、经济、文化等方面均扮演了举足轻重的角色。
深度学习领域的研究人员发现,语言模型在逻辑推理方面的表现仍然是一个重要挑战。最新的一项由Google旗下的DeepMind进行的研究揭示了一个简单重要的发现:任务中前提的顺序显著影响语言模型的逻辑推理性能。通过这项研究,我们可以看到改变前提顺序可能是提升语言模型推理能力的一种简单有效的方法,也为未来改进这一领域的研究提供了新的方向。
谷歌最新研究提出SpatialVLM,旨在解决视觉语言模型缺乏空间推理能力的问题。视觉语言模型在理解目标在三维空间中位置或关系时存在困难,研究者通过借鉴人类空间推理能力的思路,提出了这一新方法。这一研究成果有望推动视觉语言模型在未来的发展方向上取得更大突破,为人工智能领域带来新的进步。
谷歌最新论文揭示的SpatialVLM,是一种具备空间推理能力的视觉语言模型,旨在解决当前视觉语言模型在空间推理方面的困难。视觉语言模型在图像描述、视觉问答等任务上取得显著进展,但在理解目标在三维空间中的位置或空间关系方面仍存在难题。这一研究为视觉语言模型的空间推理能力提供了新的思路,为未来在机器人、图像识别等领域的发展带来了新的可能性。
谷歌AI研究团队最近提出了SpatialVLM,这是一种旨在增强视觉语言模型空间推理能力的创新系统。尽管先进的模型如GPT-4V在人工智能驱动任务中取得了显著进展,但它们在空间推理方面仍存在显著局限。-SpatialVLM的开发标志着人工智能技术的重大进步。
在AAAI2024上,小红书搜索算法团队推出了一项创新框架,旨在解决大语言模型在推理任务中的黑盒属性和庞大参数量带来的问题。传统研究方法主要关注正样本这项工作强调了负样本在知识蒸馏中的价值。这一研究为提高大语言模型应用性能提供了新思路,通过引入负样本的知识,弥补了传统研究方法的不足,为推理任务的应用提供了更可靠和高效的解决方案。
2024年1月18日凌晨,三星在举办了GalaxyAI全球新品发布会,宣告GalaxyS24系列的登场,应用了谷歌Gemininano大模型共同迎接“GalaxyAI时代”的到来。除了这个模型,GalaxyS24的一些功能还受益于谷歌Imagen2模型,将文本到图像的能力植入手机。S24、S24的起售价为115.5万韩元、135.3万韩元Ultra版则以169.84万韩元起售。
【新智元导读】小模型的风潮,最近愈来愈盛,Mistral和微软分别有所动作。网友实测发现,Mistral-medium的代码能力竟然完胜了GPT-4所花成本还不到三分之一。甚至还可以通过不冗长的输出,来进一步节省成本。
在多模态大型语言模型领域取得显著进展的同时,尽管在输入端多模态理解方面取得了显著进展,但在多模态内容生成领域仍存在明显的空白。为填补这一空白,腾讯人工智能实验室与悉尼大学联手推出了GPT4Video,这是一个统一的多模态框架,赋予大型语言模型独特的视频理解和生成能力。其在多模态基准测试中表现出色进一步强调了其卓越性能。
中国的研究人员近期提出了一项名为ControlLLM的创新框架,旨在增强大型语言模型在处理复杂的现实任务时的表现。尽管LLMs在处理自主代理的规划、推理和决策方面已经取得了显著进展,但在某些情况下,由于用户提示不清晰、工具选择错误以及参数设置和调度不足,它们可能需要辅助工具。ControlLLM整合了各种信息源,以生成基于执行结果的全面有意义的回应。
联发科今晚正式发布天玑9300旗舰5G生成式AI移动芯片,支持在端侧生成式AI、游戏、影像等方面定义旗舰新体验。天玑9300集成MediaTek第七代AI处理器APU790,为生成式AI设计,其性能和能效得到显著提升,整数运算和浮点运算的性能是前一代的2倍,功耗降低了45%。MediaTek的AI开发平台NeuroPilot构建了丰富的AI生态,支持Android、MetaLIama2、百度文心一言大模型、百川智能百川大模型等前沿主流AI大模型,完整的工具链助力开发者在端侧快速且高效地部署多模态生成式AI应用,为用户提供文字、图像、音乐等终端侧生成式AI创新体验。
Meta的研究人员提出了一种名为检索增强双指令调优的新型人工智能方法,用于提升语言模型的知识检索能力。该方法试图解决大型语言模型在捕获较为冷门知识时的局限性以及大规模预训练的高计算成本问题。该研究证明了轻量级指令调优对检索增强语言模型的有效性,特别是在涉及大规模外部知识源的场景中。
随着大型语言模型的出现,人工智能和数学问题求解领域取得了显著进展。这些模型在面对复杂的数学挑战时仍然存在问题。对工具交互的优势和挑战进行的全面分析为未来的研究提供了重要见解,有望开发更先进和适应性更强的推理代理。
阿里云旗下魔搭社区宣布开源视觉语言模型Qwen-VL。Qwen-VL以通义千问70亿参数模型Qwen-7B为基座语言模型研发,支持图文输入,具备多模态信息理解能力。该模型的推理速度快,资源消耗相对较低。
TogetherAI发布了Llama-2-7B-32K-Instruct:一项在语言处理中扩展上下文的突破。这项创新具有重大意义,特别是在需要对复杂上下文细微差别有深刻理解的任务中。这一突破将为语言处理带来新的进展,架起了理解复杂上下文和生成相关回应之间的桥梁。
Meta的研究人员开发了一种名为"指令回译"的新技术,用于提高大语言模型的指令跟踪能力。该技术可对LLaMa等大型语言模型进行微调以遵循指令无需依赖昂贵的人工注释或从GPT-4等更强大的模型进行提炼。研究人员表示,他们计划通过考虑更大的未标记语料库来进一步扩展这一方法,从获得更好的效果。
文章要点:检索增强生成方法可以让语言模型访问最新的知识库,从提高模型在实际业务中的应用能力。RAG方法相比重新训练模型或微调模型更为便宜和容易实现,同时也避免了数据集准备的工作量。通过增加步骤数或添加记忆组件等方式,可以进一步改进模型的性能。
近期研究人员提出了一种名为LEVER的技术,通过学习验证生成的程序与执行结果来改善自然语言到代码的生成。LEVER使用自然语言描述、程序表面形式和执行结果的组合表示进行训练,以识别和拒绝错误的程序。LEVER的技术可以提高代码LLMs将自然语言描述转化为可执行代码的能力,有潜力改善数据库接口、机器人控制和虚拟助手等人工智能应用。
人工智能正在快速发展中。大模型可以使用工具、计划并通过标准化评估。这项研究展示了LLM在应用税法方面的潜力和发展趋势。
如果你只需要训练一个线性层,就能拿将纯视觉模型转变为具备语言理解能力的视觉语言模型,结果会怎样?有研究人员想到了这个办法。研究人员通过使用没有文本监督训练的现成视觉编码器来将文本映射到概念向量,以便直接比较单词和图像的表示。他们的简单方法在92%的测试中都取得了成功。
日本东北大学和日本东京工业大学等团队计划开发一种更强日语能力的“大语言模型”,作为生成式人工智能的基础技术。该团队将利用理化学研究所的超级计算机“富岳”学习大量数据,并将在本年度内逐步公开。富士通和理研也已加入团队,计划开发其他语言和项目的代码。
大语言模型已经彻底改变了自然语言处理+的研发现状。增加语言模型的规模能够为一系列下游+NLP+任务带来更好的任务效果,当模型规模足够大的时候,大语言模型会出现涌现现象,就是说突然具备了小模型不具备的很多能力。博士毕业于中科院软件所,主要的专业兴趣集中在自然语言处理及推荐搜索等方向,喜欢新技术并乐于做技术分享,著有《这就是搜索引擎》,《大数�
出海如今成为了很多企业的战略,国内卷不过,国外市场大有可为。产品想要出海,得先过语言关。谨以此言、与诸君共勉。
语言是人类信息传递最重要的媒介,让机器理解语言并进行交互是人工智能的基本挑战。近日,由中国计算机学会(CCF)和中国中文信息学会(CIPS)共同发起并联合主办的第四届语言与智能高峰论坛(The 3rd Language & Intelligence Summit)在北京语言大学梧桐会堂召开。 2019 语言与智能技术竞赛在本次论坛上进行了颁奖。百度技术委员会联席主席吴华博士受邀出席“ 2019 语言与智能技术竞赛”颁奖仪式并发表了竞赛总结演讲。2019 语言与智能
图片分享社交网站Pinterest在吸引消费者购物方面的能力远胜于Facebook,其成功秘诀在于充分利用图片本身魅力,而不是像Facebook一样拉拢与用户的关系。
4月初,三星宣布扩充GalaxyAI翻译功能支持的语种,在原有13种语言的基础上新增支持阿拉伯语、印度尼西亚语和俄语三个语种,以及澳大利亚英语、粤语和加拿大法语三种方言。包含这些更新的语言包已经正式开通下载,从4月26日开始,三星GalaxyS24系列、GalaxyS23系列、GalaxyS23FE、GalaxyZFlip5、GalaxyZFold5、GalaxyTabS9系列等机型[2]将可通过下载语言包支持对更多语言的翻译。2.部分功能的可用性可能因设备型号异。
Meta最近发布了LLama3,这是一款新的大型语言模型,用于实现更安全、更准确的生成式人工智能体验。除了LLM,Meta还推出了LlamaGuard2、CodeShield和CyberSecEval2等信任和安全工具,以帮助确保符合行业和用户安全期望。随着400亿参数显示出更高的准确性,可以推断出更高的AI硬件需求不会很快减少。
苹果公司正在开发自己的大型语言模型。这款模型将能够在设备上本地运行,从优先考虑速度和隐私保护。苹果更广泛的人工智能战略预计将在6月份的WWDC上与主要软件更新预览一起公布。