首页 > 业界 > 关键词  > 大模型最新资讯  > 正文

AI大佬齐聚国际顶会KDD 2024,中国队刷脸!大模型教育应用分析论文被录用

2024-09-18 14:10 · 稿源: 新智元公众号

声明:本文来自于微信公众号 新智元,作者:新智元,授权站长之家转载发布。

【新智元导读】AI时代下,智适应教育成为全新的范式。在刚刚结束的KDD2024大会上,国内一家前沿教育企业登上这个国际舞台,向所有人分享了真正个性化学习应该有的样子。

进入开学季,一个词儿也跟着爆火——「无痛学习」。

图片

如今,AI已经以前所未见的速度,迅速融入大学生的学习和生活,越来越多人开始体会到,从「有痛学习」变成「无痛学习」是什么感受。

AI改变的,仅仅是高校生吗?当然不是。

最近一个新闻曝出,眼看着要开学,成都的一位小孩哥,用AI量产手抄报,疯狂赶暑假作业。

图片

无论你的态度是拥抱还是迟疑,无可否认的是,如今AI已经在深刻影响着教育领域。从小学生到大学生,无一能逃过这场大潮。

AI的特性,为何能跟教育融合得如此恰当呢?

原因就在于,教育应该是千人千面的,但老师却不可能无时无刻地关注到每一个学生,而AI,则完全打破了现实中的桎梏。

而且,得益于LLM、AIGC等前沿技术实现,传统的自适应教育已经逐渐进化为更加智能化的「智适应」学习。

在国外,一些代表性教育机构看准契机,纷纷在智适应教育中布局。

比如,Duolingo Max采用了角色扮演技术,让学生可以通过模拟情景与AI进行对话。

图片

Khanmigo利用个性化LLM对话的形式平台,通过不断提问的方式,帮助学生构建知识,提供个性化教学,最终答疑解惑。

图片

不会直接告诉学生答案,而是一步步引导

吴恩达的Coursera以开放式在线课程为基础,提供的是在线智适应学习课程和混合学习的模式。

显而易见,智适应教育方式,正在成为AI教育领域界的共识。

恰巧,在刚刚结束不久的ACM KDD2024上,闭幕式的重磅圆桌讨论环节,聚焦的正是GenAI+教育。

图片

席间,圣母大学教授、AAAS/AAAI/ACM/IEEE Fellow Nitesh Chawla,明尼苏达大学教授、IEEE Fellow George Karypis、松鼠Ai联合创始人梁静博士,美国东北大学教授、ACM/IEEE Fellow Ricardo Baeza-Yates四人,一起在台上探讨了生成式AI的未来方向,以及潜在的创新应用。

不仅如此,松鼠Ai研发团队在KDD主会上,发表了一篇关于LLM,尤其是教育大模型,在时间序列分析中应用的论文。

他们还组织了Workshop,并在GenAI Day上发表了主题演讲。

众所周知,作为全球数据挖掘领域历史最悠久、规模最大的国际顶会,也是国内评级的A类学术会议,KDD每年都会吸引数千名来自世界各地的顶尖学者、企业代表参会。

而在这样的国际顶会上,鲜有企业能够参与到学术论坛的讨论当中。可见,这次被大会邀请前来做客同时还在会上发布论文的松鼠Ai,在AI教育领域是有真才实学的。

那么问题来了,这些大佬,对当前AI发展是怎么看的?

真正AI个性化学习,是什么样子

很多年前,AI还没有像现在这么流行,当时公司经受了许多怀疑——为什么要在教育中使用AI?能用它做什么?

答案是,学生提供真正个性化的学习平台和内容。

如今,所有人都在思考,如何用生成式AI来帮助我们。

如果只是想利用这些工具快速赚钱,在短时间内迅速成立公司的话,这种心态其实是非常危险的。

但如果我们能以智慧的方式利用这项技术,比如用它进行数据分析,帮助学生更好地学习,而非快速生成内容,则是一个很有意义的机会。

目前来说,我们正处于从一个阶段向另一个阶段的过渡中,走向了人与机器互动。

当我们开始通过语言和多模态能力进行互动,就已经开始进入机器人工业革命。

与之对比鲜明的是,我们才刚刚从传统教育中走出来。

即使我们已经拥有了AI技术,有了MOOC,有了在线教育和远程学习,有了语音或语义识别,它仍然是传统的学习方式。

因为,它不是真正个性化的。

什么是真正的个性化学习?很多人以为在ChatGPT上输入一个问题、得到答案就是个性化学习,其实并不然。

对此梁静表示,关于个性化学习,大部分使用者甚至很多公司还都不真正了解,所以我们还需要很长的时间来展示什么是真正的人性化学习、智适应教育技术,让人们理解、体验、犯错、再体验...。

而下一步,就将是AI、个性化学习与智适应、多模态、大模型能力的结合。

基于AI的「智适应教育」,不仅可以让学生获得更高的分数,还可以让学生在相同的教学时间里培养更多能力。

想象一下,在同样空间中,不同年龄的学生们围坐一周,而桌子中心没有老师。

有时,需要共同完成小组作业;有时,需要合力开脑洞攻克难题。学生们仅通过互联的设备,自主学习。

老师,变身成为了助教、数据分析师、情感鼓励及引导的育人的导师。

这,就是智适应大模型未来应该有的样子,也是教育行业的未来。

生成式AI,在教育领域大放异彩

如今的K12教育中,存在着不少弊端,这已经成为大多数人的共识。

而当我们进入技术大爆炸的新时代,学校和家长希望孩子接受的,无疑是更智能化、个性化的教育。

生成式AI,是否有可能在教育领域探索出更多创新的应用场景?

如果能做到这一点,未来的教育方式将彻底改变,给广大学生和教育工作者带来前所未有的价值。

恰巧,生成式AI的特点,和K12教育领域的应用场景是天然契合的。

教育LLM通用标准:个性化学习

那么,在GenAI(生成式人工智能)赋能教育中,是否有个通用的衡量标准?而这个标准应该是什么?

2022年,谷歌曾发布的一份报告中,提到了未来教育的三大趋势,其中之一便是「个性化学习」智适应。

图片

报告地址:https://edu.google.com/future-of-education/

个性化学习,就是学生自主干预学习,不能有外力干扰,这对于能力培养至关重要。

在这个过程中,他们会与同伴合作,也会向老师请教问题。

另一份来自2021年EY报告中,如同自动驾驶一样,根据智能化程度高低,将教育分划分为L0-L5六个等级。

L0很好理解,是指传统真人教学,完全没有使用自动化工具。

L1典型代表是,直播课、录播课。拍照搜题等辅助工具,代表着L2。

L3-L5,AI完全切入教学环节,将教学全流程数据打通,提供千人千面的教学体验。

L5完全是由AI教学,意味着学生仅使用AI系统就能学习,不需要任何外部资源,其中典型代表是松鼠Ai。

图片

来源:安永中国智适应学习行业白皮书

如何实现L5「完全智适应教育」

具体在K12领域,已经深耕了十年之久的松鼠Ai发现,生成式AI能够通过分析学生的学习数据,动态地调整学习内容和难度。

这样,就可以为每个学生提供最合适的学习路径。

因为这种教学方式是基于数据驱动的,它不仅能提高学习效率,还能有效填补学生的知识空白,促进学生的全面发展。

那么,生成式AI是如何增强学生的学习效果的?

以下例子,为我们精准展示了它的强大。

-知识点分解

真正的掌握学习技能,必然是能吃透体系中的每个知识点,做到融会贯通。

松鼠Ai恰恰能通过苏格拉底式的引导性提问,激发学生主动思考,深化理解,打造出更为高效、人性化的学习环境。

如何做到的?

这是因为,基于松鼠Ai独有的、所积累的2400万学生的100亿学习行为全流程数据,大模型被「喂养」后,在推荐算法、深度知识追踪等技术上都实现了突破式迭代。

由此,模型能更好地捕捉数据中的复杂关系和模式,更快速发现知识点和知识点之间,知识点和题目之间,题目和孩子能力之间的关系。

这样,它就能更高效地绘制学生的学习画像,提供针对性的个性化服务。

-错误分析

松鼠Ai的新版多模态智适应大模型,引入了草稿纸内容智能分析功能。

通过这个功能,它能深度解析学生解题过程的每一步,精准定位题目理解、逻辑推理、计算及手写誊抄等各类错误。

这样,就能确保学生和教师迅速、精准地把握问题所在,从而针对性地补足自己的弱点。

这背后,得益于新版本多模态大模型在常规测评效率与准确性上的飞跃,尤其是在主观题评分上。

比如这个案例中,它精准地给出了分数,详细解析了扣分点,实现了对学生学习成效的全面洞察。

-人机交互

在智能人机交互上,全新的多模态智适应大模型也达到了全新高度。

它支持文字与语音的互动模式,覆盖了100+互动对话场景。

更贴心的是,它具备高精度的情绪识别能力。

因此,如果学生在这个过程中出现困惑、开心、注意力分散等情绪变化,模型都能准确捕捉到,用时即时地给予个性化反馈与鼓励。

而且,为了营造更全面且沉浸式的视听学习体验,松鼠Ai还对智能扫读笔与耳机进行了升级革新,致力于构建一个完善的智适应学习生态系统。

其中颠覆传统的旗舰之作——智能老师S211白鹭,采用了独特的数字纸张技术,提供原彩、彩墨、水墨三种显示模式,配合高清摄像头,可实时捕捉学习细节。

在用户体验和健康关怀上,都在行业内设立了全新标杆。

智适应多模态智适应大模型LAM

那么,松鼠Ai提出的这个智适应多模态大模型——LAM,其背后的运作机制是怎样的?

图片

具体来说,模型架构一共包含了三大关键组件:知识图谱、推荐系统,和检索增强生成(RAG)。

推荐系统中有不同的规划和智能体,包括短期路径规划、长期路径规划。

其他组件还有,情感解析、路径追溯(不同的学生都有自己的学习路径)、大模型反馈和总结。

此外,AI系统还包含了家长目标、学生画像两个重要的部分。

图片

在智能体架构中,整个智能体被称为「智适应智能体」。

该体系下面包含了不同的智能体,比如数据分析智能体、自动教学智能体(teaching autonomous driving agent)、教学问答智能体、推理智能体、阅读综合理解智能体等等。

不仅如此,针对不同学科,还有不同学科的智能体,比如物理、英语、科学等。

这么多智能体,并得是独立的存在,而是通过协作,与学生互动,为其提供个性化学习内容的推荐。

图片

为了让多智能体有效协作,研究团队还为此提供了环境支持。

他们将智适应引擎,设置为三层。

第一层是目标、学习地图、内容地图、错因分析本体。

当AI系统为不同学生设定目标后,并非是一个「死目标」。

它会根据们的学习速度、进度,以及数据分析,动态调整目标,为其做出更合理的推荐。

此外,错误分析本体,针对学生犯错,能够提供有针对性的分析。

图片

第二层是学习记录。

这里,AI系统会记录下所有学生的学习资料,并对其进行评估。

第三层,是通过交互来实现的。

学生与AI交互过程中,实时数据便会反馈到智适应引擎中,然后交由AI计算分析。

最后,AI系统根据学生下一步学习内容,给出新的推荐,可能是知识,也可能是能力MCM,还有可能是一些实践。

除了以上提到的架构,松鼠Ai的引擎中,还融入了其他一些非常重要的技术。

第一个,便是世界首个「全学科微颗粒知识图谱」。

全世界的国家中,每个年级每个学科都有不同的学习目标。

松鼠Ai研究团队所做的,便是将这些学习目标,分解成更加细致精确的层面,以便算法构建。

举个例子,一个关于「分数加法和减法」的目标,可以被分解为第二层(分数的加法、分数的减法、简单分数计算、多步分数计算等的学习目标)。

从第二层,还可以分解出第三层更加精细的学习目标,如下图所示。

最终,一个学习目标,能够到达的最底层是「第九层」。

图片

同时,松鼠Ai智适应大模型还有一个预测引擎。

它可能会根据学生在10个小时学习内容,预测将要完成100个学习目标。

而且,随着学习进度的变化,预测也会改变。

另外,还有一个推荐引擎,如上所述,在智能体第一层中,目标会动态改变。

如下图所示中,是一张根源问题追溯系统。

最高十年级,最低七年级为例,由下而上,绿色线是指学生已掌握的学习目标、知识、能力。

假设一个学生正在上十年级,遇到了一些无法理解的知识。

这时,AI系统就会根据题目追根溯源,建议学生重新温习七年级学习课程。

在确保他掌握绊住脚的学习目标后,AI才会继续推进学习进程。

图片

再来看一个例子,有三个学生对于学习目标的掌握情况,均是80%。

可以看到,每个同学掌握程度虽相同,但另外20%粉红色知识点掌握分布有所不同。

这说明了,尽管他们达到了相似的掌握水平,却有着各自的优点和弱点。

这也是,为什么需要打造一个问题追溯系统的原因。

图片

图片

图片

左右滑动查看

此外,智适应大模型还包含了MCM系统,它代表了思考方式、能力、方法论。

为什么学生需要接受MCM训练?这是因为,不同的行业、不同的职业,需要不同的MCM。

可以从不同学科来看,语言、物理、数学等,它们对学生所具备的能力素养,有着不同的要求。

图片

经过详细的剖解,可以看出,松鼠Ai的多模态智适应大模型LAM与LLM有着很大的不同。

当我们使用ChatGPT等模型时,通过提问得到回答,还有历史纪录。

而当你下一次进入这个平台时,它不会给出推荐,并且不会理解个人之前的学习行为,以及整体掌握知识的程度。

这也是,智适应大模型为什么存在的原因。

它不仅有学习者的历史记录,不同的学习行为,还能为学生推荐下一步应该学习的内容。

并且,它还会提供非常详细的成绩单和数据,为未来学习规划提供建议。

图片

模型持续迭代升级

在多模态智适应大模型中,松鼠Ai研发团队在这次KDD大会上,提出了全新算法——时间序列分析。

在题为《Foundation Models for Time Series Analysis: A Tutorial and Survey》论文中,他们系统性地探讨了大模型在时间序列分析中的应用。

图片

论文地址:https://arxiv.org/pdf/2403.14735

具体来说,论文分析了大模型在教育的应用,包括在教育时序数据分析中的应用。时间序列分析在教育场景中的应用日益广泛,例如,通过分析学生的行为数据、测试成绩和学习习惯,可以预测学生的学习进度,优化教学策略。

时序Generative AI通过在大规模教育数据集上进行预训练,能够更好地捕捉复杂的时间依赖性和非线性关系,从而在多个教育场景中实现最优的预测和分类效果。

文章也提供了多种未来可能的研究方向,例如结合多模态数据(如文本、图像、语音)进一步提升模型的泛化能力,以及如何通过自监督学习技术减少对标注数据的依赖。

这些研究不仅有助于提升时间序列分析的准确性和效率,还为个性化教育和智适应教育提供了坚实的技术基础。

图片

松鼠Ai能在本次KDD大会上与世界各地的顶尖学者你来我往,可以体现出松鼠Ai在商业之外所拥有的包括学术、科研等综合硬实力。

同时,我们也期待在AI时代全面来临的当下,可以看到更多中国企业出现在这样的顶级峰会上。

AI,接近最理想的教育场景

著名教育家苏霍姆林斯基说过——

「从我手里经过的学生成千上万,奇怪的是,留给我印象最深的并不是无可挑剔的模范生,而是别具特点、与众不同的孩子。」

在AI落地教育的种种场景里,我们可以惊喜地发现,「每个孩子人手一个导师」的理想设定,已经无比接近现实。

或许,这就是现阶段AI对于人类最深远的意义之一。

AI老师给予孩子们的,不是一些零碎知识,而是几把钥匙。

到那时,每个学生在毕业时,带走的不仅仅我一些知识和技能,而是带走渴求知识的火花,并使它终生不熄地燃烧下去。

举报

  • 相关推荐
  • 大家在看
  • Graphite Reviewer:AI代码审查伴侣

    Graphite Reviewer是一个AI代码审查工具,它通过即时反馈帮助团队提高代码审查的效率和质量。该工具利用代码库感知AI,自动检测代码中的bug和错误,使团队能够专注于构建而不是审查。它支持自定义规则,保证代码质量和一致性,同时确保代码的私密性和安全性。Graphite Reviewer的主要优点包括快速合并PR、强化质量和一致性、保持代码私密和安全、捕捉常见错误等。

  • Character SDK:构建可实时互动的AI角色

    Character SDK是一个能够创建AI角色的平台,这些角色可以实时听、说、看,甚至采取行动。它通过实时语音和视觉识别、高级OCR处理、多语言交流、自适应推理和基于意图的任务自动化等技术,帮助企业提高效率,减少成本,并提供个性化的用户体验。

  • Temperstack:一站式SRE平台,提升服务可靠性。

    Temperstack是一个企业级的主动式SRE平台,旨在减少SRE的重复劳动,提高服务的可靠性。它通过自动化服务目录、警报审计和跨您的监控工具的SLI报告,为从CTO到SRE工程师的团队提供可见性、主动发现问题并促进协作。Temperstack集成了流行的监控工具,提供统一的命令界面,以实现全面的SRE可见性和行动。

  • o1-engineer:命令行工具,提升开发效率

    o1-engineer 是一个命令行工具,旨在帮助开发者通过 OpenAI 的 API 高效地管理和交互项目。它提供了代码生成、文件编辑、项目规划等功能,以简化开发工作流程。

  • Canvas:与ChatGPT协作的新方式

    Canvas是OpenAI推出的一个新界面,旨在通过与ChatGPT的协作来改进写作和编码项目。它允许用户在一个单独的窗口中与ChatGPT一起工作,超越了简单的聊天界面。Canvas利用GPT-4o模型,能够更好地理解用户的上下文,并提供内联反馈和建议。它支持直接编辑文本或代码,并提供快捷操作菜单,帮助用户调整写作长度、调试代码等。Canvas还支持版本回溯,帮助用户管理项目的不同版本。

  • Text Behind Image:轻松创建文字背景图片设计。

    Text Behind Image 是一个开源的设计工具,允许用户轻松创建文字背景图片设计。它提供了一个简洁的界面,让用户可以自由地在图片上添加文字,创造出独特的视觉效果。这个工具对于设计师、社交媒体运营者和内容创作者来说非常有用,因为它可以快速生成具有吸引力的视觉内容。

  • torchao:PyTorch原生量化和稀疏性训练与推理库

    torchao是PyTorch的一个库,专注于自定义数据类型和优化,支持量化和稀疏化权重、梯度、优化器和激活函数,用于推理和训练。它与torch.compile()和FSDP2兼容,能够为大多数PyTorch模型提供加速。torchao旨在通过量化感知训练(QAT)和后训练量化(PTQ)等技术,提高模型的推理速度和内存效率,同时尽量减小精度损失。

  • LFMs:新一代生成式AI模型

    Liquid Foundation Models (LFMs) 是一系列新型的生成式AI模型,它们在各种规模上都达到了最先进的性能,同时保持了更小的内存占用和更高效的推理效率。LFMs 利用动态系统理论、信号处理和数值线性代数的计算单元,可以处理包括视频、音频、文本、时间序列和信号在内的任何类型的序列数据。这些模型是通用的AI模型,旨在处理大规模的序列多模态数据,实现高级推理,并做出可靠的决策。

  • NVLM-D-72B:前沿的多模态大型语言模型

    NVLM-D-72B是NVIDIA推出的一款多模态大型语言模型,专注于视觉-语言任务,并且通过多模态训练提升了文本性能。该模型在视觉-语言基准测试中取得了与业界领先模型相媲美的成绩。

  • gradio-bot:将Hugging Face Space或Gradio应用转化为Discord机器人

    gradio-bot是一个可以将Hugging Face Space或Gradio应用转化为Discord机器人的工具。它允许开发者通过简单的命令行操作,将现有的机器学习模型或应用快速部署到Discord平台上,实现自动化交互。这不仅提高了应用的可达性,还为开发者提供了一个与用户直接交互的新渠道。

  • AI-Powered Meeting Summarizer:会议语音转文本并自动生成摘要的AI工具

    AI-Powered Meeting Summarizer是一个基于Gradio的网站应用,能够将会议录音转换为文本,并使用whisper.cpp进行音频到文本的转换,以及Ollama服务器进行文本摘要。该工具非常适合快速提取会议中的关键点、决策和行动项目。

  • VARAG:视觉增强的检索与生成系统

    VARAG是一个支持多种检索技术的系统,优化了文本、图像和多模态文档检索的不同用例。它通过将文档页面作为图像嵌入,简化了传统的检索流程,并使用先进的视觉语言模型进行编码,提高了检索的准确性和效率。VARAG的主要优点在于它能够处理复杂的视觉和文本内容,为文档检索提供强大的支持。

  • JoyHallo:数字人模型,支持生成普通话视频

    JoyHallo是一个数字人模型,专为普通话视频生成而设计。它通过收集来自京东健康国际有限公司员工的29小时普通话视频,创建了jdh-Hallo数据集。该数据集覆盖了不同年龄和说话风格,包括对话和专业医疗话题。JoyHallo模型采用中国wav2vec2模型进行音频特征嵌入,并提出了一种半解耦结构来捕捉唇部、表情和姿态特征之间的相互关系,提高了信息利用效率,并加快了推理速度14.3%。此外,JoyHallo在生成英语视频方面也表现出色,展现了卓越的跨语言生成能力。

  • PhysGen:基于物理的图像到视频生成技术

    PhysGen是一个创新的图像到视频生成方法,它能够将单张图片和输入条件(例如,对图片中物体施加的力和扭矩)转换成现实、物理上合理且时间上连贯的视频。该技术通过将基于模型的物理模拟与数据驱动的视频生成过程相结合,实现了在图像空间中的动态模拟。PhysGen的主要优点包括生成的视频在物理和外观上都显得逼真,并且可以精确控制,通过定量比较和全面的用户研究,展示了其在现有数据驱动的图像到视频生成工作中的优越性。

  • Whisper large-v3-turbo:高效自动语音识别模型

    Whisper large-v3-turbo是OpenAI提出的一种先进的自动语音识别(ASR)和语音翻译模型。它在超过500万小时的标记数据上进行训练,能够在零样本设置中泛化到许多数据集和领域。该模型是Whisper large-v3的微调版本,解码层从32减少到4,以提高速度,但可能会略微降低质量。

  • Realtime API:低延迟的实时语音交互API

    Realtime API 是 OpenAI 推出的一款低延迟语音交互API,它允许开发者在应用程序中构建快速的语音到语音体验。该API支持自然语音到语音对话,并可处理中断,类似于ChatGPT的高级语音模式。它通过WebSocket连接,支持功能调用,使得语音助手能够响应用户请求,触发动作或引入新上下文。该API的推出,意味着开发者不再需要组合多个模型来构建语音体验,而是可以通过单一API调用实现自然对话体验。

  • Saylo AI:探索无限的AI角色扮演游戏。

    Saylo AI是一个AI角色扮演游戏,让你与AI角色互动,探索多样化的戏剧性故事。它利用人工智能技术,提供沉浸式的互动体验,让玩家在虚拟世界中与AI朋友交流,体验不同的故事情节。Saylo AI的背景信息展示了其创新性和娱乐性,旨在为玩家提供一种全新的娱乐方式。目前产品处于推广阶段,价格未明确标注。

  • twinny:Visual Studio Code的免费且私密的AI扩展

    twinny是一个为Visual Studio Code用户设计的AI扩展,旨在提供个性化的编程辅助,提高开发效率。它通过集成先进的AI技术,帮助开发者在编码过程中快速解决问题,优化代码,并提供智能提示。twinny的背景是响应开发者对于更加智能和自动化编程工具的需求,它通过简化开发流程,减少重复劳动,从而让开发者能够专注于更有创造性的工作。

  • Buildpad:构建人们真正想要的产品

    Buildpad 是一个旨在帮助创始人从概念到成功最小可行产品(MVP)的在线平台。它通过提供智能验证工具、AI引导的开发流程、进度跟踪以及个性化的项目见解,帮助用户构建能够获得市场认可的产品。Buildpad 的主要优点包括简化产品开发流程、提高产品成功率、以及提供个性化的指导和支持。

  • Novela:AI时代的技能学习平台

    Novela是一个专注于AI时代技能学习的在线平台,提供早期访问服务,用户可以免费试用。它旨在帮助用户掌握AI相关的技能,以适应未来职场的需求。

今日大家都在搜的词: