首页 > 传媒 > 关键词  > 科学智能最新资讯  > 正文

1.2万选手共赴“AI爱因斯坦”之约,第二届世界科学智能大赛初赛结束、复赛开启

2024-08-29 20:23 · 稿源: 站长之家用户

8月29日,由上海科学智能研究院(简称上智院)与复旦大学联合主办的第二届世界科学智能大赛进入复赛阶段,472名选手从12687位报名者中脱颖而出,开始下轮角逐。

图:上智院·天池平台是本届官方比赛平台

世界科学智能大赛始创于2023年,旨在吸引全球智能人才共同探索科学智能(AI for Science)领域的新课题、新方法。今年的大赛是第二届,参赛选手来自24个国家和地区的1085个机构,包括高校、科研机构、企业等。阿里云作为协办单位,与上智院联合开发了上智院·天池平台,通过融合双方的科学智能生态优势和竞赛管理经验,为选手提供更聚焦于AI for Science领域的参赛体验。

本届大赛秉持“AI赋能千行百业”的理念,设置了生命科学、地球科学、物质科学、社会科学以及逻辑推理五大赛道,赛题设计更贴近实际场景,鼓励选手将所学知识运用到产业一线。其中,社会科学和逻辑推理为新增赛道,意在通过多学科融合,充分发掘大模型在不同领域的应用潜力,培育科学智能的创新萌芽。

AI人才共赴“擂台”,高中少年团表现抢眼

相比去年,今年的参赛人数增加了1000多,提交作品数量更是增加了180%。参赛选手和队伍背景多元,既有深耕行业多年的AI大牛,也有仍在求学阶段的学生,甚至还有来自华师大二附中、七宝中学、松江二中等14所先进高中的21名高中生选手。

第二次参赛的“拉马努铁”团队,来自上海交通大学专注于AI for Science的学生组织思源学社。他们去年没能走到最后,本届大赛“卷土重来”,成功晋级生命科学赛道复赛。“拉马努铁”表示:“通过这次比赛,我们深入理解了AI for science的意义,能创造新的价值,造福更多人”。

逻辑推理赛道的“刚刚好”团队,成员主要来自于跨境电商平台Shopee和华东师范大学,既有经验丰富的竞赛“老手”,也有大模型行业一线从业者。成员各司其职,分别负责理论框架、模型应用和工程实现,快速迭代出了一套解决方案,取得了不错的初赛成绩。他们认为,大赛经验能为产业问题提供一些具体指导,加速从技术到应用的落地。

图:“ETO统一阵线”的4名成员合影

“ETO统一阵线”是“高中少年团”的代表,4名成员分别来自松江二中、松江一中、曹杨二中、民办平和学校。他们平时热衷探索科学和计算机技术,不乏信息学竞赛高手,是同龄人中的科技佼佼者。初赛过程中,成员们先各自“分头”探索,发现好的成果后,再沿着统一方向进行深化改造,并巧妙运用了大模型的代码生成,既用AI给过程增效,也用AI赋能结果,实现了有效的协作和高质的交付,取得了社会科学赛道排名13的亮眼成绩。

创造优质赛事体验,助力复合人才培养

本届大赛评委会主席、上智院院长、复旦大学浩清特聘教授漆远表示:“通用人工智能的比较高体现之一就是理解复杂世界、发现未知规律。简单地说,就是打造AI爱因斯坦。这也是AI for Science的关键目标”。

“以学促练,以练助学”,选手们的参赛表现,彰显了大赛在激发科研兴趣、培育年轻学者方面的价值。科学智能生态的发展,既离不开打通专业知识的壁垒,也离不开技术信仰的代代相传,呼唤着更多学科交叉、产研双精的复合型人才。

图:大赛组委会走进校园

为了给参赛者创造良好体验,初赛期间,大赛组委会走进浙江大学、上海交通大学等高校,与师生们深度交流 AI for Science的发展历程和前景。大赛官方针对五大赛道打造了定制化的学习方案,以由浅入深的学习攻略,形成“练、学、比”一体的赛事生态,鼓励参赛选手勇创佳绩。

当前,初赛已于21日结束,选手们正在紧锣密鼓准备8月29日至9月24日的复赛,并将在10月的决赛决出优胜队伍。社会科学和逻辑推理是本届大赛在首届基础上新增的两大赛道,其中社会科学赛道的题目为“市场博弈和价格预测”,对电力市场中主体博弈产生的结算价格的预测具有重要的理论和现实意义。正如上智院理事长、复旦大学大数据学院副院长吴力波教授所言,能源转型与可持续发展有赖于以电力部门为代表的多主体参与,可借助AI技术挖掘市场博弈逻辑和预测市场出清价格,提升能源保障体系的稳定,助力电力行业健康、良序发展。而围绕大模型的智能化潜力,逻辑推理赛道以“复杂推理能力评估”为题,聚焦于AI逻辑推理对自然语言的分析和理解,为金融、医疗、教育等更多场景提供技术手段和创新思路。

作为官方比赛和社区平台,上智院·天池平台通过提供赛题数据、参赛环境、结果评选等服务,助力大赛推进。平台还将联合高校、科研机构及企业持续运营,打造AI for Science等多主题的赛事,举办各类技术沙龙、论坛等,构建科学智能社区生态,推动前沿创新资源的碰撞,促进产学研的深度融合。上智院·天池平台:https://competition.sais.com.cn/

选手们评价本次赛事组织“清晰”且“快速”。“拉马努铁”团队对本届大赛的一大感受是:“比赛的页面介绍、问题背景、DS文件等非常清晰,还提供了可用性很强的baseline文件。评测系统反馈非常快,交付后10秒钟左右就能出结果”。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 大家在看
  • Ausha Intelligence:AI助力播客内容优化与搜索可见性提升

    Ausha Intelligence是Ausha推出的一款AI工具,旨在帮助播客制作者快速生成优化的内容,显著提高在播客应用中的可见性。它通过一键操作,可以生成全面的标题、吸引人的描述、结构化的章节、相关的标签、社交媒体帖子和新闻稿,从而增强播客的可发现性,并确保一致且有效的营销策略。Ausha Intelligence通过集成到平台中,提供了清晰、用户友好、流畅的体验。它不仅实用,还经过了播客营销策略的训练,能够推广节目、简化营销工作流程,并提高节目的可见性。Ausha Intelligence保证了无与伦比的内容质量。

  • ChatPPT:一键开启AI,免费解析PPT,与PPT畅所欲言。

    ChatPPT是一个利用人工智能技术,帮助用户一键分析PPT并生成对话总结的工具。它通过AI技术简化了PPT内容的理解和交流,使得用户能够更高效地处理演示文稿。该产品的主要优点是能够快速提取PPT中的关键信息,并通过对话形式呈现,使得内容更加通俗易懂。ChatPPT适合需要频繁处理PPT文件的商务人士和教育工作者,它能够显著提高工作效率和学习效率。

  • AI句子生成器:利用AI技术生成高质量句子的在线工具

    AI句子生成器是一个基于人工智能技术的在线工具,它能够根据用户提供的主题和类型生成连贯且上下文相关的句子。这项技术对于作家、学生和任何希望提高写作技能的人都非常有价值。它通过复杂的自然语言处理技术和机器学习模型,确保每个生成的句子都是定制化的,以满足用户的需求。AI句子生成器的主要优点包括简化写作过程、节省时间、激发创造力,并帮助用户生成多样化的句子结构和语调,提高整体写作风格。

  • AI Name Generators:AI驱动的名字生成工具,快速生成各种创意名称。

    AI Name Generators是一款利用人工智能技术自动生成各种类型名称的工具。用户只需输入一些基本信息或选择特定类别,如船名、日本名、游戏名等,系统将根据输入的标准生成一系列独特且富有创意的名字。该工具特别适合需要命名的场合,比如游戏开发者、作家和企业主,因为它节省时间并提供灵感,帮助他们找到最合适的名字。

  • HeadshotAI:AI驱动的头像生成器,在家即可制作专业级头像。

    HeadshotAI是一个利用人工智能技术生成逼真头像的平台,它使用先进的算法分析上传的照片,生成具有专业摄影效果的头像。这项技术的重要性在于,它让个人能够以更低的成本和更便捷的方式,获得高质量的头像,从而提升个人品牌和职业形象。HeadshotAI的主要优点包括无与伦比的真实感、轻松定制、快速生成、价格亲民以及无缝集成。

  • IconGen.io:AI驱动的图标生成器,快速创建精美图标。

    IconGen.io是一个由AI驱动的图标生成器,用户可以通过它快速创建适用于商业、演示文稿等场合的精美图标。该工具利用人工智能技术,简化了图标设计流程,使得即使是没有设计背景的用户也能轻松创建出专业的图标。IconGen.io的主要优点包括快速生成、易于使用、设计多样化,适合需要提升品牌形象的用户。

  • gptme:终端中的个人AI助手,具备本地工具。

    gptme是一个运行在终端的个人AI助手,它装备了本地工具,可以编写代码、使用终端、浏览网页、视觉识别等。它是一个不受软件、互联网访问、超时或隐私问题限制的ChatGPT“代码解释器”的本地替代方案。

  • Reverb:开源的语音识别和说话人分割模型推理代码

    Reverb 是一个开源的语音识别和说话人分割模型推理代码,使用 WeNet 框架进行语音识别 (ASR) 和 Pyannote 框架进行说话人分割。它提供了详细的模型描述,并允许用户从 Hugging Face 下载模型。Reverb 旨在为开发者和研究人员提供高质量的语音识别和说话人分割工具,以支持各种语音处理任务。

  • Voice-Pro:AI语音转录、翻译和TTS的Gradio Web-UI

    Voice-Pro是一个集成的字幕、翻译和文本到语音(TTS)解决方案。它支持将视频添加多语言字幕和多语言音频,助力视频内容扩展到全球市场。该产品使用OpenAI Whisper和开源翻译器及TTS技术,提供一键安装和便携式使用。它还配备了Vocal Remover,使用UVR5和Meta的Demucs引擎,以提高语音识别的准确性。

  • firecrawl-openai-realtime:集成Firecrawl的OpenAI实时API控制台

    firecrawl-openai-realtime是一个集成了Firecrawl的OpenAI实时API控制台,旨在为开发者提供一个交互式的API参考和检查器。它包括两个实用库,openai/openai-realtime-api-beta作为参考客户端(适用于浏览器和Node.js),以及/src/lib/wavtools,后者允许在浏览器中简单管理音频。该产品是使用create-react-app创建的React项目,并通过Webpack打包。

  • DepthFlow:2.5D视差效果视频制作工具

    DepthFlow是一个高度可定制的视差着色器,用于动画化您的图像。它是一个免费且开源的ImmersityAI替代品,能够将图像转换成具有2.5D视差效果的视频。该工具拥有快速的渲染能力,支持多种后处理效果,如晕影、景深、镜头畸变等。它支持多种参数调整,能够创建灵活的运动效果,并且内置了多种预设动画。此外,它还支持视频编码导出,包括H264、HEVC、AV1等格式,并且提供了无需水印的用户体验。

  • Arc Search for Android:现代、支持人工智能的移动浏览器

    Arc Search 是一款现代、支持人工智能的移动浏览器,专注于让用户更快地找到答案,而不会受到互联网的干扰。它通过智能搜索技术,帮助用户过滤掉不必要的信息,直接定位到他们需要的答案,从而提高搜索效率。

  • Depth Pro:高精度单目深度估计模型

    Depth Pro是一个用于单目深度估计的研究项目,它能够快速生成高精度的深度图。该模型利用多尺度视觉变换器进行密集预测,并结合真实与合成数据集进行训练,以实现高准确度和细节捕捉。它在标准GPU上生成2.25百万像素深度图仅需0.3秒,具有速度快、精度高的特点,对于机器视觉和增强现实等领域具有重要意义。

  • o1:使用Groq或OpenAI或Ollama创建类推理链

    o1是一个实验性的项目,旨在通过使用大型语言模型(LLM)来创建推理链,帮助模型解决通常难以处理的逻辑问题。它支持Groq、OpenAI和Ollama后端,通过动态推理链让模型能够“思考”并解决问题。o1展示了仅通过提示就能显著提高现有模型的逻辑推理能力,而无需额外训练。

  • Minionverse:一个受启发的创意工作流

    Minionverse是一个基于AI的创意工作流,它通过使用不同的节点和模型来生成图像。这个工作流的灵感来自于一个在线的glif应用,并且提供了一个视频教程来指导用户如何使用。它包含了多种自定义节点,能够进行文本替换、条件加载、图像保存等操作,非常适合需要进行图像生成和编辑的用户。

  • Rev AI:世界最精确的AI语音转录服务

    Rev AI提供高精度的语音转录服务,支持58种以上语言,能够将视频和语音应用中的语音转换为文本。它通过使用世界上最多样化的声音集合进行训练,为视频和语音应用设定了准确性标准。Rev AI还提供实时流媒体转录、人类转录、语言识别、情感分析、主题提取、总结和翻译等服务。Rev AI的技术优势在于低词错误率、对性别和种族口音的最小偏见、支持更多语言以及提供最易读的转录文本。此外,它还符合世界顶级的安全标准,包括SOC II、HIPAA、GDPR和PCI合规性。

  • RobotFingerPrint:统一的多机械手抓取坐标空间

    RobotFingerPrint是一种用于多种机械手抓取合成的统一坐标空间的创新表示方法。它使用经度和纬度作为坐标,在三维空间中形成一个球体的二维表面,所有机械手共享此坐标空间。该技术通过将机械手的掌心表面映射到统一的坐标空间,并设计条件变分自编码器来预测给定输入对象的统一坐标,从而建立机械手与对象之间的对应关系,用于优化问题以解决抓取姿态和手指关节。该技术能显著提高多种机械手抓取合成的成功率和多样性。

  • Flex3D:从单张图片或文本提示生成高质量3D资产

    Flex3D是一个两阶段流程,能够从单张图片或文本提示生成高质量的3D资产。该技术代表了3D重建领域的最新进展,可以显著提高3D内容的生成效率和质量。Flex3D的开发得到了Meta的支持,并且团队成员在3D重建和计算机视觉领域有着深厚的背景。

  • Helpful DoggyBot:四足机器人室内移动操作系统

    Helpful DoggyBot是一个四足机器人室内移动操作系统,它通过前端夹持装置进行物体操作,使用在模拟环境中训练的低级控制器实现敏捷技能,如攀爬和全身倾斜。此外,它还结合了预训练的视觉-语言模型(VLMs)进行语义理解和命令生成。该系统在没有实际数据收集或训练的情况下,能在未见过的环境中零样本泛化完成任务,如按照用户的指令在攀爬过后的床边取回随机放置的玩具,成功率达到60%。

  • Paper Central:一站式搜索开源成果的平台

    Paper Central 是 Hugging Face 推出的一个全面、便捷的学术平台,它将arXiv、Hugging Face 论文页、模型、数据集、Space、GitHub 和会议论文集等多个来源的开源学术资源整合在一起,帮助研究人员和开发者快速获取并使用开源资源。

今日大家都在搜的词: