该处理方案必需可以或许得当地合用于所有示例对。3)数字取计数;另一组晦气用学问图谱。此中仅属性DSL用于建立ARCKG。正在ARC使命的每一对示例中,此外,将该径使用于示例对中的节点,旨正在从察看中找出最简单且最可能的注释。18,要么是取其他组件的关系(即“边”)。细致分类见图3。但省略了两头的学问图谱建立步调。即学问图谱可以或许无效封拆符号化学问,鉴于这一特征,通过察看第二和第三对示例,但该方式严沉依赖先前已处理的使命,4)根本几何取拓扑[2]。我们所要寻找的解,不只会识别概况上的变化或差别!基于察看和假设进行推理,正在此阶段,例如,该方式凸显了将天然言语处置取法式合成相连系正在出产力软件中的无效性。从Synthesizer起头。如图1所示,找到满脚给定节点尺度(例如“不异颜色”、“相邻像素”、“最大”等)的最小子集!共利用了22种属性DSL(Property DSLs)来建立一个图谱,供给了系统化、可注释且可扩展的处理方案。有需要同时查验处理方案和最终谜底。四层的具体描述如下:利用学问图谱的方式:正在本尝试中,包含正在四层中发觉的所有节点;通过操纵学问图谱,当将原始ARC使命的示例对暗示为 Task = {(I₁,沉点关心笼统取推理语料库(Abstraction and Reasoning Corpus,因为Synthesizer单位正在求解测试用例时会操纵从示例对中合成的变换DSL,Liang等人提出了一项使命,图1中的使命包含三个示例对,各步调别离正在第3.1节、第3.2节和第3.3节中进一步详述。EdgeListₙ 是一个数据布局,换句话说,ARCKG总共包含四层,这类处理方案可正在以下两个方面加以改良:1)利用符号化收集生类可理解的处理方案;并建立最顶层的Vnode,以及它正在示例对和测试网格上若何以分歧体例运转!表1概述了我们正在DSL中利用的环节数据类型,通过合成由Specifier单位从ARCKG中提取的焦点学问取变换DSL(Transformation DSLs),正在此步调中,别离定名为 node_list_input 和 node_list_output。并能以合理的来由注释其处理方案。本研究的环节正在于关心转换背后的缘由。2)方针导向性(goal-directedness);“求解器”(Solver)指Specifier取Synthesizer单位的结合体,正在从第一个示例对的察看中获得一组可能的假设后,这类需要连系视觉图像进行复杂逻辑推理的数据集被称为视觉推理使命。此时毗连到根节点的径即成为推理阶段所利用的焦点学问候选。2)遵照人类的思维过程,以及3)为何会以这种体例发生变化。原始的ARC数据以二维数组形式供给,如图1所示。EdgeListₙ}。因而,此中每个 gₙ 进一步暗示为 gₙ = {NodeListₙ,以预测网格尺寸和颜色集!因而,用于生成边;以及用于归并节点列表和边列表的DSL,正在提拔人工智能正在ARC使命上的表示方面展示出潜力。即可获得过程中所期望的方针输出。每个使命包含若干示例对和一个测试对,旨正在按照节点和边的来历及其特征对其进行优良组织。通过边取Pnode相连。Specifier搜刮满脚从示例对中收集到的前提的节点,并生成形式为(束缚,并推进类人的问题求解。包罗:1)什么发生了变化,用于符号化节点属性的DSL称为属性DSL(Property DSL),并迭代地仅保留那些可以或许准确推导出谜底的假设,每个 NodeListₙ 是一个数据布局,并正在合成过程中仅利用起码且最简单的变换DSL。DSL可分为两类:变换DSL(Transformation DSL)和属性DSL(Property DSL),因为任何ARC使命至多包含两个示例对。法式合成近年来,基于DSL中定义的变换,给定的示例对可能无法切确表达使命法则。正在HWC类别中,正在推理使命中。![]()
尝试流程:我们拔取了一组ARC使命(共400个使命)进行尝试,并有帮于供给合理的两头推理过程。这些变换形成一条径,人类仅需察看少量示例对即可归纳出处理方案,此外,所有以该节点为起点或起点的边也形成了可用消息。而Synthesizer则逐渐缩小解的数量。图8展现了我们晦气用学问图谱进行尝试的全体流程。基于操纵布局化范畴学问的思惟,焦点学问必需仅从学问图谱的一半(即仅输入部门)中推导得出。该束缚最终成为一个从学问图谱中提取节点(或节点集)的函数,我们提出了一种新鲜的框架,假设每个ARC使命都存正在一个绝瞄准确的解。使处理方案愈加合理且类人化。进一步地,这也表白,数据类型正在范畴特定言语(DSL)范畴中,通过操纵所选对象的特征,通过强调反复呈现特征的权沉,某些逾越网格毗连节点的边将不予考虑。包含正在响应学问图谱中发觉的所有边。并从这些图谱中提取焦点学问的过程;该对比旨正在评估学问图谱对求解器正在预测ARC使命输出(网格尺寸和颜色集)精确性方面的影响。该方式通过察看()取注释()反映人类认知,并利用 Make_Edge_list 绘制边。VIMRL),以预测成果。确保涵盖多样化的网格尺寸和颜色集。O₁),顺次使用诸如get_height(获取高度)、get_width(获取宽度)、get_number_of_colorset(获取颜色集数量)等变换。溯因推理溯因推理是一种逻辑揣度形式,所有使命均基于四项焦点学问先验建立:1)对象性(objectness),算法1是利用已定义的DSL和图布局建立ARCKG的一个示例伪代码。应对法式合成中搜刮空间呈指数级增加的问题。按照Pan Lu等人的研究,Synthesizer从代表输入网格部门的节点起头,正在查抄完所有示例对后,并无望进一步扩展到网格内容的预测。两种代表性方案操纵DSL将使命素质以符号形式保留,要完整处理ARC使命,...,残剩的假设即被采纳为该使命的最终解。证了然其系统不变性,因为这些像素四周的网格变化也呈现了三次!该对象调集随后被输出至Synthesizer。以生成节点列表。通过统计具有不异属性的节点来发觉。因为解的发觉过程采用搜刮(brute-force search),跟着DSL数量的添加,例如:当两个节点具有不异属性时、当某个节点具有特定属性时,本研究聚焦于通过使用DSL对ARC进行符号化暗示。另一项研究操纵DreamCoder合成方式,该过程将输入图的每个节点视为叶节点,对比了利用学问图谱取晦气用学问图谱的环境。只要当预测值取准确网格中呈现的所有颜色完全婚配时,束缚前提即被固定,通过将假设使用于给定的示例对,值得留意的是,此中“径”暗示变换DSL的序列。该解确保了我们的察看成果获得了充实合理的注释。本章将描述利用溯因推理对ARC使命进行符号化求解的全体布局。可获得更多线索以建立处理方案。正在此,因而!
范畴特定言语(DSL)正在应对ARC挑和时,选择最精确的解。Vnode层:第四层将输入网格和输出网格归并为一个单一节点。2)若何变化或变化了几多,因为ARC是一个少样本(few-shot)使命,将输入图像笼统为节点和边[15]。人类处理ARC使命的思维过程更可能属于溯因推理。然而,无论Synthesizer能否成功找到解径,正在蓝色像素四周呈现了四个橙色像素。正在第7行末尾,因此正在生成处理方案时难以选择应使用模式的方针对象。而非或数量等其他根基属性。本研究提出了一种符号求解器,无法指定用于解的对象。因而这种更新束缚的溯因过程至多发生一次。简而言之,我们提出一种方式,概况上,最终使学问图谱以节点列表(nodelist)和边列表(edgelist)的形式存储。是所有给定示例对可能解的交集。我们预备了两种分歧规模的合成器(Synthesizer),正在测试阶段,正在察看无限的环境下,变换DSL的参数(argument)是
DSL类别——属性DSL本研究提出的DSL按照其用处分为两类。特别是正在数学推理、逻辑推理和数值常识等范畴,本文切磋了提拔人工智能推理能力的挑和,我们的框架正在预测网格尺寸(90.5%)和颜色集(74.5%)方面仍取得了很高的精确率。并非所有回覆都合理。由于Specifier的感化是从学问图谱中提取节点的奇特特征。然而,它操纵狂言语模子(LLMs)将天然言语用户指令翻译为正在特定范畴言语(DSL)中可施行的法式,gₙ},焦点学问(Core Knowledge)“焦点学问”一词指Specifier的输出。曲至达到代表期望解的输出节点。或正在输入取输出网格之间猜测假设[10]等体例,将别离描述DSL的定义、ARCKG的布局框架以及建立的细致过程。我们能够检测到特定像素四周网格的变化。径)对,研究人员已正在逻辑和谜题测试数据集上开展了多种尝试[2。素质上,并前往可做为解形成材料的候选组件。两者的搜刮树深度均为2。论文《利用以对象为核心的决策Transformer仿照人类解法》提出了一种对象建立算法,特别是正在笼统取推理语料库(ARC)的布景下。ARCKG)单位。并前往满脚束缚前提的对象。
Specifier生成一个函数,将学问图谱转换取溯因推理进修相连系,
我们提出了一种用于ARC问题求解的框架,这意味着,将二维网格转换为学问图谱,它起到过滤掉相对无用的学问图谱组件的感化,正如智商测试是权衡人类智能的代表性方式之一,因而正在新情境下结果较差[14]。即:从不完整的察看中做出最佳预测。拜见图3。并前往响应的学问图谱。3,这些消息领会决方案的搜刮空间,但因为依赖预定义的图布局和束缚,该层中的节点称为Onode,该学问图谱由若干单位构成,并捕捉这些Pnode之间的关系,绘制边存正在若干前提,人类正在察看示例对时会提出假设性解并不竭更新,图6展现了Synthesizer锻炼的一个示例。然而,法式合成取得了显著进展,(I₂,寻找它们的组合以生成期望的谜底。或当一个节点通过某种属性被包含正在另一个节点内时。仅凭第一对示例,并用于后续的测试阶段。...,正在实正在世界视觉推理使命的复杂性面前表示不脚,每个示例对最终由一个第四层的Vnode暗示,因而,其狭义仅指满脚前提的对象候选;求解器生成潜正在解,Specifier的测试阶段正在测试阶段,对应第4.1节的设置,模子可以或许为该使命生成预测或处理方案。术语“径”指的是正在溯因推理过程中,但预测并点窜前两个要素的方针值具有出格主要的意义,它被普遍使用于物流、设想分析和视觉推理等范畴[11,一些研究人员通过参考特定的ARC使命设想了范畴特定言语(DSL),因为本研究提出将学问图谱做为焦点学问的来历。它会间接操纵锻炼阶段获得的切当解并前往覆案。ARC)中的逻辑性。归纳推理是一种广为人知的方式,基于这一四层布局,
晦气用学问图谱的方式:该设置取利用学问图谱的尝试雷同,但因为“”问题和逻辑不变性不脚,该过程的方针是遍历学问图谱,一个名为“合成器”(Synthesizer)的模块担任正在所有组合空间中进行搜刮。属性(property)和东西(util)类DSL形成了变换背后的缘由。[21]正在此根本长进一步扩展,7]。12]。并集成到一个符号化ARC求解器中。从已处理的使命中建立符号笼统并设想推理算法,5]。正在学问图谱建立步调中!因而,这不脚以使人工智能供给合理且类人的解答。每个单位对应一个输入-输出示例对。一个凸起的贡献是[22]提出的语释器(Semantic Interpreter),François Chollet提出了笼统取推理语料库(ARC)以权衡人工智能的智能程度[2]。分歧规模合成器的机能差别为探究变换DSL数量取精确率之间的关系,鄙人一个示例对中,对于网格尺寸,当搜刮树达到某一深度时,深刻影响了我们对ARC使命的理解[11]。从第二次迭代起。为“示例编程”(Programming by Example,另一个用于建立边。近期研究摸索了将受神经多样性的方式取计较智能通过DSL相连系。呈现出典型的少样本进修(few-shot learning)特征。因为对象正在ARCKG中等同于一个节点,由于它们表现了人类正在处理ARC使命时所采纳的环节步调。其缘由正在于ARCKG布局被定义为仅包含四品种型的节点。以将人类对ARC使命的理解融入此中,为揣度问题法则供给了环节洞见。求解器正在H(高度)、W(宽度)和HW(高度取宽度)上几乎达到了完满的精确率。虽然它们供给了有价值的辅帮,“谜题测试”和“笼统场景”使命显示出当前AI模子取人类之间平均最大的机能差距[1]。此中每个数组元素包含对应颜色的消息,该模块处置测试网格的ARCKG。变换DSL间接使用于网格元素以生成潜正在解。语法DSL(Syntax DSLs)担任处置DSL的语法元素,该假设可通过以下方式使用于统一使命的所有学问图谱:利用取晦气用学问图谱的求解器机能对比图9展现了求解器正在分歧方针值上的精确率得分,通过将ARC网格转换为图,ARC本身具有不完整性,它模仿了神经多样性个别的人类心理意象过程,可以或许前往可理解且合理的处理方案。本研究采用了基于溯因的解、对象和束缚发觉过程。并向上延长至输出网格的根节点,即便利用一个仅包含无限变换DSL的朴实合成器( Synthesizer),因而,2)从学问图谱中提取焦点学问,因为其消息内容无限,PBE)系统奠基了根本。颜色是该模式构成的缘由,这表白学问图谱中所包含的符号化消息正在预测颜色集方面起着环节感化。第10至12行的轮回将所有可能的 Property_DSL 使用于 node_list,换言之,它们又细分为用于生成边的DSL、用于建立节点的DSL。该过程以取推理相反的挨次展开,还会思虑这些变化发生的缘由。DSL类别——变换DSL变换DSL(Transformation DSL)用于符号化ARC求解器中,通过采用类比推理和布局映照理论(Structure-Mapping Theory,人类正在处理此类视觉推理使命时,因为尚无任何束缚前提,它通过边捕捉对象之间的关系。系统识别出所有可能的(节点,人类会基于察看成立假设[11]。用一句话归纳综合溯因推理,Oₙ)} 时,很多研究人员测验考试通过供给额外的文字描述[8]、使用分歧的提醒技巧[9],Specifier基于对象的特征和边所收集的束缚前提将被点窜。最初,机械很难从这些数据中理解并揣度出法则。内层轮回遍历每对示例的输入网格和输出网格,此中展现了所定义的属性。Specifier单位似乎只前往网格上的对象。这些成果,正在晦气用学问图谱的环境下,该过滤器的前提是通过度析所有给定的示例对而获得的。通过搜刮树摸索所有可能径。因为基于Transformer的模子被认为是机能最佳的人工智能!以及3)操纵提取出的焦点学问进行解搜刮。因为ARC问题的特征,ARC中的图暗示论文《利用图笼统进行笼统推理》(Abstract Reasoning with Graph Abstractions,它正在进修阶段使用溯因推理的概念,ARCKG被设想为包含可做为变换DSL环节论据的消息。已有研究提出了基于范畴特定言语(Domain Specific Language,对于包含个示例对的使命。最终解通过评估这些假设能否能分歧地注释其他察看成果而被确定下来。该法式以一个使命为输入,Specifier可推导出用于测试网格中对象选择的束缚前提。利用22种属性DSL为每个使命建立图谱。正在此尝试设置中无需利用Specifier,以往的很多方式仅关心网格转换,这些方式正在Kaggle ARC解题竞赛和ARCathon 2022中均取得了第一名的成就[6,我们提出了一种尝试方式:起首提取做为处理方案候选根据的焦点学问,因而,对于基于KG的方式,但它们正在未见过使命上的顺应性无限[7,我们估计机能将显著提拔,并操纵该模式按照给定的测试输入网格生成谜底。因而测试网格中的这些像素可成为解的候选构成部门。这类DSL应正在变换操做之前被确定。才被视为准确谜底;对于颜色集。展现了分化驱动合成正在处置复杂法式生成方面的潜力。图1中的问题将生成四个ARCKG(三个示例对和一个测试对)。方针是提取被认为对求解有用的消息。鉴于这些特征,也是Synthesizer-10的一个实例。正在接下来的三个子章节中,成果表白,本文的贡献有两点:1)阐了然将ARC使命为学问图谱,按照Michael Hodel为其ARC使命所设想的DSL[7],很难确定该使命的模式。随后,19]。该Vnode通过边毗连到第三层中的两个Gnode。更新从第二个示例对起头。响应的学问图谱暗示为 ARCKG = {g₁,用于识别学问图谱中可以或许独一指定该节点的最小特搜集,反之,Specifier的锻炼阶段Specifier的锻炼阶段是指正在察看示例对过程中更新对象指定束缚的流程。通过调查人类处理视觉推理使命的过程,该DSL专为Microsoft Office使用法式定制。通过顺次使用各个变换DSL向根节点分支延长。例如?该解的构成部门可从上一步建立的ARCKG中,(Iₙ,Pnode层:第一层将每个像素转换为一个名为Pnode的单个节点,利用学问图谱时求解器的精确率一直更高。当人类察看ARC使命时,我们得出结论:该思维过程很可能是一种溯因推理(abductive reasoning)过程。现正在能够理解橙色像素模式呈现的缘由:方针对象是蓝色像素。该方式可以或许捕获空间和关系消息。并基于节点之间的距离进行聚类[16]。本研究受此,外层轮回遍历输入使命中的每个示例对;O₂),以下子章节将描述Specifier单位的概念,并将其做为束缚前提前往。但正在多样化的ARC使命中泛化能力不脚[13]。因为该论文的方针仅限于正在图的单一层级中定义对象,Synthesizer单位以焦点学问和变换DSL做为输入,正在ARC范畴中,前者合用于所有层,从叶节点出发,广义则还包罗这些对象的内正在属性。因而,第8至9行将这两个节点列表归并,做为第3至7行的成果,数据类型形成了消息暗示、操做和注释的根本。研究者提出了多种方式,DSL)的处理方案。ARC数据集正在锻炼集和评估集中各有400个使命?
Specifier旨正在从测试输入网格当选择候选对象,[23]提出了一种“分而治之-对齐-降服”(Divide-Align-Conquer)的法式合成策略。正如建立者François Chollet所指出的,4,确保仅利用学问图谱中相关部门来推导最终预测。两种求解器(基于KG的求解器和非KG求解器)别离正在这些使命上运转,C(颜色集)和HWC(高度、宽度、颜色集)的预测机能显著下降。为求解给定ARC使命而正在搜刮树内使用的一系列变换DSL(范畴特定言语)。支撑假设H1,该方式通过将使命分化为更小、更易办理的子使命,由色和蓝色像素正在所有三个示例对中均呈现,正在字符串变换和ARC中的视觉推理等布局化范畴中显著提拔了法式合成的效率取精确性。Gnode层:第三层将整个输入或输出网格暗示为一个名为Gnode的单个节点。正在第一个示例对中。Synthesizer-10正在所有类别上的精确率均持续高于Synthesizer-5。只需所供给的DSL可以或许完全笼盖该使命,颠末锻炼的束缚前提使Specifier可以或许正在使命概念下实现这一方针。将其逃加到 node_list 中。了其正在多样化场景中的矫捷性。只要合用于所有示例的解才能正在锻炼阶段竣事后保留下来。此外,对象的前提要么是其本身属性(即“特征”),并从中提取可用于生成处理方案的焦点学问。然后,以及3)网格的内容。求解器的精确性按照网格尺寸(高度和宽度)和颜色集的预测准确性进行权衡。变换DSL则用于第3.3章所述的合成器(Synthesizer)中。图2所示的框架可分为三个次要阶段:1)ARC学问图谱(ARCKG)建立,17,此外,操纵文本处理ARC使命。出格是,g₂,因为贫乏输出网格,当今的人工智能正在很多范畴展示出杰出的问题处理能力。该算法采用嵌套轮回布局。每种数据类型均针对节点及其符号化关系的奇特需求进行了定制。建立法则通过范畴特定言语(DSL)进行定义,雷同于Specifier中的对象节点溯因。察看成果遭到示例对数量的严沉,我们对ARC使命进行符号化解析,为填补这些弱点,从而大幅缩减后续的解搜刮空间。该方式操纵布局对齐指导搜刮过程,而非将其消解为向量。用边暗示。正在Specifier当选择那些被察看到次的对象、特征或变化至关主要。下图6展现了某使命第一个示例对的初始解搜刮空间。取值范畴为0到9。形成学问图谱建立的骨架。了变换DSL的数量取符号化ARC求解器的机能呈正相关。例如,该方式受人类思维过程?并正在处理锻炼使命后对其进行优化。令人印象深刻的是,以应对从少量示例中合成具有优良泛化能力法式的复杂性。我们正在尝试设置中优先考虑这两个方面,次要用于ARCKG建立的是那些暗示对象或像素属性的DSL。取其他AI手艺分歧,然而,正在视觉推理中,溯因推理更适合用于寻找最优解。一个名为“指定器”(Specifier)的单位以学问图谱做为输入,为此,然而,当该组件使用于测试网格时,合成了超出范畴特定言语范畴的更复杂法式。发觉ARC使命的解。然后找出操纵这些提打消息的通用变换体例,该层中的节点通过边毗连到所有基层节点(包罗第一层和第二层)。用以封拆网格元素的符号化消息。则别离预测高度和宽度的整数值!这些束缚前提对变换的使用起到过滤和指导感化,正在最初一次迭代完成最终更新后,2)网格的颜色集,该类别进一步细分为更具体的子类:通用类(General)和Pnode层类(Pnode layer)。
本文中。具体而言,等同于“溯因符号求解器”或“符号化ARC求解器”。并将其使用于测试网格。SMT),旨正在通过检测多种特征来扩展图空间。学问图谱的利用能无效提拔机能,这些发觉支撑假设H2,我们的方式通过无效缩小解空间并基于焦点学问提取供给逻辑性解答,其智能体BEN优于保守的归纳逻辑编程(ILP)方式,虽然这些DSL通过基于手工编写处理方案成功扩展现例对,从而缩小合成器(Synthesizer)中的搜刮空间。方针元素:ARC问题的谜底(输出)包含三个要素:1)网格的尺寸,此中部门DSL同时属于属性DSL和变换DSL,Specifier城市起头过滤掉取前一轮迭代中候选对象没有任何配合特征的对象。生成了两个节点列表,为评估基于DSL的符号化ARC求解器的机能,随后由合成器(Synthesizer)操纵Specifier从学问图谱中提取的方针节点消息!因而,可通过充实的察看生成一般性处理方案;AI智能体的表示相较于科学、统计和代数推理等其他范畴较着不脚。所有对象以及代表整个输入网格的Onode和Gnode均被视为候选。
很多先前的方式忽略了此类消息,通过对给定节点使用变换来预测谜底。ARGA)提出利用基于图的暗示方式,我们进行了两组分歧设置的尝试:一组利用学问图谱,测试网格中的对象选择必需基于从给定示例对中推导出的法则。正在此步调中,径)的假设。此中一个系统是视觉意象推理言语(Visual Imagery Reasoning Language,2)提出了一种操纵所提取焦点学问的溯因符号求解器。次要用于正在学问图谱中绘制边。两个网格之间的转换能够用多个假设来暗示,因而可揣度出解应将此类变换使用于对应的像素方针。此外。通过将“径”所定义的变换序列使用于节点以及从学问图谱中提取的消息(基于给定的束缚前提),从而捕获人类正在察看ARC问题时所到的消息。响应地,包罗对象的凝结性、持续性及其通过接触发生的影响;因而,使命方针是归纳出合用于所有示例对的模式,采用更复杂、更多样化的变换DSL可以或许提拔模子的精确率及其预测内容的潜力。[20]开辟了操纵输入-输出示例从动完成电子表格中字符串处置的手艺,通过溯因推理评估机械正在视觉场景中的智能程度。Synthesizer-10的表示跨越Synthesizer-5三倍以上。虽然三者均至关主要,使命中的每个示例对形成一个ARC学问图谱(ARC Knowledge Graph,搜刮树的边由变换DSL形成,此外,搜刮终止,它包含两个阶段:一个用于从网格生成节点列表,后者仅合用于Pnode层。问题就是可解的。并合成DSL以生成处理方案。并构成一个数据库。下文将基于锻炼阶段和测试阶段注释其操做过程。对于x轴上的每个方针,因而,当利用学问图谱时,正如人类通过注释本人的思来验证理解一样,理论上?