重构程序以发现可以泛化的抽象:ReGAL

- ReGAL是一种通过代码重构来学习可重用函数库的无梯度方法。 - ReGAL通过执行验证和完善其抽象,从现有程序中学习。 - ReGAL发现的共享函数库使得在不同领域中更容易预测程序。 - 使用ReGAL函数的开源和专有LLMs在LOGO图形生成、日期推理和基于Minecraft的文本游戏TextCraft的三个数据集上提高了准确性。 - 对于CodeLlama-13B,ReGAL在图形方面的准确率提高了11.5%,在日期理解方面提高了26.1%,在TextCraft方面提高了8.1%。 - 分析显示,ReGAL的抽象封装了常用子程序和环境动态。 ReGAL(Refactoring for Generalizable Abstraction Learning)是一种通过代码重构创建可重用函数库的新方法,用于增强程序合成。这种方法的独特之处在于它不仅仅生成代码,而是在不改变原始执行输出的情况下对其进行改进,并从一小组现有程序中进行学习。ReGAL的重要性在于其实际应用,已经证明它可以提高开源和专有大型语言模型(LLMs)在各个领域的准确性,包括图形生成、日期推理和基于Minecraft的文本游戏。在三个测试领域中,该方法甚至超过了GPT-3.5的表现。对于那些对人工智能和软件开发交叉领域感兴趣的人,特别是对代码生成的效率和准确性感兴趣的人来说,ReGAL发现和应用可推广抽象的方法可能是一个值得探索的改变游戏规则的方法。

评论