如何解析计算机代码,代码的出现 ay 3

wufei123 2025-01-26 阅读:3 评论:0
探秘advent of code第三天的解析挑战:优雅地处理杂乱输入 最近重温Advent of Code第三天的挑战,它巧妙地提出了一个有趣的解析问题:从杂乱的输入中提取有效代码。这对于解析器和词法分析器开发来说是一次绝佳的练习。让我们一...

探秘advent of code第三天的解析挑战:优雅地处理杂乱输入

最近重温Advent of Code第三天的挑战,它巧妙地提出了一个有趣的解析问题:从杂乱的输入中提取有效代码。这对于解析器和词法分析器开发来说是一次绝佳的练习。让我们一起探索解决这个问题的策略。

如何解析计算机代码,代码的出现 ay 3

起初,我依赖hy进行解析。但最近对生成式AI的探索让我转向了funcparserlib库。这次挑战让我深入了解了funcparserlib的强大功能。

词法分析(分词)

处理杂乱输入的第一步是词法分析(或标记化)。词法分析器(或分词器)扫描输入字符串,将其分解成独立的标记——进一步处理的基本单元。标记代表输入中有意义的单元,并按类型分类。本题中,我们关注以下标记类型:

  • 运算符 (op): 例如mul、do、don't。
  • 数字: 数值,例如2、3。
  • 逗号: ,,参数分隔符。
  • 括号: (和),定义函数调用结构。
  • 乱码: 与其他类型不匹配的字符或字符序列。

我摒弃了funcparserlib教程中常见的“魔术字符串”方法,转而采用更结构化的枚举定义:

from enum import Enum, auto

class TokenSpec(Enum):
    OP = auto()
    NUMBER = auto()
    COMMA = auto()
    LPAREN = auto()
    RPAREN = auto()
    GIBBERISH = auto()

使用TokenSpec.OP、TokenSpec.NUMBER等,提高了代码可读性、可维护性和类型安全性。

为了与funcparserlib集成,我创建了一个名为tokenspec_的装饰器,它包装了funcparserlib的tokenspec函数,简化了标记定义:

from funcparserlib.lexer import tokenspec

def tokenspec_(spec: TokenSpec, *args, **kwargs):
    return tokenspec(spec.name, *args, **kwargs)

利用tokenspec_,我们可以定义分词器:

from funcparserlib.lexer import make_tokenizer

def tokenize(input_str: str):
    tokenizer = make_tokenizer([
        tokenspec_(TokenSpec.OP, r"mul(?=(d{1,3},d{1,3}))|do(?=())|don't(?=())"),
        tokenspec_(TokenSpec.NUMBER, r"d{1,3}"),
        tokenspec_(TokenSpec.LPAREN, r"("),
        tokenspec_(TokenSpec.RPAREN, r")"),
        tokenspec_(TokenSpec.COMMA, r","),
        tokenspec_(TokenSpec.GIBBERISH, r".")  #匹配任何字符
    ])
    return tuple(token for token in tokenizer(input_str) if token.type != TokenSpec.GIBBERISH.name)

mul的正则表达式使用前瞻断言确保正确的语法。

如何解析计算机代码,代码的出现 ay 3

tokenize函数过滤掉乱码标记。

解析器实现

tokenize返回的标记序列将被送入解析器。为了简化解析器定义,我创建了tok_装饰器:

from funcparserlib.parser import tok

def tok_(spec: TokenSpec, *args, **kwargs):
    return tok(spec.name, *args, **kwargs)

数字解析器:

number = tok_(TokenSpec.NUMBER) >> int

解析规则:

from dataclasses import dataclass
from abc import ABC, abstractmethod

class Expr(ABC):
    @abstractmethod
    def evaluate(self) -> int:
        pass

@dataclass
class Mul(Expr):
    alpha: int
    beta: int

    def evaluate(self) -> int:
        return self.alpha * self.beta

@dataclass
class Condition(Expr):
    can_proceed: bool

    def evaluate(self) -> int:
        return 0 #条件表达式不参与计算


mul = (tok_(TokenSpec.OP, "mul") + tok_(TokenSpec.LPAREN) + number + tok_(TokenSpec.COMMA) + number + tok_(TokenSpec.RPAREN)) >> (lambda t: Mul(t[2], t[4]))
do = (tok_(TokenSpec.OP, "do") + tok_(TokenSpec.LPAREN) + tok_(TokenSpec.RPAREN)) >> (lambda _: Condition(True))
dont = (tok_(TokenSpec.OP, "don't") + tok_(TokenSpec.LPAREN) + tok_(TokenSpec.RPAREN)) >> (lambda _: Condition(False))

expr = mul | do | dont

from funcparserlib.parser import finished, many
import operator

call = many(tok_(TokenSpec.NUMBER) | tok_(TokenSpec.LPAREN) | tok_(TokenSpec.RPAREN) | tok_(TokenSpec.COMMA)) + expr + many(tok_(TokenSpec.NUMBER) | tok_(TokenSpec.LPAREN) | tok_(TokenSpec.RPAREN) | tok_(TokenSpec.COMMA)) >> operator.itemgetter(1)
program = many(call) + finished >> (lambda t: tuple(t[0]))

def parse(tokens):
    return program.parse(tokens)
难题求解

第一部分:

def part1(input_str: str) -> int:
    expressions = parse(tokenize(input_str.strip()))
    return sum(expr.evaluate() for expr in expressions if isinstance(expr, Mul))

第二部分:

def part2(input_str: str) -> int:
    expressions = parse(tokenize(input_str.strip()))
    can_proceed = True
    total = 0
    for expr in expressions:
        if isinstance(expr, Condition):
            can_proceed = expr.can_proceed
        elif isinstance(expr, Mul):
            if can_proceed:
                total += expr.evaluate()
    return total
迭代改进

最初,我的方法涉及两次解析。现在,单次解析就完成了所有任务,提高了效率。

这次Advent of Code之旅让我巩固了词法分析和解析的知识。期待未来更复杂的挑战!

以上就是如何解析计算机代码,代码的出现 ay 3的详细内容,更多请关注知识资源分享宝库其它相关文章!

版权声明

本站内容来源于互联网搬运,
仅限用于小范围内传播学习,请在下载后24小时内删除,
如果有侵权内容、不妥之处,请第一时间联系我们删除。敬请谅解!
E-mail:dpw1001@163.com

分享:

扫一扫在手机阅读、分享本文

发表评论
热门文章
  • 华为 Mate 70 性能重回第一梯队 iPhone 16 最后一块遮羞布被掀

    华为 Mate 70 性能重回第一梯队 iPhone 16 最后一块遮羞布被掀
    华为 mate 70 或将首发麒麟新款处理器,并将此前有博主爆料其性能跑分将突破110万,这意味着 mate 70 性能将重新夺回第一梯队。也因此,苹果 iphone 16 唯一能有一战之力的性能,也要被 mate 70 拉近不少了。 据悉,华为 Mate 70 性能会大幅提升,并且销量相比 Mate 60 预计增长40% - 50%,且备货充足。如果 iPhone 16 发售日期与 Mate 70 重合,销量很可能被瞬间抢购。 不过,iPhone 16 还有一个阵地暂时难...
  • 酷凛 ID-COOLING 推出霜界 240/360 一体水冷散热器,239/279 元

    酷凛 ID-COOLING 推出霜界 240/360 一体水冷散热器,239/279 元
    本站 5 月 16 日消息,酷凛 id-cooling 近日推出霜界 240/360 一体式水冷散热器,采用黑色无光低调设计,分别定价 239/279 元。 本站整理霜界 240/360 散热器规格如下: 酷凛宣称这两款水冷散热器搭载“自研新 V7 水泵”,采用三相六极马达和改进的铜底方案,缩短了水流路径,相较上代水泵进一步提升解热能力。 霜界 240/360 散热器的水泵为定速 2800 RPM 设计,噪声 28db (A)。 两款一体式水冷散热器采用 27mm 厚冷排,...
  • 惠普新款战 99 笔记本 5 月 20 日开售:酷睿 Ultra / 锐龙 8040,4999 元起

    惠普新款战 99 笔记本 5 月 20 日开售:酷睿 Ultra / 锐龙 8040,4999 元起
    本站 5 月 14 日消息,继上线官网后,新款惠普战 99 商用笔记本现已上架,搭载酷睿 ultra / 锐龙 8040处理器,最高可选英伟达rtx 3000 ada 独立显卡,售价 4999 元起。 战 99 锐龙版 R7-8845HS / 16GB / 1TB:4999 元 R7-8845HS / 32GB / 1TB:5299 元 R7-8845HS / RTX 4050 / 32GB / 1TB:7299 元 R7 Pro-8845HS / RTX 2000 Ada...
  • python怎么调用其他文件函数

    python怎么调用其他文件函数
    在 python 中调用其他文件中的函数,有两种方式:1. 使用 import 语句导入模块,然后调用 [模块名].[函数名]();2. 使用 from ... import 语句从模块导入特定函数,然后调用 [函数名]()。 如何在 Python 中调用其他文件中的函数 在 Python 中,您可以通过以下两种方式调用其他文件中的函数: 1. 使用 import 语句 优点:简单且易于使用。 缺点:会将整个模块导入到当前作用域中,可能会导致命名空间混乱。 步骤:...
  • Nginx服务器的HTTP/2协议支持和性能提升技巧介绍

    Nginx服务器的HTTP/2协议支持和性能提升技巧介绍
    Nginx服务器的HTTP/2协议支持和性能提升技巧介绍 引言:随着互联网的快速发展,人们对网站速度的要求越来越高。为了提供更快的网站响应速度和更好的用户体验,Nginx服务器的HTTP/2协议支持和性能提升技巧变得至关重要。本文将介绍如何配置Nginx服务器以支持HTTP/2协议,并提供一些性能提升的技巧。 一、HTTP/2协议简介:HTTP/2协议是HTTP协议的下一代标准,它在传输层使用二进制格式进行数据传输,相比之前的HTTP1.x协议,HTTP/2协议具有更低的延...