我们这次实现的简单虚拟机,和计算机的 cpu 有点类似。无非就是取指令,执行指令之类的操作。

常见的虚拟机通常分为两类,一种是栈式虚拟机,另一种是寄存器虚拟机。比如说 CPython, Jvm 就是基于栈的虚拟机,而 lua 则是基于寄存器的虚拟机。

我们这次实现的“玩具”虚拟机,就是一种基于栈的虚拟机。

虚拟机有三个重要属性,code 代表要执行的指令列表,stack 用于保存临时变量,而 addr 代表当前指令的地址。

# Python高效编程
class Machine:
    def __init__(self, code):
        self.code = code
        self.stack = list()
        self.addr = 0

原理其实很简单,我们通过不断获取当前指令地址,从指令列表中获取指令和数据,如果是数字或者字符串,就压入栈中;如果是指令,就执行相应函数。

为了少些几个字符,我们向 Machine 类中添加几个方法:

def push(self, value):
    self.stack.append(value)

def pop(self):
    return self.stack.pop()

@property
def top(self):
    return self.stack[-1]

我们通过 dispatch 方法,来判断当前从指令列表中取得的片段是指令还是数据:

def dispatch(self, opcode):
    dispatch_map = {
        "%":        self.mod,
        "*":        self.mul,
        "+":        self.plus,
        "-":        self.minus,
        "/":        self.div,
        "==":       self.eq,
        "cast_int": self.cast_int,
        "cast_str": self.cast_str,
        "drop":     self.drop,
        "dup":      self.dup,
        "exit":     self.exit,
        "if":       self.if_stmt,
        "jmp":      self.jmp,
        "over":     self.over,
        "print":    self.print,
        "println":  self.println,
        "read":     self.read,
        "stack":    self.dump_stack,
        "swap":     self.swap,
        }
    if opcode in dispatch_map:
        dispatch_map[opcode]()
    elif isinstance(opcode, int):
        self.push(opcode)
    elif isinstance(opcode, str)\
        and opcode[0] == opcode[-1] == '"':
        self.push(opcode[1:-1])

dispatch_map 就对应我们在 Machine 类中实现的方法。

比如说 plus 方法和 jmp 方法:

def plus(self):
    v2 = self.pop()
    v1 = self.pop()
    self.push(v1 + v2)


def jmp(self):
    addr = self.pop()
    if 0 <= addr < len(self.code):
        self.addr = addr
    else:
        raise RuntimeError("addr must be integer")

其余方法也很简单,大家可以直接查看源代码。

好了,在加入一个 run 函数,我们就可以解释代码了。只要当前地址小于指令长度,就不断取指令,执行指令。

def run(self):
    while self.addr < len(self.code):
        opcode = self.code[self.addr]
        self.addr += 1
        self.dispatch(opcode)

我们创建 Machine 类,并执行 run 函数,注意字符串要用引号括起来

>>> from vm import Machine
>>> Machine([521, 1314,"+", 6, "*","println"]).run()
11010

我们还可以给虚拟机加一个交互式界面:

def repl(prompt="VM>> "):
    welcome()
    while True:
        try:
            text = read(prompt)
            code = list(tokenize(text))
            code = constants_fold(code)
            Machine(code).run()
        except (RuntimeError, IndexError):
            stdout.write("1表达式不合法\n")
        except KeyboardInterrupt:
            stdout.write("请使用exit退出程序\n")

在读取用户输入字符串之后,对字符串处理:

def parse_word(word):
    try:
        return int(word)
    except ValueError:
        try:
            return float(word)
        except ValueError:
            return word

def tokenize(text):
    for word in text.split():
        yield parse_word(word)

最后放张效果图:

2b434ff383d1510cf88c7c1ef97a090c.gif

关注微信公众号:Python高效编程,在微信后台回复 201991获取源代码。

Logo

华为开发者空间,是为全球开发者打造的专属开发空间,汇聚了华为优质开发资源及工具,致力于让每一位开发者拥有一台云主机,基于华为根生态开发、创新。

更多推荐