QoBean的元语言系统(一)

QoBean是从元语言系统开始构建整个语言系统的,从本文开始,我开始讲述QoBean所理解的元语言。不过,不同的人、从不同的侧面所理解的“元语言”是不一样的,不必求同。

“QoBean的元语言系统”包括三篇,分别是:

  • 元语言系统基础,以及程序的基础元素
  • 元语言下的编程基本方法
  • 元语言的应用:虚拟执行环境

QoBean的项目地址:

注:本系列第三篇之“元语言的应用:虚拟执行环境”并没有完成。但相关内容可以参考《为脚本语言平反-JavaScript篇》(之二)(之三)

一、什么是元语言(Meta Language)

“元(meta)”这个词到了中文里头,就非常难于说清楚。就好象当年蹦出来个“超类(super classes)”就糊涂了一群人一样,“元类(meta classes)”以及类似的“meta xxx”也让人开心不起来。

有两个角度来看这个问题。一个是站在既有的知识上,例如你懂得了“类”,然后我就告诉你“所谓元类,就是比类更高一级的、能产生类的类”。这种解释方法下,所谓“元语言”,就是“能产生语言的一种语言”。

这第一种解释方法并没有错,例如最新的ECMAScript Ed4(也就是JavaScript 2)就是用元语言来定义的。具体来说,ECMAScript Ed4规范就是用一种名为Ocaml的元语言来描述,该描述文档自身也就是一份代码,可以被直接“编译”成为一种真实的、可直接使用的JavaScript 2的语言引擎。所以相对于JS2,Ocaml就是一种元语言——当然,Ocaml是一种通用性元语言,不只是能“定义和生成”ECMAScript Ed4那么简单。

第二种解释方法,则是站在纵深处,从一个领域的核心、本质出发进行说明。例如说,程序的本质是“算法+数据结构”,所以对任意程序来说,所谓“元”,就是Algorithms和Data Structures,具体实现上,在函数式语言中,Algorithms被统一成为Function;在面向对象语言中,数据结构被统一成Object。这些所谓的“统一”,其实都不过是在两种元语言的“原子类型抽象”上的泛化或概括。

这又说得复杂了,什么是“原子类型抽象”呢?我杜撰了这个词,我希望说明,可能“数据类型”不是字节、双字节这样的面向机器结构的,也不是“对象”、“类”这样面向抽象系统的。“数据类型”仅只是“算法”所面对的“目标”。当数据是x时,算法就是那个f(x);当数据是m时,f()就不适用了,得是T(m)。

再反过来,当算法是Z()时,数据还会是x或m吗?不是。所以,数据与算法是伴生的,不同的算法、不同的数据之间有机地结合时,才是好的程序。

所以第二种解释方法也是对的。我们可以说物质的“元”是分子、原子等等,也可以说物质的“元”是能量。用这种方法来解释时,没有第一种解释法那样的“参考对象”,所以它的有效性或概念都取决于解释者的“角度”,不同的角度有不同的说法,失去了“角度”的解释就没有意义——既不是对,也不是错。

那么QoBean如何定义“元语言”呢?QoBean对此有两项解释:

  • 元语言定义程序(program)的基础元素:算法与数据结构
  • 元语言说明编程(programming)的基本方法:代码的组织形式

二、QoBean中的基本系统约定

1. 数据类型

基于JS的基本观念,QoBean提出(运算性的)值数据,和引用数据两类。引用数据仅有“对象”一种,从数据的角度上来说,函数也是一类“对象”。值数据包括三种基本数据:数值、字符串和布尔值,和一种特定的、表达无数据的数据:undefined。

对象具有双重性,作为对象时,它是关联数组。所谓关联数组,即是如下形式的表:

tbl = {
   name: 'table',
   x: 100,
   y: 100
 }

对象可以描述一个一般形式的索引数组,形式如下:

tbl = {
   0: 100,
   1: 100,
   2: 100,
   length: 3
 }

或以直接量形式描述一个索引数组(普通含义上的JavaScript数组),也是一个对象,或对象的子类:

tbl = [100, 100, 100];

2. 执行体

QoBean在元语言级别上,所能理解的执行体只有“函数”。

函数作为执行体时,可以通过new运行“产生”数据——对象。其形式如下:

tbl = new f()

函数自身也可以产生函数:

foo = f();

foo = new f;

foo = new f();

上述三种形式在具体使用和f()的实现上略有不同。

函数具有双重性。当它作为执行体时——例如f(),表明执行函数;当它作为数据体时——例如f,表明它是一个对象。二者的区别在于一个执行运算符“()”。

QoBean的元语言系统不理解其它的JavaScript语言元素,例如不理解语句,也不理解变量声明。但是理解由上述“类型系统、执行体”延伸出来的概念,例如由函数延伸出来的闭包概念。

3. 动态执行能力

QoBean要求基本系统具有动态执行能力,也就是动态分析(parse)和执行(execture)由基本语法特性(上述“基本数据”和“执行体”)组成的代码文本的能力。在JavaScript中,也就是eval()这个方法。

由于QoBean理解函数中的闭包,因此也要求eval()理解这一特性。具体来说,QoBean要求:当eval()在一个闭包中执行上述代码文本时,代码文本产生的闭包位于当前闭包链的未端。这里的闭包,包括JS中的对象闭包与函数闭包两种。这意味着下面的代码,可能在打开的X对象的“对象闭包”的后面追加一
个新的闭包——这里的“可能”是指:这取决于eval()代码文本的内容:

with (X) eval(_CODE_CONTEXT);

4. 其它

基本上来说,上面约定了JavaScript语言特性的一个非常小的集合。这个集合不包括Date、RegExp之类的工具对象,也不包括语句或变量这些语法概念——不过QoBean理解“标识符”,没有标识符,元系统是组建不起来的。

在这个最小的语言特性集合上,QoBean开始构建自己的语言系统——这也意味着,只需要拥有这些最小、最简的语言特性,其它语言或其它的JavaScript实现版本、子集等,也可以按照同样的方式构建同等能力的语言系统。这也就是“元语言”最诱人的地方。

三、元系统

0、QoBean的元语言系统基本的编程结构

QoBean的元语言系统由以下函数构成:

  function Atom(atom) { }
  function Meta(func, baseMeta) { }
  function Unique(f) { }
  MetaObject = Function;
  MetaClass = Function;

1. 原子-元函数、元数据、元继承关系

所谓“元数据”,就是独立的、独一无二的一个数据体。简单的说,你可以“元化(使之变成元)”一个数据,该过程通过Atom()来实现:

function Atom(atom) {
  return atom || {};
}

// sample
tbl = {};
tbl = Atom(tbl);

我们可以通过函数来实现自身的元函数,也就是产生函数执行体(而不是对象数据)的函数,例如:

function Func() {
  return Function.apply(this, arguments)
}

// sample
f = new Func();
alert(typeof f);

元继承关系通过Meta()和属性meta来实现,例如:

function Meta(func, baseMeta) {
  func.meta = baseMeta || arguments.callee;
  return func;
}

// sample:meta is meta for self.
Meta = Meta(Meta);

2. 友元

表面上看,Atom()看起来象是一个多余的实现。但它是实现友元的一个非常好的途径。所谓友元,是元A跟元B之间执有一种私有关系,二者之间可以互访数据。在QoBean的机制里,这通过Atom()来实现。

例如:

f1 = f2 = Atom();

f1 = function(atom) {
  var data = {  ... };

  return function() {
    if (arguments[0] === atom) {
      return data;
    }
    // ...
  }
}(f1);

f2 = function(atom) {
  var data;

  return function() {
    if (data === undefined) {
      data = f1(atom);
    }
    // ...
  }
}(f2);

在上述系统中,f1与f2之间都执有一个相互识别的凭证——一个通过Atom()得到的友元原子。通过该凭证,f1可以向f2提供私有数据(反之也成立)。除此之外,系统之外的其它函数/对象都无法得到f1中的数据。

3. 类系统

元对象与元类是在元函数上的两个扩展。基本上来说,声明了一种“对象系统”的组织方式:类继承模式。这种关系是可以识别的,例如obj是MyObject的一个实例、obj也同时是Object的一个实例。

function MyObject() {
}
// class register
Class(, 'MyObject');

// sample
obj = new MyObject();
alert(obj instanceof MyObject);

在元系统中,并没有对类系统做任何实现。实现的代码在Class.js中。

4. 类类型系统

你可以在Class()做类注册时得到一个类类型(你也可以忽略它)。类类型是一种“类系统”的组织方式。类系统中也可以进行继承关系的识别,例如TMyObject继承自TObject。QoBean约定的规则为:

function MyObject() {
}
TMyObject = Class(, 'MyObject');

// sample
obj = TMyObject.Create();
alert(...)

在元系统中,并没有对类类系统做任何实现。实现的代码在Class.js中。

5. 唯一化

你可以用Unique()函数唯一化一个对象,唯一化的好处是新对象与旧对象完全一样,但是修改新的对象时,旧的对象不会同时被修改。举例来说:

obj = {
  data: 100
}

obj1 = obj;
obj2 = Unique(obj);

// init, same.
alert([obj1.data, obj2.data]);

// change the reference, the uniqued object was fixed.
obj1.data = 200;
alert([obj1.data, obj2.data]);

// change the niqued object, the , no change.
obj2.data = 300;
alert([obj1.data, obj2.data]);

下一篇:元语言下的编程基本方法 >>