Qomolangma框架库(三)：处理池与处理机

一、框架库：处理池与处理机

严格地说，Pool被译成“池”即可，只是在Qomo的TPool类中，所有放在“池”中的对象都是处理机(Machine)，因此这个TPool被称为“处理池”类。

Pool的出现早在WEUI的时代，其目的是处理同步的、缓存的XmlHttp对象。因此，Machine也就在事实上只实现了“THttpGetMachine”。这个HttpGetMachine也能处理POST类型的HTTP请求，所以，严格地说，它应该名为“THttpMachine”。

Pool是一种机制，并不局限在使用HttpGetMachine上。HttpGetMachine只是Machine的一个实现实例。我们先澄清这一点，以避免开发人员把它当成了Ajax技术的另一个名词。

HttpGetMachine已经处理了兼容问题。随便指出，Framework/Common下的公共类，都是可以在mozilla兼容浏览器中使用的。

二、池化的架构

Pool提供四种能力：

注册处理机类(Machine Class)
管理处理机实例(Machine Instance)
调度处理机(包括状态：resume, sleep, free)
管理数据(Data)对象

处理机类提供处理数据(Data)的能力，数据(Data)的结构对Pool来说是完全透明，Pool只在调度过程中，将数据传给处理器，处理器如何识别、使用、修改这个数据，Pool完全不知。

处理机应当具体的能力有：

提供 OnStateChange 事件，响应来自Pool的调度状态(resume, free)
在必要的时候，激活OnStateChange事件，以通知Pool进入调度状态(sleep)

事实上，Pool和Machine都可以响应三种状态，架构中没有约定哪种状态由谁发出，或者是由谁处理（并终结）。但在目前的设计中，

Machine处理完一段事务后，（类似于线程一样，）应触发sleep状态.
Pool在调用push()方法填入新的数据时，如果有空闲的Machine，则触发该Machine的result；否则，(在Pool未满的情况下，将)尝试创建新的Machine，会触发它Machine的resume.
Machine处理完自己的事务并进入sleep状态时，如果Pool有未处理数据，则为该Machine触发一个新的resume.

Pool和Machine可以根据需要重新设定触发方式，但不能改变对各状态值的含义的约定。

Pool和Machine都可以添加新的状态。

Machine的启动时间，以及Data处理的结束时间，是没有时序和关联的。

三、使用处理池

同一个处理池中，只能使用相同的处理机。这在处理池创建时就需要定义好。例如：

// 声明一个处理THttpGetMachine的池，池的大小(深度)为10
var pool = new Pool(THttpGetMachine, 10);

这里，池的大小为10表明池中容纳THttpGetMachine实例的上限为10个。当Machine在忙(Busy)时，如果有新的数据请求处理，则会尝试创建新的Machine。当上限设定数的Machine都在忙时，数据被缓存到队列中等待处理。

从原理上来说，无论是创建大小为1个还是100个的池，最终所有的数据都能得到处理。只是处理的并发量不一样，因此速度和性能也就有差异。——池的大小通常是经验值。

池创建后立即开始工作。但它只响应一个方法：

pool.push( _your_data );

这里的_your_data是用户自已决定的一种结构，它对于Pool来说是透明的。当它被处理时，会被传递到某个Machine实例，而这个实例确切地知道如何处理这种数据。

对于THttpGetMachine来说，它能处理一个对象，该对象有一个名为src的属性，即：

var data = { src: "[http://www.doany.net/](http://www.doany.net/)" };
pool.push( data );

这里并不限制必须是一个对象，也不限制必须是直接量声明。当然，直接量的好处，是你可以这样写代码：

pool.push({ src: "[http://www.doany.net/](http://www.doany.net/)" });

四、使用处理机

如何处理机被实现过，那么使用者只需要非常简单地调用，即可完成处理，而无需关注具体的处理机与处理池的调度过程。在上面这个使用THttpGetMachine的例子中，我们的基本代码如下：

// 1. 处理数据时的动作
function doAction(state) {
  // THttpGetMachine约定state值4表明下载完毕
  if (state == 4) {
    alert('Url: %s/nLength: %s'.format(this.data.src, this.get('XMLHTTP').responseText.length));
  }
}

// 2. Pool的状态变更响应
function doOnStateChange(mac, state) {
  doAction.call(mac, state);
}

// 3. 创建pool并添加事件响应
var pool = new Pool(THttpGetMachine, 10);
pool.OnStateChange.add(doOnStateChange);

// 4. 处理数据
pool.push({ src: "[http://www.doany.net/](http://www.doany.net/)" });

上面的步骤1、2可以有更灵活的处理方式，包括"this"的传递、数据(Data)的分析、状态(State)的识别等等，这些都是用户代码中的技巧。但在THttpGetMachine中，基本的使用方法是如上的。

下面讲述处理机的实现方法。因为Qomo的框架允许用户自行扩充各种不同的处理机。

四、实现处理机(1)：基本结构

处理机需要具有两个属性：

data: 当处理机被TPool调度时，data指向需要被处理的数据
pool: 当处理机被TPool调度时，pool指向Pool自身

所以我们看到，THttpGetMachine实现中，为每个对象声明了这两个属性：

function HttpGetMachine () {
  //...

  this.Create = function() {
    this.data = null;
    this.pool = null;

    // ...
  }
}

我们说过，处理机明确地知道它将处理的数据的格式。因此，在THttpGetMachine的实现中，它响应OnStateChange时的处理代码如下：

var doStateChange = function(state) {
  if (state=='resume') {
    // 获取或创建 XmlHttpRequest 对象、设置属性等
    var xmlHttp = ...
    var method = 'GET';

    // this 指向 Machine 自身
    var src = this.data.src;

    // src 指向需要当前 Machine 处理的URL地址，因此应该通过类似如下代码来获取数据
    xmlHttp.open(method, src, true);
    xmlHttp.send(null);
  }
  else if (state=='free') {
    // ...
  }
}

五、实现处理机(2)：自定义状态

我们发现，这里的代码中，只处理了XmlHttpRequest开始下载的行为，那么这个对象下载完成之后应该如何处理呢？

对于XmlHttpRequest来说，同步调用时，onreadystatechange事件会被对象触发。而这个状态其实对Pool来说，是透明的。这时，Pool会把这个状态交回给Machine。这个过程在Pool和Machine中传递，但只被Machine处理。

这些状态，被称为自定义状态——例如前面提到过的状态值“4”。它们是由Machine负责处理的。

THttpGetMachine使用如下的方法来实现自定义状态：

// 定义XMLHTTP.onreadystatechange事件的响应句柄
var onreadystatechange = function() {
  var xmlHttp = this.get('XMLHTTP');

  this.OnStateChange(xmlHttp.readyState);

  if (xmlHttp.readyState==4) {
    this.OnStateChange('sleep')
  }
}

// HttpGetMachine的对象构造过程
  this.Create = function() {
    //..

    var ajx = new Ajax();
    var mac = this;
    this.set('XMLHTTP', ajx);

    // 将函数封装为方法，以使this在函数内有效
    this.get('XMLHTTP').onreadystatechange = function() {
      onreadystatechange.apply(mac, arguments);
    }
  }

我们看到，HttpGetMachine内部处理了XmlHttpRequest对象的状态变更，并通过调用

  this.OnStateChange(xmlHttp.readyState);

来向处理器自身／子类／事件处理程序传递该状态，同时Pool也会感知到这个事件并响应它。

这样，xmlHttp.readyState这个自定义状态就成功地在架构的全局完成了传递——如果有事件处理程序需要处理这个状态的话，就可以得到响应的机会。

onreadystatechange中有一段代码用于激活处理机的"sleep"状态。因为这个xmlHttp已经完成了它的“处理任务”，也就是获取数据。而且，完成下载的状态值“4”也经在上一行代码中向架构全局发布了通知，这意味着（如果有响应者的话）已经完成了处理过程。所以这里触发
了"sleep"状态。

上面的代码与Qomo代码包中稍有差距。代码包中的_changer()函数用于封装这个过程，而原因只是因为在Mozilla引擎中，xmlHttp.onreadystatechange会在处理完成后被自动置null。

六、处理机的高级使用方法

Qomo的类继承结构允许你进一步的实现THttpGetMachine的子类，或者创建新的Machine类，以处理其它的数据。一般来讲，你不必要重写Pool。

在前面的基本用法中，数据的处理程序是挂在Pool.OnStateChange事件上的。但这并不是理想的用法，事实上，处理的最终处理应当由Machine负责。因此，下面的代码更符合逻辑：

function MyMachine() {
  var doStateChange = function(mac, state) {
    // if (state == 4) ...
    // ...
  }

  this.Create = function() {
    this.OnStateChange.add(doStateChange);
  }
}

TMyMachine = Class(THttpGetMahine, 'MyMachine');

var pool = new Pool(TMyMachine, 10);
//...

也许你还不明白这种结构的价值，那么下面的例子，讲述如何处理不同的网页。——事实上，这已经实现了一个动态获取并分析网页（搜索引擎？）的基本结构，或者你也可以用它来做RSS分析。

  var analy_tree = {
    sina: function(ctx) {
      // ...
    },

    baidu: function(ctx) {
      // ...
    },

    google = function(ctx) {
      // ...
    }
  };

  funtion getHostFromUrl() {
    // 分析URL，对不同的url返回其host，或返回特定的分析器标识(analy_tree的属性名)
  }

  var doStateChange = function(mac, state) {
    if (state != 4) return;

    var host = getHostFromUrl(this.data.src);
    var analizer = analy_tree[host];
    if (analizer) {
      analizer.call(this, this.get('XMLHTTP').responseText);
    }
  }

更多的代码，我就不写了。哈哈～～

七、其它

详见示例：

  /Framework/DOCUMENTs/TestCase/T_Ajax.html

这个示例是可以运行在FireFox等Mozilla系列浏览器上的。但由于有跨域数据存取的问题(我在示例中访问了非本机的Url)，因此你可能会看到一个警告框，请确定即可。

在这个文件：

  /Framework/DOCUMENTs/TestCase/T_AjaxPriviledge(FF).html

中是一个解释mozilla系列浏览器上跨域存取的示例。但目前来说，没有方法能清除那个提示框。

^.^