Qomolangma框架库(三):处理池与处理机

一、框架库:处理池与处理机

严格地说,Pool被译成“池”即可,只是在Qomo的TPool类中,所有放在“池”中的对象都是处理机(Machine),因此这个TPool被称为“处理池”类。

Pool的出现早在WEUI的时代,其目的是处理同步的、缓存的XmlHttp对象。因此,Machine也就在事实上只实现了“THttpGetMachine”。这个HttpGetMachine也能处理POST类型的HTTP请求,所以,严格地说,它应该名为“THttpMachine”。

Pool是一种机制,并不局限在使用HttpGetMachine上。HttpGetMachine只是Machine的一个实现实例。我们先澄清这一点,以避免开发人员把它当成了Ajax技术的另一个名词。

HttpGetMachine已经处理了兼容问题。随便指出,Framework/Common下的公共类,都是可以在mozilla兼容浏览器中使用的。

二、池化的架构

Pool提供四种能力:

  • 注册处理机类(Machine Class)
  • 管理处理机实例(Machine Instance)
  • 调度处理机(包括状态:resume, sleep, free)
  • 管理数据(Data)对象

处理机类提供处理数据(Data)的能力,数据(Data)的结构对Pool来说是完全透明,Pool只在调度过程中,将数据传给处理器,处理器如何识别、使用、修改这个数据,Pool完全不知。

处理机应当具体的能力有:

  • 提供 OnStateChange 事件,响应来自Pool的调度状态(resume, free)
  • 在必要的时候,激活OnStateChange事件,以通知Pool进入调度状态(sleep)

事实上,Pool和Machine都可以响应三种状态,架构中没有约定哪种状态由谁发出,或者是由谁处理(并终结)。但在目前的设计中,

  • Machine处理完一段事务后,(类似于线程一样,)应触发sleep状态.
  • Pool在调用push()方法填入新的数据时,如果有空闲的Machine,则触发该Machine的result;否则,(在Pool未满的情况下,将)尝试创建新的Machine,会触发它Machine的resume.
  • Machine处理完自己的事务并进入sleep状态时,如果Pool有未处理数据,则为该Machine触发一个新的resume.

Pool和Machine可以根据需要重新设定触发方式,但不能改变对各状态值的含义的约定。

Pool和Machine都可以添加新的状态。

Machine的启动时间,以及Data处理的结束时间,是没有时序和关联的。

三、使用处理池

同一个处理池中,只能使用相同的处理机。这在处理池创建时就需要定义好。例如:

// 声明一个处理THttpGetMachine的池,池的大小(深度)为10
var pool = new Pool(THttpGetMachine, 10);

这里,池的大小为10表明池中容纳THttpGetMachine实例的上限为10个。当Machine在忙(Busy)时,如果有新的数据请求处理,则会尝试创建新的Machine。当上限设定数的Machine都在忙时,数据被缓存到队列中等待处理。

从原理上来说,无论是创建大小为1个还是100个的池,最终所有的数据都能得到处理。只是处理的并发量不一样,因此速度和性能也就有差异。——池的大小通常是经验值。

池创建后立即开始工作。但它只响应一个方法:

pool.push( _your_data );

这里的_your_data是用户自已决定的一种结构,它对于Pool来说是透明的。当它被处理时,会被传递到某个Machine实例,而这个实例确切地知道如何处理这种数据。

对于THttpGetMachine来说,它能处理一个对象,该对象有一个名为src的属性,即:

var data = { src: "[http://www.doany.net/](http://www.doany.net/)" };
pool.push( data );

这里并不限制必须是一个对象,也不限制必须是直接量声明。当然,直接量的好处,是你可以这样写代码:

pool.push({ src: "[http://www.doany.net/](http://www.doany.net/)" });

四、使用处理机

如何处理机被实现过,那么使用者只需要非常简单地调用,即可完成处理,而无需关注具体的处理机与处理池的调度过程。在上面这个使用THttpGetMachine的例子中,我们的基本代码如下:

// 1. 处理数据时的动作
function doAction(state) {
  // THttpGetMachine约定state值4表明下载完毕
  if (state == 4) {
    alert('Url: %s/nLength: %s'.format(this.data.src, this.get('XMLHTTP').responseText.length));
  }
}

// 2. Pool的状态变更响应
function doOnStateChange(mac, state) {
  doAction.call(mac, state);
}

// 3. 创建pool并添加事件响应
var pool = new Pool(THttpGetMachine, 10);
pool.OnStateChange.add(doOnStateChange);

// 4. 处理数据
pool.push({ src: "[http://www.doany.net/](http://www.doany.net/)" });

上面的步骤1、2可以有更灵活的处理方式,包括"this"的传递、数据(Data)的分析、状态(State)的识别等等,这些都是用户代码中的技巧。但在THttpGetMachine中,基本的使用方法是如上的。

下面讲述处理机的实现方法。因为Qomo的框架允许用户自行扩充各种不同的处理机。

四、实现处理机(1):基本结构

处理机需要具有两个属性:

  • data: 当处理机被TPool调度时,data指向需要被处理的数据
  • pool: 当处理机被TPool调度时,pool指向Pool自身

所以我们看到,THttpGetMachine实现中,为每个对象声明了这两个属性:

function HttpGetMachine () {
  //...

  this.Create = function() {
    this.data = null;
    this.pool = null;

    // ...
  }
}

我们说过,处理机明确地知道它将处理的数据的格式。因此,在THttpGetMachine的实现中,它响应OnStateChange时的处理代码如下:

var doStateChange = function(state) {
  if (state=='resume') {
    // 获取或创建 XmlHttpRequest 对象、设置属性等
    var xmlHttp = ...
    var method = 'GET';

    // this 指向 Machine 自身
    var src = this.data.src;

    // src 指向需要当前 Machine 处理的URL地址,因此应该通过类似如下代码来获取数据
    xmlHttp.open(method, src, true);
    xmlHttp.send(null);
  }
  else if (state=='free') {
    // ...
  }
}

五、实现处理机(2):自定义状态

我们发现,这里的代码中,只处理了XmlHttpRequest开始下载的行为,那么这个对象下载完成之后应该如何处理呢?

对于XmlHttpRequest来说,同步调用时,onreadystatechange事件会被对象触发。而这个状态其实对Pool来说,是透明的。这时,Pool会把这个状态交回给Machine。这个过程在Pool和Machine中传递,但只被Machine处理。

这些状态,被称为自定义状态——例如前面提到过的状态值“4”。它们是由Machine负责处理的。

THttpGetMachine使用如下的方法来实现自定义状态:

// 定义XMLHTTP.onreadystatechange事件的响应句柄
var onreadystatechange = function() {
  var xmlHttp = this.get('XMLHTTP');

  this.OnStateChange(xmlHttp.readyState);

  if (xmlHttp.readyState==4) {
    this.OnStateChange('sleep')
  }
}

// HttpGetMachine的对象构造过程
  this.Create = function() {
    //..

    var ajx = new Ajax();
    var mac = this;
    this.set('XMLHTTP', ajx);

    // 将函数封装为方法,以使this在函数内有效
    this.get('XMLHTTP').onreadystatechange = function() {
      onreadystatechange.apply(mac, arguments);
    }
  }

我们看到,HttpGetMachine内部处理了XmlHttpRequest对象的状态变更,并通过调用

  this.OnStateChange(xmlHttp.readyState);

来向处理器自身/子类/事件处理程序传递该状态,同时Pool也会感知到这个事件并响应它。

这样,xmlHttp.readyState这个自定义状态就成功地在架构的全局完成了传递——如果有事件处理程序需要处理这个状态的话,就可以得到响应的机会。

onreadystatechange中有一段代码用于激活处理机的"sleep"状态。因为这个xmlHttp已经完成了它的“处理任务”,也就是获取数据。而且,完成下载的状态值“4”也经在上一行代码中向架构全局发布了通知,这意味着(如果有响应者的话)已经完成了处理过程。所以这里触发
了"sleep"状态。

上面的代码与Qomo代码包中稍有差距。代码包中的_changer()函数用于封装这个过程,而原因只是因为在Mozilla引擎中,xmlHttp.onreadystatechange会在处理完成后被自动置null。

六、处理机的高级使用方法

Qomo的类继承结构允许你进一步的实现THttpGetMachine的子类,或者创建新的Machine类,以处理其它的数据。一般来讲,你不必要重写Pool。

在前面的基本用法中,数据的处理程序是挂在Pool.OnStateChange事件上的。但这并不是理想的用法,事实上,处理的最终处理应当由Machine负责。因此,下面的代码更符合逻辑:

function MyMachine() {
  var doStateChange = function(mac, state) {
    // if (state == 4) ...
    // ...
  }

  this.Create = function() {
    this.OnStateChange.add(doStateChange);
  }
}

TMyMachine = Class(THttpGetMahine, 'MyMachine');

var pool = new Pool(TMyMachine, 10);
//...

也许你还不明白这种结构的价值,那么下面的例子,讲述如何处理不同的网页。——事实上,这已经实现了一个动态获取并分析网页(搜索引擎?)的基本结构,或者你也可以用它来做RSS分析。

  var analy_tree = {
    sina: function(ctx) {
      // ...
    },

    baidu: function(ctx) {
      // ...
    },

    google = function(ctx) {
      // ...
    }
  };

  funtion getHostFromUrl() {
    // 分析URL,对不同的url返回其host,或返回特定的分析器标识(analy_tree的属性名)
  }

  var doStateChange = function(mac, state) {
    if (state != 4) return;

    var host = getHostFromUrl(this.data.src);
    var analizer = analy_tree[host];
    if (analizer) {
      analizer.call(this, this.get('XMLHTTP').responseText);
    }
  }

更多的代码,我就不写了。哈哈~~

七、其它

详见示例:

  /Framework/DOCUMENTs/TestCase/T_Ajax.html

这个示例是可以运行在FireFox等Mozilla系列浏览器上的。但由于有跨域数据存取的问题(我在示例中访问了非本机的Url),因此你可能会看到一个警告框,请确定即可。

在这个文件:

  /Framework/DOCUMENTs/TestCase/T_AjaxPriviledge(FF).html

中是一个解释mozilla系列浏览器上跨域存取的示例。但目前来说,没有方法能清除那个提示框。

^.^