Location : Home > Languages > Perl > Package
Title : Algorithm::HITS
Toolbox Logo

名称

 Algorithm::HITS - HITS アルゴリズムの Perl 実装


説明

 本モジュールは HITS アルゴリズム(Kleinberg's hypertext-induced topic selection)を実装する。
 http://www2002.org/CDROM/refereed/643/node1.html を見よ。


使用方法

use Algorithm::HITS;

$h = new Algorithm::HITS;
SET UP GRAPH

$h->graph(
	[
	 0 => 1,
	 0 => 2,

	 1 => 0,
	 1 => 2,

	 2 => 1,
	]
	);

ITERATE THROUGH COMPUTATION

 1000回繰り返す。

	$h->iterate(1000);

 デフォルト値は 1。

	$h->iterate();

RETURN RESULT

 PDL オブジェクトフォーマットにおけるハブベクトル(hub vector)とオーソリティベクトル(authority vector)を返す。

	$h->result();

SETTINGS

 初期オーソリティベクトルを設定する。ベクトルは単位ユークリッド距離に正規化される。

	$h->set_authority(\@v);

 初期ハブベクトルを設定する。ベクトルは単位ユークリッド距離に正規化される。

	$h->set_hub(\@v);


謝辞

 ベクトル正規化におけるバグについて指摘してくれた Hugo Zanghi に感謝する。


著作権とライセンス

 Copyright (C) 2004 by Yung-chung Lin (a.k.a. xern), <xern@cpan.org>

 本パッケージはフリーソフトウェアであり、 Perl 本体と同等の条件で修正/再配布してもよい。


【訳注と解説】

  1. このアルゴリズムは、Webのページのリンク関係を解析し、そのページの重要度を測るための指標。ページ間のリンク関係は巨大なグラフ(←ネットワーク論で言う「グラフ」ね。)として記述できるので、それを用いる。
  2. そこで使う道具がAuthority値とHub値で、Authority値はたくさんのノードからリンクされると値が大きくなり、Hub値は多くの Authority値の高いノードをリンクすると値が大きくなるというもの。たくさんのページからリンクされるってことは、その分野では引用する意味のある、「権威」とでも言えるページだという考え。それと、そういう「権威」ページへのリンクがいっぱいあると言うことは、「ハブ」として(ポータルと言うべきか)機能するという考え。
Toolbox Logo
Updated : 2006/06/14