らかぁ4挺

4行日記

YahooAPI〜完結編

そんな大したモノでもないのに、ここまでひっぱって心苦しい限り。
で、なんだっけ?あーなんか大量データ処理の自動化ってことで、検索結果を使って何かやりたいと思ったんだけど、小生が思いついたのは検索結果の件数を統計的に処理しようと。具体的には、複数のキーワードのAND検索の件数から、それらのキーワード同士の関係(とりあえず『距離』と定義します)を導くと、何か面白いことできないかなぁ、と思った次第。で、次のようなモノを作ってみました。

(1)キーワード5件の単独の検索件数を求める。
(2)キーワード5件から2件抜き出し、それらのAND検索の件数を求める。
(3)(2)で求めた結果を、(1)で求めた、単独検索件数の小さい方の値で割り、キーワード間の距離とする。
(4)(2)〜(3)を全組み合わせに対して行う。

つまり、AND検索が少なくても、Aについて言及しているページの中で、Bについて言及しているページが多ければ、『距離』としては近くなります。
例として、ファウスト夏合宿の5人で実験してみました。以下が結果

線が白ければ白いほど、『距離』が近くなります。具体的な数値は書くのが面倒いので割愛。西尾維新佐藤友哉北山猛邦のトライアングルが白っぽいですが、これはメフィスト賞受賞者だからでしょう。滝本竜彦著のネガティブハッピー・チェーンソーエッヂ (角川文庫)の解説を西尾維新が書いているので、西尾維新-滝本竜彦ラインがまあまあ近かったり、角川つながりでしょうか、滝本竜彦乙一の距離が近かったり。で、一つ意外だったのが、乙一-佐藤友哉ライン。これが近いんだよね。何でだろう?遠い方で言えば、西尾維新乙一ルービックキューブ攻撃は、世間一般には浸透していないようですね。うーん、何がわかったかといえば、何も解らないことが解ったという、なんか偉い人が言うととってもありがたい結論に達したような。でもこの時点ではまだ野望は残っていたのですけど。それは次にて。