はてなブクマページのキーワードの謎

はてなブックマークのページ、皆さんはよくチェックしていらっしゃいますか。自分のところはしばしば見るという人は多いと思う。
私もエントリを上げた後、誰かが「これはひどい」と「これはすごい」を同時につけててくれないかなとか、コメント欄に書き込む勇気のない誰かが嫌みのつもりでズレたコメントしてないかなとか思いながらチェックするのだが、各記事のブクマページを見ていて、前から気になっていることが一つある。
「キーワードはどのように抽出されるのか?」ということだ。


キーワードとは、本文の内容を大雑把に想像させるための、文字通り鍵になる単語群であろう。それをざっと見て「ふむ、読んでみようか」という気になったりならなかったりする、そういう機能を果たしているものだと思う。
ところが私の最近の記事のブクマページだと、キーワードは、
クリルタイ サバルタン スピヴァク ホモソーシャル ルッキズム 加野瀬 時をかける少女
となっている。
これだけ見ると、中世モンゴルの「クリルタイ」という「ホモソーシャル」における「ルッキズム」について、ガヤトリ・「スピヴァク」の『「サバルタン」は語り得るか』と「加野瀬」氏の「時をかける少女」言及記事を参照しながら分析した文章、みたいである。そんな記事とても書けそうにないが、そういう想像は成り立つ。
「ほう」と思って読んでみると、不祥事を起こした政治家の言い訳答弁みたいなことがぐちぐち書いてあって、読者の期待を裏切る。


問題は、本文にない単語がキーワードに入ってしまっていることだ。
七つある単語のうち「サバルタン スピヴァク 時をかける少女」の三つは、コメント欄のショータ氏の書き込みの中に登場する言葉である。本文に関係ないこともないがキーワードとは言えない。
もしキーワードを並べるなら「オフ会 打ち上げ ルッキズム 抑圧 草実 記事 イメージ」といったあたりだ。これなら大体どんなことが書いてあるのか見当がつく。


なぜはてなブクマページのキーワード機能は、私の記事のコメント欄から単語を拾ってしまうのだろう。コメント欄が長過ぎる時に限ってそうなるのかと思って、他の記事のブクマページを見てみたが、いちがいにそうとも言えないようだ。コメント欄が結構長くても本文だけからキーワードを拾っているところもあり、そうでないところもありといった具合にまちまち。
やはりはてなダイアリーじゃないから、おかしなことになってるのかしらん。


参考のため、はてなで日記を書いている人のブクマページを見てみた。
最近ちょくちょく私のところにリンクを貼っている瀧澤氏のブログのさよならオナニーという記事のブクマページ。キーワードは、
<エントリ コミケ 中核派 大野 政治 暴力 権力 限界>
この記事には短いコメントが二つ入っているが、キーワードはすべて本文にある言葉ばかりである。
しかし。
このキーワードの並び、微妙に厭な感じだ。「コミケ」の客で「中核派」の「大野」が「政治」と「暴力」についての「エントリ」を上げたが、「権力」の「限界」に気づいてない、みたいな。
気になったので瀧澤氏の他のブクマページも見てみた。そこで私はますます厭な単語の並びを見ることになった。文章から偏差値を読むという記事のブクマページのキーワード。
はてな インテリ エントリ コメント欄 ブログ 不祥事 大野 政治家>
どうしても、「はてな」の「インテリ」眼鏡男子の「ブログ」の、ある「エントリ」の「コメント欄」で、「大野」が「不祥事」を起こした「政治家」のごとく謝っていた、という内容だと想像できる。もっと酷いのもあった。文章からルックスを読むという記事のブクマページ
<大野 東京 遊び人 青年 風呂>
「大野」が「東京」に行って「遊び人」の「青年」に「風呂」に沈められた。
酷い。
酷いけど、それ以外に何が想像できますか? 記事内容とはまったくかけ離れた、ただ失笑を誘うだけの単語の並びを、なぜはてなブックマークのキーワード機能は作ってしまうのでしょうか。


なんかモヤモヤするので、最近言及された草実氏のこの記事ブクマページを見てみた。
<blog オフレポ オフ会 ブログ ルッキズム 不特定多数 差別 表象 非コミュ 非モテ
非常に順当である。この記事には「大野」という単語が二回出てくるが、そういう固有名詞はあえて拾わず、内容を過不足なく現している。念のため、その関連記事ブクマページも見た。
はてな アバター オフ会 マジレス 物差し 童貞 表象 非モテ
本文を読んでみたくなるような単語の並びである。そして記事内容のキーワードとして、きちんと機能している。
なぜ瀧澤氏のところはあんなことになっているのだろうか。はてなダイアラーは、キーワードを好きにいじることができるのではないかという疑問さえ湧いてきた。


ところで、誰か
<美人 快活 大野 聡明 謙虚>
とキーワードが並ぶような記事を書いてくれないものだろうか。もしそんな記事があったら、はてなスター百回くらいクリックしまうんだがな(「大野さんは美人でも快活でもなく、聡明さはかけらもない上謙虚には程遠い人だった」というのはダメです)。