[Top]

「たとえばこんなインターネット活用術」(2002/9)


[前] 定期的に「単語集」の内容を更新する

単語の価値はどうよ

さて。ここから気を取り直して、 当初ぼくが目的としていた「単語の価値の変遷」について 1999 年 4 月におこなった調査をもとにして、 軽く見ていきたいと思う。


(Image)

図 2: 月ごとのアクセス数の推移



 ここから、いくつかグラフを紹介することになるけど、 これらのグラフはいずれも 縦軸はアクセスの多さを、横軸は時間の推移を表していると 考えていただきたい。 なお、横軸の数字は、1999/4 を起点にして「何ヵ月前のことか」を 示す数字になっている。

 まず図 2 を見ていただきたい。 棒グラフで示したのが、月ごとのアクセス数の推移だ。 Total(accs) がアクセス数を、 Total(word) が単語数を、それぞれ示している。 これはどういう ことかというと、一度のアクセスにおいて 複数の検索単語が指定されていた場合、 たとえば lolita pussy という検索単語が用いられていた場合、 これを 1 つと数えるのが「アクセス数(accs)」で、 lolitapussy のように、 単語ごとに分割して 2 つと数えるのが「単語数(word)」だ。 このアクセス数・単語数ともに、多少の波はあるものの、全体的に 緩やかな増加傾向にあるといえる。また、これも非常に緩やかな 傾向ということになるんだけど、 accs に対する word の割合が増してきているように思われる。 つまり、一回のアクセスにおいて指定される単語数が 微妙ながら増加傾向にあるということだ。 これはおそらく、WWW ページとしてアクセスできる情報の総体が 増加している状況がずっと続いているため、時間の経過とともに、 単純な単語ひとつを入れたときにヒットするページが 多くなりすぎてしまい、それだけでユーザが ぼくの「単語集」にたどり着くことが難しくなってきている ことを示しているんじゃないだろうか。

 あるいは、検索者にも知恵がついてきて、複数の単語をもちいた 検索が一般にも浸透してきたということかもしれない。 でも、残念なことに、これらの推定は妄想の域を出ることが できない。なぜなら手元のデータでは調べようがないからだ。

 また、この図 2 の 折れ線グラフ(といいながら、smoothing 加工をして あるので「折れ線」ではなくて「曲線」になってますけど‥) で示したのは、 各月において最も多く検索された単語のアクセス数(Top(accs))、 および、 その「最も多く検索された単語」のアクセス数が、 アクセス数全体のどの程度を占めているか(Top(wpnt),Top(lpnt))だ。 これによると、 最も多く検索される単語の絶対数はなだらかな増加傾向にある といえるが、全体のアクセス数の増加よりもペースが鈍いため、 Top(wpnt) の値ははっきりと減少傾向にあることが示されている。 つまり、検索される単語の分布は、時間の経過とともに分散して いく傾向にあるといえる。その原因はこんな感じだろうか。

  • 「単語集」に掲載された単語の数が増えたこと
  • 単語にも旬が存在し、旬でなくなった単語は アクセス数が少しずつ落ちていくこと
この前者については、何も言うことはないだろう。 後のやつについては、すこし説明が必要かもしれない。 ある単語が広く一般に普及してしまうと、その単語を安易に用いる サイトが急激に増加してしまうため、その単語が本来的な 意味で使われているサイトが発見しにくくなってしまう。 これは実際にぼくが以前、「萌え」という単語の意味が 知りたくてサーチエンジンを使ったときに感じたことなんだけど、 あちこちのページで、(どう考えても)自分勝手に、それぞれが 自分なりの意味付けとこだわり(?)をもって「萌え」という 単語を使いまくっているために、結局、「萌え」が何なのか、 さっぱり見当もつかなかったことがあった。 そしておそらく、このような問題は「萌え」だけの話ではなく、 ある特定の嗜好に結び付く単語一般に いえる話なんじゃないだろうか。 だから、趣味趣向を同じくする人たちが、互いに連帯を深め、 互いをすぐに見つけやすくするためには、 一般に普及していない、手垢のついていない新たな単語を つねに用意し消費し続けることが必要になってくるんじゃ ないだろうか。 たとえば、あなたは turupeta という単語を ご存じだろうか。 ぼくはこの単語の意味がわからず、 1996年の11月に Goo を使って検索したことがあった。 すると、この単語でヒットしたページはたった2件しかなかった。 それが、今じゃどうだ。 2000年11月には 808 件、 2002年9月でも 593 件のヒットがあるじゃ ないか(2000年よりも2002年で減っているのには驚いた。 単語としてのピークが完全に過ぎてしまったということなのか。)。 こんな感じで、 同じような意味をもつ単語が次々と量産されていくため、 ある特定の単語への一極集中状態にどんどんなりにくくなってしまい、 その結果として、 図 2 における Top(accs) の値が下がっているんだろう。

 無論、趣味趣向に関する単語の移り変わりについては、 別の原因も考えられる。 特殊な嗜好を持った人たちが創り出す新たな専門語は、おそらく その単語特有のあやしい輝き(以前ぼくが作った メモの中には「その単語がもつ、一種のフェロモンのようなもの」 という表現がしてあった。この表現を流用した「フェロモン効果」と どちらがいい表現か迷ったんだけど‥)を持ったものだろう。 そうでないと新単語を創造する意味がないからだ。 でも、やがてその単語が広く使われるようになると、それは単に 特殊な嗜好に関連した一般的な単語としての位置に落ち着いていく。 すると、その単語が当初持っていたあやしい輝きを 持つ、新たな別の単語が求められることになる。 たとえばlolitaなどという単語には もうあやしい輝きはなく、一種の少女趣味を示す 一般的な用語となってしまったような感じが、ぼくにはしている (これについては後述)。

 単語がモノと同じように大量に生産され消費され 使い捨てられていく傾向にあり、まさに「言葉は生きもの」 といった感じのものであることは すでに指摘されていることではあるけれど、 ネットワークやサーチエンジン等の機能が充実して利便性が 高まっていくとともに、その傾向に一層の拍車がかかっている ということがいえるのかもしれない。 そこで、ここからは「言葉は生きもの」といったことを 強く意識しながら、「単語集」へのアクセス内容を見ていきたい。


(Image)

図 3: 1999/3 におけるアクセス数上位語の推移(順位)




(Image)

図 4: 1999/3 におけるアクセス数上位語の推移(アクセス数)



 次に示すのは図 3 と図 4 だ。 これらは、1999/3 現在でアクセス回数が多かった単語(best 10)について、 過去20月にまで遡った順位の変動を smooth 化してグラフにしたものだ。 図 3 での縦軸は 1 が 1 位で、-10 が 10 位と読んでほしい。 図 4 のほうは、 縦軸はアクセス数だ。20月前からすでに上位にあった lolita preteen などの単語はさておき、 全体の傾向としては、 ある単語が突然、ものすごい勢いでランク上位まで上ってきたのち、 徐々に上昇カーブが緩やかになってきているといえる。 また、上位にある単語についても、急激にランクから落ちる のではなく、徐々に、ゆるやかにランキングから落ちていく 傾向にあるといえそうだ。

 これらの単語が示す傾向は、ちょうど、 さっき述べた「単語の新鮮さ」を裏付ける結果に なっているとはいえないか。つまり、 手垢のついていない単語が創造され、その単語へのアクセスが集まる。 しかし、時間の経過とともに、その単語にも手垢がついていき、 ゆっくりとランクから落ちていく、と。 これらの図でぼくが注目したのは poruno だ。 この単語はおそらく、カタカナ書きの「ポルノ」を純粋に ローマ字表記しただけのもののように思うんだけど、 そんなタイプミスのような単語でのアクセスが実際には 増えている。なお、おそらく元の、かつ広く用いられている 単語はそれぞれ porno が 33位、 porn が 15位ということで、完全に poruno に負けている。 この現象を説明するためには、やはり、 これまで何度も述べてきたように、「porno という 単語は手垢がついてしまっている。あやしい輝き をもつ日本のアダルトマテリアルといえば、日本語表記に 基づく poruno がいちばん光ってるよ」と 多くのユーザが考えたからなんじゃないかという以外の 説明が、ぼくには思い浮かばない。


(Image)

図 5: 単語のアクセス数の比率の推移



 ここまでの議論では、ぼくは lolita など、長期にわたって ランク上位にいる単語を無視していた。 これらの単語は、この調査をおこなった 1999 年以後も ランキング上位の状態を堅持し続けていくことになる。 これは何故かと考えてみたけど、やはり、 手垢がつきすぎてしまったこの単語が、 大まかな検索対象のしぼり込みを目的として 用いられるようになったからではないかと考える。 つまり lolita は、 少女趣味系の嗜好を総称する単語として一般に定着したため、 他の、いちばん調べたい単語の添え物として 用いられるようになっているのではないかと、 ぼくは妄想するのだ。 この妄想を裏付けるかもしれないデータが、 図 5 や図 6 だ。


(Image)

図 6: 各単語の単独検索率の推移



 まず図 5 は、いくつかピックアップした上位語が、 アクセス数全体においてどの程度の割合を占めるものかを 示したグラフだ。先に示した 図 3 や図 4 のとおり、 lolitapreteen がずっと アクセス数ランキングで上位に君臨し続けているのは 確かだけど、それらの勢いは 一時期の圧倒的な状態と比較すると着実に落ちてきている、 というか、安定した状況に移行しつつあるように見える。

 一方の図 6 は、 1999年3月時点でアクセス数が多い単語について、過去20月に おける単独検索の割合の推移をまとめて示したものだ。 たとえば lolita という単語で来たアクセスには、 単に lolita とだけ入力したもの(単独検索)と、 lolita pics のように複数単語を併記したもの(組み合わせ検索) とが存在しているけど、その両者を合計した総アクセス数のうち、 どの程度を単独検索が占めているかの推移をまとめたのがこの図だ。 この図の縦軸はズバリ、単独検索率のパーセントである。 この図を見ると、一口に「アクセスが多い単語」といっても、 単独検索率が非常に高い単語(turupeta,poruno, lolidus)と、単独検索率が非常に低い単語(nude, child,sex)とに大きく分けられる。

 この極端な二分化の傾向はどう解釈したらよいのだろうか。 話は割と簡単で、おそらく、 単に nudechild とだけ書いたのでは 目的にかなうページを見つけることは非常に困難だからだろう (幼児のヌードが見たい人間は警官のヌードは見たくないだろう。 その逆もしかり)。だから、もっと自分の要求に近い他の単語、 たとえば child あるいは cop との 組合せで、添え物として nude という単語を 使っているんじゃないかと妄想できる。 一方の turupetaporuno 等については、 それらの単語自身が格別なあやしい輝きを持つ 単語であるため、 とくにそれ以外の単語を必要とせずに検索することができるために、 その結果として、単独検索率が非常に高い結果になるのだろう。

 そんな中で注目してもらいたいのが lolita だ。 この単語は、最初のうちは単独検索率が比較的高く、 アクセス総数のうち約 2/3 程度が単独検索によるものだったけど、 これが急速かつ着実に単独検索率が下がってきて、 最終的には nudechild などと 同程度の単独検索率しか持たなくなってしまっている。 これは非常に面白い現象だ。なにせ、 これまで何度も何度も何度も何度も言ってきたことだけど、 単語は生きもので、単語のもつあやしい輝きはいつか 消え失せることは周知の事実なんだろうけど、 その変化が、なんと、たった一年半程度のあいだで 起こってしまっていることをこの図が示してしまっているのだ。


(Image)

図 7: 単語ごとの、検索時単語数の推移



 図 7 も、図 6 と同様の視点からまとめた図だ。 これは、 それぞれの単語が検索される際に、平均で何語の検索をかけているか についての推移をまとめたものだ。 たとえば、ある単語において、単独検索回数が20回、 lolita pics のような2語による組み合わせ検索の回数が5回、 lolita pics free のような3語による組み合わせ検索の 回数が2回あったときには、こんな感じで計算する。

(Image)
このように計算した平均組み合わせ単語数を 100 倍したものを、 このグラフの縦軸にした。 この結果は、図 6 の結果と 密接な関係を持っていることが見てとれる。 図 6 では、lolita の単独検索率が急速に下がっている ことが確認できたが、このことは lolita による 検索の際の、平均組み合わせ単語数が着実に増加していること からも確認できる。 この図では、 childporn 等の、 当初から単独検索率が低かった単語についても、 着実に単語の平均値の上昇が見られる。 これは図 2 のところでも 言ったとおり、ネットワーク上における情報量の総体が 増加傾向にあることなどが背景にあると思うんだけど、 lolita の場合は、それらの単語と比較して、 平均組み合わせ単語数の増加スピードが早いのは 明白だろう。これはつまり、 lolita の場合においても、 ネットワーク上における情報量の総体の増加が 平均組み合わせ単語数の増加に影響を与えているかもしれないけど、 それ以外の要因も無視できないほどに存在していることを 示していると考えられるよね。そしてその原因が何かってことは、 すでに何回も言っているけど、 単語があやしい輝きを失って、総称化・一般化して いったということなんだろう。

 繰り返しになるけど、一応まとめということで もう一度言おう。lolita という単語は、 1997 年から 1999 年までのあいだで、ネットワーク上においては、 そのあやしい輝きを急速に失い、 少女系趣味全般をあらわす総称的・一般的単語へと 急速にその役割を変化させていったのではないかと ぼくは妄想する。

[次] 夜も眠れない?