ネットの集合知と言語空間

 このところネットを検索していると、日本語空間における有益な情報が減っているという印象を持つことがあります。同じことを調べるのに、日本語では必要な情報が見つからず、仕方なく英語でキーワードを入力すると、比較的に容易に必要な情報に到達することが多くなっている気がします。

検索エンジンの基本的な仕組み
 言語には文化的な背景がありますから、英語圏で豊富な情報と日本語圏で豊富な情報に分かれるのは当然のことです。ネットの検索エンジンにおける情報構造がどうなっているのかは、同じ条件で比較することが困難ですから、日本語圏における情報環境が貧弱になっているのかについて、簡単に結論付けることは難しいでしょう。

 しかし、ソフトウェアの操作方法などグローバルに共通のテーマであれば、どの言語圏の情報が豊富なのかについてある程度、推測することが可能です。
 きっかけはWindows10の機能に関する情報でした。マイクロソフトは新しいOS(基本ソフト)であるWindows10を発売開始しましたが、従来の新製品とは異なり、同社は大々的なキャンペーンを行っていません。このため、Widows10の新機能についても、ネット上で情報収集をする必要があります。

 ある機能に関するキーワードを入力しても日本語ではよい情報を見つけることができず、仕方なく英語で入力すると、欲しい情報にアクセスできるというケースがたびたびありました。Winsows10への置き換えは米国の方が進んでいますから、英語の情報が多いという可能性は十分に考えられます。
 ただ、検索エンジンの基本的な仕組みというものを考えると、特定の言語圏の情報空間が貧弱になってしまう可能性は十分にあるとみてよいでしょう。

 よく知られているようにグーグルの検索エンジンは、ページランク方式と呼ばれる考え方に基づいてWebサイトの優先順位を決定しています。ページランク方式とは、簡単に言ってしまうと、多くの人から参照されている(リンクが貼られている)サイトの重要度を高く設定するというものです。

 この考え方は学術論文の評価によく使われており、ノーベル賞の受賞者選定にも大きな影響を与えています。つまり、多くの学者から参照されている論文の重要性は高いと考えられるので、参照数の多い論文は、優れた論文である可能性が高いという理屈です。

 検索エンジンもこれと同じ考え方で作られています。多くの人が参照するページは重要であり、あるキーワードを検索すると、参照している数が多い順に検索結果に表示されるという仕組みになっています。

nettogeno6173

インターネットは実は恐ろしい
 もちろんグーグルはそれだけで検索結果の順位を決めているわけではありません。現在は人工知能が発達していますから、その文章を書いたのは誰か、文章の質はどの程度なのかなど、多面的な評価を行った上でランクが決定されています。しかし基本的な考え方は、多くの人が参照しているかどうかです。

 この考え方はネットの世界では集合知と呼ばれています。多くの人が考えていることはおおよそ正しいことであり、皆の知見を集めれば、もっとも正しい答が得られるというものです。
 こうした考え方には反対意見もあります。多くの人の意見を集めても、衆愚政治のような状況になってしまえば、かえって情報の質が落ちるというものです。つまり集合知の世界は、参加者の質が高いと、知のレベルは果てしなく上がっていき、逆に参加者のレベルが低いと、知のレベルも下がっていく可能性があるわけです。

 しっかりとした集合知が成立するためには、他人に影響されない独自の情報がたくさん存在していることが重要となります。情報の独立性と多様性が重要なのです。ある事柄について、たくさんの人が、それぞれの立場に基づいて情報をサイトにアップしていれば、利用者はその中から有望と思われる情報を選び出します。もっとも多くの人の参照を集めたサイトの情報が、結果的にもっとも正しいという流れになるわけです。

 しかし、ある事柄について、ネットの参加者が独自の情報をアップせず、誰かがすでに公開した情報をコピーしたものばかりになっているとしたらどうでしょうか。ネットには同じ情報ばかりが溢れてしまうことになり、情報の多様性が薄れてしまいます。もし、コピーされている情報が正しいものでなかった場合には、ネット空間ではウソの情報しか得られないことになってしまいます。

 日本語空間がそうなっているのかは分かりませんが、集合知を前提とするネット空間では、情報の出し手(つまりネットの参加者)の意識が低いとそういった結果に陥る可能性があるわけです。

 これはかなり前から危惧されていたことですが、ネットが完全に社会のインフラとして定着した今、この問題の重要性は高まっています。ネットとは非常に便利な存在ですが、一方、その言語空間における参加者の知的能力が問われてしまうという、恐ろしい存在でもあるわけです。

 わたしたちが、何気なくブログにアップしている情報であっても、日本語の情報空間の質に影響を与えているのだという自覚が必要なのかもしれません。