6.2 情報探索空間としてのインターネット
東洋大学社会学部助教授 海 野 敏
1.はじめに
インターネットの急速な発展と爆発的な普及によって、情報探索/検索をとりまく情勢は大きく転換しつつある。本講義においては、いままでの情報検索研究の理論的な枠組みを確認したうえで、その枠組みがどのように転換しつつあるのかを論じる。次に、情報探索空間としてのインターネットをめぐって、現在どのような研究課題が提示されているのかを概観する。さらに、情報探索空間としてのインターネットの出現によって、大学図書館の機能がどのように変容しつつあるかについて、若干の考察を行う。
2.インデクシングとリトリーバル
一般に、巨大な情報空間から役に立つ情報を引き出すための処理は、個別の情報要求が発生する以前の「予備的処理」と発生した時点での「探索的処理」に分けられる。
いま、情報空間Sが「単位をなす情報」dの集合であるとすると、従来の情報検索の基本的なプロセスは次のようなモデルによって表現することができる。
(1)一次情報diの属性群を標準化して記述することで二次情報di'を生成する
(2)di'を手がかりにして、diの情報空間Sにおける位置が検索できるようにする
(3)ユーザの情報要求qiを標準化して記述することで質問表現qi'を生成する
(4)qi'とすべてのdi'を照合し、適合性(relevance)の高いdi'のみを識別する
(5)di'を手がかりにしてSからdiを入手する
これらは、(1)_(2)が予備的処理で、巨大な情報空間に厳密な構造を与えておくプロセスであり、(3)_(5)が探索的処理で、その構造を用いて情報要求に合致する情報を抽出するプロセスである。予備的処理は広義の「索引」、探索的処理は狭義の「検索」と考えられる。ここでは前者をインデクシング(indexing)、後者をリトリーバル(retrieval)と呼ぶことにする。このモデルは、19世紀以来の「資料」(とりわけ印刷物)に対する情報探索の実践において、暗黙のうちに培われてきたものである。
いままでの情報検索研究の中心的課題は、インデクシングとリトリーバルの手法を改善することによって検索効率を向上させることであった。例えば、目録作成やメタデータ生成、分類やクラスタリング、キーワード抽出やディスクリプタ付与、語彙コントロール、索引語の重み付けなどは、いずれもインデクシングに関連する研究課題であり、ブール検索やファジィ検索、ランキング出力やレレバンスフィードバック、検索語の重み付けなどは、いずれもリトリーバルに関連する研究課題である。
3.ネットワーク情報資源の探索
インターネットで流通しているネットワーク情報資源(networked information resources)は、物理的な実体や地理的な所在から自由であり、情報の発信、入手、加工、改変などに要するコスト(時間×費用×労力)が、印刷物を中心とする従来の情報資源に比べて非常に小さい。そのために、情報探索空間としてのインターネットにおいては、以下のような理由で、いままでの「インデクシング+リトリーバル」の手法が必ずしも適当ではなくなってきている。
(a)情報空間Sの膨張と変容が急激なため、Sに、逐次厳密な構造を与えている時間的余裕が
ない
(b)情報加工の低コスト化により、二次情報di'を一次情報diから分離して操作する必要が
ない
(c)ハイパーテキスト(hypertext)の浸透により、情報の断片化と癒着が進み、単位をなす情報
diが明確に識別できない
(d)無益無用な情報が氾濫しているため、はじめから効率のよい検索を行うことがきわめてむ
ずかしい
(e)検索時の試行錯誤が低コストになったため、はじめから効率のよい検索をする必要がない
(f)ノービスユーザの割合が高く、専門的な知識を必要とする検索手法が適当でない
以上のような理由で、情報探索空間としてのインターネットにおいて実行されるネットワーク情報資源の探索では、「インデクシング+リトリーバル」以外の手法も求められている。
4.ブラウジングとスクリーニング
ネットワーク情報資源の探索においては、「インデクシング+リトリーバル」の枠内のみで処理を行っていたのでは、ある程度以上の検索効率をあげることがむずかしい。そこで注目すべきなのは、「インデクシング+リトリーバル」の枠外に位置づけられることができる二つの処理である。それらがすなわち予備的処理としてのスクリーニング(screening)と、探索的処理としてのブラウジング(browsing)である(図1を参照)。
スクリーニングとは、役に立ちそうな情報だけ選別することであり、情報空間に厳密な構造を与えることはせず、ユーザの情報要求を予測して情報をおおざっぱにすくいあげておく作業である。
印刷物の時代には、生産・流通にコストがかかったため、編集、出版などの活動を通して生産・流通する情報は自然と限定され、スクリーニングは潜在化していた。しかし、ネットワーク情報資源の時代になって、スクリーニングはまだ社会的水準で安定的に機能していない。インターネットの空洞化が指摘される大きな理由はここにあると考えられる。
一方、ブラウジングとは、役に立ちそうな情報を明確な方略を持たないまま探すことであり、情報要求に合致する情報のみを精確に抽出することはせず、ユーザが試行錯誤を繰り返しながら情報を探し歩く作業である。
印刷物の時代には、ブラウジングは一次情報あるいは二次情報に対して個人的に行う作業であり、リトリーバルを補足する作業に過ぎなかった。ネットワーク情報資源の時代になってWWW(World Wide Web)の仕組みがハイパーテキストを実現し、ブラウジングは一気に一般的な情報探索の作業に組み込まれるようになった。そもそもハイパーテキストは、連想に基づくブラウジングを支援する仕組みと考えることができる。
図1 情報探索の新しい枠組み
5.新しい研究課題
ネットワーク情報資源の探索においても、「インデクシング+リトリーバル」が重要な研究課題であることに変わりはない。ネットワーク情報資源をめぐる新しい課題としては、次のようなものがある。
・ランキング出力(ranking output)の性能向上
・インデクシングロボット(indexing robot)の性能向上
・画像・音声データへの言語または非言語によるインデクシング
・メタデータの標準化(Dublin Core, Resource Description Framework, etc.)
一方、スクリーニングに関しては、次のような新しい課題が登場している。
・ソーシャルフィルタリング(social filtering/collaborative filtering)
・プロファイリング(profiling)に基づく情報提供サービス
・ホームページ評価の標準化
・プッシュ型システムの応用
さらに、ブラウジングに関しては、次のような新しい課題が登場している。
・情報空間の視覚化(visualization)
・データマイニング(data mining)
・ハイパーテキストの多種化/多重化
・「迷子問題」の解消
なお、インターネットにおける情報交換、情報探索、情報収集の仕組みとしては、WWWブラウザが実質的にプラットフォーム化している。上述のような各研究の成果は、当面はWWWブラウザへの実装というかたちで普及するだろう。
6.大学図書館の機能変容
大学図書館に限らず、いままでの図書館は「コレクション」を基盤としてサービスを行ってきた。図書館はかたちのない情報ではなく、かたちのある物品にサービスの基盤を置いていたと言ってよい。このことは、図書館サービスの質がコレクションの規模に左右されざるをえないというある種の制約になっていた。
情報探索空間としてのインターネットの登場によって、この制約からはある面で解放されるだろう。ネットワーク情報資源に関して、個別の大学図書館が果たしうる機能としては、次の五つが考えられる。
(1)館外から/館外へのアクセスを保証する「ネットワーク環境提供機能」
(2)大規模な電子図書館(的サービス)への入口となって、研究成果が探索、入手できるように
する「ゲートウェイ機能」
(3)情報の探索、入手ができない利用者を人的に支援する「レファレンス機能」
(4)利用者のニーズに合わせて研究素材を選別、組織化する「フィルタリング機能」
(5)学内で刊行される学術情報を編集し、ネットワーク化して公開する「エディトリアルセンター機能」
印刷メディアに代表されるパケージ系メディアについてのサービスが不要になるわけではない。大学図書館は、いままで通り「コレクション」に対して行ってきた作業を着実に続けていかなければならないだろう。
しかし、ネットワーク化が本格化して「バーチャルコレクション」の網羅性が高くなれば、もはや同一内容のパケージ系メディアを多くの図書館で重複して収集、保管している必要がなくなる。そのとき、個別の図書館がコレクション構築のために配分していた図書館資源(予算、人員、労働時間、スペース)は、大幅に削減できる。また、そうなれば、図書館間で分担収集・分担保存の体制を強化し、いっそうコレクション構築に割かれる図書館資源を削減することが望ましい。
そこで問題となるのは、コレクション構築から解放された分の図書館資源を、どう活用するかである。むろんネットワーク情報資源を扱うための予算、人員が新たに必要となる。それ以外に、図書館サービスの主軸であるにもかかわらずいままで十分に実施されていなかった「レファレンスサービス」へ、予算、人員を配分することが求められよう。
最後に、ネットワーク情報資源についてのサービスが進展したとき、ユーザはパケージ系メディアについても、同じようなアクセス水準を大学図書館に要求するようになる可能性を指摘しておきたい。
7.情報をめぐる認知と思考の変容
ここまで、情報探索空間としてのインターネットに対応するための研究課題とサービス課題について展望してきた。ネットワーク情報資源という新しい情報メディアによって情報探索の仕組みは組み変わり、それゆえに新しい課題に取り組まなければならないのである。
しかし、ネットワーク情報資源という新しい情報メディアが更新するのは、情報を扱う仕組みだけではない。新しい情報メディアの登場は、そのメディアを通じて情報をやりとりする人間の認知と思考のパターン自体を必ず変容させるからである。かつてマクルーハン(Marshall McLuhan)は、この現象を「メディアはメッセージである」という命題によって表現した。
来るべき高度情報化社会における情報探索環境を考えるにあたっては、情報を探索する人間の認知・思考パターンがどのように変化し、それによって情報探索行動がどのような影響を受けるかも視野に入れなければならない。なぜなら、効率的な探索システムの設計のためには、人間の理解が不可欠だからである。
8.まとめ
情報探索空間としてのインターネットの出現は、研究者に、スクリーニングとブラウジングという新しい研究課題を提示している。また大学図書館は、この新しい情報探索空間を活用するために、新しいサービスの導入と図書館資源の再配分を検討しなければならない。
参考文献
"From 'storage and retrieval systems' to 'search engines': Text retrieval in evolution"
Bulletin of the American Society for Information Science. vol. 24, no. 4, April/May 1998.
p.6-20.