“ミーム”の群集構造が欲しい

例えば出張先の天気予報を知りたいとき、面白そうな漫画を見つけたとき、健康診断結果の値が気になったとき、日々誰しもが検索している。そして大部分は検索結果のトップヒットのリンク先を読んで、ブラウザを閉じる。当然トップヒットで十分満足できる場合もあるが、例えば大事なことを判断するために参考情報を探す際には、検索結果上位の情報以外を探すために時間をかけていないだろうか?

ピロリ菌は悪者なのか?検索方法を少し変えると異なる印象になる

健康診断のオプションでピロリ菌検査を目に留め、「ピロリ菌」とは何か疑問に思って検索された方もいるのではないだろうか。この耳慣れない「ピロリ菌」という単語を検索すると、胃癌リスクを高める可能性や病原菌としての紹介が検索結果上位に並ぶ。日本語版Wikipedeiaでも

ヘリコバクター・ピロリの感染は、慢性胃炎、胃潰瘍や十二指腸潰瘍のみならず、胃癌や ~(病名一部略)~などの発生に繋がることが報告されている他、特発性血小板減少性紫斑病、小児の鉄欠乏性貧血、慢性蕁麻疹などの胃外性疾患の原因となることが明らかとなっている。細菌の中でヒト悪性腫瘍の原因となり得ることが明らかになっている唯一の病原体である。

と紹介されている。

ところが、学名の「Helicobacter pylori」で検索すると少し印象は変わる。検索結果第2位の英語版Wikipediaを引用すると

It is also linked to the development of duodenal ulcers and stomach cancer. However, over 80% of individuals infected with the bacterium are asymptomatic and it may play an important role in the natural stomach ecology.
ヘリコバクター・ピロリは十二指腸潰瘍及び胃癌の発症との関連がある。しかし感染者の80%以上の人々が病兆はなく、ヘリコバクター・ピロリは通常の胃環境にて重要な役割を果たしている可能性がある。

と記載されおり、胃腸の病気との相関関係は示されているが、病原菌とは断定されていない。
※当コラムではピロリ菌の医学的な位置づけについて議論したいわけではない。
検索にコストを割くことで、違った側面の情報が得られることもある。

検索結果上位だけがクリックされる

一般的に、検索結果のうちクリックされるリンクは上位のものだけである。10位以下になるとクリック率は3%まで下がる。上位の検索結果で十分な情報量が得られるということでもあるが、下位の情報は人目に留まる可能性が非常に低いことになる。
日本語で「ピロリ菌」と検索した場合でも、30位まで確認すると、英語のWikipediaと類似する意見も見かけるようになる。けれどもクリック率の調査結果から考えると、「ピロリ菌」の検索だけで異なる意見に辿りつく人は1%に満たないだろう。

微生物は群集構造で読み解く

ピロリ菌繋がりで、微生物学を少しご紹介したい。長年、微生物は単離培養法で研究されてきた。自然界に存在する微生物を、人工環境下で増えたものだけを研究する手法である。ところが、2010年以降メタゲノムという大量にDNA情報を解析する研究手法が普及すると、単離培養法では注目を浴びなかった微生物が多量に見つかった。単離培養法では1種の微生物だけに注目するが、メタゲノムは、ある特定の環境下に共存している微生物の集合体全体(群集構造1)を対象とする研究である。目立ちやすい微生物だけで判断せず、他の微生物の存在も考慮することで、今まで見えていなかった新しい世界が広がりつつある。

情報収集する場合も同様に、今目立つ情報だけでなく、下位の目立たない様々な情報も考慮し、全体のバランスを知ることが重要ではないだろうか。情報収集時に本当に欲しい検索結果とは、例えば「ピロリ菌」と検索した時に、「ピロリ菌が病原菌である」とする多量の結果を上位に並べられることよりも、「ピロリ菌が病原菌である」、「ピロリ菌は常在菌であり、無害である」、「ピロリ菌が胃癌のリスクを上げるかどうかは不明である」といった複数の異なる意見が示されことである。

検索結果の情報同士を類似度でグルーピングし、その意見の要約と割合を提示することはできるはずである。それは”ミーム2” の群集構造と呼べるのではないか。ミームの群集構造が与えられると、多数派を占める意見だけでなく、少数派の意見の存在、大部分で一致しているように見えて実際は各論で食い違う意見等に気付くことができるだろう。

1 群集構造:ある環境のある範囲内に、何種の生物が存在しているか(種数)、もしくは各種が何個体ずつ存在しているか(相対的な個体数)を示したもの。
2 ミーム:動物行動学者リチャード・ドーキンスが提唱する、伝播・複製される情報のこと。遺伝子が生物から生物へ複製を繰り返し増えていくように、情報も遺伝子同様に人から人へ複製されことに着目する概念。

微生物の群集構造は、個体数だけで評価はできない

微生物学にはもう一つの特徴がある。存在量だけで特定の種の影響度を判断してはいけないことである。たとえばある微生物群集の個体数のうち80%が菌類Aだったとして、Aがその微生物群集全体の振る舞いを決定していると考えることは危険である。その瞬間、何かの加減でAが増えやすい環境だったに過ぎない可能性があるからである。

検索結果(ミーム)も同様に考えることができるだろう。検索結果の大部分が同様の意見だったとしても、それはその瞬間、拡散されているだけかもしれない。有用な情報が拡散される場合もあるが、「炎上」等のトリガーによって偏った情報だけが多量に並ぶケースもある。ある意見が大量に検索結果を占めているからといって、それだけでは全体を見ているとは言えない。現在の検索結果は微生物学における単離培養法と言えるだろう。

“ミームの群集構造”が提示されること(メタゲノムならぬメタミーム)によって、その分野の素人であっても複数の選択肢を得ることができるようになる。今でもGoogleは、「ナレッジグラフ」を提供している。今後、セマンティックウェブやAIの進歩によって、その瞬間の大多数の意見だけではなく、時系列的に”ミームの群集構造”を分析した結果を、検索結果として(できればグラフィカルに)得られるようになることを期待している。