有益なメールや仕事やプライベート上欠かすことができないメールがある一方で、 情報価値がなく、迷惑なだけのメールがある。 その最たるものは、スパムメールであろう。 最近では、 全メールの70%近くがスパムメールであるという 報告もある。 有害なウィルスを添付してあるものや、 フィッシングのような犯罪はいうに及ばず、 メール受信料が発生するような携帯電話においてもその実害はいうまでもないところだ。
悪質な迷惑メールへの対策
総務省がまとめた 「迷惑メールへの対応の在り方に関する研究会」報告書案 によれば、スパムメールを防ぐ特効薬といったものはなく、 送信側や受信側のサーバレベルでのブロッキングやユーザレベルでのフィルタリング、 さらには、法的規制といったさまざまなレイヤでの複合的な対策が必要である、 とされている。 迷惑メールの手口も、発信形態やコンテンツレベルでの巧妙化が進んでおり、 いたちごっこの感もあるにはあるが、少なくとも悪質なものに関しては、 今後の法的なあるいは技術的な解決策がかなりの程度は有効に寄与するであろうと筆者は考えている。
アンテナを高く保とうとすれば無用メールの数も増える
ところで、迷惑メールと一口にいっても、その定義はあいまいである。 もらってうれしくないメール、あるいは、 「自分にとってなんら情報価値がなく、かつ返信の必要性もないメール」 と解釈するとさらにその幅は大きく広がってくる。 たとえば、筆者のところには、さまざまなIT関係のイベントの案内や レポートの広告、新商品の案内が送られてくる。 過去のイベントの際に登録したメールアドレスを無断で使用していると思われるものもあるが、 以前にその種の案内を受け入れるということで登録したと思われるものもある (よく覚えてはいないが…)。
自分で登録して承諾しているのだから通常いわれているところの迷惑メールではないのだが、実際のところは迷惑メールと同じ処理をしていることが多い (つまりほとんど見ないで消去)。 こうした無用メールは一定の交渉や手続きにより配信をとめることもできようが、 必ずしもすべてが未来永劫無用であるとも言い切れないところが難しいところだ。
不特定多数に送りつけるスパムは論外としても、 企業からみれば、 メール配信の了解を得たユーザにはできるだけユーザの目的や嗜好にあったメールを配信したいと考えるのは当然だ。 また、個人としてもインターネット上でできるだけ高いアンテナをもって、 より有用な情報や新しいコミュニケーションチャネルを獲得しようとするのであれば、、 メールアドレスはできるだけ秘匿したくないし、 メール配信のチャネルも確保したいと思うだろう。 近年、スパム対策として、WEB上でのメールアドレス公開を差し控える傾向があるが、 理想論としては、当然、広くメールアドレスを公開して、 いろいろな人と交流していきたいというのが本来のところではないだろうか。
必要なメールだけを選別するためには…
広くメールアドレスを公開することの代償として得られる大量のメール。 無用なメールを極力排除し、本来あるべきコミュニケーションを達成するためにはどうしたらよいのだろうか。 まず第一に考えられるのは、メールを出す側の意識向上である。 かつて「授業で課題が出たのですが、わからないので教えてください」 というメールをいただいたことがある。 ネット上で関連のありそうな人を見つけて片っ端からメールを出したのであろうが、 明らかなリテラシ不足である。また、企業が配信するメールであれば、 CRMの精度向上も必須であろう。 明らかに興味のない人に長文の宣伝広告を配信しても単なる迷惑なだけである。 とはいえ、一般的にいえばCRMの精度向上には自ずと限界もある。 まず第一に、ユーザの嗜好を示すデータが必要になるがここには大きな壁がある。 また、仮にある程度のユーザ嗜好データが得られて分析が行われたとしても、 筆者の感覚では、 実際にユーザのニーズに一致するものはせいぜい数パーセント程度ではないかと思われる。 すると、やはり少なくとも90%以上のメールは、 ユーザ側で処理されなければならない。つまり、 コンテンツに応じたフィルタリング処理が必要とされる。
コンテンツフィルタリングとしては、 前回の筆者のコラム でも述べたようにさまざまなレベルのものがある。 たとえばスパムフィルタには、 大きく判定ルールに基づくものと統計的学習に基づく方法があるが、 いずれも高い精度でスパムメールを識別することができる。 ただし、これらのフィルタリングは、あくまでスパムであるか否かに対応したもので、 興味のレベルに応じて分類したりするものではないし、そもそも興味自体 時間とともに変化していくものである。 また、スパムか否かはかなり明確に教え込むことができるが、 面白いとか興味があるといったことはかなりファジイな判断にならざるを得ず、 学習データ自体が矛盾するということも往々にしてありうる。 ユーザの嗜好や興味、 あるいはそのメールの重要性を自動的に判断できるようなフィルタリングエージェントの技術開発が望まれる所以である。
おまけ:フィルタリングの責任の所在
さて、仮にこのような知的なエージェントが開発されたとしても、 フィルタリングの責任の所在という問題がある。 原稿の締切りを督促するメールやクレーム・叱責のメール といったものも、できれば見ないで済ましたいメールであろうが、 「メールフィルタが私の嗜好を解釈してフィルタリングしてしまいました」 では理由にならない。 一般的にメールに限らず大量の情報を処理する自分のエージェントに 何か有用な仕事をさせようと思うと必然的に責任を伴う作業となる。 この場合の作業の責任の所在はどこにあるのか? 逆にいえば、ユーザはどうやってエージェントに責任ある仕事を任せようと 判断することができるのか? やや本稿の範囲を逸脱したこの大きな問題については、 次回あらためて触れることとしたい。
本文中のリンク・関連リンク:
- Email Threats (MessageLabsの発表。スパムメール比率の推移など)
- The Apache SpamAssassin Project
- 総務省「迷惑メールへの対応の在り方に関する研究会」 最終報告書案
- スパムの処理に1年で47時間、2割のPCにスパイウェア (シマンテック)
- ソーシャルネットワークと人間関係の希薄化 (CNET)
- 情報フィルタリングの双対性 (Take IT Easy (2005/04/05))