データ・マイニングの深い闇 How Your Data Are Being Deeply Mined
- 2014年 2月 27日
- 時代をみる
- 「ピースフィロソフィー」データ・マイニング個人情報監視の危険な罠
エドワード・スノーデンが暴露した国家安全保障局(NSA)による個人情報監視の一方で、民間企業によるビッグ・データの利用が、私たちの目に見えないところで着々と進んでいる。
データ・マイニングとは、データ解析の技法を大量のデータに網羅的に適用することによって、自明でない情報を抽出すること。データの山から意味のある情報を「採掘する」という意味である。このように膨大なデータを処理する技術の進歩によって、私たちが今まで考えても見なかった方法で、私たちのプライバシーが盗み取られ、利用されるようになってきた。インターネットや携帯電話のオンライン世界だけでなく、車に乗ったりショッピング・モールで買い物をしたりするだけで、私たちの行動はデータ・マイニング会社の記録に取り込まれていく。もはや現実的にこの包囲網から身を引いて生活することは不可能になっている。その結果、データ差別と政府による監視という2つの問題が起きることが指摘されている。
個人情報保護法で「目に見える」個人情報のやりとりが規制されたおかげで、私達の生活はいくぶん窮屈になった一方で、企業による目に見えない個人情報の収集と転売は、収まるどころか激しさと巧妙さを増している。さらに、これを政府が利用しているのであれば、特定秘密保護法はむしろ、テロ対策を口実に、このこと全てを闇に包んでしまうのではないか。
ソーシャルメディアが人々を連帯させアラブの春を起こしたと賞賛された。しかし選挙運動にソーシャルメディアが利用されると、2012年のオバマ陣営のように、それは精密に計算されたピンポイント攻撃の人心操作へと変貌する。個人情報とデータ・マイニング技術を金で買える者たちが、民主主義さえ歪める力を持つのだ。
ニューヨーク・レビュー・オブ・ブックス、2014年1月9日号の論説を翻訳して紹介する。
(前文・翻訳:酒井泰幸、文中の[ ]内は訳者注)
原文は、
http://www.nybooks.com/articles/archives/2014/jan/09/how-your-data-are-being-deeply-mined/
データ・マイニングの深い闇
2014年1月9日
アリス・E・マーウィック
アメリカ国家安全保障局(NSA)が世界中の何百万人もの個人情報とデジタル活動記録を収集しているという、最近明らかにされた事実は、計り知れない注目と公衆の関心を集めた。しかし、これに劣らないほど不安で不透明なシステムが、広告やマーケティング[市場調査と商品開発]、データ・マイニング[データ解析の技法を大量のデータに網羅的に適用することによる、自明でない情報の抽出]を行う企業によって運営されていることは、ほとんど知られていない。スーパーのポイントカードからフェイスブックの個人向け広告におよぶ様々な技術を使って、あなたが誰で、何をし、何を買うかといった、非常に個人的な情報を、民間企業は計画的に集めている。あなたのオンラインとオフラインの行動[パソコンや携帯電話を使ったネットワーク上での行動と、ネットから離れた現実世界での行動]についてのデータは、組み立てられ、分析されて、マーケッター[商品開発・市場開発をする業者]や、企業、政府、そして時には犯罪者に売られていく。この情報収集、蓄積、転売活動の広がりは、NSAが行っていることに引けを取らないのだが、全くといってよいほど規制されておらず、データ・マイニングやデジタル・マーケティングの会社が行う多くの活動は、公には全く知られていない。
ここで、私は2つのことについて議論する。第一は、非自発的つまり受動的な、民間企業によるデータの収集、そして第二は、自発的で能動的な、個人による自分自身の個人データの収集と組み立てだ。私たちが憂慮すべきなのは前者の方だとは思うが、後者が提起するのは、果たして私たちは企業のもっと大きな思惑に利用されることなくソーシャル・メディアを活用することが可能なのだろうかという疑問である。
データベース・マーケティング
個人データを収集し、組み立て、転売する産業は、「データベース・マーケティング」と呼ばれる。この分野で業界第2位の会社であるAcxiom(アクシオム)は、年間で50兆件を超えるデータを処理する2万3千台のコンピュータ・サーバーを持っていると、ニューヨーク・タイムズは書いている(1)。アクシオム社によれば、11億件のブラウザー・クッキー(ウェブサイトから送り込まれ、ユーザーの活動を追跡するために使われる小さなデータ)をはじめ、2億件の携帯電話加入者情報、消費者一人あたり平均1,500件のデータなど、何億人ものアメリカ人に関する記録を持っているというのだ。これらのデータの中には、不動産評価額や自動車保有のように、公に入手可能な記録から拾い集めた情報や、クッキーやブラウザー広告などを通して追跡したオンラインの行動についての情報、顧客調査から得られたデータ、「オフライン」のショッピング行動などが含まれている。アクシオム社の最高経営責任者スコット・ハウは、「当社のデジタル包囲網は間もなくアメリカのインターネット・ユーザーのほぼ全てをカバーするだろう」(2)と語った。
どんなウェブサイトを訪問しても、小さなテキストファイルであるデジタル・クッキーがあなたのコンピュータに残される。「ファースト・パーティー[第一当事者]」クッキーはウェブサイトそのものによって植え込まれる。たとえばGmail(ジーメイル)が、サイトを訪れるたび毎回ログインしなくても良いようにパスワードを保存するのがこれにあたる。「サード・パーティー[第三者]クッキー」は複数のサイトにまたがって働き、どのサイトを、どんな順番で訪問したかを追跡する。ログインした人に対して、[ウェブ・ブラウザの]Google Chrome(グーグル・クローム)とFirefox(ファイアーフォックス)は、これらの閲覧履歴を異なるデバイス間で同期し、あなたがiPadで行ったことを、あなたがiPhoneやラップトップでしたことと組み合わせる。これが、広告を送付するのに使われる。
たとえば、何日か前の晩に私はiPhoneで冬用のブーツを探してLLBean.com(エルエルビーン・ドット・コム)を見ていた。何日か後に、私がiPadで読んでいたニュース・ブログにエルエルビーン・ドット・コムの広告が現れた。この「行動ターゲティング広告」は、もっと新しい「予測ターゲティング広告」によって流行遅れになりつつある。エルエルビーン・ドット・コムの広告を見たことで私がなにかを買いそうかどうかを予測するために、エルエルビーン社は高度なデータ・マイニング技法を用いるのだ。
アクシオム社が提供する「独自の高品質な行動の洞察」は、「何千件にも達し、ブランドや販売店系列への親近感から製品の使用目的や購入時期にいたるまで、消費者の関心をカバーしています。」言い換えるなら、アクシオム社は、所有しているという一人1,500件のデータに基づいて、何百万もの人々についてのプロファイル、つまりデジタル履歴書を作り出しているのだ。これらのデータには、子どもの人数、乗っている車のタイプ、保有する株式、最近のショッピング履歴、人種、年齢、教育水準などが含まれるだろう。これら異なる情報源からのデータは合成される。たとえば、雑誌購読者リストと住宅所有の公開記録を組み合わせて、「ド派手な一戸建てにミニバン」とか「裕福な両親と同居の大人」といった既存カテゴリーのいくつかに、あなたが該当するかどうかを判定する(3)。こうしてアクシオム社は消費者プロファイルを顧客に販売することができる。その顧客には、クレジットカード会社の上位15社中の12社、リテール・バンク[小口金融機関]の上位10社中7社、通信・メディア会社の上位10社中8社、不動産・損害保険業者の上位10社中9社が含まれる。
アクシオム社はデータ取引業者大手の中の一つではあるが、個人情報をオンラインで扱う方法に劇的な変化が起きていることを示している。コンピュータ技術を使って非常に大きなデータの山から社会的洞察を見出す「ビッグ・データ」に向けた動きは、医療から選挙運動にいたるまで、さまざまな業界を急速に変容させようとしている。ビッグ・データには良く知られた社会的な用途がたくさんある。たとえば、警察や、生産性を上げたい経営者がこれを使うだろう。しかし、そこから生じたプライバシーに対する新しい課題は、いまだかつて経験したことのないような程度と規模になる。ビッグ・データは数多くの「リトル・データ」からできているが、これらのリトル・データは極めて個人的なものであるかも知れないのだ。
あなたが量販店チェーンTarget(ターゲット)からカカオバター・ローションを1本買ったという事実は、それだけなら取るに足らないことである。その一方で、ターゲットは顧客の一人一人に個別のゲストID番号を割り当て、それはクレジットカード番号や、メールアドレス、氏名に関連づけられる。あなたがターゲットで買い物や取引をするたびに、あなたのゲストIDと関連づけられる。あなたが買ったカカオバターも例外ではない。
現在までターゲットは、間もなく子供を持つ人たちに対してどのように営業活動をするかを探るため、膨大な時間を費やしてきた。多くの人々は、トイレットペーパーはここで、靴下はあそこで買うというように、買い物の習慣はかなり一貫している。しかし子供の誕生は、大変動を伴う人生の変化点である。出生記録は公表されているので、新しく親になった人たちにはマーケティングや広告が浴びせかけられる。したがって、ターゲットの目標は、赤ちゃんが生まれる前に親を見つけ出すことだった。ターゲットの主任統計学者であるアンドリュー・ポールは、「妊娠4〜6ヶ月で(新しい親たちを)特定できれば、その後何年にもわたり顧客として捕捉することができる可能性が高いことが分かっていました」(4)と語った。それまでにポールは、妊娠した女性と新しい親たちの購買習慣について膨大な量のデータをマイニングしてきた。女性たちは妊娠中に、カカオバターやカルシウム錠、おむつ袋用に拡げることができる大きなハンドバッグといった、特定の品物を買っていることを見出した。
次にターゲットは、妊娠中の女性にダイレクトメールの発送を始めた。ところがこれは思わぬ結果に終わった。女性たちはむしろ不気味に感じたのだ。自分たちが妊娠していることをターゲットはどうやって知ったのか。有名な例がある。10代の女の子の父親が、ターゲットに苦情の電話をかけた。チャイルドシートや紙おむつのクーポン券を送りつけて、ターゲットは10代の妊娠を奨励しているのかと。しかし1週間後に、彼はお詫びの電話をした。娘は父親にまだ妊娠のことを伝えていなかったのだ(5) 。
そこでターゲットの経営者たちは戦術を変えた。おしゃぶりや赤ちゃん用ウェットティッシュのクーポンに、ワインや芝刈り機のクーポンを混ぜたのだ。妊娠した女性はターゲットが妊娠のことを知っているとは気付かずにそのクーポンを使うだろう。ポールがニューヨーク・タイムズ・マガジンに語ったように、「法律に触れない範囲でやっていても、人々を不安にさせるようなことはできる。」
これと同じ技術がオバマの2012年の選挙運動に使われて大きな効果を上げた。良く知られているように、オバマ陣営は分析学と行動科学での若く精鋭の専門家たちを雇い入れ、彼らを1日16時間も「洞窟」という名の部屋に詰め込んだ(6) 。オバマ陣営の主任データ科学者は、以前スーパーマーケットの売り上げアップのためビッグ・データのマイニングをやっていたアナリストだった。この「ドリーム・チーム」は細分化された人口統計をオバマに提供することができたので、寄付金呼びかけのEメールを受け取った人がいくらのお金を出すかを正確に予測することができた。東海岸の30〜40歳の女性は期待したほどに寄付していないことをこのチームが発見すると、寄付の報奨としてサラ・ジェシカ・パーカー[映画・テレビ・舞台女優兼プロデューサー]とのディナーパーティーへの抽選権を付けた(7)。オバマ陣営は選挙運動の状況をモデル化するために、毎晩6万6千通りのシミュレーションを実行した。オバマのアナリストたちは最先端のデータベース・マーケティング技術を使っていただけではなく、最先端をもはるかに超える技術を開発しつつあったのだ。
オバマ陣営の戦術は、データ・マイニングとマーケティングに関する議論でしばしば見落とされがちな、あることを浮き彫りにしている。それは、政府と政治家がマーケティング業者とデータ取引業者への主要な依頼者であるという事実である。たとえば、オバマ陣営はオハイオ州民のテレビ視聴習慣についてのデータをFourthWallMedia(フォースウォールメディア)という会社から購入した。各家庭は番号を振られていたが、家族構成員の名前は明かされていなかった。しかしオバマ陣営は、有権者名簿をケーブルテレビの契約者名簿と組み合わせ、本来はテレビのセットトップ・ボックスの使用パターンを追跡するのに使われる、匿名であるはずのID番号と関連づけることが出来た(8) 。こうして、特定の有権者層がテレビを見ている時間を狙って、オバマの選挙広告を流すことが出来た。その結果、オバマ陣営は、従来の常識で推奨されるような各地のニュースの時間ではなく、サン・オブ・アナーキー[カリフォルニアを舞台にしたバイク・クラブのメンバーたちのドラマシリーズ]や、ウォーキング・デッド[ポスト・アポカリプス・ホラードラマ]、23号室の小悪魔[シチュエーション・コメディシリーズ]のような、通常では考えられないような番組の放送時間を購入した。
「洞窟の住人たち」は、数多くのオンラインでのサインアップやコメント機能に使われる「フェイスブック・コネクト」というフェイスブックのサイン・オン技術を使って、有権者名簿とフェイスブック情報を照合することさえも可能だった。このユーザーの中にはオバマ支持者がいると分かっているから、あまり乗り気ではない友人たちを説得して投票させる方法を、オバマ陣営は考え出すことができた。オバマ陣営はフェイスブックの友達リストを調べ、タグ付けされた写真と比較して、「友達」を説得可能な有権者のリストと関連づけ、オバマ支持者を動員して「実生活」での彼らの友達をオバマに投票するよう説得させた。
ソーシャル・メディア
これらの高度なデータ・マイニングと分析技術の存在を知ってしまうと、アクシオムや、Experian(エクスペリアン)、Epsilon(イプシロン)といった会社が蓄えている私たちの個人プロファイルに飲み込まれることなく、ソーシャル・メディア、あるいはインターネットそのものを使えるような方法が、はたして私たちには残されているのだろうかと疑わざるを得ない。
ソーシャル・メディアを使えば、私たち自身についてのデータを収集し追跡することができる。たとえば、iTunes(アイチューンズ)やSpotify(スポティファイ)を使って聴いた全てのデジタル音楽の履歴を追跡するために、私は2005年からLast.fm(ラスト・エフエム)というウェブサイトを利用している。その結果、私の音楽の好みがどのように移り変わってきたかが驚くほどよく分かり、ラスト・エフエムは、この広範なリスニング履歴に基づいて、世に知られていないバンドを私に勧めることもできる。
ソーシャル・メディアを使えば、友達とつながることができ、自分自身についてより良く知ることができ、自分の生活を良くすることさえもできる。Quantified Self(クオンティファイド・セルフ)[自己の数値化]運動は、カロリー計算のように女性たちが何十年も前から使っている技術を発展させたもので、個人データを使って自己認識を促進するものだ。たとえば、長期にわたって睡眠サイクルを計測すれば、午後4時を過ぎたらカフェインを控えることを学んだり、睡眠に入るためには就寝の1時間前にはインターネットの使用を止めなければならないことに気付いたりできる。
しかし、これらのデータはデータ取引業者にとって宝の山なのだ。MyFitnessPal(マイフィットネスパル)が記録するあなたのカロリー摂取量、Fitbit(フィットビット)が追跡する毎日の歩数、Foursquare(フォースクエア)を使っているフィットネスクラブに行く回数、Instagram(インスタグラム)に投稿した料理の写真から判るあなたの食生活を、もし健康保険業者が見たらどのような反応を示すか、想像してほしい。情報の断片は、それ自身では取るに足らないものかもしれないが、この情報を組み立てると個人の全体像が見えてくる。データ収集業者はこのような情報を集中的にアクセスし、自分のデータベースに追加していくことができる。このデータ収集活動の結果として起きる2つの大きな影響に注目する必要がある。
その第一はデータ差別だ。いったん顧客集団が細分化された人口統計カテゴリーへと区分けされると、重要度の順に並べ替えることができる。2013年にアクシオム社が消費者マーケティング協会で行なった発表では、全ての顧客を「顧客価値区分」に当てはめ、上位30パーセントの顧客は500パーセントの価値を付加するが、下位20パーセントは実に400パーセントの費用を発生していると指摘した。言い換えれば、上位顧客にふんだんな配慮を振りまく一方で、顧客対応窓口への電話にかかる時間が「長すぎ」、企業にとって返品やクーポン券のコストが余計にかかり、売り上げ以上にコストがかかる下位20パーセントの顧客を無視するのが企業の義務であると、アクシオム社は言っているのだ。
これら「低価値ターゲット」は業界用語で「ゴミ」と呼ばれている。コミュニケーション学が専門のペンシルバニア大学教授、ジョセフ・トゥローは、ニッチ市場のマーケティングを研究している。彼は、全く知らないうちに何の通知もなく「ゴミ」のカテゴリーに入ってしまった人々に何が起こるだろうかと問いかける。価格差別を受けるだろうか?劣悪なサービスだろうか?他の人に提供されるオファーが自分には来ないのだろうか?このような差別は全く目に見えないのでさらに狡猾である。
第二に私たちは、個人情報を収集するマーケッターやデータ取引業者よりも、政府による監視に注意していれば良いと考えるかもしれないが、ここで見落とされているのは、政府がこれらの会社から定期的にデータを購入しているという事実だ。現在はElsevier(エルゼビア)[学術誌を多く持つ出版社]に所有されているChoicePoint(チョイスポイント)は、巨大なデータ組み立て業者だった。つまり、社会保障番号、信用状況報告書、犯罪歴を含む、公的・私的なデータベースから引き出された個人データを組み合わせていた。この会社は企業と個人に関する170億件の記録を保持し、35の政府機関や7千の連邦、州、地方警察組織をはじめとする約10万の依頼者に売っていた(9) 。
たとえば、国務省は何百万ものラテンアメリカ系市民に関する記録を購入し、それを入国管理データベースと照合した。チョイスポイントは14万5千人の個人データを個人情報詐欺組織に売却した疑いでも捜査を受けた。さらに最近になって、個人信用調査機関の大手3社のひとつであるExperian(エクスペリアン)は、誤って個人データをベトナム人ハッカーに売ってしまった。詐欺師たちは、社会保障番号や母親の旧姓が入ったこれらのデータを「fullz」(フルズ)[マル完]と呼ぶ。これさえあればクレジットカードやローンを申し込めるからである。
2〜3年前に、私は大手広告代理店の研究所を見学した。そこで見たのは最先端の消費者監視技術だった。そう遠くない将来、あなたが[ドラッグストアの]Duane Reade(デュアン・リード)の店内で、シャンプーが並ぶ大きな商品棚をぼんやり見つめながら、どれを買おうか考えているとき、商品棚はあなたの目の動きを追跡し、どのボトルを手に取るかなどを詳細に観察する。デュアン・リードはこのデータを使ってコンピュータで導き出した特定ブランドのシャンプーのクーポン券を発行し、あなたは商品棚のプリンタからこれを受け取る。携帯電話をバッグやポケットに入れても無線追跡装置からは丸見えだ。携帯電話のMACアドレスと呼ばれる固有のID番号に基づいて、ショッピングモール内での個々人の動きを追跡する実験的なアプリケーションを、私は見た。またしても、これら全ての例で、個々人は追跡されていることを自覚していない。このような手法の説明は複雑に入り組んだプライバシー・ポリシーの隅っこに隠されているかもしれないが、人々は携帯電話などを買ったときにはそのことに気付かないだろう。あるいは、監視カメラの横に掲示してある告知文に書かれているかもしれない。このようなことは専門的には違法と言えないかもしれないが、倫理的には疑問が残る。
これらの問題に対する安易な回答は、ポイントカードや、インターネットの使用、ソーシャル・メディアから身を引くことだが、これはほとんど現実的ではない。じっさい、極端な回避策を取らないかぎり、オンラインでもオフラインでも、追跡されずに生活することは実質的に不可能である。都市の交通管理が自動車の動きを追跡する。無線IDタグが衣類やドライクリーニングに付けられている。監視カメラがほとんどの店頭に設置されている(10)。消費者保護法令は多くのばあい時代遅れになっていて、現代のネットワーク社会に適用することが困難なのに対し、このような追跡技術はずっと急速に発達しつつある。
現在、連邦取引委員会と上院通商委員会はデータ取引業者を調査しており、個人情報の収集と拡散についてさらなる透明性を求めている。私たちがプライバシーについて憂慮しているのなら、これらの民間企業に抑制と均衡が働くよう要求し続けなければならない。人々には、多くのプラットフォーム[パソコンや携帯電話の基本ソフト]用に提供されている、様々な回避ツールや、広告ブロッカー、プラグインについて良く調べて知るように喚起すべきである。国家安全保障局(NSA)に対する詳細な調査も必要だが、一見無害なダイレクトメールや広告が、狡猾で危険な個人プライバシーの侵害に利用されることのないように、民間企業に同様の圧力を掛けていかなければならない。
(1) ナターシャ・シンガー、「アクシオム社、消費者データベース・マーケティングの静かな巨人」、ニューヨーク・タイムズ、2012年6月16日
Natasha Singer, “Acxiom, the Quiet Giant of Consumer Database Marketing,” The New York Times, June 16, 2012.
(2) ジュディス・アキノ、「アクシオム社、収益が不安定な中で新たな『オーディエンス・オペレーティング・システム』を準備」、AdExchanger.com、2013年8月1日
Judith Aquino, “ Acxiom Prepares New ‘Audience Operating System’ Amid Wobbly Earnings,” AdExchanger.com, August 1, 2013.
(3) ナターシャ・シンガー、「データ取引業者、秘密裏に覗き見を許す」、ニューヨーク・タイムズ、2013年8月31日
Natasha Singer, “A Data Broker Offers a Peek Behind the Curtain,” The New York Times, August 31, 2013.
(4) チャールズ・デュヒッグ、「企業はどのようにあなたの秘密を知るか」、ニューヨーク・タイムズ・マガジン、2012年2月16日
Charles Duhigg, “How Companies Learn Your Secrets,” The New York Times Magazine, February 16, 2012.
(5) カシミア・ヒル、「ターゲットはどうして父親よりも先に少女の妊娠を知ることができたのか」、フォーブズ、2012年2月16日
Kashmir Hill, “ How Target Figured Out a Teen Girl Was Pregnant Before Her Father Did,” Forbes, February 16, 2012.
(6) ジム・ルーテンバーグ、「信ずるに足るデータ:オバマ陣営のデジタル技術指導者、成果を上げる」、ニューヨーク・タイムズ・マガジン、2013年6月20日
Jim Rutenberg, “ Data You Can Believe In: The Obama Campaign’s Digital Masterminds Cash In,” The New York Times Magazine, June 20, 2013.
(7) マイケル・シェラー、「オバマの勝利を助けたデータ処理技術者たちの、秘密世界の内幕」、タイム、2012年11月7日
Michael Scherer, “ Inside the Secret World of the Data Crunchers Who Helped Obama Win,” Time, November 7, 2012.
(8) ロイス・ベケット、「オバマのビッグ・データ戦術について(今のところ)我々が知っている全てのこと」、ProPublica(プロパブリカ)、2012年11月29日
Lois Beckett, “ Everything We Know (So Far) About Obama’s Big Data Tactics,” ProPublica, November 29, 2012.
(9) 「ChoicePoint(チョイスポイント)」の項、電子プライバシー情報センター
“ ChoicePoint,” at the Electronic Privacy Information Center.
(10) サラ・ケスラー、「オフラインなら追跡されずに済むと思ったら大間違い。こうすれば防げる」Fast Company(ファスト・カンパニー)、2013年10月15日
Sarah Kessler, “ Think You Can Live Offline Without Being Tracked? Here’s What It Takes,” Fast Company, October 15, 2013.
初出:「ピースフィロソフィー」2014.2.26より許可を得て転載
http://peacephilosophy.blogspot.jp/2014/02/how-your-data-are-being-deeply-mined.html
〈記事出典コード〉サイトちきゅう座http://www.chikyuza.net/
〔eye2558:140227〕
「ちきゅう座」に掲載された記事を転載される場合は、「ちきゅう座」からの転載であること、および著者名を必ず明記して下さい。