DB編では、データベースに蓄積したデータをどうにかしてきれいにする対策を紹介する。いきなり取り掛かると手間や時間がかかる。まずはアセスメントを実施し、その上でクレンジングや名寄せに取り組もう。時にはデータモデルを見直すという大手術も必要だ。以下で三つの事例を取り上げる。

目的不明で挫折する現場も

 データ品質の向上に悩む企業の駆け込み寺となっているのが、リアライズである。クレンジング、名寄せを専門に手掛ける数少ない1社だ。

 そんな同社のもとには、最近困った依頼が増えているという。目的や方針を持たずに、ただデータをきれいにしたい、あるいはどのように活用すればよいのか教えてほしいという問い合わせが目立っているのだ。「やみくもなクレンジング/名寄せは時間とコストの無駄。事前に目的を明確にするアセスメントを自らの現場で実施することが大切だ」と、同社の大西浩史氏(代表取締役社長)は注意を呼び掛ける。

図4●アセスメントの手順
図4●アセスメントの手順
やみくもにデータをきれいにすると、時間とコストがかかるだけである。リアライズの大西浩史氏らは、目的と方針を最初に設定し、その上でデータ品質を調査するアセスメントの手順を推奨している
[画像のクリックで拡大表示]

 ひと口に汚れたデータをきれいにするといっても、その目的や方針によってアプローチは大きく変わる(図4上)。例えば「コンプライアンス上、顧客データを一意に特定できる状態にする」という目的であれば、すべての顧客データを対象にクレンジング/名寄せする必要がある。ツールを使って実施できない場合もあり、台帳を含めた紙のデータもカバーしなければならない。逆に「見込み客の名寄せをする」のが目的なら、例えば大口顧客だけを対象に、ツールの標準機能でクレンジング/名寄せする方針を立てられる。企業内のデータは膨大に存在するだけに、「こうした目的の設定が、クレンジング/名寄せに挫折しない一つの条件になる」と大西氏は指摘する。

 アセスメントでは、最初に何のためにデータをきれいにするのかを明確にする。次に、それを達成するための方針(対象データの範囲と深さ)を決める。図4に示したように、目的は上位の「WANT」と下位の「MUST」の間で複数のレベルがある。それぞれ達成する方針を考えると、どこが妥協点なのかがはっきりしてくるはずだ。

 方針を立てたら、次に対象となるデータの品質を調査する。大西氏らがよく直面するデータの不備の例を図4下に挙げた。とりわけ顧客マスターは、名称や住所、電話番号など、不備が入り込みやすいという。加えてこの顧客マスターは、受注データや請求データといったトランザクションデータの参照先となる。顧客マスターの汚れは、またたく間に企業内の多くのデータを汚す危険性をはらんでいる。

 大西氏は「“妄想”ではなく“構想”を立てることが大切」と強調する。アセスメントによって目的とデータの状態を正しく把握することが、DBへの対策の最初の一歩といえよう。