ビッグデータという言葉を耳にするようになって、何年かたつ。ビッグデータとは、巨大で複雑なデータ集合の集積物を表す用語だ。実際に事業などに生かすには、その膨大なデータを取捨選択し、解析・可視化するという作業が必須である。人と人はもちろん、人とモノ、モノと人がつながるIoT(Internet of Things)時代を迎えて、ますますビッグデータ活用の重要性は高まっている。

 こうしたビッグデータ活用の考え方は、様々な分野で応用されている。演算速度や通信速度の向上という追い風を受けて、実際に成果が上がっている事例も、あちこちの分野で出てきている。今回は、筆者が面白いと感じた、機械翻訳などの観光関連と、乳幼児の突然死防止システムや血糖値測定コンタクトレンズなどの医療関連という、異なる分野でのケースについて説明したい(写真)。

写真●米グーグルが製薬会社と開発を進めている血糖値センサーつきのコンタクトレンズ
[画像のクリックで拡大表示]
写真●米グーグルが製薬会社と開発を進めている血糖値センサーつきのコンタクトレンズ

訳語を統計データで選ぶ

 まずは機械翻訳の分野だ。今週のITpro特集「訪日外国人急増、待ったなしの多言語対応」の中で、外国語の翻訳・通訳の分野でのビッグデータ活用について伝えている(当該記事はこちら)。

 東京オリンピック・パラリンピックが開催される2020年に、訪日外国人旅行者を2000万人に引き上げるという目標を政府が掲げている。だが、日本人の外国語音痴は、結構有名だ(関連記事:世界で活躍したいなら、外資系の実態を知っておこう(5)外資の社員でも英語はダメ?)。

 外国からお客を大勢呼んでおいて、「言葉が通じません」では話にならない。多数のマルチリンガルな日本人を育て上げるために、地道に教育していく手段もあるが、わずか5年で目覚しい成果を挙げるのはほぼ不可能だろう。そこで、ITの力を借りて“言葉の壁”を崩す取り組みが行われているのだ。

 具体的には、統計翻訳(機械統計翻訳とも呼ばれる)技術の応用である。総務省と独立行政法人情報通信研究機構(NICT)は2020年に向けて、「グローバルコミュニケーション計画」と呼ぶ多言語音声翻訳システムの開発を推進しているが、このプロジェクトで採用している技術だ。