大学、専門学校や企業などの研究室を訪問し、研究テーマや実験の様子をレポート
第28回 Part.4第28回 ビッグデータの新たな解析法を開発(4)
Part.4
科学の大きな転換期を迎え
データで世界に迫る
汪 金芳(ワン・ジンファン)教授
公開:
数年前から「ビッグデータ」という言葉がよく使われるようになった。このビッグデータの解析や活用のために、「データサイエンス」という新しい学問も登場している。そこで今回は、ビッグデータを解析する新たな手法を研究している横浜市立大学の汪金芳先生の研究室を訪ね、データサイエンスの意義や具体的な研究内容について話を伺った。(Part.4/全4回)
Part.1「データから新しい価値を創造するデータサイエンス」はこちら
Part.2「ビッグデータを活用するために新たな統計解析の方法を開発」はこちら
Part.3「情報の転移方法の開発によって糖尿病の因子や発症確率を探る」はこちら
汪先生は、ビッグデータの解析と活用を中心に、データサイエンスという新しい学問領域を開拓しているが、今後の研究の展開や目標についてうかがってみた。汪先生はまず、科学そのものがいま大きな転換点にきていると指摘する。
「科学の視点から人間の長い歴史を見たとき、最初に『経験的科学』があります。太陽は毎朝、東から昇ってくるので次の日も東からだろうと考えるような、経験に基づいて物事を判断する科学です。
それでは詳細なことまではわからない。農作物の種を植えるベストなタイミングを知りたいとなると、細かな観測などが必要になります。代表的なのがニュートン力学で、これは『理論科学』と呼ばれ、科学の第2のパラダイムになります。
その後、長く理論科学の時代が続くのですが、コンピュータの登場で劇的に変貌します。非常に複雑な現象をコンピュータの世界で解くようになりました。これがコンピューテーショナルサイエンス、『計算機科学』で、第3のパラダイムになります。
そして、ビッグデータの登場によって、科学は第4のパラダイム『データ駆動型科学』に移行したといわれています。
科学の究極の目的は、人によっても考え方が違うかもしれませんが、私は人間もその一部分である世界を知りたいということだと思います。
そしていま、ビッグデータがある。ただ、デジタルデータと現実の世界との間にはギャップがある。そこで、少し難しい言葉になりますが、実世界からバーチャルな世界へ『射影』されたデータから実世界のほうへアプローチすることが必要なのですが、その可能性と限界の両方がある、というのが現状だと思います。
可能性というのは、ビッグデータの登場で、リアルワールドデータから実世界に、これまでとは異なるアプローチができるようになったということです。
限界というのは、世界は巨大で複雑すぎるということです。葛飾北斎の有名な絵『群盲評象』に描かれているように、小さな人間がそれぞれに象の鼻を触った、お腹を触った、背中を触ったからといって、それで全体を語ることはできません。
しかし、データ中心、データ駆動型のサイエンスというアプローチによって、世界の全体像に近づけるかもしれません。すべてを知ることはできないとしても、少しでも全体像に近づきたいと思っているのです」
そのためにもデータサイエンスという新しい学問の確立と発展が必要だという。
データサイエンスの確立と発展に
研究を通して貢献
「データサイエンスは、言葉自体が新しいもので、学問として市民権を得られているかはわかりません。
しかし、科学の新しい時代を開くものであることは確かです。
このデータサイエンスという学問を一時的な現象で終わらせるのではなく、1つの学問として、科学として確立し発展させていくことに、自分自身の研究を通して、そして、多くの人々との連携を通して、少しでも貢献できればと考えています」