大规模かつ多様なデータを相互に结ぶことで、大きな流れや新しい予测が可能になる。これはビッグデータを扱う大きなメリットですが、一方でビッグデータは个人情报漏えいの危険性もはらんでいます。改正个人情报保护法以降は公司间のデータ売买が可能になりますが、个人情报漏えいをいかに防ぐかという课题は依然として残っています。
そこで私の呼びかけで今年开催されるのが「匿名加工?再识别コンテスト」です。私の研究室も参加するこのコンテストでは、データから个人が特定されないように础大学が加工したデータを、叠大学が再识别するといった攻防が繰り広げられます。现実の个人データの再识别は违法ですが、このコンテストで使われるのは拟似データなので存分に技术を発挥できる点で新しい试みといえます。
研究室では他にも好きなデータを调べておもしろさを竞ったりもしていますが、なかにはポケモンのキャラをクラスタリング(グループ化)する学生もいます。私たちの研究の魅力は身近な実データを数理的に考えることで、今まで见えなかったものが见えてくるところにあります。
研究室を含め、本学科の学生の约半数は大学院进学が见込まれています。これはある公司の方の“理系採用者の约8割が修士卒”という话と无関係ではありません。理系学科を志す高校生は、ぜひ大学院进学を视野に入れて进路を决めてほしいと思います。