MC2-6 交通流速度データのためのトピックモデル
○正田備也(長崎大学)
本研究では交通流速度のようなセンサーデータのためのトピックモデルを提案する。トピックモデルに関する研究は、Bleiらが潜在的ディリクレ配分法(LDA: latent Dirichlet allocation)を提案して以来盛んである。本研究では、センサーデータを分析するためにLDAを改変する方法を提案する。LDAでは観測データが多項分布でモデル化されているが、提案手法ではガンマ分布でモデル化する。これは、今回の研究で非負実数値のセンサーデータを分析対象として想定するためである。また、観測データをモデル化する分布を置き換えると同時に、事前分布も置き換える。実験では、市街地の道路で計測された現実の車速データを分析した。その結果、センサーの観測値が全く同じでも、そのデータが置かれた文脈によって分析結果が異なるというトピックモデル特有の分析結果が得られた。これは、テキストデータにおける多義語の多義性解消に相当する結果である。