GPUリソースの利用率向上を目的としたプログラム自動チューニング手法

Info

竹嶌 良, 津邑 公暁 : "GPUリソースの利用率向上を目的としたプログラム自動チューニング手法", 信学技報 (SWoPP2014) ,pp31--36 (Jul. 2014)

Abstract

理論演算性能の高いGPU に汎用計算を行わせるGPGPU が注目を集めている.このGPU 向けの並列計算アーキテクチャのひとつにCUDA がある.CUDA では,GPU 上に存在する多数の実行ユニットに対して,大量のThread を割り当てるというプログラミングモデルを採用している.また,GPU 上にはアクセス速度や容量などの特徴が異なる様々なメモリが存在しているが,CUDA ではこれらを明示的に使い分けることができる.ただし,Threadの割り当てや使用するメモリの選択はプログラムの実行効率に大きく影響するため,これらを適切に設定する必要がある.しかし,そのためにはCUDA やそのAPI の仕様に対する深い知識が必要となる.そこで本稿では,Thread 割り当ての改善と適切なメモリへのデータの自動配置を行うプリプロセッサを提案し,実装する.