動画像処理ライブラリRaVioliにおけるデータ転送と関数実行の効率化

Info

古橋 一輝, 小野 和馬, 津邑 公暁 : "動画像処理ライブラリRaVioliにおけるデータ転送と関数実行の効率化", 信学技報 (HotSPA2016) ,pp15--20 (May. 2016) 予稿

Abstract

静止画や動画像の処理を高速に実行可能な GPU の性能を十分に引き出すためには,その複雑なプロセッサ構成を理解した上でプログラムを記述する必要がある.動画像処理ライブラリRaVioliのGPU向け拡張であるRaVioli/CUDAは,GPU向け開発環境であるCUDA特有の記述をライブラリ内に隠蔽することで,このプログラマの負担を軽減している.しかしRaVioli/CUDAには,まだGPUの性能を十分に引き出しきれていない部分がある.そこで本稿では,RaVioli/CUDAを改良し,GPUの利用効率を向上させる手法を提案する.提案手法では,GPU使用時のデータ転送の効率化と関数同士の並行実行を可能にすることで,GPUの利用効率の向上を図る.提案手法を実装しRaVioli/CUDAを用いたプログラムの実行時間を,既存のRaVioli/CUDAと比較した結果,最大で約3倍の高速化を実現できることが確認できた.