加治/日誌/2014-02-09
をテンプレートにして作成
[
トップ
] [
新規
|
一覧
|
単語検索
|
最終更新
|
ヘルプ
|
ログイン
]
開始行:
[[加治/日誌]]
*すらこう [#r15fae41]
**アルゴリズム説明 [#gef03cf7]
**Problems of Parallelization by GPGPU [#wc6e3433]
***2DCDPコンピュテーションのプロファイリング [#d6b3b871]
-もとの2DCDPコードのプロファイリング
--9割が累積値計算部分で、リアルタイム処理を求めるには不十分で、あとこれぐらい必要
-これを高速化するためにGPGPUを用いた
--GPGPUの動き
--並列化した部分32x32
--GPGPUのプロファイリング
--データ転送部が大きなボトルネックになる
**Optimization for GPGPU [#g2ad9bde]
***データのアラインメント [#g4975a0d]
-コアレッシングを用いたデータ転送の最適化
***データ転送量の削減 [#nb150e48]
-Backtrackingを引き続きGPU上で行わせることにより、最終結果のN^2のデータにする
--これにより、評価対象のデータであればこれぐらい削減できるだろう
***初期化処理の並列化 [#u88a2643]
-BacktrackingのGPGPU化に伴い必要な初期化処理をGPUで並列化するようにした
-これによりこれぐらい削減できるであろう
**Evaluation [#p4374516]
-実際の測定
--マシンスペック
-測定対象
--GPGPU
--Backtraking on GPU
**Conclusion [#rf6558d0]
*書くべきこと [#a700d356]
*書くべきこと [#gab03859]
-変数のアラインメント
--N^4なのでおおいからN^2にするbyGPGPU
--データ転送に時間が掛かる
終了行:
[[加治/日誌]]
*すらこう [#r15fae41]
**アルゴリズム説明 [#gef03cf7]
**Problems of Parallelization by GPGPU [#wc6e3433]
***2DCDPコンピュテーションのプロファイリング [#d6b3b871]
-もとの2DCDPコードのプロファイリング
--9割が累積値計算部分で、リアルタイム処理を求めるには不十分で、あとこれぐらい必要
-これを高速化するためにGPGPUを用いた
--GPGPUの動き
--並列化した部分32x32
--GPGPUのプロファイリング
--データ転送部が大きなボトルネックになる
**Optimization for GPGPU [#g2ad9bde]
***データのアラインメント [#g4975a0d]
-コアレッシングを用いたデータ転送の最適化
***データ転送量の削減 [#nb150e48]
-Backtrackingを引き続きGPU上で行わせることにより、最終結果のN^2のデータにする
--これにより、評価対象のデータであればこれぐらい削減できるだろう
***初期化処理の並列化 [#u88a2643]
-BacktrackingのGPGPU化に伴い必要な初期化処理をGPUで並列化するようにした
-これによりこれぐらい削減できるであろう
**Evaluation [#p4374516]
-実際の測定
--マシンスペック
-測定対象
--GPGPU
--Backtraking on GPU
**Conclusion [#rf6558d0]
*書くべきこと [#a700d356]
*書くべきこと [#gab03859]
-変数のアラインメント
--N^4なのでおおいからN^2にするbyGPGPU
--データ転送に時間が掛かる
ページ名: