加治/日誌/2012-11-05
をテンプレートにして作成
[
トップ
] [
新規
|
一覧
|
単語検索
|
最終更新
|
ヘルプ
|
ログイン
]
開始行:
[[加治/日誌]]
*研究 [#a5dd638e]
**コード [#rf70501c]
-引き続きコード入れ替えなどちょこちょこしたことをやってみたが、結果は特に変わらない
***疑問 [#ufa91d24]
-ヘッダに宣言するとダメで、本文に宣言すると大丈夫な理由
-なぜaccmCalc()は__global__でなくて大丈夫なのか
**論文読み [#tf7ff10c]
**論文書き [#efdaf96d]
***構成 [#xe0f7b54]
Abstract&br;
1. Introduction&br;
2. 2DCDP&br;
-2DCDPの背景
-2DCDPのアルゴリズム説明
-応用例など
3. Problems and Profiling
-実装において
--計算量、メモリ使用量が、ピクセル数Nに対して(N)^4
-先行研究
--メモリ使用の最適化をしたので焦点を高速化にあてる
--学部までの研究結果の説明と、その課題点
--その際CUDAの説明もいる
--何倍速くなったなど
--しかし、CUDA化したことによりデータ転送の占める割合が高くなったことを示す
4. Suggestions for Improvement
-コアレスアクセスによる転送効率の向上
--GMEM⇔GPU間
-BackTraceをGPUに処理させることによる転送量の削減
--HMEM⇔GMEM間
5. Methods
-実際に行った手法
--データ配列の構造を変更
---ACCM, RLAについて
--BackTrace on GPU
---accumulation計算終了後に結果を転送するのではなく、バックトレース処理をCUDA化し、その処理が終了した後最終的な計算結果のみを転送する
6. Evaluation
-計算機環境
-評価
-なぜそのような結果になったのか
7. Conclution and Futurework
-総括
-Coarse-to-Fineによる高速化
終了行:
[[加治/日誌]]
*研究 [#a5dd638e]
**コード [#rf70501c]
-引き続きコード入れ替えなどちょこちょこしたことをやってみたが、結果は特に変わらない
***疑問 [#ufa91d24]
-ヘッダに宣言するとダメで、本文に宣言すると大丈夫な理由
-なぜaccmCalc()は__global__でなくて大丈夫なのか
**論文読み [#tf7ff10c]
**論文書き [#efdaf96d]
***構成 [#xe0f7b54]
Abstract&br;
1. Introduction&br;
2. 2DCDP&br;
-2DCDPの背景
-2DCDPのアルゴリズム説明
-応用例など
3. Problems and Profiling
-実装において
--計算量、メモリ使用量が、ピクセル数Nに対して(N)^4
-先行研究
--メモリ使用の最適化をしたので焦点を高速化にあてる
--学部までの研究結果の説明と、その課題点
--その際CUDAの説明もいる
--何倍速くなったなど
--しかし、CUDA化したことによりデータ転送の占める割合が高くなったことを示す
4. Suggestions for Improvement
-コアレスアクセスによる転送効率の向上
--GMEM⇔GPU間
-BackTraceをGPUに処理させることによる転送量の削減
--HMEM⇔GMEM間
5. Methods
-実際に行った手法
--データ配列の構造を変更
---ACCM, RLAについて
--BackTrace on GPU
---accumulation計算終了後に結果を転送するのではなく、バックトレース処理をCUDA化し、その処理が終了した後最終的な計算結果のみを転送する
6. Evaluation
-計算機環境
-評価
-なぜそのような結果になったのか
7. Conclution and Futurework
-総括
-Coarse-to-Fineによる高速化
ページ名: