加治/日誌/2012-10-16
をテンプレートにして作成
[
トップ
] [
新規
|
一覧
|
単語検索
|
最終更新
|
ヘルプ
|
ログイン
]
開始行:
[[加治/日誌]]
*研究 [#nf489f5f]
**現在の問題 [#ec230709]
-accumulation()の時間を測るタイマーがおかしくなる
-出力画像が時々おかしくなる
--この2つは関係しているのだろうか
**タイマーについて [#z30f1bd1]
***CUDAのタイマー関数を用いた [#be2580aa]
-単位はミリ秒。ミリ秒の小数第6位までの精度
--cutCreateTimer()
--cutStartTimer()
--cutStopTimer()
--cutDeleteTimer()
***今までのTimerと比較 [#id8873e0]
-0.0◯msまでは同じ精度
-しかしタイマーがおかしくなることについてはこちらでも同様になる。
--やはりコードが問題か
-BackTrace処理の部分を外してみても変わらない
--BackTraceを実装した際におかしくなったわけではない・・?
-バックトレースを実装する前の正常動作するコードに、cudaMalloc()でpickupを確保したら同じようにタイマーがおかしくなった。
--結果がおかしくなるようなことは無いように見える
--つまり結果がおかしくなることとタイマーがおかしくなることは関係ない?
--CUDA_SAFE_CALL()で囲っても特に出力は無い
-BackTrace on GPUを実装する前、後ともに2つ目のcu_rlabufInit()をコールしたあとにcudaMallocをするとタイマーがおかしくなることが判明
**出力画像がおかしくなる問題について [#x2db063d]
***どこで値がおかしくなるのか確かめる [#wbfa18a0]
-おかしくなる場合には、ファイル出力されるプロットデータの内容がほとんど異なっていた
--このデータはpickup_hのものなので、おかしくなる原因はGPUからの転送に失敗しているかGPUの計算の時点でおかしくなっているか。
--GPU側からprintfでpickupの配列を表示させようとしたが、なぜか全ては表示されない
---小さいコードにしてpickupの値を表示させようとしたが、こちらも途中からの値しか表示されない
-間違いの箇所がわからないので、CUDAデバッガのParallel Nsightを使おうと調べているが難易度が高い
終了行:
[[加治/日誌]]
*研究 [#nf489f5f]
**現在の問題 [#ec230709]
-accumulation()の時間を測るタイマーがおかしくなる
-出力画像が時々おかしくなる
--この2つは関係しているのだろうか
**タイマーについて [#z30f1bd1]
***CUDAのタイマー関数を用いた [#be2580aa]
-単位はミリ秒。ミリ秒の小数第6位までの精度
--cutCreateTimer()
--cutStartTimer()
--cutStopTimer()
--cutDeleteTimer()
***今までのTimerと比較 [#id8873e0]
-0.0◯msまでは同じ精度
-しかしタイマーがおかしくなることについてはこちらでも同様になる。
--やはりコードが問題か
-BackTrace処理の部分を外してみても変わらない
--BackTraceを実装した際におかしくなったわけではない・・?
-バックトレースを実装する前の正常動作するコードに、cudaMalloc()でpickupを確保したら同じようにタイマーがおかしくなった。
--結果がおかしくなるようなことは無いように見える
--つまり結果がおかしくなることとタイマーがおかしくなることは関係ない?
--CUDA_SAFE_CALL()で囲っても特に出力は無い
-BackTrace on GPUを実装する前、後ともに2つ目のcu_rlabufInit()をコールしたあとにcudaMallocをするとタイマーがおかしくなることが判明
**出力画像がおかしくなる問題について [#x2db063d]
***どこで値がおかしくなるのか確かめる [#wbfa18a0]
-おかしくなる場合には、ファイル出力されるプロットデータの内容がほとんど異なっていた
--このデータはpickup_hのものなので、おかしくなる原因はGPUからの転送に失敗しているかGPUの計算の時点でおかしくなっているか。
--GPU側からprintfでpickupの配列を表示させようとしたが、なぜか全ては表示されない
---小さいコードにしてpickupの値を表示させようとしたが、こちらも途中からの値しか表示されない
-間違いの箇所がわからないので、CUDAデバッガのParallel Nsightを使おうと調べているが難易度が高い
ページ名: