吉田/徒然/箱
をテンプレートにして作成
[
トップ
] [
新規
|
一覧
|
単語検索
|
最終更新
|
ヘルプ
|
ログイン
]
開始行:
[[吉田>吉田]]/[[日誌>吉田/日誌]]
どこからでも取り出せてどこにでも入れられる夢の記憶域(ゴミ箱とも言う) カオス化。プチプチ潰していく。
#contents
**2dcdp [#i2b5cd4a]
+%%まずは動かしてみれ。%%
--%%zxw001(RAM32GByte装備)で実行。%%
--%%結果とRAM使用量をみる。−−−−−−−(A)%%
--
+%%使用メモリ量の最適化とか%%
--%%実行順序に注意:並列化を阻害しないよう。%%
--%%(A)%%
--
+%%それなりにしてOpenMPでぶった切る。%%
--%%(A)%%
--
+SSE系命令に手を出してみる(Intel時)
--5を先にすると笑顔になれるかも。
--(A)
+細粒度・祖粒度の並列化をバランスで。
--(A)
--
*ポイント
-探すもの
--accmbuf[]計算の依存関係。
--accnbuf[](に限らず)の配列のメモリ使用量の最大必要量。
---行き(累積)と戻り(トレース)
---縮小検討。
-distbuf[]要らねぇんじゃね?
--キャッシュ汚染低下見込み。
--その都度関数コールで対応。
-並列化可能箇所
~
*どこが並列化できるか。
-「fine:プロセッサ」と「course:マシン」
--マシン間通信はコスト大により減らすべし。(MPI)
---使用する元画像データや座標のみとか。
--プロセッサ間通信はそれなりに。(OpenMP, MPI)
--コア間通信は大胆且つ綿密に。(SSEとか)
--
--
--
--
--
**草案未満 [#h5ad7c9d]
-2DCDPのマルチコア(SIMD[SSE])プロセッサへの適用(の、ためのメモリアライン)
+要約
--
+いんとろ
--%%プログラムを作成するに当たってはC++やJavaなどでコードを作成してコンパイルする%%
--%%ここで生成されるマシン語や確保されるメモリ空間が杜撰では効率的な処理は出来ない%%
--%%生成されるマシン語の洗練にはSIMDやGPGPUなどの効率的処理のための方法がある%%
--%%が、これにはメモリ空間の適切な確保が必要になる%%
--%%ではどうするか(問題提起%%
--2画像間の最適かつ高速なピクセルマッチングの問題は画像の認識や検索、多チャンネルによる3次元形状復元など、多くの分野で生じている主要な問題である.
--この問題の解決法の一つにDPマッチングを用いた画像のスポッティング認識がある.これは事前のセグメンテーションを不要とするものであり、画像のマッチングに対して極めて有効なものである.
--画像のマッチングには他に、ピクセル対応を行うテンプレートマッチング、SIFT特徴量による特徴点マッチング、ヒストグラム特徴によるアクティブ探索法などがある.
--既存のテンプレートマッチングではアフィン変換や非線形変形に対応できない.
--特徴点マッチングでは特徴点を捉えることでアフィン変換などに強い耐性を持つが、ピクセルマッチングではないので外形の把握が困難.
--アクティブ探索法ではヒストグラム特徴を用いて類似箇所を高速に得ることが出来るが、やはり変形に弱いなどの問題がある.
--これらに対し、スポッティング認識では非線形変形を許容するピクセルマッチング法として高精細なregistrationを可能とする.
--スポッティング認識とは対象のセグメンテーションと認識を同時に行うものである.
--このアルゴリズムの手法の一つに連続DP(CDP)と呼ばれるものがある.
--これは時系列のデータベースから参照する時系列パターンに非線形最適にマッチングする区間のスポッティング認識を行うものであり、連続音声認識やジェスチャ認識に用いられている.
--2次元連続DP(2DCDP)はCDPを2次元に拡張したもので、西村らにより提案された.
--またこの2DCDPは任意形状のテンプレートでも扱えるよう拡張され、
--矢口らはテンプレートを行列2方向に分けて2次元対1次元の処理を2度行うこれまでの手法から完全な2次元対2次元の画像マッチングが行える2DCDPを提案している.
--しかし、従来の2DCDPではDPマッチングの特徴として生じる累積距離のデータ量が4次元量となるために莫大なメモリ領域を必要とし、サイズの大きな画像を扱うのが困難なこと.計算量も4次元量[O(N^4)]であるために計算時間が掛かりすぎることなどの欠点を持つ.
--本研究では従来の2DCDPの必要メモリ量を最適化してより大きなサイズの画像を扱えるようにすると共に、メモリの確保方法を工夫してMulti-core processorによるSIMD演算を用いた高速化手法を提案する.
--また、その結果を実験によって示す.
+2DCDPの原理
--(出来る限り、さらっと
--(それが出来れば苦労はない
--(まぁ、あまりにさらっとし過ぎても文章量不足になるから、いいか
--
+最適化の工程
--(今回だとSIMD化を焦点にしたメモリアラインか
++既存の方法・研究(survey)
+++データをメモリの同一配列内へ指定bit単位で確保.理想は連続した領域に確保
+++"構造体の配列"問題とその解決法
+++"配列の構造体"問題とその解決法
+++あらまほしけれ
++今回は2DCDPとかいうのに適用
---「2DCDPとは何をするもので、何で弄らなきゃならんのか」を2秒で説明
---<問題点>:4次元量のバッファの扱い
---<解決策>:(まず処理全体を見直し適切なメモリ確保量を決定した後にSIMD化に移る
--(とにかく「どこをどうやったか」を「どんな意味があるか」を交えて書く
+実験
--(アライン前後のアクセス効率とか
--(SIMD化までやっちゃったら、その結果比較とか
--
+考察(次への計画
--(次.次ったら私のタスクはブロック化かねぇ・・・
--
+こんくるーじょん
--何やった
--どうなった
--どうしたい
__________________________________________________________________________________
終了行:
[[吉田>吉田]]/[[日誌>吉田/日誌]]
どこからでも取り出せてどこにでも入れられる夢の記憶域(ゴミ箱とも言う) カオス化。プチプチ潰していく。
#contents
**2dcdp [#i2b5cd4a]
+%%まずは動かしてみれ。%%
--%%zxw001(RAM32GByte装備)で実行。%%
--%%結果とRAM使用量をみる。−−−−−−−(A)%%
--
+%%使用メモリ量の最適化とか%%
--%%実行順序に注意:並列化を阻害しないよう。%%
--%%(A)%%
--
+%%それなりにしてOpenMPでぶった切る。%%
--%%(A)%%
--
+SSE系命令に手を出してみる(Intel時)
--5を先にすると笑顔になれるかも。
--(A)
+細粒度・祖粒度の並列化をバランスで。
--(A)
--
*ポイント
-探すもの
--accmbuf[]計算の依存関係。
--accnbuf[](に限らず)の配列のメモリ使用量の最大必要量。
---行き(累積)と戻り(トレース)
---縮小検討。
-distbuf[]要らねぇんじゃね?
--キャッシュ汚染低下見込み。
--その都度関数コールで対応。
-並列化可能箇所
~
*どこが並列化できるか。
-「fine:プロセッサ」と「course:マシン」
--マシン間通信はコスト大により減らすべし。(MPI)
---使用する元画像データや座標のみとか。
--プロセッサ間通信はそれなりに。(OpenMP, MPI)
--コア間通信は大胆且つ綿密に。(SSEとか)
--
--
--
--
--
**草案未満 [#h5ad7c9d]
-2DCDPのマルチコア(SIMD[SSE])プロセッサへの適用(の、ためのメモリアライン)
+要約
--
+いんとろ
--%%プログラムを作成するに当たってはC++やJavaなどでコードを作成してコンパイルする%%
--%%ここで生成されるマシン語や確保されるメモリ空間が杜撰では効率的な処理は出来ない%%
--%%生成されるマシン語の洗練にはSIMDやGPGPUなどの効率的処理のための方法がある%%
--%%が、これにはメモリ空間の適切な確保が必要になる%%
--%%ではどうするか(問題提起%%
--2画像間の最適かつ高速なピクセルマッチングの問題は画像の認識や検索、多チャンネルによる3次元形状復元など、多くの分野で生じている主要な問題である.
--この問題の解決法の一つにDPマッチングを用いた画像のスポッティング認識がある.これは事前のセグメンテーションを不要とするものであり、画像のマッチングに対して極めて有効なものである.
--画像のマッチングには他に、ピクセル対応を行うテンプレートマッチング、SIFT特徴量による特徴点マッチング、ヒストグラム特徴によるアクティブ探索法などがある.
--既存のテンプレートマッチングではアフィン変換や非線形変形に対応できない.
--特徴点マッチングでは特徴点を捉えることでアフィン変換などに強い耐性を持つが、ピクセルマッチングではないので外形の把握が困難.
--アクティブ探索法ではヒストグラム特徴を用いて類似箇所を高速に得ることが出来るが、やはり変形に弱いなどの問題がある.
--これらに対し、スポッティング認識では非線形変形を許容するピクセルマッチング法として高精細なregistrationを可能とする.
--スポッティング認識とは対象のセグメンテーションと認識を同時に行うものである.
--このアルゴリズムの手法の一つに連続DP(CDP)と呼ばれるものがある.
--これは時系列のデータベースから参照する時系列パターンに非線形最適にマッチングする区間のスポッティング認識を行うものであり、連続音声認識やジェスチャ認識に用いられている.
--2次元連続DP(2DCDP)はCDPを2次元に拡張したもので、西村らにより提案された.
--またこの2DCDPは任意形状のテンプレートでも扱えるよう拡張され、
--矢口らはテンプレートを行列2方向に分けて2次元対1次元の処理を2度行うこれまでの手法から完全な2次元対2次元の画像マッチングが行える2DCDPを提案している.
--しかし、従来の2DCDPではDPマッチングの特徴として生じる累積距離のデータ量が4次元量となるために莫大なメモリ領域を必要とし、サイズの大きな画像を扱うのが困難なこと.計算量も4次元量[O(N^4)]であるために計算時間が掛かりすぎることなどの欠点を持つ.
--本研究では従来の2DCDPの必要メモリ量を最適化してより大きなサイズの画像を扱えるようにすると共に、メモリの確保方法を工夫してMulti-core processorによるSIMD演算を用いた高速化手法を提案する.
--また、その結果を実験によって示す.
+2DCDPの原理
--(出来る限り、さらっと
--(それが出来れば苦労はない
--(まぁ、あまりにさらっとし過ぎても文章量不足になるから、いいか
--
+最適化の工程
--(今回だとSIMD化を焦点にしたメモリアラインか
++既存の方法・研究(survey)
+++データをメモリの同一配列内へ指定bit単位で確保.理想は連続した領域に確保
+++"構造体の配列"問題とその解決法
+++"配列の構造体"問題とその解決法
+++あらまほしけれ
++今回は2DCDPとかいうのに適用
---「2DCDPとは何をするもので、何で弄らなきゃならんのか」を2秒で説明
---<問題点>:4次元量のバッファの扱い
---<解決策>:(まず処理全体を見直し適切なメモリ確保量を決定した後にSIMD化に移る
--(とにかく「どこをどうやったか」を「どんな意味があるか」を交えて書く
+実験
--(アライン前後のアクセス効率とか
--(SIMD化までやっちゃったら、その結果比較とか
--
+考察(次への計画
--(次.次ったら私のタスクはブロック化かねぇ・・・
--
+こんくるーじょん
--何やった
--どうなった
--どうしたい
__________________________________________________________________________________
ページ名: