大堀/論文/論文5
をテンプレートにして作成
[
トップ
] [
新規
|
一覧
|
単語検索
|
最終更新
|
ヘルプ
|
ログイン
]
開始行:
[[大堀/論文/2008]]
*BRINGING HIGH-PERFORMANCE RECONFIGURABLE COMPUTING TO EXACT COMPUTATIONS [#v782e9e1]
**概要 [#dde3eee4]
-本来の目的 : 可変精度計算を行える再構成可能ハードウェアの実装を目指す
--基礎技術 : 仮想畳み込みスケジューリング(I/UCRC)
--基礎技術 : 高性能、高い効率、動的なパイプライン技術
--例 : GMP (GNU Multi-Precision) : 任意精度ライブラリ
-論文内の目的 : 可変精度計算が可能なHPRC (High-Performance Reconfigurable Computers)の利用を提案する
-実際には、HPRC上で可変精度計算を行えるHWの実装、検証を行っている。
**目的 [#x8f11f92]
-伝統的に、可変精度計算は、SWで行われてきた。
--例 : GMP (GNU Multi-Precision)
-そのため精度固定演算に比べて、精度可変演算は遅い。
-論文では、HWで精度可変演算を行い、性能を向上させることを考える。
--提案するアーキテクチャは、仮想畳み込みスケジューリングを元にしている。
**結果 [#l3d2f757]
-SRC-6上でaddition/subtracctionの性能を計測した。
-加算・減算の場合
--HWの方が、Compiled-GMPとPortable-GMPよりも約5倍速くなった(データが15000以上)。
--データ量が少ない場合、オーバーヘッド、レイテンシーの関係上、最大25倍速くなる。
例) 10000bitのデータを処理する(加算・減算する)場合
SW : 0.015secかかる (図より。)
HW : 0.002secかかる (図より。)
0.015/0.002=7.5
7.5 倍 速くなった。
-乗算の場合
--2つのアルゴリズムで検証した。
--Portable-GMPはHWで実装したものと同じアルゴリズムを使用している。
--Portable-GMPと比較すると約9倍速くなった。(オーバーヘッド、レイテンシーはあるが、加算・減算より明確ではない。)
例) 10000bitのデータを処理する(乗算する)場合
SW : 2.5 sec
HW : 0.25 sec
2.5 / 0.25 = 10
10倍速くなった。
--Compiled-GMPはSWでチューニングされたもの(データサイズによって利用するアルゴリズムを使い分けている)
---0bit 〜 10000bitまでは、HWで乗算を行った方が速く、10000bit以上はSWで行った方が速い。
--加算・減算では5倍、乗算では9倍(portable-GMPの方)の速度が計測でき、HPRCは可変精度演算を行えるとわかった。
-今後
--より速いアルゴリズムの実装。(Compiled-GMP)
--RTR adaptability
--浮動小数の可変精度計算も必要になる。
**詳細 [#d3525945]
***可変精度計算問題の説明 [#we05bfa6]
例) ABCDEFG × HIJK の計算方法
(一般) ABCDEFG
×) HIJK
---------------------
●●●●●●●
●●●●●●●
:
-------------------------
というふうにけいさんする
(論文)
4cまで読破。
*** リコンフの授業で発表。 [#vc5d90c7]
-18ページ位。原稿あり。
終了行:
[[大堀/論文/2008]]
*BRINGING HIGH-PERFORMANCE RECONFIGURABLE COMPUTING TO EXACT COMPUTATIONS [#v782e9e1]
**概要 [#dde3eee4]
-本来の目的 : 可変精度計算を行える再構成可能ハードウェアの実装を目指す
--基礎技術 : 仮想畳み込みスケジューリング(I/UCRC)
--基礎技術 : 高性能、高い効率、動的なパイプライン技術
--例 : GMP (GNU Multi-Precision) : 任意精度ライブラリ
-論文内の目的 : 可変精度計算が可能なHPRC (High-Performance Reconfigurable Computers)の利用を提案する
-実際には、HPRC上で可変精度計算を行えるHWの実装、検証を行っている。
**目的 [#x8f11f92]
-伝統的に、可変精度計算は、SWで行われてきた。
--例 : GMP (GNU Multi-Precision)
-そのため精度固定演算に比べて、精度可変演算は遅い。
-論文では、HWで精度可変演算を行い、性能を向上させることを考える。
--提案するアーキテクチャは、仮想畳み込みスケジューリングを元にしている。
**結果 [#l3d2f757]
-SRC-6上でaddition/subtracctionの性能を計測した。
-加算・減算の場合
--HWの方が、Compiled-GMPとPortable-GMPよりも約5倍速くなった(データが15000以上)。
--データ量が少ない場合、オーバーヘッド、レイテンシーの関係上、最大25倍速くなる。
例) 10000bitのデータを処理する(加算・減算する)場合
SW : 0.015secかかる (図より。)
HW : 0.002secかかる (図より。)
0.015/0.002=7.5
7.5 倍 速くなった。
-乗算の場合
--2つのアルゴリズムで検証した。
--Portable-GMPはHWで実装したものと同じアルゴリズムを使用している。
--Portable-GMPと比較すると約9倍速くなった。(オーバーヘッド、レイテンシーはあるが、加算・減算より明確ではない。)
例) 10000bitのデータを処理する(乗算する)場合
SW : 2.5 sec
HW : 0.25 sec
2.5 / 0.25 = 10
10倍速くなった。
--Compiled-GMPはSWでチューニングされたもの(データサイズによって利用するアルゴリズムを使い分けている)
---0bit 〜 10000bitまでは、HWで乗算を行った方が速く、10000bit以上はSWで行った方が速い。
--加算・減算では5倍、乗算では9倍(portable-GMPの方)の速度が計測でき、HPRCは可変精度演算を行えるとわかった。
-今後
--より速いアルゴリズムの実装。(Compiled-GMP)
--RTR adaptability
--浮動小数の可変精度計算も必要になる。
**詳細 [#d3525945]
***可変精度計算問題の説明 [#we05bfa6]
例) ABCDEFG × HIJK の計算方法
(一般) ABCDEFG
×) HIJK
---------------------
●●●●●●●
●●●●●●●
:
-------------------------
というふうにけいさんする
(論文)
4cまで読破。
*** リコンフの授業で発表。 [#vc5d90c7]
-18ページ位。原稿あり。
ページ名: