大堀/論文/論文3
をテンプレートにして作成
[
トップ
] [
新規
|
一覧
|
単語検索
|
最終更新
|
ヘルプ
|
ログイン
]
開始行:
[[大堀/論文]]
//研究室限定
*直接解法マシン(custom computing machines)について。 [#h5879900]
*わかったこと。 [#xf915fff]
-リコンフィギャラブルマシン
-直接解法マシン(CCM)
は、SRAMに配線データを格納している。
この配線データを入れ替えることで、電源を入れたまま、ハードウェア構成を変えることができる。
----
-CCMの代表的なプロジェクト
Splash2
--パターンマッチング、
--画像処理
など、常に入力されてくるデータをパイプライン的に処理するようなアプリケーションでは、
大幅な性能向上。
FPGA間の結合の自由度が低い
任意のメモリへのアクセスが困難
----
-CCMの問題点(従来?)
問題点
--高いレベルで記述し、それを良質のHWに落とす自動的な方法がない。いちいち考えながら記述するしかない。
--システムのサイズを越える規模の問題が解けない。仮想記憶のない計算機のようなもの。
解決方法
--データフロー言語や、拡張C言語で記述し、データフローグラフを経てHWに変換する方法。
--マルチファンクションあるいは、マルチコンテキスト機能を持つFPGA、による仮想HWの実現方法。(検討中?)
さらなる問題点
--高精度の浮動少数点を扱う数値経産を行うものには、対応できない。
---専用の浮動小数点演算用LSIでは、レイアウトレベルで既に最適化されたマクロセルを用いることができる。
---FPGAは、論理回路をSRAMのテーブルで構成したり、配線をトランスファーゲートを用いて切り替えるので、遅延時間、実装面積で不利。
--巨大な記憶容量を必要とするものには、対応できない。
---メモリとの接続が通常の計算機に比べて、貧弱なため。
さらなる解決方法
--アプリケーションにあったデータ幅を用いる。
---長すぎず、短すぎないデータ幅をアプリケーション毎に用いる。
---様々なデータ幅で高い効率を実現する宴慙愧のマクロが整備されていることが必要。
--並列演算、他の演算との組み合わせ、データの流れの最適化を図る。
---ビット演算、パターンマッチングなどの得意な演算と組み合わせることも可能。(1チップ上に複数の演算器を実装することが前提)
--メモリとの接続は、チップ内部で行う。
---DRAM混載型FPGA。(マルチコンテキストへの利用も期待される。)
----
-CCMスーパーコンピューティングシステムの実現
--1チップ上に複数の浮動小数点演算装置を格納できる規模がある。(たぶん、もうできてる。)
--DRAM混載(現行をみておくこと!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!)
--様々なデータ幅の浮動小数点マクロが整備されている。(実現予定)
------------------------------------------------
*ペタフロップスマシンについて [#ocd13758]
-ペタフロップスマシン
--1秒間に1000兆回の浮動小数点数演算を行なう、実に地球シミュレータ25基分
--単位
|Y |yotta- |ヨッタ |1024倍 |
|Z |zetta- |ゼッタ |1021倍 |
|E |exa- |エクサ |1018倍 または 260 = 1,152,921,504,606,846,976倍|
|P |peta- |ペタ |1015倍 または 250 = 1,125,899,906,842,624倍|
|T |tera- | テラ| 1012倍 または 240 = 1,099,511,627,776倍|
|G |giga- | ギガ| 109倍 または 230 = 1,073,741,824倍|
|M |mega- | メガ| 106倍 または 220 = 1,048,576倍|
|k* |kilo- | キロ| 103倍 または 210 = 1,024倍 |
|h |hecto- |ヘクト| 102倍|
|da |deca- |デカ |101倍 |
|d |deci- |デシ |10-1倍 |
|c |centi- |センチ| 10-2倍 |
|m |milli- |ミリ | 10-3倍 |
|µ |micro- |マイクロ | 10-6倍|
|n |nano- |ナノ |10-9倍 |
|p |pico- |ピコ |10-12倍 |
|f |femto- |フェムト| 10-15倍 |
|a |ato- |アト |10-18倍 |
|z |zepto- |ゼプト| 10-21倍 |
|y |yocto- |ヨクト| 10-24倍 |
終了行:
[[大堀/論文]]
//研究室限定
*直接解法マシン(custom computing machines)について。 [#h5879900]
*わかったこと。 [#xf915fff]
-リコンフィギャラブルマシン
-直接解法マシン(CCM)
は、SRAMに配線データを格納している。
この配線データを入れ替えることで、電源を入れたまま、ハードウェア構成を変えることができる。
----
-CCMの代表的なプロジェクト
Splash2
--パターンマッチング、
--画像処理
など、常に入力されてくるデータをパイプライン的に処理するようなアプリケーションでは、
大幅な性能向上。
FPGA間の結合の自由度が低い
任意のメモリへのアクセスが困難
----
-CCMの問題点(従来?)
問題点
--高いレベルで記述し、それを良質のHWに落とす自動的な方法がない。いちいち考えながら記述するしかない。
--システムのサイズを越える規模の問題が解けない。仮想記憶のない計算機のようなもの。
解決方法
--データフロー言語や、拡張C言語で記述し、データフローグラフを経てHWに変換する方法。
--マルチファンクションあるいは、マルチコンテキスト機能を持つFPGA、による仮想HWの実現方法。(検討中?)
さらなる問題点
--高精度の浮動少数点を扱う数値経産を行うものには、対応できない。
---専用の浮動小数点演算用LSIでは、レイアウトレベルで既に最適化されたマクロセルを用いることができる。
---FPGAは、論理回路をSRAMのテーブルで構成したり、配線をトランスファーゲートを用いて切り替えるので、遅延時間、実装面積で不利。
--巨大な記憶容量を必要とするものには、対応できない。
---メモリとの接続が通常の計算機に比べて、貧弱なため。
さらなる解決方法
--アプリケーションにあったデータ幅を用いる。
---長すぎず、短すぎないデータ幅をアプリケーション毎に用いる。
---様々なデータ幅で高い効率を実現する宴慙愧のマクロが整備されていることが必要。
--並列演算、他の演算との組み合わせ、データの流れの最適化を図る。
---ビット演算、パターンマッチングなどの得意な演算と組み合わせることも可能。(1チップ上に複数の演算器を実装することが前提)
--メモリとの接続は、チップ内部で行う。
---DRAM混載型FPGA。(マルチコンテキストへの利用も期待される。)
----
-CCMスーパーコンピューティングシステムの実現
--1チップ上に複数の浮動小数点演算装置を格納できる規模がある。(たぶん、もうできてる。)
--DRAM混載(現行をみておくこと!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!)
--様々なデータ幅の浮動小数点マクロが整備されている。(実現予定)
------------------------------------------------
*ペタフロップスマシンについて [#ocd13758]
-ペタフロップスマシン
--1秒間に1000兆回の浮動小数点数演算を行なう、実に地球シミュレータ25基分
--単位
|Y |yotta- |ヨッタ |1024倍 |
|Z |zetta- |ゼッタ |1021倍 |
|E |exa- |エクサ |1018倍 または 260 = 1,152,921,504,606,846,976倍|
|P |peta- |ペタ |1015倍 または 250 = 1,125,899,906,842,624倍|
|T |tera- | テラ| 1012倍 または 240 = 1,099,511,627,776倍|
|G |giga- | ギガ| 109倍 または 230 = 1,073,741,824倍|
|M |mega- | メガ| 106倍 または 220 = 1,048,576倍|
|k* |kilo- | キロ| 103倍 または 210 = 1,024倍 |
|h |hecto- |ヘクト| 102倍|
|da |deca- |デカ |101倍 |
|d |deci- |デシ |10-1倍 |
|c |centi- |センチ| 10-2倍 |
|m |milli- |ミリ | 10-3倍 |
|µ |micro- |マイクロ | 10-6倍|
|n |nano- |ナノ |10-9倍 |
|p |pico- |ピコ |10-12倍 |
|f |femto- |フェムト| 10-15倍 |
|a |ato- |アト |10-18倍 |
|z |zepto- |ゼプト| 10-21倍 |
|y |yocto- |ヨクト| 10-24倍 |
ページ名: