吉田/日誌/2009-05-28
をテンプレートにして作成
[
トップ
] [
新規
|
一覧
|
単語検索
|
最終更新
|
ヘルプ
|
ログイン
]
開始行:
[[吉田>吉田]]/[[日誌>吉田/日誌]]
&size(18){デスサイズ。};
>現状課題(2009/05/28 22:04)
-RPR2009。1.1、2.10-11-12。ズレ込みそう。~
-並列バケットソートプログラム。やっつけの予感。~
-2DCDPの引き継ぎCELLプログラムを解して並べて揃えて晒す。~
--エミュ:CELL BE SDK 3.0。ダウンロードが何故か出来なかった&出来ても動くのはfedora上なのでちょい保留。~
>今日と昨日の何か。~
いろいろ量れる体重計でいろいろ量ってみた。結果、
-体重:50.5kg (同身長(168.5cm)で43kgだった時を思えば重畳。
-代謝:1335kcal
--必要カロリー2225kcal/day、基礎代謝基準値26.4
-筋量:37.4%
-脂肪:9.6% (内臓脂肪:2%
-BMI :17.8
-肉体年齢/実年齢:18/26
とか。~
''2.10 - ここまでのまとめ:Pen4について''
なんちゃら。~
=Pen4の機能解析=
ならんちゃ。~
-実際問題予測ミスやキャッシュミスがどうパフォに影響するか。
-図2.31:10個のSPEC CPU2000ベンチにおける実質CPI。
--使用ベンチ:gzip, vpr, gcc, mcf, crafty, wupwise, swim, mgrid, applu, mesa
--mcf:他4個のINTベンチの4倍超CPI、最悪推測率、L1L2のミスレートも死亡説。これではキャッシュミス隠蔽は無理。
--vpr:INTベンチ5個中3個の1.6倍のCPI(mcf除く)、INTベンチ中最悪予測率、L2ミスINTベンチ中ではmcfに次いで多い。
--swim:FPベンチ中最低パフォ、他FPベンチの2倍↑CPI、mcfに次ぐL1L2ミスレート。良いところはスバラシイ推測率。でもコレじゃミスレートはカバーできない。特にL2ミス。
--L1L2ミスレートがそこそこなmgrid, gzipとかはそれなりのパフォーマンス。
-Pen4とAMD Opteron を比べてみよう。 in SPEC benchmarks.
--両方、動スケ、推測式パイプラインで毎クロック3命令を処理。
--両方2レベルキャッシュ(L1L2)構造だがPen4はL1のトレースキャッシュを使っている上に最近のPen4はL2のサイズがより大きくなってる。
--トランジスタ数、チップ面積、消費電力がほぼ同じ。2005年における各プロセッサの最適クロックレートはPen4が7-10%高かった。
-1番の違いは高クロックレートにデザインされた深パイプライン(in NetBurstアーキ)
-コンパイラはどちらも似たようなコードを吐くのでCPI比較が興味深い。
-パイプラインの違いと同様にメモリヒエラルキの違いも測定に影響。
--メモリシステムパフォの違いについては5章で。
-図2.32:2プロセッサのCPI比較。
--平均してOpteronがPen4よりCPIが1.27高い。
--無論、より深いパイプラインのPen4はOpteronよりCPIが大きかろうとは思う。
--深々パイプライン化されたNetBurst設計の最重要課題は、高クロックレートに拘るか、CPI増大を改善するかである。
-2005時点の最高クロックレートで2つをテストしたよ。in SPEC CPU2000(Opt 2.8GHz, Pen4 3.8GHz)
-高クロックレートになったはいいが、キャッシュミス増により実質のCPIは増加した。
-図2.33:同ベンチセットの性能比較。
--結果はOpteronの僅差勝ち。
--Pen4の敗因はCPI増大により生じる膨大なパイプラインストールをツブし切れなかったこと。
-よって、設計者が当初考えていたほど深パイプラインによる高クロックレートと複数命令同時発行による高スループットの両立は出来ていない。
-コレについては次章で。
''2.11 - 問題点・注意点''
''2.12 - 総括''
#comment
__________________________________________________________________________________
#comment
終了行:
[[吉田>吉田]]/[[日誌>吉田/日誌]]
&size(18){デスサイズ。};
>現状課題(2009/05/28 22:04)
-RPR2009。1.1、2.10-11-12。ズレ込みそう。~
-並列バケットソートプログラム。やっつけの予感。~
-2DCDPの引き継ぎCELLプログラムを解して並べて揃えて晒す。~
--エミュ:CELL BE SDK 3.0。ダウンロードが何故か出来なかった&出来ても動くのはfedora上なのでちょい保留。~
>今日と昨日の何か。~
いろいろ量れる体重計でいろいろ量ってみた。結果、
-体重:50.5kg (同身長(168.5cm)で43kgだった時を思えば重畳。
-代謝:1335kcal
--必要カロリー2225kcal/day、基礎代謝基準値26.4
-筋量:37.4%
-脂肪:9.6% (内臓脂肪:2%
-BMI :17.8
-肉体年齢/実年齢:18/26
とか。~
''2.10 - ここまでのまとめ:Pen4について''
なんちゃら。~
=Pen4の機能解析=
ならんちゃ。~
-実際問題予測ミスやキャッシュミスがどうパフォに影響するか。
-図2.31:10個のSPEC CPU2000ベンチにおける実質CPI。
--使用ベンチ:gzip, vpr, gcc, mcf, crafty, wupwise, swim, mgrid, applu, mesa
--mcf:他4個のINTベンチの4倍超CPI、最悪推測率、L1L2のミスレートも死亡説。これではキャッシュミス隠蔽は無理。
--vpr:INTベンチ5個中3個の1.6倍のCPI(mcf除く)、INTベンチ中最悪予測率、L2ミスINTベンチ中ではmcfに次いで多い。
--swim:FPベンチ中最低パフォ、他FPベンチの2倍↑CPI、mcfに次ぐL1L2ミスレート。良いところはスバラシイ推測率。でもコレじゃミスレートはカバーできない。特にL2ミス。
--L1L2ミスレートがそこそこなmgrid, gzipとかはそれなりのパフォーマンス。
-Pen4とAMD Opteron を比べてみよう。 in SPEC benchmarks.
--両方、動スケ、推測式パイプラインで毎クロック3命令を処理。
--両方2レベルキャッシュ(L1L2)構造だがPen4はL1のトレースキャッシュを使っている上に最近のPen4はL2のサイズがより大きくなってる。
--トランジスタ数、チップ面積、消費電力がほぼ同じ。2005年における各プロセッサの最適クロックレートはPen4が7-10%高かった。
-1番の違いは高クロックレートにデザインされた深パイプライン(in NetBurstアーキ)
-コンパイラはどちらも似たようなコードを吐くのでCPI比較が興味深い。
-パイプラインの違いと同様にメモリヒエラルキの違いも測定に影響。
--メモリシステムパフォの違いについては5章で。
-図2.32:2プロセッサのCPI比較。
--平均してOpteronがPen4よりCPIが1.27高い。
--無論、より深いパイプラインのPen4はOpteronよりCPIが大きかろうとは思う。
--深々パイプライン化されたNetBurst設計の最重要課題は、高クロックレートに拘るか、CPI増大を改善するかである。
-2005時点の最高クロックレートで2つをテストしたよ。in SPEC CPU2000(Opt 2.8GHz, Pen4 3.8GHz)
-高クロックレートになったはいいが、キャッシュミス増により実質のCPIは増加した。
-図2.33:同ベンチセットの性能比較。
--結果はOpteronの僅差勝ち。
--Pen4の敗因はCPI増大により生じる膨大なパイプラインストールをツブし切れなかったこと。
-よって、設計者が当初考えていたほど深パイプラインによる高クロックレートと複数命令同時発行による高スループットの両立は出来ていない。
-コレについては次章で。
''2.11 - 問題点・注意点''
''2.12 - 総括''
#comment
__________________________________________________________________________________
#comment
ページ名: