吉田/日誌/2009-06-16
をテンプレートにして作成
[
トップ
] [
新規
|
一覧
|
単語検索
|
最終更新
|
ヘルプ
|
ログイン
]
開始行:
[[吉田>吉田]]/[[日誌>吉田/日誌]]
&size(18){鎖骨。};
頭蓋涙骨鼻骨頬骨脊椎胸骨肋骨肩胛骨上腕骨尺骨中指骨大腿骨腓骨踵骨(ッ!?
>現状課題
-RPR2009スライド。1.1空気、2.11-12。ミナ。~
-並列輪講:8章前半、の、前半担当。
-2DCDPの引き継ぎCELLプログラムを解して並べて揃えて晒す。~
--現状:もやい結び。もやもや。並べても揃わない。
--Fodoraで動くと評判のCELL-SDKがFedoraで動かない。もっかいやるか~
-並列プログラム。動くようになったら動かす。何この待ちの姿勢。~
>今日と昨日の何か、~
-RPR資料作成 Reloaded
--
-針金工作。骨。後で網金を皮に。
-ポップコーンがちゃんとタコになってると何か幸せな午前3時。
''2.12 - 総括''
-複数命令同時発行構造の実に興味深い点は、その性能向上が基本的なユニプロセッサプログラミングモデルの影響を受けないこと。
-ILPの恩恵を、受けること自体は簡単なのだけれど、設計上の問題はそのプラクティスの煩雑さ。
-単純なレベル1解析においてさえ想定するパフォーマンスを達成するのは困難でしょう。
-過去10年ほどは、目新しい技術を取り入れることよりも、クロックレートを上げたり、均一な性能を出すことに主眼があった。
-過去5年間に発表された動的スケジューリング・マルチイシュー型のプロセッサはすべて同じ基本アーキテクチャと発令レートを持っていたの。この基礎技術は1995年の技術発表当時と変わらない。
--Pen4, IBM Power5, Athlon, Opteron. どれも3-4m命令/clock
-でも、クロックレートは10-20倍、キャッシュサイズは4-8倍、リネームレジスタ数は2-4倍になり、ロードストアユニット数も2倍以上になっている。トータルなパフォーマンスは初期の8-16倍になっているのさ。
-クロックレート増加とCPI減少のトレードオフの決定は困難であり、この書の'95年版では以下のように述べている。
--(略
-3.8GHzPen4の有用性を引き出すときのネックは主に私達のプロセッサ設計の理解度にある。
-しかしながら次章で触れるが、高クロックレートプロセッサの初期の成功は何故だったのかと言う疑問も出てくる。(ILPの有用性、ILPの効果的運用、電力配分による命令転送速度の向上があった。それか?[3-4i/c])(((?
-更に、OpteronとPen4の比較にてディープパイプラインでの高クロックレートによるアドバンテージはパイプラインストールにより相殺される事が分かった。
--この辺りの解析は次章で。
-'95から'05まででより明白になったがマルチイシュー型プロセッサの性能安定率は命令発効率の増大に比例して下がっている、
-クロックレートとCPIのトレードオフは様々な要素が絡むので一概には決めきれない。
-我々が次に目指すべきは明白で、Pen4の高クロックなヤツはもうね、破棄。
-IBMもAMDもIntelもみんなデュアルコアな感じに移行してきている。
-次章では、何故この20年追求してきたILPによる高速化をここに来て止めるのかを説明する。
-
-
#comment
__________________________________________________________________________________
- 昨夜より?調子の悪かったミニ冷蔵庫が、今見たらただの箱になってました。[[吉田]] -- &new{2009-06-17 (水) 06:32:55};
- ナマモノは無いのを確認しましたが、大事をとって全てラウンジの冷蔵庫に移しました。使用者は確認をお願いします。調味料などを下段に移しスペースを空けました。そちらの確認も。[[吉田]] -- &new{2009-06-17 (水) 06:47:26};
- 一応トップにも書いておく -- [[吉田]] &new{2009-06-17 (水) 06:48:40};
#comment
終了行:
[[吉田>吉田]]/[[日誌>吉田/日誌]]
&size(18){鎖骨。};
頭蓋涙骨鼻骨頬骨脊椎胸骨肋骨肩胛骨上腕骨尺骨中指骨大腿骨腓骨踵骨(ッ!?
>現状課題
-RPR2009スライド。1.1空気、2.11-12。ミナ。~
-並列輪講:8章前半、の、前半担当。
-2DCDPの引き継ぎCELLプログラムを解して並べて揃えて晒す。~
--現状:もやい結び。もやもや。並べても揃わない。
--Fodoraで動くと評判のCELL-SDKがFedoraで動かない。もっかいやるか~
-並列プログラム。動くようになったら動かす。何この待ちの姿勢。~
>今日と昨日の何か、~
-RPR資料作成 Reloaded
--
-針金工作。骨。後で網金を皮に。
-ポップコーンがちゃんとタコになってると何か幸せな午前3時。
''2.12 - 総括''
-複数命令同時発行構造の実に興味深い点は、その性能向上が基本的なユニプロセッサプログラミングモデルの影響を受けないこと。
-ILPの恩恵を、受けること自体は簡単なのだけれど、設計上の問題はそのプラクティスの煩雑さ。
-単純なレベル1解析においてさえ想定するパフォーマンスを達成するのは困難でしょう。
-過去10年ほどは、目新しい技術を取り入れることよりも、クロックレートを上げたり、均一な性能を出すことに主眼があった。
-過去5年間に発表された動的スケジューリング・マルチイシュー型のプロセッサはすべて同じ基本アーキテクチャと発令レートを持っていたの。この基礎技術は1995年の技術発表当時と変わらない。
--Pen4, IBM Power5, Athlon, Opteron. どれも3-4m命令/clock
-でも、クロックレートは10-20倍、キャッシュサイズは4-8倍、リネームレジスタ数は2-4倍になり、ロードストアユニット数も2倍以上になっている。トータルなパフォーマンスは初期の8-16倍になっているのさ。
-クロックレート増加とCPI減少のトレードオフの決定は困難であり、この書の'95年版では以下のように述べている。
--(略
-3.8GHzPen4の有用性を引き出すときのネックは主に私達のプロセッサ設計の理解度にある。
-しかしながら次章で触れるが、高クロックレートプロセッサの初期の成功は何故だったのかと言う疑問も出てくる。(ILPの有用性、ILPの効果的運用、電力配分による命令転送速度の向上があった。それか?[3-4i/c])(((?
-更に、OpteronとPen4の比較にてディープパイプラインでの高クロックレートによるアドバンテージはパイプラインストールにより相殺される事が分かった。
--この辺りの解析は次章で。
-'95から'05まででより明白になったがマルチイシュー型プロセッサの性能安定率は命令発効率の増大に比例して下がっている、
-クロックレートとCPIのトレードオフは様々な要素が絡むので一概には決めきれない。
-我々が次に目指すべきは明白で、Pen4の高クロックなヤツはもうね、破棄。
-IBMもAMDもIntelもみんなデュアルコアな感じに移行してきている。
-次章では、何故この20年追求してきたILPによる高速化をここに来て止めるのかを説明する。
-
-
#comment
__________________________________________________________________________________
- 昨夜より?調子の悪かったミニ冷蔵庫が、今見たらただの箱になってました。[[吉田]] -- &new{2009-06-17 (水) 06:32:55};
- ナマモノは無いのを確認しましたが、大事をとって全てラウンジの冷蔵庫に移しました。使用者は確認をお願いします。調味料などを下段に移しスペースを空けました。そちらの確認も。[[吉田]] -- &new{2009-06-17 (水) 06:47:26};
- 一応トップにも書いておく -- [[吉田]] &new{2009-06-17 (水) 06:48:40};
#comment
ページ名: