吉田/日誌/2010-04-21
をテンプレートにして作成
[
トップ
] [
新規
|
一覧
|
単語検索
|
最終更新
|
ヘルプ
|
ログイン
]
開始行:
[[吉田>吉田]]/[[日誌>吉田/日誌]]
&size(24){攻性能力欠乏症.};
どちらにせよ無い.
>To do
-RPR
--来週木5にD3-D6.
-惰眠録
-- 6:30 to 10:00 (3.5h)
-Research(Acceleration of 2dcdp)
--[[こんなん>http://www.ipsj.or.jp/10jigyo/fit/fit2010/index.html]]とか.
--もしくは[[ここ>http://www.computing-conf.org/]]とか.
--出せるように要綱に沿って改稿.中.
-POSTER
--入りきらねぇ・・・!
--motivation down.
-そうだ、報告書を書こう。
--なんの話だ.
__________________________________________________________________________________
>Scribble freely.
--- ここ一週間ほど耳がおかしい.~
ノイズと、不意打ちで頭殴られた感じの痛みがくる.
--- 改めて見ると結構おもしろいなPS2 (http://pc.watch.impress.co.jp/docs
- かたまらない. -- &new{2010-04-21 (水) 18:31:21};
- たまには砂でも吐けばいいと思う. -- &new{2010-04-21 (水) 21:18:33};
- 距離がつかめない. -- &new{2010-04-22 (木) 00:00:55};
#comment
__________________________________________________________________________________
~
- 研究方針 in sem1:現状周辺のsurvey再固めとCUDA云々.
// D.3
//ほんの2年前(2005)までは、既にデスクトップ環境では使い古された20年モノのDhrystoneベンチマークを評価基準として使用していた.
//前述のように、ESの種類は多岐にわたり、要求性能も同様である.
//多くの設計者たちは各々のアプリ用のベンチを自作して使っていた.
//そんなESのための標準ベンチマーク"EEMBC"が1998年、同名の団体により発表された.
//EEMBCは(EEMBC用語でsubcommitteesという)以下の6つのクラスから成る.
//これらはあわせて50のベンチマークから構成される.
//多くのESは細かなカーネル性能差が大きく響くけど、アプリ全体の性能も同様に重要だということを忘れてはならない.
//Power Consumption and Efficiency as the Metric
//測定基準としての消費電力と効率
//ES市場では通常コストや出力よりも性能が重視される.
//ESではプロセッサモジュール(+要求インターフェイス)と次いでメモリが最もコストがかかる.
//デスクトップやサーバと違い、ESは2次記憶領域を持たない.
//代わりにアプリ全体をFLASHメモリかDRAM上に配する必要がある.
//PDAなどの多くのESはコストと大きさを制限されているため、アプリのためのメモリは重要である.
//同様に電力は(特にバッテリー型では)プロセッサに依って決定される.
//EEMBC EnergyBenchはベンチ実行中のプロセッサの消費電力データを出力する.
//EEMBC certified Energymark scoreはpower and energyの効率的運用の指針としてデバイス開発者に採用されています.
//EEMBCはNational InstrumentsのLabVIEW開発環境の標準ベンチマークであり、ベンチ改良のためのハードウェアデータを収集している.
//図9は各種ESの通常動作における1Wあたりのパフォーマンスです.
//これを本来の(生の)性能を示した図10と比較し、結果がどれくらい異なっているかに注目してください.
//NEC VR 4122はワットあたりのパフォーマンスでわかりやすい利点が見えますが素の性能では2番目に悪いものとなっています.
//電力消費の面で言えば、バッテリー型として作られたNEC VR 4122が堂々の勝利です.
//IBM PowerPC は動作に6W必要でバッテリー型には向かないと思われるが電力効率の良さによる高い性能を見せています.
// D.4
//マルチプロセッサはサーバー環境ではごく一般的に、デスクトップでもSunやCompaq、Appleなどのベンダーがいくつか提供しています.
//ESの領域では各々の目的に特化された多くのシステムがマルチプロセッサ化されました.(D.5で述べるPS2など.
//多くの特化ES設計は汎用書き換え回路や特化DSP、ストリーム指向I/Oの有限オートマトンから成る.
//画像処理、メディア処理から情報通信にまで及ぶアプリケーションで、このマルチプロセッサの特化は常識となっています.
//プロセッサ間バス相互作用は主に単純な通信チャンネルから成り比較的シンプルで高度に制御されているが、ほとんどの設計がシリコンベースなので入出力や汎用プロセッサをつなぐ通信プロトコルを確かなものにしている.(?)
//最近になって、汎用プロセッサから成る組み込みマルチプロセッサが初登場しました(?初?)
//これらは主に拡張性が重視されるハイエンドな遠隔通信・ネットワーク市場に焦点を当てています.
//例えばvoice-over IP systemに使われるempowerTel NetworksのMPXプロセッサである.
//MPXプロセッサは、主に次の4つの要素から成る.
// ・jitter制御付き音声ストリーム・インターフェイス
// ・高速パケットroutingとチャンネル検索
// ・MACレイヤー含むEthernet interface
// ・各々48kB〜12kBのキャッシュを持ったMIPS32 R4000クラスのプロセッサ x4
//MIPSプロセッサは、サービスの品質保証、エコーキャンセル、圧縮、パケットのコード化を含むvoice-over IP channelを維持するために使用される.(?)
//出来るだけ多くのindependent voice streamsを実行するために、マルチプロセッサは最良の選択です.
//MIPSコアの小ささのため、チップ全体ではたった13.5M個のトランジスタで済んでいる.
//次世代のチップは、より多くの音声チャンネルを扱って、より洗練された圧縮をすると予想される.
//マルチプロセッサは、主に2つの理由からESの世界でより広範囲に利用されるようになるだろう.
//1つめはバイナリソフトの互換性がES部分にあまり関係がないこと.
//大抵のESソフトウェアは機能を削ったり特化したりしている.(これが組み込み命令並列化で動的なスパスカより静的なVLIWが好まれる理由である)
//2つめは、特にハイエンドなES領域ではアプリケーションは自然に並列性を持つこと.
//アプリケーションの自然な並列性の例として、set-top boxやネットワークスイッチ、携帯電話(D.7参照)やゲームシステム(D.5参照)が挙げられる.
//【セットトップボックス】(Set Top Box):テレビに接続して様々なサービスを受けられるようにする機器の総称。テレビの上に置いておくことが多いことからこう呼ばれる。
//ダイコストの
//スレッドレベル並列性がES領域で容易に得られるようになったことで、広範囲で応用的なニーズの高い性能要求に対してもマルチプロセッシングを適用できるようになった.
// D.5
//デスクトップやサーバは多段メモリキャッシュによって静的データへのアクセスを減らしているが、データを連続したストリームにおくESがある.
//そのようなアプリケーションには、特別な場所がまだありますが、テンポラルな局所性ははるかに限られている.
//別視点からデスクトップのメモリ性能を超えるために、この節ではPS2のmicroprocessorについて検証する.
//ゲームの要求する安定した映像・音声ストリームは、今までとは異なるメモリデザイン方式を生んだ.
//この方式は多くの独立した専用メモリにより高いバンド幅を持つ.
//図11はPS2のブロックダイヤグラムである.
//インターフェイスとしてvideo, sound and DVD playerがついている.これはゲームマシンとしては珍しくもない.、
//注目は標準I/Oバスを2つもっているところ、ポータブルPCの様にUSB、IEEE1296、PCMCIAポートやモデムを持っているところだ.
//これらはSonyがPS2を既存のゲーム機を超えさせようとしていたことが伺える.
//PS以上の速度のゲーム用プロセッサとしても動作する34MHz MIPSを含む、I/Oデバイスとコンソールを制御するI/Oプロセッサを持つ.(?)
//更にゲーム音声用にPC標準サウンドカードも接続されている.
//この組み込みアプリのメモリシステムの一つの挑戦は、大量なI/Oデバイスのためにソースまたは目的地として機能すること.
//PS2設計者は2チャンネル使用のPC800DRDRAM chip x2個により32MBのストレージと3.2GB/secのバンド幅を提供する.
//図にはGraphics SynthesizerとEmotion Engineの2つのchipがある.
//Graphics SynthesizerはEmotion Engineからの32bitの描画命令をDisplayListsとして受け取る.
//このチップはメモリの中で最高のバンド幅を持っている.
//Graphics Synthesizerはembedded DRAMを持つ.
//これはfull-video bufferから成り2048bitワイドのインターフェイスを持つため、画像処理がボトルネックにならない.
//このeDRAMによって、DRDRAMに対する帯域幅要求を大幅に減らすことができる.
//組み込みアプリで見つけられたテクニックの例として、個々に分けられた専門機能のための安価で広帯域なシステム全体のメモリがある.(?)
//もういっこの大きなチップとして、Emotion EngineはI/Oプロセッサからの入力を受けてゲームのリアルタイム3D処理のDisplayListを作る.
//Emotion Engineの主要な設計思想として、例えば一般にレーシングゲームでは、前景物体(車とか)は絶えず変化し、背景はただの絵に出来るくらい変化しない.
//これは処理が分化可能だということを示す.
//CPUはVPU0と共に密結合コプロセッサとして動作する.命令セットやアドレッシングはMIPSのものに準拠する.
//VPU0はベクタプロセッサと呼ばれ、しかしいくつかのデスクトップと同様にマルチメディアのための128bit SIMD拡張がされています(D.2参照)
//VPU1は対照的にこれまでのベクタプロセッサと似た動作をし、VPU0+CPUと並列に動作可能.
//前景を柔軟なVPU0+CPUが実行し、背景をVPU1が担当する、と.
//それぞれの処理結果のDisplayListsはGraphics I/Fに入れられ、Graphics Synthesizerへと送られる.
//よって、Emotion Engineのプログラマは、浮動小数演算ユニットを含む64bitMIPS、MIPSをマルチメディア用に拡張したVPU0、そして独立したベクタプロセッサVPU1の3種からプログラムを実行するためのプロセッサを選べる.
//またMPEGデコード高速化のために独立したIPUを持つ.
//処理を分割すると、今度は各ユニットをどうつなげるか、データフローをどうするか、そして各ユニットの必要バンド幅をどう決めるかが問題になる.
//前にも述べたようにEE設計者は多くの専用メモリを選べる.
//CPUは16kBのSPRAMに加え16kBの命令キャッシュと8kBのデータキャッシュを持つ.
//VPU0はそれぞれ4kBの命令キャッシュとデータキャッシュを持つ.
//VPU1はそれぞれ16kBの命令キャッシュとデータキャッシュを持つ.
//
//これらのメモリのレイテンシは1clockである.
//VPU1がVPU0より多くメモリ持ってるのはこれが大量にDisplayListsを作り、そして独立して大きな処理をするためである.
//(プログラマは)全てのメモリをDMA入力ペアとDMA出力ペアの2つのdouble bufferに構成する.
//(プログラマは)入力バッファデータを改変して出力データバッファに送るために多様なプロセッサを使う.
//ユニット内のデータフローを保つために、(プログラマは)次に現実的なアニメーションのための毎秒15フレームを得るためのDMAチャンネル x10を用意する.(?)
//図12はこの構成がサポートする2つのモードを示す:
// Serial connection: CPU+VPU0をVPU1へのプリプロセッサとして使うもの.
// Parallel connection: CPU+VPU0とVPU1を並列に動作させる.
//このDisplayListsとGSは、論理的な最終的なイメージを作り出すために平行なDisplayListsを区別する複数の文脈識別子を持つ.
//EEの持つ全てのユニットは、共用150MHz、128bitワイドのバスでつながっている.
//広帯域を提供するためにCPU−VPU0間とVPU1−GraphicIF間に128bitの専用パスを持ち、DMAチャンネルセット時に選択できる.
//大きな画像を扱うときに、日頃シングルパスとたくさんのキャッシュを使うcache-coherentな機構に慣れた私たち(特にサーバ設計者)は戸惑うでしょう.
//対して、PS2はES設計者のこれまでを示し、また最低9個の異なるメモリモジュールを持つ.
//メモリからディスプレイまでのデータフローをリアルタイムで行うために、PS2は専用のメモリに専用のバス、そしてDMAチャンネルを用いる.
//データの一貫性はプログラマに一任され、主メモリからGraphics I/Fへの連続したデータフローやリアルタイム処理、アプリケーションへの一貫性処理が(プログラマにより)与えられる.
// D.6
//もう一個有名なESとしてデジカメがあるね.
//ここではSanyo VPC-SX500を見てみますか.
//電源を入れると、カメラのプロセッサはまず全コンポーネントの診断を行いバックLCDに結果を表示する.
//このカメラは1.8inchの低温polysilicon TFT color LCDを使用している.
//写真を撮るとき、シャッターに半分指をかけるとプロセッサがピントを(自動で)合わせてくれる.
//プロセッサはCCDでのRGBキャプチャに最適な光量になるようシャッターを調節してくれる.
//CCD(Charged-Couple Device)は1/2-inch 1360x1024pixelの新しいスキャンチップですの.
//画素は一行ごとにスキャンされ、ホワイトバランスや色彩、エイリアシングを調整し4MBのフレームバッファに保存する.
//次に取り込んだ画像をJpegなどの標準フォーマットに変換して、Flashメモリに格納する.
//撮影者は画像の質をファインとノーマルから選ぶ.保存にかかる時間は10〜20秒.
//画質ノーマルで512MBのFlashメモリに約2000枚の画像を保存できる.
//で、撮った画像は背面LCDに表示される.
//前節では一般的なデジカメの基本機能を述べたが、ここではもうちょい掘り下げて:
//これまで撮った画像をLCDでスライドショー出来たり、バッテリを保たせるためのスリープモードがあったり、バッテリ残量を表示したり、非圧縮保存の高速撮影モードとか、MPEGで動画とかWAVで音声とかも可能.
//デジカメの電子頭脳は組み込みCPUとチップ上に組み込まれたいくつかの特殊機能から成る.[Okada et al. 1999]
//図13にこのデジカメのダイヤグラム図を示す.
//D.1で述べたが、このような1チップ上に過去のサーキット全要素を乗せたチップをSystem on Chips (SoCs) と呼ぶ.
//SoCは一般的に他の非統合型回路に比べて小サイズ・省電力である.
//Sanyoは自社カメラのSoCに出来るだけ他社の半分の消費電力と他社より小さいサイズを満たすよう求めた.
//より高い性能のために2つのバスを持つ:
// SmartMediaInterface、プログラム・データメモリやDMAなどのI/Oデバイス用の16bit低速バス.
// SDRAMやCCDからのシグナルプロセッサ、JPEGエンコーダやLCDとつなぐNTSC/PALエンコーダ用の32bitバス.
//デスクトップのプロセッサとは異なり、このチップは多種多様なI/Oバスと統合する必要がある.
//32bitRISC MPUは独占的なデザインであり、28.8MHzの動作クロックと同クロックのバスを持つ.
//この700mWチップは10.5mm平方の中に1.8M個のトランジスタをもって出来ている.
&color(white){人に必要とされない自分など要らない.};~
&color(white){まだ辛いけれど、もう「人を好きな自分」を辞める気はない.};~
&color(white){こんなにも人が好きなのに、人を信じることが辛い.};~
&color(white){きっと自分は幸せだけど、きっと自分はどうしようもなく独りだ.};~
&color(white){ただの自愛者.};~
&color(white){苦しい言えば助けてもらえると思うなよ.};~
~
>BGM:~
MusicとかMovieとか。しばしばBGで無くなるのが欠点。~
- どーん (http://www.nicovideo.jp/watch/sm7494912 -- &new{2010-04-21 (水) 18:33:46};
#comment
__________________________________________________________________________________
終了行:
[[吉田>吉田]]/[[日誌>吉田/日誌]]
&size(24){攻性能力欠乏症.};
どちらにせよ無い.
>To do
-RPR
--来週木5にD3-D6.
-惰眠録
-- 6:30 to 10:00 (3.5h)
-Research(Acceleration of 2dcdp)
--[[こんなん>http://www.ipsj.or.jp/10jigyo/fit/fit2010/index.html]]とか.
--もしくは[[ここ>http://www.computing-conf.org/]]とか.
--出せるように要綱に沿って改稿.中.
-POSTER
--入りきらねぇ・・・!
--motivation down.
-そうだ、報告書を書こう。
--なんの話だ.
__________________________________________________________________________________
>Scribble freely.
--- ここ一週間ほど耳がおかしい.~
ノイズと、不意打ちで頭殴られた感じの痛みがくる.
--- 改めて見ると結構おもしろいなPS2 (http://pc.watch.impress.co.jp/docs
- かたまらない. -- &new{2010-04-21 (水) 18:31:21};
- たまには砂でも吐けばいいと思う. -- &new{2010-04-21 (水) 21:18:33};
- 距離がつかめない. -- &new{2010-04-22 (木) 00:00:55};
#comment
__________________________________________________________________________________
~
- 研究方針 in sem1:現状周辺のsurvey再固めとCUDA云々.
// D.3
//ほんの2年前(2005)までは、既にデスクトップ環境では使い古された20年モノのDhrystoneベンチマークを評価基準として使用していた.
//前述のように、ESの種類は多岐にわたり、要求性能も同様である.
//多くの設計者たちは各々のアプリ用のベンチを自作して使っていた.
//そんなESのための標準ベンチマーク"EEMBC"が1998年、同名の団体により発表された.
//EEMBCは(EEMBC用語でsubcommitteesという)以下の6つのクラスから成る.
//これらはあわせて50のベンチマークから構成される.
//多くのESは細かなカーネル性能差が大きく響くけど、アプリ全体の性能も同様に重要だということを忘れてはならない.
//Power Consumption and Efficiency as the Metric
//測定基準としての消費電力と効率
//ES市場では通常コストや出力よりも性能が重視される.
//ESではプロセッサモジュール(+要求インターフェイス)と次いでメモリが最もコストがかかる.
//デスクトップやサーバと違い、ESは2次記憶領域を持たない.
//代わりにアプリ全体をFLASHメモリかDRAM上に配する必要がある.
//PDAなどの多くのESはコストと大きさを制限されているため、アプリのためのメモリは重要である.
//同様に電力は(特にバッテリー型では)プロセッサに依って決定される.
//EEMBC EnergyBenchはベンチ実行中のプロセッサの消費電力データを出力する.
//EEMBC certified Energymark scoreはpower and energyの効率的運用の指針としてデバイス開発者に採用されています.
//EEMBCはNational InstrumentsのLabVIEW開発環境の標準ベンチマークであり、ベンチ改良のためのハードウェアデータを収集している.
//図9は各種ESの通常動作における1Wあたりのパフォーマンスです.
//これを本来の(生の)性能を示した図10と比較し、結果がどれくらい異なっているかに注目してください.
//NEC VR 4122はワットあたりのパフォーマンスでわかりやすい利点が見えますが素の性能では2番目に悪いものとなっています.
//電力消費の面で言えば、バッテリー型として作られたNEC VR 4122が堂々の勝利です.
//IBM PowerPC は動作に6W必要でバッテリー型には向かないと思われるが電力効率の良さによる高い性能を見せています.
// D.4
//マルチプロセッサはサーバー環境ではごく一般的に、デスクトップでもSunやCompaq、Appleなどのベンダーがいくつか提供しています.
//ESの領域では各々の目的に特化された多くのシステムがマルチプロセッサ化されました.(D.5で述べるPS2など.
//多くの特化ES設計は汎用書き換え回路や特化DSP、ストリーム指向I/Oの有限オートマトンから成る.
//画像処理、メディア処理から情報通信にまで及ぶアプリケーションで、このマルチプロセッサの特化は常識となっています.
//プロセッサ間バス相互作用は主に単純な通信チャンネルから成り比較的シンプルで高度に制御されているが、ほとんどの設計がシリコンベースなので入出力や汎用プロセッサをつなぐ通信プロトコルを確かなものにしている.(?)
//最近になって、汎用プロセッサから成る組み込みマルチプロセッサが初登場しました(?初?)
//これらは主に拡張性が重視されるハイエンドな遠隔通信・ネットワーク市場に焦点を当てています.
//例えばvoice-over IP systemに使われるempowerTel NetworksのMPXプロセッサである.
//MPXプロセッサは、主に次の4つの要素から成る.
// ・jitter制御付き音声ストリーム・インターフェイス
// ・高速パケットroutingとチャンネル検索
// ・MACレイヤー含むEthernet interface
// ・各々48kB〜12kBのキャッシュを持ったMIPS32 R4000クラスのプロセッサ x4
//MIPSプロセッサは、サービスの品質保証、エコーキャンセル、圧縮、パケットのコード化を含むvoice-over IP channelを維持するために使用される.(?)
//出来るだけ多くのindependent voice streamsを実行するために、マルチプロセッサは最良の選択です.
//MIPSコアの小ささのため、チップ全体ではたった13.5M個のトランジスタで済んでいる.
//次世代のチップは、より多くの音声チャンネルを扱って、より洗練された圧縮をすると予想される.
//マルチプロセッサは、主に2つの理由からESの世界でより広範囲に利用されるようになるだろう.
//1つめはバイナリソフトの互換性がES部分にあまり関係がないこと.
//大抵のESソフトウェアは機能を削ったり特化したりしている.(これが組み込み命令並列化で動的なスパスカより静的なVLIWが好まれる理由である)
//2つめは、特にハイエンドなES領域ではアプリケーションは自然に並列性を持つこと.
//アプリケーションの自然な並列性の例として、set-top boxやネットワークスイッチ、携帯電話(D.7参照)やゲームシステム(D.5参照)が挙げられる.
//【セットトップボックス】(Set Top Box):テレビに接続して様々なサービスを受けられるようにする機器の総称。テレビの上に置いておくことが多いことからこう呼ばれる。
//ダイコストの
//スレッドレベル並列性がES領域で容易に得られるようになったことで、広範囲で応用的なニーズの高い性能要求に対してもマルチプロセッシングを適用できるようになった.
// D.5
//デスクトップやサーバは多段メモリキャッシュによって静的データへのアクセスを減らしているが、データを連続したストリームにおくESがある.
//そのようなアプリケーションには、特別な場所がまだありますが、テンポラルな局所性ははるかに限られている.
//別視点からデスクトップのメモリ性能を超えるために、この節ではPS2のmicroprocessorについて検証する.
//ゲームの要求する安定した映像・音声ストリームは、今までとは異なるメモリデザイン方式を生んだ.
//この方式は多くの独立した専用メモリにより高いバンド幅を持つ.
//図11はPS2のブロックダイヤグラムである.
//インターフェイスとしてvideo, sound and DVD playerがついている.これはゲームマシンとしては珍しくもない.、
//注目は標準I/Oバスを2つもっているところ、ポータブルPCの様にUSB、IEEE1296、PCMCIAポートやモデムを持っているところだ.
//これらはSonyがPS2を既存のゲーム機を超えさせようとしていたことが伺える.
//PS以上の速度のゲーム用プロセッサとしても動作する34MHz MIPSを含む、I/Oデバイスとコンソールを制御するI/Oプロセッサを持つ.(?)
//更にゲーム音声用にPC標準サウンドカードも接続されている.
//この組み込みアプリのメモリシステムの一つの挑戦は、大量なI/Oデバイスのためにソースまたは目的地として機能すること.
//PS2設計者は2チャンネル使用のPC800DRDRAM chip x2個により32MBのストレージと3.2GB/secのバンド幅を提供する.
//図にはGraphics SynthesizerとEmotion Engineの2つのchipがある.
//Graphics SynthesizerはEmotion Engineからの32bitの描画命令をDisplayListsとして受け取る.
//このチップはメモリの中で最高のバンド幅を持っている.
//Graphics Synthesizerはembedded DRAMを持つ.
//これはfull-video bufferから成り2048bitワイドのインターフェイスを持つため、画像処理がボトルネックにならない.
//このeDRAMによって、DRDRAMに対する帯域幅要求を大幅に減らすことができる.
//組み込みアプリで見つけられたテクニックの例として、個々に分けられた専門機能のための安価で広帯域なシステム全体のメモリがある.(?)
//もういっこの大きなチップとして、Emotion EngineはI/Oプロセッサからの入力を受けてゲームのリアルタイム3D処理のDisplayListを作る.
//Emotion Engineの主要な設計思想として、例えば一般にレーシングゲームでは、前景物体(車とか)は絶えず変化し、背景はただの絵に出来るくらい変化しない.
//これは処理が分化可能だということを示す.
//CPUはVPU0と共に密結合コプロセッサとして動作する.命令セットやアドレッシングはMIPSのものに準拠する.
//VPU0はベクタプロセッサと呼ばれ、しかしいくつかのデスクトップと同様にマルチメディアのための128bit SIMD拡張がされています(D.2参照)
//VPU1は対照的にこれまでのベクタプロセッサと似た動作をし、VPU0+CPUと並列に動作可能.
//前景を柔軟なVPU0+CPUが実行し、背景をVPU1が担当する、と.
//それぞれの処理結果のDisplayListsはGraphics I/Fに入れられ、Graphics Synthesizerへと送られる.
//よって、Emotion Engineのプログラマは、浮動小数演算ユニットを含む64bitMIPS、MIPSをマルチメディア用に拡張したVPU0、そして独立したベクタプロセッサVPU1の3種からプログラムを実行するためのプロセッサを選べる.
//またMPEGデコード高速化のために独立したIPUを持つ.
//処理を分割すると、今度は各ユニットをどうつなげるか、データフローをどうするか、そして各ユニットの必要バンド幅をどう決めるかが問題になる.
//前にも述べたようにEE設計者は多くの専用メモリを選べる.
//CPUは16kBのSPRAMに加え16kBの命令キャッシュと8kBのデータキャッシュを持つ.
//VPU0はそれぞれ4kBの命令キャッシュとデータキャッシュを持つ.
//VPU1はそれぞれ16kBの命令キャッシュとデータキャッシュを持つ.
//
//これらのメモリのレイテンシは1clockである.
//VPU1がVPU0より多くメモリ持ってるのはこれが大量にDisplayListsを作り、そして独立して大きな処理をするためである.
//(プログラマは)全てのメモリをDMA入力ペアとDMA出力ペアの2つのdouble bufferに構成する.
//(プログラマは)入力バッファデータを改変して出力データバッファに送るために多様なプロセッサを使う.
//ユニット内のデータフローを保つために、(プログラマは)次に現実的なアニメーションのための毎秒15フレームを得るためのDMAチャンネル x10を用意する.(?)
//図12はこの構成がサポートする2つのモードを示す:
// Serial connection: CPU+VPU0をVPU1へのプリプロセッサとして使うもの.
// Parallel connection: CPU+VPU0とVPU1を並列に動作させる.
//このDisplayListsとGSは、論理的な最終的なイメージを作り出すために平行なDisplayListsを区別する複数の文脈識別子を持つ.
//EEの持つ全てのユニットは、共用150MHz、128bitワイドのバスでつながっている.
//広帯域を提供するためにCPU−VPU0間とVPU1−GraphicIF間に128bitの専用パスを持ち、DMAチャンネルセット時に選択できる.
//大きな画像を扱うときに、日頃シングルパスとたくさんのキャッシュを使うcache-coherentな機構に慣れた私たち(特にサーバ設計者)は戸惑うでしょう.
//対して、PS2はES設計者のこれまでを示し、また最低9個の異なるメモリモジュールを持つ.
//メモリからディスプレイまでのデータフローをリアルタイムで行うために、PS2は専用のメモリに専用のバス、そしてDMAチャンネルを用いる.
//データの一貫性はプログラマに一任され、主メモリからGraphics I/Fへの連続したデータフローやリアルタイム処理、アプリケーションへの一貫性処理が(プログラマにより)与えられる.
// D.6
//もう一個有名なESとしてデジカメがあるね.
//ここではSanyo VPC-SX500を見てみますか.
//電源を入れると、カメラのプロセッサはまず全コンポーネントの診断を行いバックLCDに結果を表示する.
//このカメラは1.8inchの低温polysilicon TFT color LCDを使用している.
//写真を撮るとき、シャッターに半分指をかけるとプロセッサがピントを(自動で)合わせてくれる.
//プロセッサはCCDでのRGBキャプチャに最適な光量になるようシャッターを調節してくれる.
//CCD(Charged-Couple Device)は1/2-inch 1360x1024pixelの新しいスキャンチップですの.
//画素は一行ごとにスキャンされ、ホワイトバランスや色彩、エイリアシングを調整し4MBのフレームバッファに保存する.
//次に取り込んだ画像をJpegなどの標準フォーマットに変換して、Flashメモリに格納する.
//撮影者は画像の質をファインとノーマルから選ぶ.保存にかかる時間は10〜20秒.
//画質ノーマルで512MBのFlashメモリに約2000枚の画像を保存できる.
//で、撮った画像は背面LCDに表示される.
//前節では一般的なデジカメの基本機能を述べたが、ここではもうちょい掘り下げて:
//これまで撮った画像をLCDでスライドショー出来たり、バッテリを保たせるためのスリープモードがあったり、バッテリ残量を表示したり、非圧縮保存の高速撮影モードとか、MPEGで動画とかWAVで音声とかも可能.
//デジカメの電子頭脳は組み込みCPUとチップ上に組み込まれたいくつかの特殊機能から成る.[Okada et al. 1999]
//図13にこのデジカメのダイヤグラム図を示す.
//D.1で述べたが、このような1チップ上に過去のサーキット全要素を乗せたチップをSystem on Chips (SoCs) と呼ぶ.
//SoCは一般的に他の非統合型回路に比べて小サイズ・省電力である.
//Sanyoは自社カメラのSoCに出来るだけ他社の半分の消費電力と他社より小さいサイズを満たすよう求めた.
//より高い性能のために2つのバスを持つ:
// SmartMediaInterface、プログラム・データメモリやDMAなどのI/Oデバイス用の16bit低速バス.
// SDRAMやCCDからのシグナルプロセッサ、JPEGエンコーダやLCDとつなぐNTSC/PALエンコーダ用の32bitバス.
//デスクトップのプロセッサとは異なり、このチップは多種多様なI/Oバスと統合する必要がある.
//32bitRISC MPUは独占的なデザインであり、28.8MHzの動作クロックと同クロックのバスを持つ.
//この700mWチップは10.5mm平方の中に1.8M個のトランジスタをもって出来ている.
&color(white){人に必要とされない自分など要らない.};~
&color(white){まだ辛いけれど、もう「人を好きな自分」を辞める気はない.};~
&color(white){こんなにも人が好きなのに、人を信じることが辛い.};~
&color(white){きっと自分は幸せだけど、きっと自分はどうしようもなく独りだ.};~
&color(white){ただの自愛者.};~
&color(white){苦しい言えば助けてもらえると思うなよ.};~
~
>BGM:~
MusicとかMovieとか。しばしばBGで無くなるのが欠点。~
- どーん (http://www.nicovideo.jp/watch/sm7494912 -- &new{2010-04-21 (水) 18:33:46};
#comment
__________________________________________________________________________________
ページ名: