ここでは映像の解像度、フォーマット、情報量・帯域幅などについて解説します。
当社製の4K送受信機やセットトップボックスは例えば3840X2160P/60Hz/4:2:0/8bitの映像信号が伝送できますが、その意味を含め解説します。
【解像度】まず解像度は映像の細かさを表すものであり、4Kと言われているものは例えば横3,840画素、縦2,160画素となります。
3,840は約4,000であり、1,000を表す「k」がついているわけです。単位の接頭辞「キロ」としては小文字のkが正しいわけですが、大文字小文字はどちらも使われます。
8K映像なら7,680X4,320画素、またいわゆるハイビジョンテレビのHD(2Kとは日本では言わない)は1,920X1,080画素となります。
なお上記 3,840X2,160画素4Kはテレビの規格のUHDTV(ウルトラハイデフィニションTV)であり、本項で頻繁に例示します。そのほかの4Kの バリエーションとして、映画制作会社の団体 Digital Cinema Initiatives(DCI)の4Kは4,096×2,160画素であり、さらに、別の画素数のものもあります。
【プログレッシブ/インタレース】映像表示するのに端から1行ずつ順々に行うのがプログレッシブ、1行飛ばしで奇数行の画像と偶数行の画像を交互に表示するのがインタレースです。例えば、一般にはテレビ放送(NTSC方式)はインタレース、パソコンのディスプレイはプログレッシブです。それぞれ特徴がありますが、プログレッシブのほうが1枚の画像を構成する行数(走査線数)が2倍のためくっきりとした鮮明な映像となります。但し、同じフレームレート(後述)とした時、プログレッシブのデータ量はインタレースの2倍となります。
しばしば解像度の数字のあとに「P」とか「i」を付けてそれを示します。プログレッシブのPは大文字小文字さまざまですが、インタレースのiは数字の1と間違えないため小文字で表記されることが多いようです。
【フレームレート】1秒間に映像を更新する回数です。単位はHz(ヘルツ)又はFPS(Frame per Second)です。
この数字が大きいほど滑らかな映像となりますが、比例して情報量が増えます。
60Hzですと、映像が1/60秒ごとに更新される、つまり1÷60=0.0166秒=16.6ミリ秒ごとに更新されることになります。30Hzならその2倍の33.3ミリ秒。液晶モニタの速度が例えば1ミリ秒とかの評価法がありますが、映像全体はそんなに速く更新されるわけではありません。
同じプログレッシブ画像として30Hzと60Hzを比べると、明らかに60Hzが自然、30Hzは遅いことがわかります。なお、会話を自然にする、一般のインターネット会議よりスムーズにしたい、という程度なら30Hzも十分許容範囲かもしれません。しかし、動きのある画面になると60Hzがほしくなります。じゃんけんをするなら60Hzがほしいです。
さらに速さを追求するならフレームレートを120Hzにあげる方法もあります。120Hzと60Hzの違いは「自分で手を振る映像」程度ではわかりにくいですが、例えば叩くような動作での映像の感触など微妙な差があらわれます。また、離れたところにいるミュージシャンどうしが違和感なく演奏するには望ましいかもしれません。
さらには240Hzのとかの例もあるようです。
なお、フレームレートに関連してビデオカメラやモニタでの画像処理時間等も遅延を発生する要素になりますので、上記の60Hzの16.6ミリ秒、30Hzの33.3ミリ秒という数字に画像処理に要する時間がプラスされることに留意が必要です。
少々脱線してしまいましたが、遅延にお困りであれば、お問い合わせページよりご連絡ください。
【色情報】これは少々ややこしく、RGBであったりYCbCr=4:2:0とかいうものです。
そもそも、明るく光るモニタで色を表すのに色の三原色RGB、つまりRed・Green・Blueを用い、それぞれの色の明るさを変えることで多くの色を表現できます。
4K映像なら 3,840X2,160画素の一つ一つにR/G/Bの情報を割り当てるのが、一番シンプルな話です。
さて、昔の白黒テレビには色情報はなく輝度のみの情報を使って放送が行われていました。これを引き継ぎつつカラー化するには輝度情報は従来通り送りつつ、色情報を無駄なく電波に載せるため、色差情報を2つ付加するという方式がとられました。
昔の技術はさておき、輝度情報はYと表記され、色差情報は例えばCb、Crと表記されます。RGBからこのYCbCrに変換する式は
となります。これは小数点以下の桁数が異なる標記もありますが、ともかく国際標準化組織であるITUの「ITU-R BT.601:標準テレビジョン 放送用規格」で規定されています。放送方式の継続性と共に、人間の視覚の特性として「明るさに比べて色に関する感度が低い」という特性を利用しています。ちなみに、他の変換も存在していてYPbPrは、
という「ITU-R BT.709:高精細テレビジョン方式のスタ ジオ規格」となります。さらにYUVという表記もありやや混用されていますが、話が脱線してきたのでここまでとし、例えばウィキペディアほかでYUVなど検索してみてください。
さて、4:4:4、4:2:0などで記述されるものは何でしょう。下に図にしてみました。
まず、説明に使う画素は横4画素X縦2画素の合計8画素の領域です。
RGBはそれぞれの画素にRed、Green、Blueの情報があり8X3=24マス分の情報となります。本項の説明で「マス」と「画素」は使い分けていますのでご注意ください。
YCbCr=4:4:4は図のように対象領域8個の画素それぞれに3つの情報を割り当てるもので、マスの数はRGBと同じ24マスです。
さて、前述の 「明るさに比べて色に関する感度が低い」 ということを利用して色情報であるCbCrを間引くもの(クロマサブサンプリング)として、YCbCr=4:2:2以下があります。輝度情報はすべての画素で独立に持っていますが、 YCbCr=4:2:2の 色情報は領域1と2、3と4、5と6、7と8 それぞれ共通としてこの部分の色情報を半分にします。すなわち、マスの数は8+4+4=16マスとなります。マスの数はRGBや4:4:4に比べ16/24=2/3になります。 視覚の特性を利用して色情報を少し省略しているわけですが、8画素は一応別々の色となることが可能ですので、解像度自体の数字は悪くはなっていません。
YCbCr=4:2:0は、左と右の各4画素の色情報を同じにしています。従ってマスの数は 8+2+2=12マスであり、RGBや4:4:4に比べ半分になります。
YCbCr=4:1:1は、左と右で色情報を変えるのではなく、1行目と2行目で分けていて、マスの数は4:2:0と同じです。これは現在ほとんど使われないかと思いますが、説明のために記載しました。
蛇足ですが、4:P:Qと表すときのPとQの数字は次のようになっています。
Pは第一行目にいくつの色情報があるか、Qは少々複雑ですが第2行目について「1行目と違う情報がいくつあるか」ということです。CbとCrは同じ区切りですので片方について判別します。
なお、上記は平易な説明です。厳密な定義ではないのでご注意ください。
さらなる蛇足は、Dual Green(デュアルグリーン)という情報量を減らす方式があります。これも視覚の特性を利用して情報量を減らすもので、下の図の左のように2X2の画素について緑(G)の画素を二つ割りあて、他の二つを青(B)と赤(R)にします。緑が視覚に与える影響が大きいことを利用しています。上記と同じ横4画素X縦2画素 に当てはめたのが図の右側に示したもので、対象領域に8マスの情報、すなわちフルのRGBに比べ3分の一の情報となります。
【ビット数】上記の1マスに何ビット割り当てるかです。従来は8ビットとするのが一般的で、2の8乗すなわち256階調の情報が載せられます。フルのRGBやYCbCr=4:4:4であれば1画素あたり8X3=24ビットとなります。YCbCr=4:2:2なら1画素あたり16ビット、YCbCr=4:2:0なら1画素あたり12ビットとなります。
また1マスあたり10ビットとか12ビットとかにすれば、より多くの色を滑らかに表現できるようになります。
【情報量・帯域幅】映像の情報量は1秒当たり次のような掛け算で求めることができます。
(横方向の画素数)×(縦方向の画素数)×(フレームレート)×(1画素あたりのビット数)
例えば3840X2160P/60Hz/4:4:4/8bitですと、次のようになります。
3840×2160×60×24=11,943,936,000bit/s≒11.9Gb/s
しかし、実際に伝送されるビット数、つまり伝送に必要な帯域幅はこれよりずっと多くなります。HDMIを例にすると、「ブランキング期間」と「8B10Bコーディング」により約18Gb/sが必要帯域です。まずブランキング期間について図示します。数字は4K映像の場合です。
映像領域3,840X2,160画素の外にブランキング期間(帰線期間)があります。これは昔のブラウン管テレビにおいて、電子ビームを左から右へ水平走査したあとに次の走査のために電子ビームを左に戻す期間でした。垂直方向も同じです。現在のデジタル技術では、ここに音声情報や各種制御信号、イーサネット信号などを入れています。
4Kでは図に示すように全横幅4,400bit、全縦幅2,250bitとするのが一般的です。映像領域だけに比べ情報量が増えています。
なお、上の図ではブランキング期間の位置はブラウン管のイメージで右と下に書いてありますが、HDMIでは左と上になります。
「8B10Bコーディング」 について説明します。これは高速デジタル信号の伝送において「1」が続く「0」が続く状態は電子回路的に不具合が生じる(直流バランスが崩れる)ので、それを避けるように冗長性を入れます。任意の8ビット長の信号を、上記の不具合が生じないような10ビット長の符号に変換します。8分の10、つまり1.25倍の情報伝送となります。
従って 上に例示した3840X2160P/60Hz/4:4:4/8bitですと
4400×2250×60×24×1.25=17,820,000bit/s≒18Gb/s
となります。
当社製の4K送信機受信機やセットトップボックスでは 3840X2160P/60Hz/4:2:0/8bitを扱えるようにしています。 さらに4096X2160P/60Hz/4:2:0/8bitも伝送可能です。
これら4:2:0としたのは、高精細映像の伝送をシンプルに行うのにコモディティ化した10Gb/s部品を活用するためです。4:2:0は4:4:4の半分の情報量で伝送できるのでそのような部品が気軽に使えます。幾何学的模様からなるテストパターンでは若干の差が生じますが、通常の映像では4:2:0にて遜色ない再現が可能です。
コモディティ化した部品と言っても、2束3文でいい加減なものという意味ではなく、少し前までは最先端の技術をつぎ込んだもので、数が出ているから入手が容易ということでありますので誤解無きように願います。
さて、前述したデュアルグリーン方式はまだ8K映像で使われることがありますが、 約24Gb/sとなります。
フルスペック8Kの7680X4320P/60Hz/4:4:4/8bitですと4Kの4倍で約72Gb/sであるのに対し、3分の1の伝送量で送ることが可能です。
当社製の8Kゼロ遅延伝送装置(トランシーバ)は 7680X4320P/60Hz/4:2:2/8bitで 約48Gb/sの伝送レートとしています。これはやはりコモディティ化した部品をギリギリ利用し、かつ良好な映像クオリティを得ることができるバランスをみて選択しています。
これらは当社で使用している技術、汎用的な技術であります。先のブランキング期間を必要最小限ギリギリまでに減らすとか、8B10B変換をもっと軽いものにするとか、特殊なことをすれば必要帯域を押さえることは可能かもしれません。しかしその開発費を回収するのに莫大な出荷数量が必要となるか、もしくは極めて高価なものとなり、現実的ではありません。
【ピクセルクロック】表示のみの場合と伝送についても論じる場合とでは異なります。表示では前項の図の映像領域だけですが、伝送について論じる場合には全縦横のビット数を考えます。伝送についてのピクセルクロックはブランキング期間含め1秒間に何画素分を送るかを表すもので、単位はHzとなります。RGBやYCbCr=4:4:4などクロマサブサンプルングしていないなら、
ピクセルクロック=(全横幅ビット数)×(全縦幅ビット数)×(フレームレート)
となります。例えば3840X2160P/60Hz/4:4:4/8bit なら
4400×2250×60=594,000,000Hz=594MHz
です。
クロマサブサンプリングすると伝送する等価的な画素数は減るので、 例えば3840X2160P/60Hz/4:2:0/8bit のピクセルクロックは
4400×2250×60×(1/2)=297,000,000Hz=297MHz
となります。
さらに細かいことを言うと、水平垂直の同期やパケットヘッダなど若干の情報追加があります。本項の範囲を超えるので省略しますが、おおむね上記の数字となります。
以上長くなりましたが、映像の解像度・プログレッシブ/インタレース・フレームレート・色情報・情報量・帯域幅・ピクセルクロックなどについて説明しました。
分かりやすさを念頭に書いたため、細部の記述は技術的に不十分ではありますがお許しください。
当社製品および一般的技術のご理解の参考にしていただければ幸いです。
映像関連でお困りのことがあればお問い合わせページよりご連絡ください。