美しいハイビジョン映像を世界中の人々に──。(前編)

【未来を創るチカラVol.9】デジタル映像H.264/AVC実用化でハイビジョンの世界的普及に貢献 中川 章

デジタル映像の、劇的な進化を牽引する

劇的な進化を続けるデジタル映像の技術。ハイビジョン放送、Blu-ray、PCやスマホで見るワンセグやYouTubeなど、今私たちの生活の中で日常的に目に触れる高画質なデジタル映像のほとんどは、「H.264/AVC」という国際標準規格の動画技術によって再現されています。

H.264/AVCの技術開発を牽引し、世界規模でのハイビジョン普及に貢献したのが、中川章(富士通研究所准フェロー)。2016年には、その貢献が認められ、紫綬褒章を受賞しています。世界の期待に応えるイノベーションはどのようにして生まれるのか、中川に聞きました。

高画質な映像を日常にした、映像符号化技術とは

「映像データは一般にとても大きく、そのままでは、とてもコンピュータで取り扱うことができません。例えばハイビジョン映像は1秒あたり200万画素の写真を30回撮影したもので、圧縮せずにDVDに記録すると、たった30秒しか記録できません。そのため人の目に分からないように、余分な情報を絞って情報量を圧縮することが必要です。これが映像符号化技術です。

映像符号化技術の実用化は、1980年台に業務用テレビ電話から始まりました。その後映像を符号化する方法、半導体、記録、伝送技術の進歩によって解像度が上がり、放送や録画など用途も広がりました。」

赤いインクでびっしりと書きこまれた中川の研究ノート

H.264/AVC国際標準化活動から、各国各社がしのぎを削る

「2001年から二つの国際標準化機関ITU-TとISO/IECの共同で始まったのが、ハイビジョンなど高精細な映像向けの動画圧縮プログラム(コーデック)H.264/AVCの規格標準化です。

国際標準化では、世界中から技術者が集まって最良と思われる仕組みのルールを文書にします。会合には毎回100人以上が集まって、それぞれ最新の技術研究成果を持ち寄って提案し、議論しながら順次採用するものを策定していきます。大きな技術なので文書は300ページ以上にもなりました。

実は私は前の規格H.263の時に初めて国際標準化にも参加し、提案がなかなか採用されずに辛い日々を過ごした経験がありました。その反省を踏まえ、H.264/AVCの標準化活動では、シンプルで効果が明確な方式を提案するなどあらゆる準備をして臨みました。そして、その甲斐あって、無事に提案技術が採用され、標準化の性能改善に貢献できたと同時に、必須特許も取得しました。」

期待に反して実用化は困難?「マンモス」と揶揄された

「日本ではこの標準化策定の後に、ちょうど地デジ放送が開始され、ハイビジョン化普及に向けて市場や社会の期待が高まりました。従来の規格MPEG-2の半分の情報量で同等画質での圧縮が可能となるH.264/AVC技術には、実用化に大きな期待が寄せられましたが、実現するためには300ページ以上の標準化文書の要件をすべて満たす必要がありました。性能向上のために非常に多くの機能を詰め込んだ結果、映像符号化に必要な計算量はMPEG-2の10倍以上。あまりの複雑さ、処理量の多さから実現は困難ではないかと言われ、当時の日経エレクトロニクスの記事では、H.264/AVCは『マンモスコーデック』と命名されていました。」

H.264/AVCの規格について書かれた文書。これを頭に入れて実用化技術の開発にあたる。

きれいな映像を、少ない情報量に変換するための方法

「H.264/AVCを実用化するためには、この高い演算量を克服すること、いかに少ない計算でH.264/AVCの性能を引き出すかを追求した符号化の計算方法を開発することが不可欠でした。

しかも規格には、復号方法(圧縮データから映像への戻し方)しか規定していません。映像を圧縮データに変換する符号化方法は、各社独自方式となります。各社の符号化技術によって、同じ映像を同じ情報量に圧縮したとしても、大きく画質が異なるため、少ない情報量できれいな映像での圧縮をいかに実現するかは、各社の腕の見せどころでした。」

中川たちが指標にした評価映像(※)の中で最も難しいものの一つ。人物、水、風に揺れる木の葉、日の光など、日常的に用いられる映像素材の中で、圧縮すると劣化した印象になりやすい構成要素で試行錯誤を繰り返した。
※画像は映像情報メディア学会テストチャート「Chromakey(Sprinkling)」

『主観画質』人が注目する部分をきれいに符号化する

「この壁を乗り越えるために、私たちは人間の視覚特性を利用しました。人間の主観特性で、シーンの中で一箇所でも悪いところに目が行くと、それに引き摺られて全体が悪いという印象になります。そこで注目が高い領域を追跡して、重点的にきれいに符号化。それ以外は劣化が認知されないよう情報を省いて符号化します。

基本的に映像というのは前の画像との差分を送るので、時間方向に変化が起きるもの、例えば水や火、森の中、花吹雪などは、情報を圧縮した時に劣化した印象になりやすく非常に難しいものです。そういう難しい映像でも、ちゃんときれいに見えるように、"人間の目にとって一番優しい崩れ方"をしようと考えました。

文献も読みましたが、主観特性を計測する装置はないので、結局は人が見ていかないといけない。自分たちの目でどこにノイズがあったら嫌かなと考え、次にどういう戦略で情報量を与えて行こうか制御を考える。想定外の映像はないか、全て自分たちの目で見ていく。その積み重ねでした。」

2006年に販売開始したH.264/AVC採用の「映像伝送装置IP-9500」※現在は販売終了

「当時はまだクラウドという言葉がない時代でしたが、複数のコンピュータを連携させて並列計算させる富士通のグリッドコンピューティングという技術を使うことによって、映像評価と改善アイディアの延べ数万時間にわたるシミュレーションを効率よく行えたことも幸運でした。その結果、わずか1年で高画質と低演算量を両立した独自のアルゴリズムを達成し、H.264/AVCを製品化するプロジェクトが始動しました。
しかし、まだまだ大変なのはこれからでした。」

符号化アルゴリズムの開発に成功し、喜びもつかの間、次に待つのは製品化。インタビュー後編では、H.264/AVC製品化への道のりや、次世代へのエールを語ります。

富士通研究所
准フェロー
中川章
1989年東大工学部電子工学科、1991年同大学院修士課程を修了。
同年富士通研究所に入社。以来、動画像符号化技術の基礎研究、国際標準化、LSI・装置開発に従事。
博士(工学)、平成28年春の褒章で「紫綬褒章」受章