シフトJISコード体系における
日本語文書の圧縮に関する研究


915092坪井武志
915113沼崎香苗
915533白木秀之
  • 概要
    近年、電子メールや電子ニュースによるメッセージ交換が盛んになり、回線や中継サイトの負担が増大している。このため転送データの圧縮化が注目されている。これまで、データ圧縮に関する研究は広く行われてきたが、対象を日本語文書に限ったものに関してはあまり行われていない。
    本研究では日本語文書の圧縮に焦点を当て、日本語文字コードの持つ固有の特徴を検討し、圧縮を行う方法を取り上げる。対象コードは、パーソナルコンピュータに広く用いられている、シフトJISコード体系とする。
    さらに、今回の提案法に加えて、現在広く用いられている既存の圧縮法との組合せによる圧縮効果についても検討する。