雑考:オブジェクト指向と複合文字列

「構想:オブジェクト指向言語の多言語化」に対するコメントで理髪さんが

あるいは結果を文字列の集まりとして取り扱えないでしょうか。 (ShiftJIS , EUC-JP , ISO-2022JP) コード変換をしない代わりに文字操作でオーバーヘッドが大きくなりそうですが。

と書いてる。オブジェクト指向ならデータ構造が本物の文字列でなくても文字列のように振る舞うことができるのでこのやり方もアリだと思う。とりあえずこのような複数の文字列の集まりで表現されるデータを普通の文字列と区別するために複合文字列と呼ぶことにする。

複合文字列の最大の利点は汎用性である。この方法なら既存の文字セットに含まれない言語(象形文字だって)を扱うことも可能となる。欠点としてはどうしてもオーバーヘッドが大きくなりそうなところである。常時この形態で使うよりは UTF-16 などとうまく使い分けていく方向性がいいかもしれない。

さて、複合文字列の考え方をもっと発展させて適用範囲を広げていくと面白いことができそうである。例えば文字コードではなくフォントサイズやフォントフェイスで考えるとスタイル付テキストのオブジェクト指向版である。さらにもっと複雑な構造 HTML にまで発展させることができるのではないだろうか。

Tags:

Comments are closed.