テキストファイルのバイナリ文字は邪道?

CSVXMLMovableTypeのエクスポートファイルなどテキストファイルというのはそのフォーマットに工夫がいる。制御に使いたいものも全てテキストで表現すると、そのテキストを内容に使われたら困るということになるから。
例えばCSVであればカンマ、XMLであればタグ文字の対策をしていないと、システムが区別できず意図した処理を行うことができない。
対策の王道はエスケープかと思う。でも、エスケープすると少々ファイルが読みにくかったり、プログラムもややこしくなったりする。これを回避するためにテキストの範囲外の文字を使うのは邪道だろうか。
最近目にしたファイルでは、バイナリエディタで「02」になる文字を頻繁に利用してファイルの制御とテキストを区別していた。合理的である気はするけれど、改行コードなどの慣れ親しむ制御文字以外を利用するのに少し抵抗もある。テキストはテキストでありたいという心の抵抗だろうか。

2件のコメント

  1. 対策の王道は「ライブラリで解決」じゃないですかね

  2. こんにちは。XMLとかの例えに対してエスケープを王道とか言ったらおかしいですね。何か頭がごちゃごちゃでした。

コメントする

メールアドレスが公開されることはありません。 が付いている欄は必須項目です