[Hiki-dev:00860] 行末のホワイトスペース文字の取り扱い

Back to archive index

zunda zunda****@yahoo*****
2005年 6月 23日 (木) 14:43:19 JST


zundaです。ご無沙汰しています。

ホワイトスペース文字のとりあつかいについて。行末の空白は捨ててもいいけ
ど改行は捨てないようにするのがいいと思います。

むかーしIRCで議論した(じゃなくてひとりわめいていた)ような記憶があるので
思い出してみると、
  http://www.w3.org/TR/html401/struct/text.html#h-9.1
より、HTML4では、「ホワイトスペース文字はそれぞれの言語(script)の慣習に
合わせてクライアント側でよしなに整形するように」というルールになってい
るようです。

これを読むと、w3cに従っているブラウザならラテン文字の間にはさまっている
複数のホワイトスペース文字は一つの空白にレンダリングされて、日本語の文字
の間にはさまっている複数のホワイトスペース文字は抹消される、ということに
なりそうだな、と思うのですがどうでしょうか?

そういうわけで、見栄えからすると行末の空白は捨てても問題ないと思います。
が、Hikiは行末の改行も捨ててしまうので、行末に空白を書いておかないと、
改行の前後の英単語がひとつの単語としてレンダリングされてしまう、という
問題があったのでした。つまり、行末の改行と空白と両方捨ててしまうとラテ
ン言語では使えなくなっちゃいます。

そうそう、それでシングルバイト文字が続く場合には捨てた改行の代わりに空白
を一つ足すパッチを作ったのでした。
  http://zunda.freeshell.org/d/20031111.html#p05
だんだん思いだしてきた。考えてみたら、わざわざ空白を追加するよりは、最初
に改行を捨てないようにした方がいいよね。

そういうわけで、上に書いたように空白はどうでもいいけど改行を捨てちゃう
のは良くない、と思いました。

以上、参考まで。

--- Kenta MURATA <murak****@compl*****> からのメッセージ:
> むらたです.
> 
> Kazuhiko wrote:
> > pre じゃないときは行末の空白は全部捨てたほうがいいのかなぁ。個人的にはどっ
> > ちでもいいのですが、何か意見のある人はいますか? (ちなみに、テキストの先
> > 頭と末尾の空行は捨てています。)
> 
> 参考までに:
> 
> TeX では,
> (1) 連続するホワイトスペースは1つにまとめ
> (2) 行頭のホワイトスペースは無視し
> (3) 行末の改行は1つの空白へ置き換わり
> (4) コマンド後の空白は無視
> していたと記憶しています.
> 
> pTeX は上記の (3) が「行末の改行を無視」に変更されます.
> 
> 分かち書きされない言語で問題になるホワイトスペース文字の取り扱いについて
> 何らかの基準ってあるんでしょうかね?
> 
> # 多言語化するとき困る気が・・・

# そうそう、(4) TeXでコマンドの後の空白は無視、ってのはよくないですよね。
# \newcommand\micron{\mbox{$\mu$m} となっていて、原稿に「10 \mircon band」
# と書くと、「10 μmband」というようになってしまいます。「10 {\micron} band」
# ならおっけー。

__________________________________
Save the earth
http://pr.mail.yahoo.co.jp/ondanka/




Hiki-dev メーリングリストの案内
Back to archive index