シノバーです On Thu, 19 Dec 2002 22:13:47 +0900 加藤 雅 <mkato@xxxxxxxxxxxxx> wrote: > 本題からは外れますが、人様の書かれたソースを読む機会はあまり無かったので、 > 御蔭様で大変ワクワクしています。有り難うございます。 GLOBALというのをインストールしました。 http://www.gnu.org/software/global/ ソースのあるディレクトリで $ gtags $ htags でHTMLができあがり、webブラウザでソースが読めます。 libxmlのほうをずぅっと眺めていて、 余分なバイトが加えられるのはどうもここらしいというのが見付かりました。 parser.c中のxmlCopyCharMultiByteという関数です。 非ASCII文字をCOPY_BUFしようとするとこの関数が呼ばれます。 この関数の中で非ASCII文字はUTF-8に変換したうえでコピーします。 libxmlの仕様だとこれまで考えていたのですが、腑に落ちないところもありますね。 どうして無条件にこの変換をやってしまうのか? 入力はiso8859-1を仮定しているようですが。 gnumeric-1.0.11のこの問題はDebianでも上がってきました。 http://bugs.debian.org/cgi-bin/bugreport.cgi?archive=no&bug=173732 -- Masaki Shinomiya <shino@xxxxxx> http://shino.pos.to/linux/