vine-users ML アーカイブ



[vine-users:057081] Re: gnumeric xml 保存時の日本語 文字化け及び脱落

  • From: Masaki SHINOMIYA <shino@xxxxxx>
  • Subject: [vine-users:057081] Re: gnumeric xml 保存時の日本語 文字化け及び脱落
  • Date: Sat, 21 Dec 2002 09:39:54 +0900
シノバーです

On Thu, 19 Dec 2002 22:13:47 +0900
加藤 雅 <mkato@xxxxxxxxxxxxx> wrote:
> 本題からは外れますが、人様の書かれたソースを読む機会はあまり無かったので、
> 御蔭様で大変ワクワクしています。有り難うございます。

GLOBALというのをインストールしました。
http://www.gnu.org/software/global/
ソースのあるディレクトリで
$ gtags
$ htags
でHTMLができあがり、webブラウザでソースが読めます。

libxmlのほうをずぅっと眺めていて、
余分なバイトが加えられるのはどうもここらしいというのが見付かりました。
parser.c中のxmlCopyCharMultiByteという関数です。
非ASCII文字をCOPY_BUFしようとするとこの関数が呼ばれます。

この関数の中で非ASCII文字はUTF-8に変換したうえでコピーします。
libxmlの仕様だとこれまで考えていたのですが、腑に落ちないところもありますね。
どうして無条件にこの変換をやってしまうのか?
入力はiso8859-1を仮定しているようですが。

gnumeric-1.0.11のこの問題はDebianでも上がってきました。
http://bugs.debian.org/cgi-bin/bugreport.cgi?archive=no&bug=173732

-- 
Masaki Shinomiya <shino@xxxxxx>
http://shino.pos.to/linux/