vine-users ML アーカイブ



[vine-users:056982] Re: gnumeric xml 保存時の日本語 文字化け及び脱落

  • From: Masaki SHINOMIYA <shino@xxxxxx>
  • Subject: [vine-users:056982] Re: gnumeric xml 保存時の日本語 文字化け及び脱落
  • Date: Mon, 16 Dec 2002 23:25:20 +0900
シノバーです

On Mon, 16 Dec 2002 01:56:38 +0900
Masaki SHINOMIYA <shino@xxxxxx> wrote:
> xml-io.cの中で new xml_parser を通すところだと思うのですが、
> 古いparserでは読み込みで失敗、
> 新しいparserでは読み込み正常で書き込みに失敗しているところから、
> これらを使い分ければ逃げられないかと思ってみたりしますが…

そうではなく、やはり読み込みで問題が生じているようです。
たとえば「あ」の1文字をgnumeric形式で保存しますと
gnumericの新旧、あるいはxml_parserの新旧で同じものができます。
これを古いparserでは「あ」が復元できますが
新しいparserでは正しく復元できないようです。
すなわち旧バージョンの日本語を含んだgnumeric形式ファイルは
素のgnumeric-1.0.11では読めない(と思う)。

本家の gnumeric-1.0.11.tar.bz2 を展開、./configure, make, make install
でインストールすると/usr/local以下にインストールされるので
/usr/bin/gnumericで旧、/usr/local/bin/gnumericで新が立ち上がるので
このあたりのテストができます。
履歴を保存する ~/.gnome/Gnumeric は共通ですので注意が必要ですが。
(正確さを期するなら都度~/.gnome/Gnumericを消去?)
# /usr/local/lib/gnumeric/1.0.11-bonobo/plugins/guile は
# エラーメッセージが邪魔なのでディレクトリごと消しちゃったほうが良いです。

「あ」の1文字をgnumeric形式で保存します。
これを仮に a.gnumericとします。これを a.xml.gz とファイル名を変え、
gunzipすると a.xml ができます。これを覗いてみると
&#164;&#162; が見付かります。
「あ」のeuc-jpコードは16進表記で a4a2、
1byteづつ10進表記すると164,162となります。

この保存ファイルはgnumericの新旧、あるいはxml_parserの新旧で同じです。
これを読み込むさいの新旧の処理が違うみたいです。

-- 
Masaki Shinomiya <shino@xxxxxx>
http://shino.pos.to/linux/