VineSeed ML アーカイブ



[VineSeed:16927] Re: [提案]anth yの学習量

  • From: Toshiharu Kudoh <toshi.kd2@xxxxxxxxx>
  • Subject: [VineSeed:16927] Re: [提案]anth yの学習量
  • Date: Mon, 16 Mar 2009 04:58:03 +0900
工藤です。

HARADA Kazutaka さんは書きました:
> ハラダです。
>
> Toshiharu Kudoh さんは書きました:
>   
>> 更新されたanthy-ut-patches-20090228の中をざっと見てみましたが、
>> anthy-9100/src-ordering/candswap.c
>> anthy-9100/src-ordering/commit.c
>> へのパッチは基本的にanthy-9100.patch.bz2と同じですよね?
>>     
>
> あれ、20090228だとコメントアウトされてませんでしたか??
> こっちの2つファイルへではG-HALさんの変更自体が無効になって
> いるようだったので、それでどうしたものかと思ったのですが…。
>   
今パッチのコードをG-HALさんの解説と合わせて読み直してみましたが、
patch12の途中から自立語とOCHAIRE学習を改善する方向に傾いてきているように
思います。
多分その方向性から、自立語候補とOCHAIRE学習のパラメータを設定する
anthy-9100/src-ordering/candswap.c
anthy-9100/src-ordering/commit.c
がコメントアウトされているようです。私の見落としですね。失礼しました。
# 寝不足状態でコード読んではダメですね…orz

そうなると、学習データ量の設定は、
anthy-9100/src-ordering/candhistory.c
anthy-9100/src-worddic/record.c
の設定だけに現在のパッチはなっているということなのでしょうかね。

>> 後、anthy-ut-patches-20090228/ghal-patch/の
>> anthy-9100h.patch13ptn20
>> anthy-9100h-remove-corpus.diff
>> conf
>> の文字コードがISO-8859-1となっていますが、大丈夫でしょうか?
>>     
>
> $ pwd
> /home/hoge/rpm/SOURCES/anthy-ut-patches-20090228/ghal-patch
>
> $ nkf -g *
> anthy-9100h-remove-corpus.diff:EUC-JP (LF)
> anthy-9100h.patch13ptn20:EUC-JP (LF)
> conf:EUC-JP (LF)
> depgraph:ASCII (LF)
>
> と出ているので特に問題なさそうですが、私の文字コードの
> 確認方法が間違ってるかも知れませんので、良かったら工藤さん
> の方法も教えてもらえると助かります。
>   
こちらもnkfで確認しましたら、EUC-JPと出ました。
多分、Geanyで開いていたのが問題だったと思います。

どちらも私の環境と拙速さに起因するミスです。
申し訳ありませんでした。