vine-users ML アーカイブ



[vine-users:077980] Re: sylpheed とbogofilter について

  • From: 野宮 賢 / NOMIYA Masaru <nomiya@xxxxxxxxxxxxxxxx>
  • Subject: [vine-users:077980] Re: sylpheed とbogofilter について
  • Date: Fri, 11 Jan 2008 21:23:34 +0900
野宮です.

>>>>> In the Message: [vine-users ML: No.077974]
>>>>>   with the date of Fri, 11 Jan 2008 12:12:44 +0900
>>>>> [金子さん] == "KANEKO Seiji" <giraffe@xxxxxxxxxxxx> has written:

小生>> 「高速」は解りますが,「高精度」というのはどういうことでしょうか?

金子さん> 分かち書きの精度のことです。詳細は、
金子さん> http://mecab.sourceforge.net/#diff
金子さん> あたりをご参照下さい。

有難うございます.

実は,メインテナーの方が仰るのだから,と Google 調べ,それなりに事情を推察
出来,bogofilter のみならず,namazu も MeCab を使う形でビルドしました.

namazu with MeCab でインデクサを作成するのに時間が掛りましたが(それも,
with Kakasi に比べると随分高速で,驚きました),検索をやって大変驚きました.

つまり,namazu with Kakasi は,関係無いものまで該当ファイルとして示していた
のですが,何と,namazu with MeCab は,きっちり該当ファイルのみを示して呉れ
ました.これには,感動です.

ところで,bogofilter with MeCab ですが,分かち書き規則が厳密な分,SPAM 検出
には分が悪く思えました.SPAM 検出では,Kakasi のルーズなところに分があるよ
うに思えました.

そうすると,namazu は,with MeCab で,bogofilter は,with Kakasi で,という
のが解決策となりそうですが,そうも行きません.つまり,namazu のビルドは,
Kakasi を優先的に認識するようなっていますので.

ま,bogofilter with MeCab では,wordlist.db が 10MB と,with Kakasi の場合
に比して 10 分の 1 以下のサイズに収まりますので,良しとしています.

ともあれ,貴重な情報を有難うございます.

# 1. それにしましても,日本のSPAMって,どうしてああいう「えげつない
#   Subject」を用いるのか....
# 2. 初めて Linux の世界を教えて呉れた Vine に代えようか....

---
  野宮  賢             mail-to: nomiya @ galaxy.dti.ne.jp

       「eメールや携帯電話に縛られた社会は、自分自身と向き合ったり、
        空想にふけったりする自由を奪う。」
                                                  -- M. Crichton --