论坛: ご意見ご感想 (Thread #7977)

MeCab使用時の不具合確認(1.1b) (2005-06-24 10:49 by sard #14929)

お世話になります。
前々からMargarineに興味がありつつもWindowsユーザな身でしたので実行する機会が
なかったのですが、この度Linux環境を投入することが出来ましたので早速使用させて
いただきました。

■当方環境
・PC:i586系自作PC(P3-1000B)
・OS:Vine Linux 3.1(6/23現在の最新版update/upgrade済)
・Ruby:(備考)
・Margarine:Ver1.1-Beta
・MySQL:(備考)
・MeCab:0.81+ipadic2.5.1
・Rice:0.0.0.2

当初はChaSen環境を構築してたのですが、本体のインストールと確認は出来たのですが、
ruby-chasenの導入がうまくいかない経緯があり、MeCabに逃げるように移行したところでした。
導入はうまくできたのですが、以下のようなケースで停止してしまうことが確認されました。


 「こんにちはー」・・・この「ー(長音記号)」を含まれると停止してしまう
(「こんにちは~」であれば問題なく処理される。「ー」のみでもNG)


MeCab単独で動かしてみたところ、「ー」が未知語として処理されるようです。
未知語を受けてしまうと、Margが無反応になってしまうようです。
(ちなみに「:SELF」であれば問題なく処理されています)

セルフモードでも運用できるので緊急ではないものの、せっかくある形態素解析システム
を活用してみたく、ご教授いただければ幸いです。

どうぞ、よろしくお願いします。




P.S.
最近のIRCにて、非推奨とされつつも半角カタカナを使用する方も多くなってるようで、
それによってMarg側で文字化けを起こしてしまうことが見受けられました。
色々模索してみたものの、まだLinux歴2日の身では困難を極めておりまして(^-^;)
このあたりも何かアイデアがありましたらよろしくお願いします。

RE: MeCab使用時の不具合確認(1.1b) (2005-06-24 10:52 by sard #14933)

自己レスを一つ。

上記の(備考)とは、今現在勤務中につきバージョン確認が出来ていませんでした。
しかし、両方ともapt-getによるインストールを実施していますので、確認できましたら追ってご連絡させていただきます。

・・・肝心のRubyは1.8.1だったかと思いました。
少なくとも1.8系である事は間違いないです。
回复到 #14929

RE: MeCab使用時の不具合確認(1.1b) (2005-06-26 10:53 by nisi #14953)

こちら↓でちょっと触れていますが、
http://sourceforge.jp/forum/forum.php?thread_id=3186&forum_id=2322
茶筌をVineで使う場合、普通にセットアップすると"/etc/ld.so.conf" に、"/usr/local/lib"を追加して/sbin/ldconfigを実行する必要があります。

MecCab、半角カタカナ問題については、ご報告ありがとうございます。ただ今、本業と別プロジェクトにかかりっきりでこちらの更新はもっと先になってしまいそうですが、今後の課題とさせて頂きます。
回复到 #14929

RE: MeCab使用時の不具合確認(1.1b) (2005-06-27 01:55 by sard #14969)

お返事ありがとうございます。

まず、茶筅の方ですが、パスは通してありまして、以下の様なエラーが表示されます。

/usr/local/lib/site_ruby/1.8/i386-linux/chasen.so: /usr/local/lib/site_ruby/1.8/i386-linux/chasen.so: undefined symbol: _Znwj - /usr/local/lib/site_ruby/1.8/i386-linux/chasen.so (LoadError)
from ./margarine.rb:366:in `initialize'
from ./margarine.rb:38:in `new'
from ./margarine.rb:38:in `initialize'
from marg.rb:16:in `new'
from marg.rb:16

ruby-chasenの部分だとは思うのですが、解決の糸口を見出せないでいる状況です。


あと、前回宿題だったバージョン関連は、以下のとおりになります。

・Ruby:1.8.1
・MySQL:4.0.23(server+client)
・Darts:0.2.0

半角文字に関しましては、私も試行錯誤でいろいろ調べてみては試してみたのですが、どうにもうまくいきませんでした。
自分も勉強しながら試行錯誤続けてみたいと思いますので、これからもどうぞよろしくお願いします。
回复到 #14953

【報告】茶筌解決! (2005-06-27 21:33 by sard #15014)

毎度お世話になってます。
茶筌のトラブルの件ですが、調べましたところライブラリの設定誤りが原因だったようです。
(結構このトラブルは多いようです)

次の通りにruby-chasenをインストールし直したところ、解決できましたので報告させて頂きます。


1. 「/usr/local/src」にてruby-chasen(chasen1.6.tar.gz)を解凍する。
 【tar zxfv chasen1.6.tar.gz】
2. 出来上がったディレクトリ「chasen1.6」に移動する。
3. mkmfをオプション付きで実行する。
 【ruby -rmkmf -e 'dir_config("chasen","/usr/local");have_library("stdc++"); create_makefile("chasen") if have_library("chasen")'】
4. makeした後にmake installさせる。
5. 「/etc/ld.so.conf」を開き、パスが通ってるかを確認。無かったら追記する。
 【デフォルトのパス:/usr/local/bin】
6. 「/sbin/ldconfig -v」にてコンフィグを有効にする。


・・・以上で何とか動かせるようにはなりました。
過去スレッドの問題だった方も、同じ方法で回避は出来たと思われます。
(基本的には「undefined symbol」のエラーが出てる方は、この方法で回避できそうです)


ただ、依然半角カナ文字による文字化けは解決できてない状況です。
こちらももう少し粘ってみて、対処法が見つかったらお知らせできたらいいなと思っております。

どうぞ、よろしくお願いします。
回复到 #14969

半角カナ文字について (2005-07-05 11:20 by sard #15101)

ここ数日ばかり動向を確認していたのですが、もしかしたらちゃんと変換されている可能性があります。
(ChaSen環境にて)

実は、実行コンソール上での表示が文字化けしておりましたので、改善されてなかったんじゃないかと思っていた次第です。
しばらく様子を見ていたのですが、Margからの発言には半角カナ文字が使用されていないことに気づきました。


今度時間がとれるときにでも、ChaSenと自己解析での動向を再度確認してみたいと思います。
回复到 #15014