技術情報
ちょっとした調べ物や技術情報を紹介します。
ちょっとした調べ物や技術情報を紹介します。
コミットされたファイルの拡張子によりMIME typeを決定し、
svn:mime-type属性に付与しようとしました。
ファイルの追加時のみsvn:mime-type属性値が存在するかチェックすることにして、
ファイルの編集時は省略することにします。
結論から言うとスマートにはできません。
まだやってませんが以下のようなことをしなければならなそう。
・svn:mime-typeを付与するためだけの作業コピーをサーバに用意し、
post-commitフックでsvn:mime-type属性値をセットして再度コミットする
・コミットのストリームを横取りしてsvn:mime-typeを付与するように書き換える(可能か?)
・svnクライアント側でsvn:mime-typeが付与されるようにする
以下作業記録。
OpenOfficeDocumentConverterではなくStreamOpenOfficeDocumentConverterを使ったら解決 orz
nutch-0.9に含まれるWordExtractorを使って日本語を含むMicrosoft Wordファイルをテキスト化しようとしたら
java.lang.StringIndexOutOfBoundsException: String index out of range: -101 at java.lang.AbstractStringBuilder.substring(AbstractStringBuilder.java:881) at java.lang.StringBuffer.substring(StringBuffer.java:416) at org.apache.poi.hwpf.model.TextPiece.substring(TextPiece.java:88) at org.apache.nutch.parse.msword.WordExtractor.extractText(WordExtractor.java:190) at org.apache.nutch.parse.msword.Test.main(Test.java:41)
こんな例外が起きる。
通常、将来的に廃止される予定のメソッド等にObsoleteアトリビュートを付加する事により、コンパイル時に警告を出す事が出来る。この機能を利用して、あまり理解してない人に利用して欲しくないメソッドに警告を出すようにしている。(本来は、そもそも使えないようにすれば良いのだけれども、、実プロジェクトで大規模なリファクタリングをする時間が無い事は多々あるので…) (さらに…)