技術情報
jodconverterでconversion failedが起きる
OpenOfficeDocumentConverterではなくStreamOpenOfficeDocumentConverterを使ったら解決 orz
OpenOfficeDocumentConverterではなくStreamOpenOfficeDocumentConverterを使ったら解決 orz
nutch-0.9に含まれるWordExtractorを使って日本語を含むMicrosoft Wordファイルをテキスト化しようとしたら
java.lang.StringIndexOutOfBoundsException: String index out of range: -101 at java.lang.AbstractStringBuilder.substring(AbstractStringBuilder.java:881) at java.lang.StringBuffer.substring(StringBuffer.java:416) at org.apache.poi.hwpf.model.TextPiece.substring(TextPiece.java:88) at org.apache.nutch.parse.msword.WordExtractor.extractText(WordExtractor.java:190) at org.apache.nutch.parse.msword.Test.main(Test.java:41)
こんな例外が起きる。
5GBのDVDイメージを外付けUSBハードディスク(以下 USB HDD)にコピーしようとしたら、USB HDDの容量が足りないというエラーが発生。
USB HDDの残容量は43GBぐらいあるのにおかしい。んで、FAT32はファイルサイズに4GBの制限があることを思い出した。
FAT32をフォーマットなしにNTFSに変換するを参考にしながら変換した時のメモ。
IEnumerable<T>をテンプレート引数が異なるIEnumerable<T’> where T : T’ に変換したい場合がしばしばある。
普通にキャストすると
IEnumerable tEnumerable = (IEnumerable )tConcreteEnumerable;
コンパイルは通るけど実行時に例外が起きてしまう。
(さらに…)