Text Mining Tool - это бесплатная программа для извлечения текста из файлов
Text Mining Tool
Text Mining Tool - это бесплатная программа для извлечения текста из файлов следующих типов: pdf, doc, rtf, chm, html без использования других программ (Word, Acrobat и т.п).
* Так как мы стараемся выкладывать на сайт только последние версии, поэтому с большой долей вероятности программа Text Mining Tool для Windows 7 подходит и будет с ним совместима.
Обзор Text Mining Tool 1.1.42
Помню, будучи сутдентом РУДН "писал" курсовую по немецкому языку. За пару дней до сдачи нужно было внести кое-какие изменения в файл скачанный с немецкого сайта, нет не с видео для взрослых, а с биографией Гете. PDF файл вскрываться упорно не хотел(защищен был от копирования текста), качать Adobe Editor и crack к нему времени не было.
Выкрутился я довольно просто: отскринил текст и заменил в картинке фразы где нужно было (слава богу менять надо было мало). Называйте это смекалкой или глупостью, как хотите) А вспомнил я этот случай потому что меня попросили обозреть программу Text Mining Tool.
Давайте же обозрим :) Она "вскрывает" PDF, DOC, RTF, CHM, HTML файлы и выдает на выходе "чистый" текст - содержимое. Есть возможность запускать из консоли и без GUI, в режиме командной строки - что бы срочно отпарсить в txt гига 2-3 разных документов, наверное.
В общем, эта штука бесплатная, если кому такая "отвертка" пригодится в хозяйстве - хорошо.
Прочие же могут 8 мегабайт (а именно столько "весит" Text Mining Tool) потратить на сайтах, родного Гете, немецкого содержания.
Если же еще и учесть что для использования "отвертки" надо скачать .Net Framework 2.0, то можете себе позволить короткометражное творение немецкого кинематографа.