BookDesigner - лучший помошник ocr-щика

http://www.the-ebook.org/rus/wp-content/uploads/2008/06/ocrpadwindow.jpg

сайт программы http://www.bookdesigner.org

Основные возможности программы

Форматирование входных файлов

1. Форматирование текстовых файлов и файлов, из которых извлекается чистый текст (см. п. 2.3).
  1.1. Автоматическое определение способа форматирования книги на основе статистического анализа структуры текста
  1.2. Автоматическое восстановление формата для плохо сформатированных файлов.
  1.3. Поиск заголовков, подзаголовков, эпиграфов и стихов при автоматическом форматировании книги
2. Три метода форматирования для  html, doc, rtf и rbфайлов.
  2.1. Полное сохранение исходного формата.
  2.2. Сохранение основных элементов исходного формата (заголовки, подзаголовки, параграфы, картинки, закладки и ссылки).
  2.3. Полное переформатирование путем извлечения чистого текста.
3. Автоматическое определение шести основных нелатинских кодировок: win-1251, koi8, cp866, iso, alt, и MacCyr
4. Назначение пользовательских цветов для заголовков, подзаголовков, параграфов, эпиграфов, стихов и т.д.
5. Объединение множественных файлов в одну книгу (для rb).

Режим чтения

1. Автоматическая загрузка недочитанных книг со страницы, где чтение было прервано.
2. Точное позиционирование при перелистывании страниц.
3. Меню доступа к последним читаемым книгам.
4. Возврат на предыдущую (последуюшую) позицию.
5. Увеличение/уменьшение размера шрифта одним кликом.
6. Возможность изменения цвета, типа и размера шрифта, а также цвета страниц.
7. Возможность вставлять и редактировать закладки и ссылки.
8. Возможность собирать, редактировать и записывать в отдельный файл цитаты из читаемой книги.
9. Поиск/замена слов.
10. Поиск книг (включая поиск по регулярным выражениям).
11. Поиск заголовков, подзаголовков, параграфов, эпиграфов, стихов и т.д.
12. Автоскроллинг.
13. Статистический анализ: подсчет количества заголовков, подзаголовков, параграфов, эпиграфов, стихов, картинок, стилей (жирный шрифт, наклонный и т.д) и символов (точки, запятые, тире и т.д).   
14. Информация о файле книги: время создания, размер, тип форматирования и т.д.
15. Справка на русском и английском языках.
16. Поддержка фонтов ClearType (для Windows 2000 и выше).

Режим редактирования

1. Поиск, назначение и преобразование друг в друга основных структурных элементов книги - заголовков, подзаголовков, параграфов, эпиграфов, стихов и т.д.
2. Динамический редактор html файлов, позволяющий осуществлять быстрое редактирование загруженных книг или написание новых.
3. Две опции редактирования: автоматическая (как в Word, нажатием кнопок), и ручная (прямое редактирование выбранных html-фрагментов книги).
4. Изменения цвета, типа и размера шрифта как для всей книги, так и для выбранных фрагментов.
5. Возможность вставлять и редактировать картинки.
6. Возможность вставлять и редактировать закладки и ссылки.
7. Возможность вставлять и редактировать элементы контроля (кнопки, боксы и т.д.).
8. Найти/заменить (текст, регулярные выражения, ASCI коды, html-элементы).
9. Проверка орфографии.
10. Экспорт в html, doc и rtf формат.

Изготовление электронных книг

1. Переносы.
2. Оптимизация книги под выбранное устройство. 
3. Закладки и ссылки.
4. Картинки.