Задача редактирования может выполняться одним из двух способов.
Первый - на входе имеется только распознанный текст без исходных сканов, физической печатной копии или фотографий. Это самый сложный вид редактирования распознанного текста, т.к. редактор не может сверяться с оригиналом и должен восполнить пробелы и откорректировать текст на основе контекста и здравого смысла.
Второй способ - когда клиент предоставляет сканы книги или саму книгу для сканирования. Идеальный вариант для редактора, когда сканирование книги выполнено с помощью хорошего сканера с разрешением 300-600 точек на дюйм без искажения горизонталей строк. В этом случае автоматическое распознавание текста дает наименьшие ошибки, картинки и таблицы не требуют выравнивания границ и работа редактора сводится к корректуре только текста.
После сканирования или фотографирования документа получается изображение его страниц в растровом формате. Это означает, что визуально скан похож на текстовую страницу, но выделить и скопировать текст, отредактировать его или использовать поиск по документу нельзя. Для решения этих задач необходимо провести распознавание текста. Результатом работы, как правило, являются файлы формата DOC, XLS или текстовый PDF не переведенный в кривые.
Распознавание отсканированного текста и редактирование производится с участием редактора. Он настраивает работу программы, делает подстройку в процессе распознавания, проверяет ошибки распознавания и исправляет их. Результат сохраняется в текстовом редакторе. На выходе получается структурированный, редактируемый, качественный документ в нужном формате (Word, Excel).
Стоимость распознавания отсканированного текста
Стоимость ручного распознавания с проверкой и форматированием указана в прайс-листе за 1800 знаков исходного текста. В отдельных случаях могут быть применены скидки и наценки, которые зависят от состояния исходного документа (контраст, четкость печати, цветной фон страниц, геометрические искажения при сканировании) - и сложности структуры документа (наличие таблиц, графиков, рисунков). Редактирование на иностранных языках также может увеличить стоимость работы.Услуга | Цена |
редактура распознанного текста (ocr) | 120 руб. |
распознавание просканированного текста (без редактуры) | 3 руб. |
Редактирование на иностранных языках
Редактирование распознанного текста на иностранных языках, таких как английский, французский, немецкий, выполняется редактором-переводчиком нужного языка. Часто редактор является носителем языка и это означает, что он вычитывает текст на своем родном языке и может заметить и исправить неточности, которые не увидит русскоязычный редактор. Вычитка и редактирование распознанного текста на китайском, корейском, японском языке имеет повышенный коэффициент сложности. Такую работу необходимо согласовать с переводчиком и стоимость будет определяться индивидуально в каждом случае. Работа с арабский языком также имеет ряд нюансов и для редактирования мы привлекаем переводчиков-арабистов. Русскоязычному редактору очень сложно редактировать арабский текст по многим причинам.Какие еще причины могут влиять на стоимость редактирования распознанного текста?
Сканы страниц плохого качества - увеличивают время работы и стоимость редактирования.
Редактирование распознанного текста с картинками выполняется дольше, но не всегда требует дополнительной оплаты.
Редактирование текста с воссозданием структуры таблиц зависит от того, как автоматическая программа распознавания построит таблицы.
Редактирование отсканированного рукописного текста это отдельная услуга, все подписи, штампы, примечания, сделанные от руки необходимо набирать редактору заново, автоматическое распознавание в этом случае бесполезно.