Бюро переводов, Москва

Услуги профессиональных переводчиков всех
основных языков мира. Без машинного перевода!

+7 495 504-71-35   с 9-30 до 17-30
info@flarus.ru | Как заказать перевод?
Прайс-лист на переводы

Услуги Тематики
Цены Наши рабочие языки
Наши переводчики О компании


О компании
Наши проекты

Автоматический определитель языка текста



Любой автоматический определитель языка имеет в своей основе какой-либо алгоритм работы. Алгоритм разработанного нами определителя языка Guesser.ru построен на последовательном сравнении из базы данных букв, сочетаний и слов, характерных для иностранного языка с соответствующими фрагментами загруженного текста. Подразумевается, что язык, на котором этот текст написан, требуется определить. Самым сложным и неоднозначным этапом стало не программирование алгоритма, а именно подбор буквенных сочетаний, которые мы назвали "маркерами" языка. Работу по наполнения таблицы маркеров выполнили профессиональные редакторы бюро переводов. Работа над списком маркеров ведется и по сей день, ведь характеристики языка достаточно условны и, к тому же, постепенно изменяются во времени.

В разработке нового алгоритма мы отошли от старого метода определения языка по списку заранее загруженных в наш глоссарий слов. Этот алгоритм хорошо определяет язык небольших текстов, предложений и даже отдельных слов, однако при определении языка объемных текстов, в процессе вычисления накапливается ошибка и результат существенно искажается случайным образом. Это возникает из-за одинакового написания коротких или популярных, а соответственно, наиболее частотных слов в разных языках и использования в них одинаковых букв.

определитель языка

Новый алгоритм требует большего объема текста для определения языка, однако ошибка определения уменьшается при увеличении объема исходных данных. Чем больше объем загруженного текста, тем больше итераций совершается по поиску вхождений в текст маркеров.

определитель языка, ввод текста

Определитель Guesser.ru находит маркеры нескольких языков и начинается процесс накопления веса каждого из языков. Каждый потенциально определенный язык суммирует вес маркера умноженный на кол-во вхождений этого маркера в текст. По окончании работы алгоритма, определитель языка сравнивает веса и выдает таблицу языков с вероятностью их определения.

определитель языка, результаты

Однако, при достаточно типичном для нескольких языков тексте, например, написанном на русском/болгарском, немецком/голландском, испанском/французском языках, набор веса каждого из "конкурирующих" языков идет практически с одним темпом. В результате определения языка текста мы получаем набор языков с очень близкими или вообще совпадающими значениями.

определитель языка, точность определения

Для компенсации маркеров для похожих по написанию языков, мы разработали и применили метод вычисления уникальности (по отношению к другим языкам) найденного в тексте маркера и таким образом смогли организовать "точки" обнуления вероятности накопленной ошибки. С этим дополнением, определитель может существенно повысить вероятность распознавания того языка, который имеет больше всего совпадений с текстом уникальных маркеров. Для большинства определяемых языков, к которым составлены таблицы маркеров, точность определения приближается к 98%.

Дополнительным достоинством определителя языка Guesser.ru является то, что его алгоритм может работать с многоязычными текстами, т.к. результатом работы является не один единственный язык, определенный с наибольшей вероятностью, а таблица языков с рассчитанной вероятностью их определения.

определитель языка, точность определения

Проверить работу пределителя языка





Последний наш перевод:
"Обработка полов из камня, гранита и керамической плитки против скольжения / Anti-slip treatment for floors in stoneware, granite, ceramic tiles". Технический перевод, перевод с английского на русский язык выполнил переводчик №381

Метки перевода: кремний, гранит, материал, обработка, стекло, поверхность, состав.

Переводы в работе: 38
Загрузка бюро: 25%
Все наши переводы: 29700

Наши клиенты

Расчет стоимости перевода

Исходный язык:


Язык перевода:


Объем текста:




Стоимость перевода:
450,00 руб.

Заказать перевод

Наши рабочие языки




Услуги

Письменный перевод
Локализация сайтов
Редактирование
Вычитка текста
Оцифровка
Верстка

Компания

Презентация
Примеры переводов
Наши клиенты
Оплата услуг
Вакансии
Контакты



Бюро переводов Фларус
© 2001-2019

Проекты

Работа для переводчиков
Поздравления с переводом
Разговорник
Глоссарии и словари
Шаблоны переводов

Контакты

Россия, Москва,
ул. Большая Молчановка, 34 стр.2, оф. 25
схема проезда

Телефон:
+7 495 504-71-35

Заказ: info@flarus.ru