Статистический машинный перевод — это разновидность машинного перевода текста, основанная на сравнении больших объемов языковых пар. Этот переводческий подход основан на вероятностном законе. Он использует модели статистического перевода. Один из применяемых подходов – теорема Байеса, т.е. P(E|F) = P(F|E) P(E), где P(F|E) – вероятность того, что исходная строка является переводом целевой строки, а P(E) – вероятность возможности получить строку целевого языка. Построение моделей статистического перевода – процесс довольно быстрый, но эта технология в большой степени зависит от наличия многоязычного корпуса текстов. Требуется минимум 2 миллиона слов для каждой отдельной области, если речь идет о языке в целом. Статистический машинный перевод требует наличия специального оборудования, для того чтобы «усреднять» переводческие модели. Примером статистического машинного перевода служит
Google Translate.