Машинный перевод: различия между версиями

[непроверенная версия][отпатрулированная версия]
Содержимое удалено Содержимое добавлено
Метка: добавление ссылки
не указано, что такое "трансферный", нет АИ - откат
Строка 10:
 
=== Автоматизированный перевод ===
Вместо ''«машинный»'' иногда употребляется слово '''автоматический''', что не влияет на смысл. Однако термин '''[[автоматизированный перевод]]''' имеет совсем другое значение  — при нём программа просто ''помогает человеку'' переводить тексты.
 
Автоматизированный перевод предполагает такие формы взаимодействия:
* Частично автоматизированный перевод: например, использование переводчиком-человеком компьютерных [[словарь|словарей]].
* Системы с разделением труда: компьютер обучен переводить только фразы жёстко заданной структуры (но делает это так, чтобы исправлять за ним не требовалось), а всё, не уложившееся в схему, отдаёт человеку.
 
Архитектура систем машинного перевода может быть:
* трансферной.
* с полным анализом текста.
 
Основным достоинством систем на основе трансфера является высокая полнота охвата текстов при приемлемом уровне качества перевода, а также низкий уровень затрат на первичную разработку и модернизацию.
 
В англоязычной терминологии также различаются термины {{lang-en|machine translation, MT}} (полностью автоматический перевод) и {{lang-en|machine-aided}} или {{lang-en|machine-assisted translation (MAT)}} (автоматизированный); если же надо обозначить и то, и другое, пишут M(A)T.
Строка 49 ⟶ 43 :
Качество перевода зависит от тематики и [[стили речи|стиля]] исходного текста, а также грамматической, синтаксической и лексической родственности языков, между которыми производится перевод. Машинный перевод [[Функциональные стили речи#Художественный стиль|художественных текстов]] практически всегда оказывается неудовлетворительного качества. Тем не менее для технических документов при наличии специализированных машинных словарей и некоторой настройке системы на особенности того или иного типа текстов возможно получение перевода приемлемого качества, который нуждается лишь в небольшой редакторской корректировке.{{нет АИ|10|06|2012}}<!-- можно ли привести примеры подобных удачных переводов? --> Чем более [[Формализация|формализован]] стиль исходного документа, тем большего качества перевода можно ожидать. Самых лучших результатов при использовании машинного перевода можно достичь для текстов, написанных в техническом (различные описания и руководства) и [[Функциональные стили речи#Официально-деловой стиль|официально-деловом стиле]].
 
Применение машинного перевода без настройки на тематику (или с намеренно неверной настройкой) служит предметом многочисленных бытующих в [[Интернет]]е шуток. Из старых и наиболее популярных примеров таких шуток наиболее известен текст перевода документации к [[драйвер]]у [[Компьютерная мышь|мыши]], известный как [http://www.lib.ru/ANEKDOTY/mouse_driver.txt «Гуртовщики Мыши»], заявленный как «перевод компьютерной документации системой машинного перевода Poliglossum на основе медицинского, коммерческого и юридического словарей»<ref>Впрочем, это не так: [[Polyglossum]] (''[[sic]]'') — это [[электронный словарь]] [http://www.polyglossum.com/pg/r/index.htm], программа того же класса, что и [[Lingvo]], самостоятельно переводить не способная. В то время он существовал в версиях для [[DOS]] и [[Windows 3.x]] и, уступая ''Lingvo'' и ''Context'' по качеству общего словаря, имел рекордный объём специализированных словарей. К тому же отдельные ошибки перевода выдают подделку — после машинного перевода текст редактировался вручную [http://offline.computerra.ru/1999/325/2720/]: «Замечательный пример текста, полученного якобы при помощи медико-биологического словаря в результате перевода руководства по работе с драйверами мыши, называется „Гуртовщики Мыши“ … не верю в чистоту эксперимента: наверняка там не обошлось без поправок, внесенных в текст рукой человека.»</ref>.
Из кратких — фраза «{{lang-en2|Our cat gave birth to three kittens — two whites and one black}}», которую онлайн-переводчик «[[ПРОМТ]]» (версия 7.0, [[2007]]) превращал в «Наш кот родил трёх котят — двух белых и одного [[Афроамериканцы|афроамериканца]]».<ref>[http://ivannikitin.com/2007/06/15/наш-кот-родил-трех-котят-двух-белых-и-о/ Наш кот родил трех котят — двух белых и одного афроамериканца]</ref> Если «афроамериканца» ещё можно было сделать «чёрным», написав «{{lang-en2|black kitten}}», то «коту» так и не получалось сменить пол: например, {{lang-en2|female cat}} переводился как «самка кот».
 
Чаще всего подобные шутки связаны с тем, что программа не распознаёт контекст фразы и переводит термины дословно, к тому же не отличая собственных имён от обычных слов. Тот же переводчик ПРОМТ превращает «Лев Толстой» в «Lion Thick» («толстый лев»), «[[Бра и кет|bra-ket notation]]» в «примечание Кети лифчика», «[[алгебра Ли|Lie algebra]]» — в «алгебру Лжи», «[[вектор эксцентриситета|eccentricity vector]]» — в «вектор оригинальности», «[[Шоуни Смит|Shawnee Smith]]» в «индеец племени шони Смит» и т. п. [[Google Translate|Переводчик Google]], наоборот, слово «{{lang-en2|[[рис|rice]]}}» часто принимал за фамилию [[Райс, Кондолиза|госсекретаря США]].
Строка 67 ⟶ 61 :
== Ссылки ==
* О. С. Кулагина. О современном состоянии машинного перевода // Математические вопросы кибернетики, вып. 3, М.: Наука, 1991, стр. 5—50. Библиография из 140 названий. ISBN 5-02-014323-5.
* [http://old.computerra.ru/offline/2002/446/18251/ Будущее машинного перевода] // [[Компьютерра]] №21№ 21, 05 июня 2002
* [http://elibrary.ru/item.asp?id=16498144 Гращенко Л.А., Клышинский Э.С., Тумковский С.Р., Усманов З.Д. Концептуальная модель системы русско-таджикского машинного перевода] // Доклады Академии наук Республики Таджикистан – 2011. - том 54, №4. – С. 279-285.
* [http://old.computerra.ru/offline/2002/446/18251/ Будущее машинного перевода] // [[Компьютерра]] №21, 05 июня 2002
* [http://www.primavista.ru/rus/articles/mashinniy_perevod История машинного перевода] (перевод [[:en:History of machine translation]])