ПЕРСПЕКТИВЫ СОВРЕМЕННЫХ СИСТЕМ МАШИННОГО ПЕРЕВОДА

Сведения об авторах:

О. И. Кузьмин

Московский государственный лингвистический университет, Москва, Россия

Аннотация научной статьи:

Современный мир движется в направлении глобальной цифровизации и, в частности, к софтверизации. Повсеместно происходят процессы замены человеческого ресурса на цифровые сервисы или программы, имитирующие выполнение схожих задач. Несомненно, что применение таких технологий в долгосрочной перспективе имеет экономические выгоды для предприятий и компаний. Однако, несмотря на это, качество конечного результата часто оказывается неудовлетворительным. Системы машинного перевода (МП) не являются исключением. До сих пор невозможно обойтись без редакторской правки текста, переведенного с помощью сервисов онлайн перевода. Полностью автоматизированный перевод высокого качества на сегодняшний день не является возможным ввиду многих факторов. Основная причина кроется в тайнах естественного языка: существовании подъязыков, абстрактных слов, полисемии.
Повышение качества работы систем машинного перевода является одной из приоритетных задач обработки естественного языка (NLP — natural language processing). За последние годы был сделан существенный прорыв в скорости анализа информации, и в будущем этот вопрос не будет первостепенным. Главными критериями оценки качества переведенных текстов будут являться смысловая связность текста и семантическая точность использованных лексических материалов. Для усовершенствования систем МП необходимо внести элементы дифференциации данных и персонализации информации под индивидуальные задачи пользователя. Для этих задач необходимо использование способа тематического моделирования для отнесения текста к той или иной предметной области. В настоящее время существуют алгоритмы, основанные на глубоком обучении, которые способны выполнять данные задачи. Однако процесс выявления уникальных лексических единиц требует более детального лингвистического описания семантических особенностей. Методы парсинга, которые будут задействованы при анализе текстов, должны также предусматривать возможность кластеризации по подъязыкам. Cоздание электронных автоматизированных словарей профессиональных областей знаний поможет качественно улучшить работу систем машинного перевода. Стоит отметить, что до сих пор не было успешных проектов по созданию словарей машинных систем перевода конкретных подъязыков. Таким образом, возникает потребность в разработке таких словарей и интеграции их в существующие системы онлайн-перевода.

Рубрика журнала Язык и культура
DOI: 10.47388/2072-3490/lunn2021-53-1-41-52
Количество скачиваний 452
Ключевые слова: машинный перевод; нейросетевой перевод; статистический перевод; гибридный перевод; обработка естественного языка (NLP).

Скачать “ПЕРСПЕКТИВЫ СОВРЕМЕННЫХ СИСТЕМ МАШИННОГО ПЕРЕВОДА”

53-03.pdf – Загружено 452 раза – 414,96 КБ