ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ – ПОМОЩНИК В ПЕРЕВОДЕ, НО НЕ ЗАМЕСТИТЕЛЬ
В 2023 году термин «искусственный интеллект» доминировал в заголовках многих новостей и статей. Каковы возможности и риски инструментов ИИ? Являются ли они волшебной палочкой, способной решить почти любую проблему? Об этом и многом другом узнаете в данной статье блога Skrivanek.
Когда инструменты искусственного интеллекта, созданные на базе больших языковых моделей (large language model), попали в распоряжение широкой аудитории, у многих они вызвали смешанные чувства – от восторга до серьезного беспокойства.
Запуск классических чат-ботов с искусственным интеллектом сопряжен с известными рисками и ограничениями – особенно в отношении перевода, – но предусмотрительно и даже с хитростью их можно использовать. Одним словом, потребуется участие специалиста по языку.
ЧАСТО НЕ ХВАТАЕТ МЕСТНОГО КОНТЕКСТА
Перевод текста как процесс может показаться совсем простым. Берем одно слово, находим такое же на другом языке, на который нужно перевести текст, – и готово!
Однако все не так просто. Особенно в переводе творческих материалов.
Языки могут различаться построением предложений, частицами, передачей личных имен и многим другим. Не говоря уже о более своеобразных выражениях, фразеологизмах или сокращениях.
Например, в английском языке в рамках одного предложения зачастую могут использоваться не одно или два, а даже четыре и пять местоимений. Подобный текст, обработанный машинным переводчиком без дополнительных инструкций, носителю латышского языка покажется странным и неестественным.
Источник: ChatGPT, версия 4.0. Пример перевода без дополнительных инструкций.
МАЛО ОБУЧАЮЩИХ ДАННЫХ НА ЛАТЫШСКОМ ЯЗЫКЕ
Принимая во внимание количество говорящих на латышском языке в мире, очевидно, что в обучении чат-ботов используются более распространенные языки – английский, испанский. Таким образом, если чат-боту не дать специальное указание действовать определенным образом, вопросы, связанные с культурой языка, «исчезнут в переводе».
Источник: ChatGPT, версия 4.0. Пример перевода без дополнительных инструкций.
Приведенное в примере предложение довольно простое, но в нем сразу же обнаруживается ряд ошибок, самые заметные из которых – неправильные окончания. Можно подумать, что после их исправления текст станет пригодным к использованию.
Однако в культуре латышского языка не существует выражения «красные флажки», поэтому часть читателей может не понять, что на самом деле мы пытаемся этим предложением сказать.
Источник: ChatGPT, версия 4.0. Пример перевода с дополнительной инструкцией сделать текст более читабельным для носителей латышского языка.
Когда чат-боту дана еще одна инструкция, а именно сделать переводимый текст более читабельным для носителей латышского языка, предложение становится более понятным в сравнении с предыдущим примером.
Однако без дополнительного контекста оно все равно несколько сбивает с толку. О каких предупреждающих сигналах идет речь? Лампочках на панели управления? Поворотниках? Или все-таки о необычных шумах в моторном отсеке при трогании с места?
ТЕКСТ НЕОБХОДИМО ТЩАТЕЛЬНО ПРОВЕРЯТЬ
Каждое слово, которое нам выдают чат-боты, следует тщательно проверять. Во время перевода может показаться, что проверке фактов нужно уделять меньше внимания. Верно, ведь основной материал у робота уже есть, однако зачастую переводимые слова могут видоизменяться и становиться немного странными.
Источник: ChatGPT, версия 4.0. Запрос аналога в латышском языке, который описывает английское слово «pop» для создания рекламного материала.
Как показано на рисунке выше, машинный перевод предлагает 66 % непригодных для использования вариантов, которых в латышском языке не существует или они имеют другой контекст. Этот феномен часто можно наблюдать, запросив у чат-бота аналог из какого-то другого языка на латышском.
Если запрос короткий, контекста недостаточно, чтобы дать удовлетворительный или даже хороший вариант.
Но подобные ситуации ежедневно наблюдаются и с более длинными текстами, в которых вдруг окончания самых обычных слов становятся очевидно кривыми. Совсем как в первом визуальном примере статьи, где слово «līdzīgā» превратилось в несуществующее «līdzējā».
ИНФОРМАЦИЯ МОЖЕТ БЫТЬ ИСПОЛЬЗОВАНА ДЛЯ ОБУЧЕНИЯ
Как говорится в старой интернет-поговорке, что попало в Интернет, останется там навсегда.
В каких объемах данные после вода в чат-боты попадают в обучающие материалы, знают лишь сами разработчики, однако, если только память робота не выключена, часть этих данных может попасть в распоряжение разработчиков.
Поэтому перед использованием популярнейших чат-ботов стоит заранее определиться, что туда можно вводить без сомнений, не боясь утечки данных или идей.
По этой причине многие компании создают свои внутренние ИИ-инструменты, чтобы данные не попали в распоряжение третьих лиц..
ИИ-ИНСТРУМЕНТЫ ПОНЕМНОГУ СТАНОВЯТСЯ ВСЕ БОЛЕЕ ЛЕНИВЫМИ
Чем больше в обучающие данные искусственного интеллекта включается реальных данных из социальных сетей и дискуссионных форумов, тем ленивее становится робот.
Причина этого довольно забавная и, вероятно, не самая точная, но со временем, при повторе похожих действий, например просьбы описать или разъяснить работу сайта или документ, ChatGPT без плагинов чаще всего поможет с небольшой частью задания вместо выполнения его целиком.
Некоторое время назад ChatGPT в качестве новинки предлагал возможность отправлять роботу файлы, загружая их, которые тот сможет проанализировать. Казалось бы, эту функцию с тем же успехом можно было бы использовать для перевода документов объемом в несколько десятков страниц.
Но нет. Робот скорее даст небольшой обзор на один или несколько параграфов, но полностью проигнорирует остальной документ.
Возможно, в этом стоит винить не столько поведение робота в Интернете, сколько высокую стоимость запуска языковой модели. В апреле 2023 года компания SemiAnalysis, занимающаяся исследованием данных, пришла к выводу, что каждый запрос или приказ (prompt), что вводится в чат-бот, стоит 0,36 доллара.
ОБЪЕМ ДАННЫХ СЛИШКОМ ВЕЛИК
Использование инструментов ИИ для перевода текстов и документов по большей степени полезно, если обучающие данные уже включают в себя почти весь Интернет – теоретически нет ни одной темы, незнакомой роботу.
Но, как говорится, что подходит для всего, не подходит ни для чего.
Чтобы сделать процесс перевода более эффективным, есть два варианта: бороться самостоятельно, подбирая правильные запросы, или использовать инструмент для перевода, который уже адаптирован к особенностям латышской языковой культуры.
Если вы рассматриваете возможность машинного перевода с использованием искусственного интеллекта, рекомендуем обратить внимание на созданное Skrivanek решение машинного перевода, адаптированное под нужды предприятий.
Как уже упоминалось, в ChatGPT и других похожих инструментах объем обучающих данных большой, однако он не адаптирован под латышский язык.
Да, и без адаптации возможно добиться довольно высокой точности с помощью инструментов ИИ, однако не всегда можно рассчитывать на то, что в содержании не будет варваризмов, ненужных англицизмов или слов, придуманных ИИ.
Переведенный текст полностью выполняет свою задачу, если при прочтении невозможно определить, что он изначально создан на другом языке.
ПРЕИМУЩЕСТВА ИНСТРУМЕНТА МАШИННОГО ПЕРЕВОДА SKRIVANEK:
- Быстрая обработка. Если нужно перевести текст, чтобы как можно быстрее понять его смысл, машинный перевод поможет сэкономить время и деньги.
- Ориентирован на местный рынок. Выражения, которые понятны в одной стране, в другой могут вызывать удивление.
- Данные не хранятся на сервере. Информация, введенная в традиционные инструменты ИИ, может быть использована в целях обучения. Информация, введенная в нейронный машинный переводчик Skrivanek, не передается третьим лицам.
- Возможность «отшлифовать» текст. Чтобы быть уверенным в том, что текст «доведен до совершенства», после использования инструмента ИИ можно привлечь профессионального переводчика или копирайтера.
ВЫВОДЫ
У каждого инструмента есть свои преимущества и недостатки. Инструменты искусственного интеллекта не являются исключением – генерируемые ими тексты можно использовать, однако, чтобы создавать превосходные, изящные тексты, побуждающие к действию, необходимо участие лингвиста или переводчика.
Искусственный интеллект способен творить чудеса – особенно когда сталкиваешься с его инструментами впервые,– но зачастую они слишком необычны, чтобы можно было сразу ими воспользоваться. Чтобы текст получился хорошим и подходящим для местного рынка, важен взгляд профессионального лингвиста.