Google Translate покращить переклади за допомогою нейромережі

Представництво Google виступило з офіційною заявою, в якій йдеться про те, що протягом найближчих декількох місяців якість перекладу тексту через сервіс Google Translate істотно покращиться. Це стане можливим завдяки переходу на нову нейронну систему Neural Machine Translation (NMT).

На поточний момент перекладач Google базується на основі технології Phrase-Based Machine Translation, яка виконує переклад кожного слова, після чого виводить користувачеві повністю перекладений текст. Найчастіше переклад виконується настільки погано, що зрозуміти сенс навіть окремого речення або всього тексту вкрай складно. Тому для якісного перекладу текстів різної тематики і складності потрібно звертатись до досвідчених фахівців, наприклад з бюро перекладів «ЕСПЕРАНТО™».

Технологія NMT, яка буде впроваджена в Google Translate, враховує смислове навантаження, зв’язок між пропозиціями і контекстом. По суті, при належному рівні реалізації, подібне рішення дозволить назавжди відмовитися від авторського людського перекладу, але поки що про це говорити ще надто рано.

Для кінцевих споживачів головне розуміти, що NMT послідовно перекладає всі слова, після чого порівнює їх за змістом. Все це відбувається не в рамках окремо взятої пропозиції, а в усьому тексті.

Спрощено нову систему машинного перекладу можна описати наступним чином. Вона складається з двох восьмишарових нейромереж, котрі аналізують і синтезують текст. Перша «прочитує» пропозицію і передає дані другій нейромережі, яка повинна скласти пропозицію на іншій мові. Між нейромережами встановлений додатковий модуль уваги, який повинен коригувати роботу таким чином, щоб система не пропускала рідкісні, але важливі для змісту речення слова.

Слід зазначити, що елементарними одиницями даних в нейромережі NMT, на відміну від аналогів, є не слова, а їх фрагменти (wordpieces), яких у даній роботі використовується 32 тисячі штук. За словами творців, це дозволяє досягти компромісу між універсальністю і точністю з одного боку, і швидкістю обчислень і навчанням — з іншого.

Нова система наразі адаптована всього на кількох мовних парах. Найкращі результати показа мовна пара англійська-іспанська. Якість перекладу в суб’єктивних опитувальниках (коли результат оцінюють люди) зросла на 60-87 відсотків щодо різниці з людиною.