Czy tłumaczenia maszynowe są już gotowe, by zastąpić tradycyjne tłumaczenia?

Tłumacze mają partnera w branży – maszyny! Dzięki postępowi w sztucznej inteligencji i uczeniu maszynowemu tłumaczenia maszynowe to jedna z najszybciej rozwijających się dziedzin technologii językowej. W związku z tym stają się coraz bardziej precyzyjne i dostępne dla szerokiego grona odbiorców.

W tym artykule przyjrzymy się bliżej tematowi tłumaczeń maszynowych, ich definicji, historii, metodom, a także omówimy ich wady i zalety.

Co to jest tłumaczenie maszynowe?

Tłumaczenie maszynowe (ang. Machine Translation, MT), zwane też automatycznym, jest tłumaczeniem wykonywanym przez oprogramowanie komputerowe. Opiera się ono na wykorzystaniu algorytmów i technik automatyzacji procesu rozumienia i tłumaczenia tekstu z jednego języka na inny. Jest to narzędzie wspomagające pracę tłumacza, przydatne przeważnie w tłumaczeniu dużych ilości tekstu w krótkim czasie. 

W realizacji tłumaczeń maszynowych niezmiernie przydatna jest pamięć tłumaczeniowa (ang. Translation Memory, TM), czyli rodzaj bazy danych, która składa się z fragmentów tekstu w co najmniej dwóch wersjach językowych. Zwykle występuje w postaci plików oprogramowania typu CAT (ang. Computer-Assisted Translation). 

Zarówno tłumaczenia maszynowe, jak i pamięci tłumaczeniowe to niezwykle ważne narzędzia w branży tłumaczeniowej. Tłumaczenia maszynowe służą do szybkiego tłumaczenia dużych ilości tekstu, a pamięci tłumaczeniowe przechowują wcześniejsze tłumaczenia w taki sposób, że można je łatwo wykorzystać do tłumaczenia podobnych treści.

Tłumaczenie maszynowe – jak to się wszystko zaczęło?

Początki tłumaczeń automatycznych, podobnie zresztą jak Internetu i wielu innych technologii, związane są z wojskiem. W latach 50. XX wieku zaczęły powstawać pierwsze systemy, które umożliwiały wykonywanie tłumaczeń automatycznych opartych na regułach. Ówczesne maszyny zajmowały jednak bardzo dużo miejsca, proces był czasochłonny i kosztowny, a jakość i dokładność tłumaczeń pozostawiała wiele do życzenia. 

Do przełomu w dziedzinie tłumaczeń maszynowych doszło kilka dekad później, kiedy udoskonalono tłumaczenia oparte na modelach statystycznych. W latach 90. w związku z postępującą globalizacją, a co za tym idzie – z rosnącym zapotrzebowaniem na tłumaczenia, powstał najpierw program tłumaczący forum internetowe z polskiego na niemiecki, a następnie ogólnodostępny darmowy program tłumaczeniowy BabelFish Altavista. 

Kilkanaście lat później, w 2014 roku, opracowana została technologia tłumaczeń automatycznych oparta na sieciach neuronowych, która działa podobnie do ludzkiego mózgu, a więc pozwala na samodzielny rozwój, uczenie i doskonalenie się maszyn. Początków takich rozwiązań można szukać już w 1949 roku, kiedy to Alan Turing (ten sam, który brał udział w łamaniu szyfrów Enigmy) zaproponował wykorzystanie w tłumaczeniach technologii machine learning.

Obecnie w tłumaczeniach maszynowych najczęściej stosowane są metody SMT, NMT oraz DBMT. Istnieje jednak więcej metod wykorzystywanych przez maszyny do wykonywania przekładów z jednego języka na inne.

Rodzaje i systemy tłumaczeń

DBMT (ang. Directed Bilingual Machine Translation), czyli system tłumaczenia bezpośredniego, jest najbardziej podstawową metodą tłumaczenia i jest używany do prostych zadań, takich jak tłumaczenie kilku słów lub zdań. Opiera się na wielkich zbiorach danych i modelach statystycznych, które uczą się na podstawie analizy par językowych i identyfikują zależności między słowami i frazami w językach źródłowym i docelowym. Jest to metoda dobrze sprawdzająca się w tłumaczeniu języków bardzo podobnych do siebie.

RBMT (ang. Rule-Based Machine Translation) wykorzystuje reguły do identyfikacji języka źródłowego i generowania danych wyjściowych w języku docelowym. Tłumaczenie maszynowe oparte na regułach bazuje na tłumaczeniu całych jednostek składniowych, a nie tylko pojedynczych słów czy fraz.

TBMT (ang. Transfer-Based Machine Translation), czyli system oparty na transferze semantycznym, wykorzystuje do tłumaczenia kombinację reguł i dwujęzycznych słowników. Pod uwagę bierze własności składniowe i części znaczeniowe wyrazów.

IMT (ang. Interlingual Machine Translation) generuje pośrednią reprezentację tekstu źródłowego w sztucznym języku międzynarodowym zwanym interlingua przed przetłumaczeniem go na pożądany język. Ten system językowy polega więc na przekładzie z języka źródłowego na interlinguę, a z niej na język docelowy.

SMT (ang. Statistical Machine Translation) opiera się w dużej mierze na statystykach. System statystyczny opiera się na gramatycznych i lingwistycznych modelach tłumaczeń, które uwzględniają reguły gramatyczne i semantykę języków źródłowego i docelowego. Program uczy się, analizując pamięć tłumaczeniową, a następnie dobiera najbardziej prawdopodobne tłumaczenie fraz. Ta metoda jest bardziej precyzyjna niż DBMT, ale wymaga dużych zasobów obliczeniowych i czasu na naukę.

EBMT (ang. Example-Based Machine Translation), czyli tłumaczenie maszynowe oparte na przykładach. Tworzy własne przykłady z istniejących korpusów równoległych jako dane wejściowe do generowania tłumaczeń. Innymi słowy, system analizuje pamięć tłumaczeniową i dokonuje przekładu najbardziej zbliżonych do siebie zdań.

NMT (ang. Neural Machine Translation) jest nowszą metodą, która opiera się na sieciach neuronowych i uczeniu głębokim. Sieci te są w stanie uczyć się na podstawie dużych zbiorów danych i zyskiwać dzięki nim kompleksowe zrozumienie języków źródłowego i docelowego, a następnie wykorzystywać je do generowania tłumaczeń z niesamowitą dokładnością. Ta metoda jest jeszcze bardziej precyzyjna niż DBMT i SMT, ale wymaga dużo większych zasobów obliczeniowych i danych do nauki.

W zależności od potrzeb i celów różne metody MT są stosowane w różnych dziedzinach i branżach. Silniki tłumaczeniowe również posługują się różnymi metodami: silnik AliExpress oraz Yahoo! wykorzystuje metodę SMT, podczas gdy Google czy DeepL do tłumaczeń wykorzystują sieci neuronowe (NMT). 

Wady i zalety tłumaczenia maszynowego

Tłumaczenia maszynowe mają liczne zalety, dzięki którym zrewolucjonizowały branżę tłumaczeniową, zwiększając wydajność tłumaczeń. Oto niektóre z nich:

  • Szybkość: w porównaniu z tłumaczeniami tradycyjnymi tłumaczenia maszynowe mogą być wykonane nawet kilka razy szybciej! 
  • Dokładność: tłumaczenia tego typu charakteryzuje duża precyzyjność i dokładność. Ponadto dzięki ciągłemu rozwojowi i ulepszaniu algorytmów tłumaczenia maszynowe stają się coraz lepsze z każdym tłumaczeniem.
  • Oszczędność: dzięki ponownemu wykorzystaniu wcześniej przetłumaczonych treści pozwalają obniżyć koszty usług tłumaczeniowych.
  • Uczenie się: tłumaczenia maszynowe korzystają z pamięci tłumaczeniowych i dopasowują się do rodzajów tłumaczonych treści, jak również do nawyków oraz stylu tłumacza. 

Chociaż tłumaczenia maszynowe są szybkie i dostępne 24/7, nadal potrzeba ludzkiego doświadczenia i wiedzy, aby zapewnić wysoką jakość i poprawność tłumaczenia. Oto kilka powodów, dla których tak się dzieje:

  • Brak rozumienia kontekstów: tłumaczenia maszynowe często nie uwzględniają kontekstu i specyfiki branży, przez co mogą być tworzyć nietrafione tłumaczenia. 
  • Brak wyczucia językowego: tłumaczenia maszynowe nie uwzględniają emocji, stylu ani subtelności i niuansów językowych, co może prowadzić do powstania tłumaczenia zbyt dosłownego, brzmiącego sztucznie i bezosobowo.
  • Niespójność: tłumaczenia maszynowe bywają niespójne składniowo, zarówno w szerszym kontekście, jak i wewnątrz jednego dokumentu. 
  • Dosłowność: tłumaczenia maszynowe cechują się zwykle wysoką dokładnością, która niestety nierzadko przechodzi w dosłowność.
  • Ograniczenia językowe: tłumaczenia maszynowe mają ograniczenia w zakresie języków i branż, co może uniemożliwiać ich stosowanie w niektórych sytuacjach, np. w tłumaczeniu poezji. 

Technologia tłumaczeń maszynowych nie jest jeszcze doskonała i nie należy bezkrytycznie polegać na niej w przypadku tłumaczeń profesjonalnych. Algorytmy i pamięci tłumaczeniowe jednak stale się uczą i ulepszają, co niewątpliwie doprowadzi do znacznego podniesienia jakości tłumaczeń maszynowych w przyszłości. 

Już teraz stanowią one wartościową pomoc dla tłumaczy niosącą za sobą wiele korzyści, dlatego dobrym pomysłem jest wykorzystywane ich w celu zwiększania efektywności pracy. 

Rola MT w naszym wielojęzycznym świecie będzie nieustannie rosnąć, a biura tłumaczeń mogą wykorzystać tę technologię, aby wzmocnić swoją pozycję na rynku, łącząc najlepsze praktyki tradycyjnego tłumaczenia z nowoczesnymi narzędziami. 

Więcej odcinków

Podziel się z innymi!

small_c_popup.png

Zadaj nam dowolne pytanie – nasz konsultant skontaktuje się z Tobą szybciej niż możesz się tego spodziewać.

Szybki kontakt