Tłumacze mają partnera w branży – maszyny! Dzięki postępowi w sztucznej inteligencji i uczeniu maszynowemu tłumaczenia maszynowe to jedna z najszybciej rozwijających się dziedzin technologii językowej. W związku z tym stają się coraz bardziej precyzyjne i dostępne dla szerokiego grona odbiorców.
W tym artykule przyjrzymy się bliżej tematowi tłumaczeń maszynowych, ich definicji, historii, metodom, a także omówimy ich wady i zalety.
Co to jest tłumaczenie maszynowe?
Tłumaczenie maszynowe (ang. Machine Translation, MT), zwane też automatycznym, jest tłumaczeniem wykonywanym przez oprogramowanie komputerowe. Opiera się ono na wykorzystaniu algorytmów i technik automatyzacji procesu rozumienia i tłumaczenia tekstu z jednego języka na inny. Jest to narzędzie wspomagające pracę tłumacza, przydatne przeważnie w tłumaczeniu dużych ilości tekstu w krótkim czasie.
W realizacji tłumaczeń maszynowych niezmiernie przydatna jest pamięć tłumaczeniowa (ang. Translation Memory, TM), czyli rodzaj bazy danych, która składa się z fragmentów tekstu w co najmniej dwóch wersjach językowych. Zwykle występuje w postaci plików oprogramowania typu CAT (ang. Computer-Assisted Translation).
Zarówno tłumaczenia maszynowe, jak i pamięci tłumaczeniowe to niezwykle ważne narzędzia w branży tłumaczeniowej. Tłumaczenia maszynowe służą do szybkiego tłumaczenia dużych ilości tekstu, a pamięci tłumaczeniowe przechowują wcześniejsze tłumaczenia w taki sposób, że można je łatwo wykorzystać do tłumaczenia podobnych treści.
Tłumaczenie maszynowe – jak to się wszystko zaczęło?
Początki tłumaczeń automatycznych, podobnie zresztą jak Internetu i wielu innych technologii, związane są z wojskiem. W latach 50. XX wieku zaczęły powstawać pierwsze systemy, które umożliwiały wykonywanie tłumaczeń automatycznych opartych na regułach. Ówczesne maszyny zajmowały jednak bardzo dużo miejsca, proces był czasochłonny i kosztowny, a jakość i dokładność tłumaczeń pozostawiała wiele do życzenia.
Do przełomu w dziedzinie tłumaczeń maszynowych doszło kilka dekad później, kiedy udoskonalono tłumaczenia oparte na modelach statystycznych. W latach 90. w związku z postępującą globalizacją, a co za tym idzie – z rosnącym zapotrzebowaniem na tłumaczenia, powstał najpierw program tłumaczący forum internetowe z polskiego na niemiecki, a następnie ogólnodostępny darmowy program tłumaczeniowy BabelFish Altavista.
Kilkanaście lat później, w 2014 roku, opracowana została technologia tłumaczeń automatycznych oparta na sieciach neuronowych, która działa podobnie do ludzkiego mózgu, a więc pozwala na samodzielny rozwój, uczenie i doskonalenie się maszyn. Początków takich rozwiązań można szukać już w 1949 roku, kiedy to Alan Turing (ten sam, który brał udział w łamaniu szyfrów Enigmy) zaproponował wykorzystanie w tłumaczeniach technologii machine learning.
Obecnie w tłumaczeniach maszynowych najczęściej stosowane są metody SMT, NMT oraz DBMT. Istnieje jednak więcej metod wykorzystywanych przez maszyny do wykonywania przekładów z jednego języka na inne.
Rodzaje i systemy tłumaczeń
DBMT (ang. Directed Bilingual Machine Translation), czyli system tłumaczenia bezpośredniego, jest najbardziej podstawową metodą tłumaczenia i jest używany do prostych zadań, takich jak tłumaczenie kilku słów lub zdań. Opiera się na wielkich zbiorach danych i modelach statystycznych, które uczą się na podstawie analizy par językowych i identyfikują zależności między słowami i frazami w językach źródłowym i docelowym. Jest to metoda dobrze sprawdzająca się w tłumaczeniu języków bardzo podobnych do siebie.
RBMT (ang. Rule-Based Machine Translation) wykorzystuje reguły do identyfikacji języka źródłowego i generowania danych wyjściowych w języku docelowym. Tłumaczenie maszynowe oparte na regułach bazuje na tłumaczeniu całych jednostek składniowych, a nie tylko pojedynczych słów czy fraz.
TBMT (ang. Transfer-Based Machine Translation), czyli system oparty na transferze semantycznym, wykorzystuje do tłumaczenia kombinację reguł i dwujęzycznych słowników. Pod uwagę bierze własności składniowe i części znaczeniowe wyrazów.
IMT (ang. Interlingual Machine Translation) generuje pośrednią reprezentację tekstu źródłowego w sztucznym języku międzynarodowym zwanym interlingua przed przetłumaczeniem go na pożądany język. Ten system językowy polega więc na przekładzie z języka źródłowego na interlinguę, a z niej na język docelowy.
SMT (ang. Statistical Machine Translation) opiera się w dużej mierze na statystykach. System statystyczny opiera się na gramatycznych i lingwistycznych modelach tłumaczeń, które uwzględniają reguły gramatyczne i semantykę języków źródłowego i docelowego. Program uczy się, analizując pamięć tłumaczeniową, a następnie dobiera najbardziej prawdopodobne tłumaczenie fraz. Ta metoda jest bardziej precyzyjna niż DBMT, ale wymaga dużych zasobów obliczeniowych i czasu na naukę.
EBMT (ang. Example-Based Machine Translation), czyli tłumaczenie maszynowe oparte na przykładach. Tworzy własne przykłady z istniejących korpusów równoległych jako dane wejściowe do generowania tłumaczeń. Innymi słowy, system analizuje pamięć tłumaczeniową i dokonuje przekładu najbardziej zbliżonych do siebie zdań.
NMT (ang. Neural Machine Translation) jest nowszą metodą, która opiera się na sieciach neuronowych i uczeniu głębokim. Sieci te są w stanie uczyć się na podstawie dużych zbiorów danych i zyskiwać dzięki nim kompleksowe zrozumienie języków źródłowego i docelowego, a następnie wykorzystywać je do generowania tłumaczeń z niesamowitą dokładnością. Ta metoda jest jeszcze bardziej precyzyjna niż DBMT i SMT, ale wymaga dużo większych zasobów obliczeniowych i danych do nauki.
W zależności od potrzeb i celów różne metody MT są stosowane w różnych dziedzinach i branżach. Silniki tłumaczeniowe również posługują się różnymi metodami: silnik AliExpress oraz Yahoo! wykorzystuje metodę SMT, podczas gdy Google czy DeepL do tłumaczeń wykorzystują sieci neuronowe (NMT).
Wady i zalety tłumaczenia maszynowego
Tłumaczenia maszynowe mają liczne zalety, dzięki którym zrewolucjonizowały branżę tłumaczeniową, zwiększając wydajność tłumaczeń. Oto niektóre z nich:
- Szybkość: w porównaniu z tłumaczeniami tradycyjnymi tłumaczenia maszynowe mogą być wykonane nawet kilka razy szybciej!
- Dokładność: tłumaczenia tego typu charakteryzuje duża precyzyjność i dokładność. Ponadto dzięki ciągłemu rozwojowi i ulepszaniu algorytmów tłumaczenia maszynowe stają się coraz lepsze z każdym tłumaczeniem.
- Oszczędność: dzięki ponownemu wykorzystaniu wcześniej przetłumaczonych treści pozwalają obniżyć koszty usług tłumaczeniowych.
- Uczenie się: tłumaczenia maszynowe korzystają z pamięci tłumaczeniowych i dopasowują się do rodzajów tłumaczonych treści, jak również do nawyków oraz stylu tłumacza.
Chociaż tłumaczenia maszynowe są szybkie i dostępne 24/7, nadal potrzeba ludzkiego doświadczenia i wiedzy, aby zapewnić wysoką jakość i poprawność tłumaczenia. Oto kilka powodów, dla których tak się dzieje:
- Brak rozumienia kontekstów: tłumaczenia maszynowe często nie uwzględniają kontekstu i specyfiki branży, przez co mogą być tworzyć nietrafione tłumaczenia.
- Brak wyczucia językowego: tłumaczenia maszynowe nie uwzględniają emocji, stylu ani subtelności i niuansów językowych, co może prowadzić do powstania tłumaczenia zbyt dosłownego, brzmiącego sztucznie i bezosobowo.
- Niespójność: tłumaczenia maszynowe bywają niespójne składniowo, zarówno w szerszym kontekście, jak i wewnątrz jednego dokumentu.
- Dosłowność: tłumaczenia maszynowe cechują się zwykle wysoką dokładnością, która niestety nierzadko przechodzi w dosłowność.
- Ograniczenia językowe: tłumaczenia maszynowe mają ograniczenia w zakresie języków i branż, co może uniemożliwiać ich stosowanie w niektórych sytuacjach, np. w tłumaczeniu poezji.
Technologia tłumaczeń maszynowych nie jest jeszcze doskonała i nie należy bezkrytycznie polegać na niej w przypadku tłumaczeń profesjonalnych. Algorytmy i pamięci tłumaczeniowe jednak stale się uczą i ulepszają, co niewątpliwie doprowadzi do znacznego podniesienia jakości tłumaczeń maszynowych w przyszłości.
Już teraz stanowią one wartościową pomoc dla tłumaczy niosącą za sobą wiele korzyści, dlatego dobrym pomysłem jest wykorzystywane ich w celu zwiększania efektywności pracy.
Rola MT w naszym wielojęzycznym świecie będzie nieustannie rosnąć, a biura tłumaczeń mogą wykorzystać tę technologię, aby wzmocnić swoją pozycję na rynku, łącząc najlepsze praktyki tradycyjnego tłumaczenia z nowoczesnymi narzędziami.