Tłumacz Google

Tłumacz Google
Ilustracja
Zdjęcie serwisu (2018)
Typ strony

serwis tłumaczeniowy

Komercyjna

nie

Data powstania

2006 (od 2001 dostępny przez Language Tools)

Autor

Google

Właściciel

Google

Rejestracja

opcjonalna

Wersje językowe

133 języki

Strona internetowa

Tłumacz Google (ang. Google Translate) – darmowy serwis internetowy Google umożliwiający tłumaczenie tekstu, plików, stron internetowych, mowy i zdjęć na różne języki.

Historia

W 2001 w wyszukiwarce Google wprowadzono funkcję tłumaczenia znalezionych stron internetowych dla anglojęzycznych użytkowników[1]. Do wyszukiwarki dodano także podstronę Language Tools (pol. Narzędzia językowe), na której można było tłumaczyć podaną przez siebie stronę[2] i tekst[3]. W 2006 te dwa narzędzia zyskały własną subdomenę[4], tuż po implementacji pierwszej pary języków korzystających ze statystycznego tłumaczenia maszynowego (angielski-arabski). Rok 2006 podawany jest jako data uruchomienia Tłumacza Google[5][6][7]. 8 maja 2008 dodano język polski i możliwość tłumaczenia między dwoma dowolnymi językami z list. W 2013 z serwisu korzystało codziennie 200 milionów osób[8]. W 2016 ponad 500 milionów osób korzystało z serwisu – tłumacząc ponad 100 miliardów słów dziennie[5]. W marcu 2017 język polski zaczął opierać się na systemie GNMT, który ulepszył jakość tłumaczeń.

Funkcje

Tłumacz Google pozwala na tłumaczenie tekstu wieloma metodami. Wśród nich są:

  • tłumaczenie tekstu – tłumaczy tekst wprowadzony za pomocą klawiatury (fizycznej lub wirtualnej, w tym przez pismo odręczne[9]) bądź głosowo[10].
  • tłumaczenie dokumentów – wersja na komputer pozwala tłumaczyć pliki[11].
  • tłumaczenie stron – Tłumacz Google pozwala na tłumaczenie stron internetowych[11].
  • tłumaczenie zdjęć – tłumaczy tekst wykryty w obrazie z aparatu lub zapisanym zdjęciu. Funkcja dostępna wyłącznie w aplikacji mobilnej[12].
  • „dotknij, aby przetłumaczyć” – tłumaczenie wybranego tekstu z innych aplikacji. Funkcja dostępna wyłącznie w aplikacji mobilnej[13].
  • konwersacja – pozwala na tłumaczenie dwujęzycznego dialogu. Funkcja dostępna wyłącznie w aplikacji mobilnej[14].
  • transkrypcja – zamiana mowy na tekst. Funkcja dostępna wyłącznie w aplikacji mobilnej[15].

Serwis natychmiastowo tłumaczy wyrażenia podczas wpisywania i potrafi wykryć ich język. Wpisując wyraz lub wyrażenie translator działa niczym słownik, oferując kilka propozycji. Po zalogowaniu się na konto Google, serwis pozwala na zapisanie tłumaczeń na później[16] i przegląd historii[17].

W przypadku języków, które nie posługują się pismem łacińskim dostępna jest automatyczna transliteracja. Do tego dostępne są edytory wprowadzania znaków (IME) dla większości tych języków.

Otrzymane tłumaczenia można odsłuchać dzięki syntezie mowy – większość należy do WaveNet od Google (głosy brzmiące naturalnie), a reszta – do eSpeak (głosy brzmiące syntetycznie). Głosy różnią się w zależności od geolokalizacji: angielski głos będzie miał akcent brytyjski w Europie, Afryce i Azji Południowej, australijski w Australii i Nowej Zelandii, indyjski w Indiach, nigeryjski w Nigerii, a amerykański w reszcie świata. Podobnie z hiszpańskim (amerykański na kontynencie, kastylijski poza nim), portugalskim (akcent europejski tylko w Portugalii, poza nią – brazylijski) i francuskim (akcent Quebecu tylko w Kanadzie, poza nią – europejski).

Tłumacz Google jest dostępny jako wtyczka w niektórych przeglądarkach[18], a w Chrome jest zintegrowana domyślnie[19].

Akcenty głosu angielskiego w zależności od lokacji:

     brytyjski

     amerykański

     australijski

     indyjski

     nigeryjski

Dostępne języki

Języki dostępne w Tłumaczu Google (czas w UTC+0:00, dane na 6 lutego 2022)[20]
kodjęzykdata dodanianarzędzia wprowadzaniapismo odręcznesyntezator mowytłumaczenie mowytranskrypcjaaparat
enangielskido 2001
  • klawiatura angielska
  • klawiatura angielska (Dvoraka)
taktak (WaveNet, 5 dialektów)taktaktak
frfrancuskido 2001
  • klawiatura francuska
  • klawiatura amerykańska (międzynarodowa)
taktak (WaveNet, 2 dialekty)taktaktak
eshiszpańskido 2001
  • klawiatura hiszpańska
  • klawiatura amerykańska (międzynarodowa)
taktak (WaveNet, 2 dialekty)taktaktak
deniemieckido 2001
  • klawiatura niemiecka
  • klawiatura niemiecka (szwajcarska)
  • klawiatura amerykańska (międzynarodowa)
taktak (WaveNet)taktaktak
ptportugalskido 2001
  • klawiatura portugalska (portugalska)
  • klawiatura portugalska (brazylijska)
  • klawiatura amerykańska (międzynarodowa)
taktak (WaveNet, 2 dialekty)taktaktak
itwłoskido 2001
  • klawiatura włoska
  • klawiatura amerykańska (międzynarodowa)
taktak (WaveNet)taktaktak
zh-CNchiński (uproszczony)[a]18–19 listopada 2004
  • IME chińskie Pinyin (uproszczone)
  • IME chińskie Wubi
  • IME chińskie Zhuyin
  • IME chińskie Cangjie
  • IME chińskie Pinyin (tradycyjne)
  • IME kantońskie
taktak (WaveNet)taktaktak
jajapoński18–19 listopada 2004
  • IME japońskie
taktak (WaveNet)taknietak
kokoreański18–19 listopada 2004
  • klawiatura koreańska
taktak (WaveNet)taknietak
ararabski26 kwietnia 2006
  • klawiatura arabska
  • IME arabskie
taktak (WaveNet)taknietak
rurosyjski5–6 grudnia 2006, ~0:00
  • klawiatura rosyjska
  • IME rosyjskie
taktak (WaveNet)taktaktak
zh-TWchiński (tradycyjny)[a]2 lutego 2007, ~9:10--tak (WaveNet)-tak-
elgrecki11 listopada 2007, ~14:30
  • klawiatura grecka
  • IME greckie
taktak (WaveNet)taknietak
nlniderlandzki11 listopada 2007, ~14:30
  • klawiatura niderlandzka
  • klawiatura amerykańska (międzynarodowa)
taktak (WaveNet)taknietak
hihindi30 kwietnia 2008, ~19:00
  • klawiatura hindi (fonetyczna)
  • klawiatura hindi (Inscript)
  • IME hindi
taktak (WaveNet)taktaktak
bgbułgarski[21]8 maja 2008
  • klawiatura bułgarska
  • klawiatura bułgarska (fonetyczna)
  • IME bułgarskie
taktak (WaveNet)taknietak
hrchorwacki8 maja 2008
  • klawiatura chorwacka
taktak (eSpeak)taknietak
csczeski8 maja 2008
  • klawiatura czeska
  • klawiatura czeska (QWERTZ)
taktak (WaveNet)taknietak
daduński8 maja 2008
  • klawiatura duńska
taktak (WaveNet)taknietak
fifiński8 maja 2008
  • klawiatura fińska
taktak (WaveNet)taknietak
nonorweski[b]8 maja 2008
  • klawiatura norweska
taktak (WaveNet)taknietak
plpolski8 maja 2008
  • klawiatura polska
taktak (WaveNet)taknietak
rorumuński8 maja 2008
  • klawiatura rumuńska
  • klawiatura rumuńska (SR13392, pierwsza)
  • klawiatura rumuńska (SR13392, druga)
taktak (WaveNet)taknietak
svszwedzki8 maja 2008
  • klawiatura szwedzka
taktak (WaveNet)taknietak
tlfilipiński24–25 września 2008
  • klawiatura łacińska Afryki
taktak (WaveNet)taknietak
iwhebrajski24–25 września 2008
  • klawiatura hebrajska
  • IME hebrajskie
taktak (WaveNet)taknietak (nie w czasie rzeczywistym)
idindonezyjski24–25 września 2008
  • klawiatura łacińska Afryki
taktak (WaveNet)taknietak
cakataloński24–25 września 2008
  • klawiatura katalońska
taktak (WaveNet)taknietak
ltlitewski24–25 września 2008
  • klawiatura litewska
taknietaknietak
lvłotewski24–25 września 2008
  • klawiatura łotewska
taktak (WaveNet)taknietak
srserbski24–25 września 2008
  • klawiatura serbska (cyrylica)
  • klawiatura serbska (łacińska)
  • IME serbskie
taktak (WaveNet)taknietak
sksłowacki24–25 września 2008
  • klawiatura słowacka
  • klawiatura słowacka (QWERTY)
taktak (WaveNet)taknietak
slsłoweński24–25 września 2008
  • klawiatura słoweńska
taknietaknietak
ukukraiński24–25 września 2008
  • klawiatura ukraińska
  • IME ukraińskie
taktak (WaveNet)taknietak
viwietnamski24–25 września 2008
  • klawiatura wietnamska (TELEX)
  • klawiatura wietnamska (VIQR)
  • klawiatura wietnamska (TCVN 6064)
  • klawiatura wietnamska (VNI)
  • IME wietnamskie
taktak (WaveNet)taknietak
sqalbański30–31 stycznia 2009
  • klawiatura albańska
taktak (eSpeak)taknietak
etestoński30–31 stycznia 2009
  • klawiatura estońska
taktak (WaveNet)taknietak
gagalicyjski30–31 stycznia 2009
  • klawiatura galicyjska
taknietaknietak
mtmaltański30–31 stycznia 2009
  • klawiatura maltańska
taknienienietak (tylko w czasie rzeczywistym)
thtajski30–31 stycznia 2009
  • klawiatura tajska
  • klawiatura tajska (Pattajoti)
  • klawiatura tajska (TIS)
  • IME tajskie
taktak (WaveNet)taktaktak
trturecki30–31 stycznia 2009
  • klawiatura turecka (QWERTY)
  • klawiatura turecka (FGĞIOD)
taktak (WaveNet)taknietak
huwęgierski30–31 stycznia 2009
  • klawiatura węgierska
taktak (WaveNet)taknietak
faperski[22]18 czerwca 2009
  • klawiatura perska
  • IME perskie
taknietaknietak
afafrikaans[23]23–25 sierpnia 2009
  • klawiatura łacińska Afryki
taktak (WaveNet)taknietak
bebiałoruski23–25 sierpnia 2009
  • klawiatura białoruska
  • IME białoruskie
taknienienietak
gairlandzki23–25 sierpnia 2009
  • klawiatura łacińska Afryki
taknienienietak
isislandzki23–25 sierpnia 2009
  • klawiatura islandzka
taktak (WaveNet)taknietak
yijidysz23–25 sierpnia 2009
  • klawiatura jidysz
nienienienienie
mkmacedoński23–25 sierpnia 2009
  • klawiatura macedońska
taknietaknietak
msmalajski23–25 sierpnia 2009
  • klawiatura łacińska Afryki
taktak (WaveNet)taknietak
swsuahili23–25 sierpnia 2009
  • klawiatura łacińska Afryki
taktak (eSpeak)taknietak
cywalijski23–25 sierpnia 2009
  • klawiatura łacińska Afryki
taknienienietak
htkreolski (Haiti)28–29 stycznia 2010
  • klawiatura francuska
taknienienietak
azazerski[24]13 maja 2010taknietaknietak
eubaskijski13 maja 2010
  • klawiatura baskijska
taknietaknietak
kagruziński13 maja 2010
  • klawiatura gruzińska
  • klawiatura gruzińska (maszynistki)
taknietaknienie
hyormiański13 maja 2010
  • klawiatura ormiańska (zachodnia)
  • klawiatura ormiańska (wschodnia)
taknietaknienie
ururdu13 maja 2010
  • klawiatura urdu
  • IME urdu
taktak (WaveNet)taknietak
lałaciński[25]29–30 września 2010taktak (WaveNet, identyczny z włoskim)nienietak
bnbengalski[26]19–20 czerwca 2011
  • klawiatura bengalska
  • klawiatura bengalska (Inscript)
  • IME bengalskie
taktak (WaveNet)taknietak
gugudżarati19–20 czerwca 2011
  • klawiatura gudżarati
  • klawiatura gudżarati (Inscript)
  • IME gudżarati
taktak (WaveNet)taknietak (nie w czasie rzeczywistym)
knkannada19–20 czerwca 2011
  • klawiatura kannada
  • klawiatura kannada (Inscript)
  • IME kannada
taktak (WaveNet)taknietak (nie w czasie rzeczywistym)
tatamilski19–20 czerwca 2011
  • klawiatura tamilska
  • klawiatura tamilska (Inscript)
  • klawiatura tamilska (maszynistki)
  • klawiatura tamilska (ITRANS)
  • klawiatura tamilska (Tamil99)
  • IME tamilskie
taktak (WaveNet)taknietak
tetelugu19–20 czerwca 2011
  • klawiatura telugu
  • klawiatura telugu (Inscript)
  • IME telugu
taktak (WaveNet)taknietak
eoesperanto[27]22 lutego 2012, ~21:30taknienienietak
lolaotański[28]12–13 września 2012
  • klawiatura laotańska
taknietaknienie
kmkhmerski[29]19 kwietnia 2013, ~1:00
  • klawiatura khmerska (NiDA)
taktak (WaveNet)taknienie
bsbośniacki[30]8 maja 2013, ~2:00
  • klawiatura bośniacka
taktak (eSpeak)nienietak
cebcebuański8 maja 2013, ~2:00taknienienietak
hmnhmong[c]8 maja 2013, ~2:00taknienienietak (tylko w czasie rzeczywistym)
jwjawajski8 maja 2013, ~2:00
  • klawiatura łacińska Afryki
tylko w aplikacjitak (WaveNet)taknietak
mrmarathi8 maja 2013, ~2:00
  • klawiatura hindi (fonetyczna)
  • IME marathi
taktak (WaveNet)taknietak
hahausa[31]9 grudnia 2013, ~23:00
  • klawiatura łacińska Afryki
nienienienietak
igigbo9 grudnia 2013, ~23:00
  • klawiatura łacińska Afryki
nienienienietak
yojoruba9 grudnia 2013, ~23:00
  • klawiatura łacińska Afryki
nienienienietak
mimaori9 grudnia 2013, ~23:00
  • klawiatura maori
taknienienietak
mnmongolski9 grudnia 2013, ~23:00
  • klawiatura mongolska
taknietaknietak
nenepalski9 grudnia 2013, ~23:00
  • klawiatura nepalska
  • klawiatura nepalska (Inscript)
  • IME nepalskie
taktak (WaveNet)taknietak
papendżabski9 grudnia 2013, ~23:00
  • klawiatura pendżabska
  • klawiatura pendżabska (Inscript)
  • IME pendżabskie
taktylko w aplikacji (WaveNet)taknietak (nie w czasie rzeczywistym)
sosomalijski9 grudnia 2013, ~23:00
  • klawiatura łacińska Afryki
taknienienietak (tylko w czasie rzeczywistym)
zuzulu9 grudnia 2013, ~23:00
  • klawiatura łacińska Afryki
taknietaknietak
mybirmański[32]11 grudnia 2014
  • klawiatura birmańska
  • klawiatura birmańska (smart)
taktak (WaveNet)taknienie
nycziczewa11 grudnia 2014
  • klawiatura łacińska Afryki
taknienienietak
kkkazachski11 grudnia 2014
  • klawiatura kazachska
taknietaknietak
mlmalajalam11 grudnia 2014
  • klawiatura malajalam
  • klawiatura malajalam (Inscript)
  • IME malajalam
taktak (WaveNet)taknietak (nie w czasie rzeczywistym)
mgmalgaski11 grudnia 2014
  • klawiatura łacińska Afryki
taknienienietak
stsotho11 grudnia 2014
  • klawiatura łacińska Afryki
nienienienietak
susundajski11 grudnia 2014
  • klawiatura łacińska Afryki
taktak (WaveNet)taknietak
sisyngaleski11 grudnia 2014
  • klawiatura syngaleska
  • IME syngaleskie
taktak (WaveNet)taknienie
tgtadżycki11 grudnia 2014
  • klawiatura tadżycka
taknienienietak
uzuzbecki11 grudnia 2014
  • klawiatura uzbecka (łacińska)
  • klawiatura uzbecka (cyrylica)
  • klawiatura uzbecka (cyrylica, maszynistki)
taknietaknietak
amamharski[33]17 lutego 2016, ~16:30
  • klawiatura amharska
  • IME amharskie
taknietaknienie
fyfryzyjski[d]17 lutego 2016, ~16:30taknienienietak
hawhawajski17 lutego 2016, ~16:30taknienienietak
kykirgiski17 lutego 2016, ~16:30
  • klawiatura kirgiska
taknienienietak (tylko w czasie rzeczywistym)
cokorsykański17 lutego 2016, ~16:30taknienienietak
kukurdyjski[e]17 lutego 2016, ~16:30
  • klawiatura kurdyjska
taknienienietak (tylko w czasie rzeczywistym)
lbluksemburski17 lutego 2016, ~16:30
  • klawiatura francuska
  • klawiatura amerykańska (międzynarodowa)
taknienienietak (tylko w czasie rzeczywistym)
pspaszto17 lutego 2016, ~16:30
  • klawiatura paszto
nienienienietak
smsamoański17 lutego 2016, ~16:30taknienienietak
snshona17 lutego 2016, ~16:30
  • klawiatura łacińska Afryki
taknienienietak
sdsindhi17 lutego 2016, ~16:30
  • klawiatura sindhi
nienienienietak (tylko w czasie rzeczywistym)
gdszkocki gaelicki17 lutego 2016, ~16:30taknienienietak
xhxhosa17 lutego 2016, ~16:30
  • klawiatura łacińska Afryki
taknienienietak
ororija[34]27 lutego 2020, ~17:30
  • klawiatura orija
  • klawiatura orija (Inscript)
  • IME orija
nienienienietak (nie w czasie rzeczywistym)
rwruanda-rundi[f]27 lutego 2020, ~17:30
  • klawiatura łacińska Afryki
nienienienietak
tttatarski27 lutego 2020, ~17:30
  • klawiatura tatarska
nienienienietak
tkturkmeński27 lutego 2020, ~17:30
  • klawiatura łacińska Afryki
nienienienietak
ugujgurski27 lutego 2020, ~17:30
  • klawiatura ujgurska
nienienienietak (tylko w czasie rzeczywistym)
asasamski[35]11 maja 2022 (test); 12 maja 2022, ~21:30 (wypuszczenie)
  • klawiatura bengalska
taknieniebrak danychbrak danych
ayajmara11 maja 2022 (test); 12 maja 2022, ~21:30 (wypuszczenie)nienieniebrak danychbrak danych
bmbambara11 maja 2022 (test); 12 maja 2022, ~21:30 (wypuszczenie)nienieniebrak danychbrak danych
bhoBhodźpuri11 maja 2022 (test); 12 maja 2022, ~21:30 (wypuszczenie)
  • klawiatura hindi (fonetyczna)
nienieniebrak danychbrak danych
dvDivehi11 maja 2022 (test); 12 maja 2022, ~21:30 (wypuszczenie)nienieniebrak danychbrak danych
doidogri11 maja 2022 (test); 12 maja 2022, ~21:30 (wypuszczenie)
  • klawiatura hindi (fonetyczna)
nienieniebrak danychbrak danych
eeewe11 maja 2022 (test); 12 maja 2022, ~21:30 (wypuszczenie)nienieniebrak danychbrak danych
gnguarani11 maja 2022 (test); 12 maja 2022, ~21:30 (wypuszczenie)nienieniebrak danychbrak danych
iloIlokano11 maja 2022 (test); 12 maja 2022, ~21:30 (wypuszczenie)nienieniebrak danychbrak danych
qukeczua11 maja 2022 (test); 12 maja 2022, ~21:30 (wypuszczenie)nienieniebrak danychbrak danych
gomKonkani11 maja 2022 (test); 12 maja 2022, ~21:30 (wypuszczenie)
  • klawiatura hindi (fonetyczna)
nienieniebrak danychbrak danych
krikrio11 maja 2022 (test); 12 maja 2022, ~21:30 (wypuszczenie)nienieniebrak danychbrak danych
ckbkurdyjski (sorani)11 maja 2022 (test); 12 maja 2022, ~21:30 (wypuszczenie)
  • klawiatura kurdyjska (arabska, oparta na klawiaturze arabskiej)
  • klawiatura kurdyjska (arabska, oryginalna)
nienieniebrak danychbrak danych
lnlingala11 maja 2022 (test); 12 maja 2022, ~21:30 (wypuszczenie)nienieniebrak danychbrak danych
lgluganda11 maja 2022 (test); 12 maja 2022, ~21:30 (wypuszczenie)nienieniebrak danychbrak danych
maimaithili11 maja 2022 (test); 12 maja 2022, ~21:30 (wypuszczenie)
  • klawiatura hindi (fonetyczna)
nienieniebrak danychbrak danych
mni-Mteimeiteilon (manipuri)11 maja 2022 (test); 12 maja 2022, ~21:30 (wypuszczenie)
  • klawiatura manipuri (meitei mayek)
nienieniebrak danychbrak danych
lusmizo11 maja 2022 (test); 12 maja 2022, ~21:30 (wypuszczenie)nienieniebrak danychbrak danych
omoromo11 maja 2022 (test); 12 maja 2022, ~21:30 (wypuszczenie)nienieniebrak danychbrak danych
sasanskryt11 maja 2022 (test); 12 maja 2022, ~21:30 (wypuszczenie)
  • klawiatura sanskrycka
  • klawiatura sanskrycka (Inscript)
  • IME sanskryckie
nienieniebrak danychbrak danych
nsoSepedi11 maja 2022 (test); 12 maja 2022, ~21:30 (wypuszczenie)nienieniebrak danychbrak danych
titigrinia11 maja 2022 (test); 12 maja 2022, ~21:30 (wypuszczenie)taknieniebrak danychbrak danych
tsTsonga11 maja 2022 (test); 12 maja 2022, ~21:30 (wypuszczenie)nienieniebrak danychbrak danych
aktwi11 maja 2022 (test); 12 maja 2022, ~21:30 (wypuszczenie)nienieniebrak danychbrak danych

Aplikacja mobilna

Tłumacz Google
Ilustracja
Przykładowe tłumaczenie z czeskiego (2021)
AutorGoogle
Pierwsze wydaniestyczeń 2010 (Android)

8 lutego 2011 (iOS)

System operacyjnyAndroid, iOS
Rodzajserwis tłumaczeniowy

Aplikację mobilną wydano najpierw na system Android w styczniu 2010, a 8 lutego 2011[36] na iOS. Oprócz tego, istniała wcześniejsza aplikacja HTML dla urządzeń z iOS, powstała w sierpniu 2008[37]. Poza podstawowymi funkcjami, aplikacja pozwala na użytkowanie w trybie offline, tłumaczenie napisów z aparatu oraz plików graficznych[38] (dzięki Word Lens[39]), wykonywanie tłumaczeń w innych aplikacjach, oraz tłumaczenie ludzkiej mowy na żywo w trybie konwersacji[40] lub w trybie transkrypcji.

API

Google nadal oferuje API serwisu, pomimo tego, że 26 maja 2011[41][42] ogłosiło zakończenie jego funkcjonowania, z datą końcową 1 grudnia[43]. Ze względu na dużą popularność API do tego nie doszło[44], ale od tego momentu API stało się płatne[45].

Społeczność

Google pozwala wolontariuszom ulepszać tłumaczenia (crowdsourcing) przez aplikację Google Crowdsource[46][47], lub opcję „Społeczność” na stronie internetowej[48][49][50][51][52]. Użytkownicy mogą tłumaczyć podane zdania, oceniać istniejące tłumaczenia, a w przypadku języków  BETA , testować wczesną wersję translatora. Badania pokazują, że nawyki użytkowników pozwalają niwelować błędne tłumaczenia nawet w 40% przypadków[53]. Oprócz obecnie dostępnych języków, można wybrać też:

Pozostałe języki dostępne w Społeczności Tłumacza Google (dane na 12 maja 2022)
kodjęzyk
aceaceh
adyadygejski
aaafar  BETA 
ahrahirani
altałtajski południowy
anaragoński
avawarski
bfybagheli
bxgbangala
babaszkirski
bbcbatak toba
bcibaule
balbeludżi
bewbetawi
brxbodo  BETA 
brbretoński
kjhchakaski
ctgchatgaya
toichitonga
kmzchorasański turkmeński
sr-MEczarnogórski
ceczeczeński
chrczirokeski
cvczuwaski
hnećhattisgarhi
dccdakhini
luodholuo
dyudiula
dzdzongkha
binedo
efiefik
ishesan
fonfon
ffFulfulde  BETA 
gaggagauski
gbmgarhwali
bgcharyanvi
hilhiligaynon
iuinuktitut
isoisoko
sahjakucki
klkalaallisut
kamkamba
yuekantoński
krkanuri
krckaraczajsko-bałkarski
kaakarakałpacki
qxqkaszkajski
kskaszmirski
quckicze
kikikuju
trpkokborok
swckongijski suahili
kumkumycki
lktlakota
luLuba[g]
lualuba[h]
madmadurski
magmagahi
meomalajski kedah
mfamalajski pattani
mni[i]manipuri  BETA 
rwrmarwari
yuamaya  BETA 
mznmazanderański
minminangkabau
mosmossi
nvnawaho
nrndebele południowy
newnewarski  BETA 
ocoksytański
pampampango
pcmpidgin nigeryjski
sepółnocnolapoński
rajradżastani
rktrangpuri
rmretoromański[j]
rhgrohingya
scksadri
slrsalarski
sgsango
satsantali  BETA 
skrsaraiki  BETA 
serserrano
sjpsurdźapuri
scnsycylijski
sylsylheti
cjsszorski
bertamazight  BETA 
stytatarski syberyjski
tivtiw
tpitok pisin
tntswana
tsctswa
tyvtuwiński
botybetański  BETA 
urhurhobo
uumurum
vahVarhadi-Nagpuri
vevenda
wowolof
zzazazaki
zazhuang
sgsżmudzki

Oprócz tego, (co najmniej) 3 języki są niedostępne w menu: balijski (kod: ban), kreolski seszelski (kod: crs) i rundi (kod: rn).

Metody tłumaczenia

Od listopada 2016, Google korzysta z GNMT[23][54], a wcześniej – z mechanizmu statycznego tłumaczenia maszynowego[55] i SYSTRAN.

GNMT

Google Neural Machine Translation (GNMT) opracowano w celu zwiększenia płynności i dokładności serwisu. System ten wykorzystuje dużą, sztuczną sieć neuronową (dokładniej sieć długiej pamięci krótkoterminowej[56][57][58][59]) zdolną do deep learningu. Dzięki wykorzystaniu metody tłumaczenia maszynowego opartą na próbkach (EBMT), w której system „uczy się z milionów przykładów”, GNMT pozwala poprawić jakość tłumaczeń[60]. Według badaczy Google technika ta umożliwia przekładanie „całych zdań naraz, a nie kawałek po kawałku. Zwraca uwagę na szerszy kontekst, aby znaleźć najbardziej odpowiednie tłumaczenia, które następnie przestawia i dostosowuje tak, aby przypominały ludzką mowę z poprawną gramatyką”. Zamierzona przez GNMT architektura została zaimplementowana dla wszystkich języków obsługiwanych przez serwis[61][62]. Dzięki kompleksowej strukturze, „system z czasem uczy się tworzyć lepsze, bardziej naturalne tłumaczenia”. Sieć GNMT jest zdolna do międzyjęzykowego tłumaczenia maszynowego, która koduje „semantykę zdania, niż zapamiętując frazę do tłumaczenia”, a system nie wymyślił własnego języka uniwersalnego, ale korzysta z „podobieństw znalezionych między wieloma językami”[63]. GNMT zostało wypuszczone dla polskiego w marcu 2017[64].

GNMT umożliwia tłumaczenie bezpośrednio z jednego języka na inny (L1 → L2), co jest poprawą względem wcześniejszych wersji, które najpierw tłumaczyły na język angielski, a dopiero potem na język docelowy (L1 → EN → L2). Jest to możliwe dzięki „tłumaczeniu zero-shot”[65], które dotyczy par języków, których system nie oferował bezpośrednio (np. z japońskiego na koreański).

Statystyczne tłumaczenia maszynowe i SYSTRAN

Przed październikiem 2007 tłumaczenia między językami innymi niż arabski, chiński i rosyjski działały w oparciu o SYSTRAN – silnik oprogramowania, który był stosowany np. w Babel Fish. Od tego czasu, do implementacji GNMT Tłumacz Google używał zastrzeżonej technologii wewnętrznej opartej na statystycznym tłumaczeniu maszynowym[66][67][55].

System ten nie stosował się do zasad gramatycznych – jego algorytmy były oparte na analizie statystycznej, a nie na tradycyjnej analizie opartej na regułach gramatyki. Oryginalny twórca systemu, Franz Josef Och, skrytykował skuteczność algorytmów opartych na regułach, w zamian popierając metody statystyczne. Oryginalne wersje serwisu wykorzystywały metodę zwaną statystycznym tłumaczeniem maszynowym, opartą na badaniach Ocha, zwycięzcy konkursu DARPA na tłumaczenie maszynowe w 2003 roku. Och był szefem grupy tłumaczeń maszynowych Google, aż do momentu dołączenia do Human Longevity, Inc. w lipcu 2014[68].

Według Ocha solidna podstawa do stworzenia użytecznego systemu statystycznego dla nowej pary języków od podstaw powinna składać się z dwujęzycznego korpusu tekstowego (lub kolekcji równoległej) o objętości ponad 150–200 milionów słów i dwóch jednojęzycznych korpusów, z których każdy powinien zawierać ponad miliarda słów. Modele statystyczne z tych danych byłyby następnie wykorzystywane do tłumaczenia między językami. Do zebrania tak ogromnej ilości danych językowych Google wykorzystał dokumenty i transkrypty od Organizacji Narodów Zjednoczonych i Parlamentu Europejskiego[69][70]. ONZ zazwyczaj publikuje dokumenty w sześciu oficjalnych językach, co ułatwiło zebranie ogromnego korpusu.

Tłumacz Google nie tłumaczył bezpośrednio z jednego języka na inny (L1 → L2). W zamian, w większości przypadków treści były tłumaczone najpierw na angielski, a dopiero potem na język docelowy (L1 → EN → L2).

Przy generowaniu tłumaczenia Tłumacz Google szukał wzorców w setkach milionów dokumentów, które zostały już przełożone przez ludzkich tłumaczy, aby znaleźć najtrafniejsze odwzorowanie. Wykrywszy je, Tłumacz mógł w przemyślany sposób domyślić się, jak powinno brzmieć poprawne tłumaczenie.

Wykorzystane licencje WordNet

Język[71]WordNetNa licencji
albańskiAlbanetCC BY 3.0/GPL 3
angielskiPrinceton WordnetWordnet
arabskiArabic WordnetCC BY-SA 3
chińskiChinese WordnetWordnet
duńskiDannetWordnet
fińskiFinnWordnetWordnet
francuskiWOLF (WOrdnet Libre du Français)CeCILL-C
galicyjskiMultilingual Central RepositoryCC BY-3.0
hebrajskiHebrew WordnetWordnet
hiszpańskiMultilingual Central RepositoryCC BY-3.0
indonezyjskiWordnet BahasaMIT
japońskiJapanese WordnetWordnet
katalońskiMultilingual Central RepositoryCC BY-3.0
kreolski (Haiti)MIT-Haiti InitiativeCC-BY 4.0
malajskiWordnet BahasaMIT
norweskiNorwegian WordnetWordnet
perskiPersian Wordnetwolny użytek
polskiplWordnetWordnet
portugalskiOpenWN-PTCC BY-SA-3.0
tajskiThai WordnetWordnet
włoskiMultiWordnetCC BY-3.0

Dokładność

Tłumacz Google nie jest tak dokładny, jak tłumaczenie ludzkie. Jeżeli tekst jest krótki[72], poprawnie sformułowany i używa formalnego słownictwa (w szczególności kiedy oba języki mają duże korpusy językowe[73]), wynik jest podobny do satysfakcjonującego[74], lecz w im mniejszym stopniu spełnia te kryteria, tym wynik będzie gorszy. Ludzka ocena wykazała, że tłumaczenia przekazywały zamysł powyżej 50% tylko dla 35 języków z 102[75]. W przypadku par bez angielskiego po którejkolwiek stronie, liczba ta wynosi około 1%. Badania z 2011 pokazały, że Google uzyskał wynik trochę większy niż na zaliczenie egzaminu z angielskiego na UCLA[76]. Pod względem formalności, spójności, długości oraz struktury zdań wyniki Tłumacza są podobne względem tłumaczeń ludzkich[77]. Podczas badań Google z 2018, użytkownicy języków mieli ocenić tłumaczenia w skali od 0 do 6 – średnia wyniosła 5,43[78].

Jakość tłumaczeń różni się między językami ze względu na powszechność języków i źródeł na ich temat. Wiele języków azjatyckich i afrykańskich (z wyjątkami np. afrikaans i chińskiego) wypada gorzej w porównaniu z tymi europejskimi, a tych rdzennych z Oceanii i Ameryk nie ma prawie wcale.

Działając jako słownik, Tłumacz często popełniał błędy względem słów polisemicznych – 100 najpopularniejszych słów w korpusie słownika Oxford ma średnio 15 znaczeń[79], a większość znanych wyrazów ma ich co najmniej 2. Ponieważ translator opierał się na tłumaczeniu statystycznym, a tłumaczenia korzystały z angielskiego jako bazy, w niektórych przypadkach oznaczało to błędne tłumaczenia. Jeżeli w bazie nie ma wyrazu, serwis jest w stanie wymyślić dla niego tłumaczenie[53].

Ograniczenia

Tłumacz Google, jak inne serwisy tłumaczeniowe, posiada ograniczenia. Serwis ogranicza liczbę znaków (5000), które mogą być jednorazowo przetłumaczone, lecz można to obejść tłumacząc tekst w pliku. O ile serwis pozwala użytkownikowi zrozumieć tekst, często tłumaczy słowo-do-słowa, co czyni tłumaczenia niedokładnymi. Pod względem gramatycznym, serwis zmaga się z rozróżnianiem aspektu dokonanego i niedokonanego w językach romańskich, co przyczynia się do błędów, których by nie napotkał ludzki tłumacz. Translator borykał się także z trybem łączącym[80] oraz francuskim tu i vous (w angielskim oba tłumaczy się jako you)[81]. Tłumacz ma problemy z rozumieniem polisemii i związków frazeologicznych[82].

Odbiór i wykorzystanie w praktyce

Tuż po wystartowaniu serwisu, wygrał on międzynarodowy turniej w tłumaczeniu maszynowym z angielskiego na chiński i arabski[83].

Wykorzystanie w sądzie

W 2017 Tłumacz Google został użyty podczas rozprawy sądowej w Teesside Magistrates’ Court, ponieważ nie można było zarezerwować tłumacza dla oskarżonego mówiącego po chińsku[84].

Uwagi

  1. a b nie można tłumaczyć z języka chińskiego tradycyjnego. Chiński uproszczony jest oznaczony po prosty jako „chiński”. W obu przypadkach określenie dotyczy pisma.
  2. odmiana bokmål
  3. hmong daw
  4. zachodniofryzyjski
  5. odmiana kurmandżi
  6. rwanda
  7. luba-katanga
  8. luba-kasai
  9. duplikat
  10. romansz

Przypisy

  1. Google Special Search Features – Web Page Translation, Google [dostęp 2022-03-24] [zarchiwizowane 2001-05-21] (ang.).
  2. Language Tools, Google [dostęp 2022-03-24] [zarchiwizowane 2001-09-11] (ang.).
  3. Language Tools, Google [dostęp 2022-03-24] [zarchiwizowane 2001-12-02] (ang.).
  4. web.archive.org/web/2006*/http://translate.google.com/, 2006 [dostęp 2022-03-24] (ang.).
  5. a b Barak Turovsky, Ten years of Google Translate, Google, 28 kwietnia 2016 [dostęp 2022-03-24] (ang.).
  6. Alanna Petroff, Google Translate now covers 103 languages, CNNMoney, 18 lutego 2016 [dostęp 2022-03-24] (ang.).
  7. Michael Pollitt, A Warning from History for the Google Translate Generation, „History Today”, 64 (9), wrzesień 2014 [dostęp 2022-03-24] (ang.).
  8. Stephen Shankland, Google Translate now serves 200 million people daily, CNET [dostęp 2022-02-06].
  9. Tłumaczenie pisma odręcznego lub tekstu wpisanego z klawiatury wirtualnej – Urządzenie z Androidem – Google Translate – Pomoc, support.google.com [dostęp 2020-10-24].
  10. Tłumaczenie mowy – Urządzenie z Androidem – Google Translate – Pomoc, support.google.com [dostęp 2020-10-24].
  11. a b Tłumaczenie stron internetowych i dokumentów – Komputer – Google Translate – Pomoc, support.google.com [dostęp 2020-10-24].
  12. Tłumaczenie obrazów – Urządzenie z Androidem – Google Translate – Pomoc, support.google.com [dostęp 2020-10-24].
  13. Jacob Kastrenakes, Google Translate now works inside any app on Android, The Verge, 11 maja 2016 [dostęp 2022-02-04].
  14. Tłumaczenie rozmowy w dwóch językach – Android – Google Translate – Pomoc, support.google.com [dostęp 2022-02-04].
  15. Transkrypcja w Tłumaczu Google – Android – Google Translate – Pomoc, support.google.com [dostęp 2022-02-04].
  16. Zapisywanie tłumaczeń – Urządzenie z Androidem – Google Translate – Pomoc, support.google.com [dostęp 2020-10-24].
  17. Znajdowanie i usuwanie historii tłumaczeń – Android – Google Translate – Pomoc, support.google.com [dostęp 2022-02-06].
  18. Search results for "Google Translate" – Add-ons for Firefox (en-US), addons.mozilla.org [dostęp 2022-02-07].
  19. Google Translate Integrated In Google Chrome 5 – gHacks Tech News, gHacks Technology News, 7 lutego 2010 [dostęp 2022-02-07].
  20. Języki – Tłumacz Google, translate.google.pl [dostęp 2022-02-07].
  21. Alex Chitu, Google Translate Becomes the Best Free Online Translator, Google Translate Becomes the Best Free Online Translator, 8 maja 2008 [dostęp 2022-02-05].
  22. Alex Chitu, Google Translate for Persian, Google Translate for Persian, 18 czerwca 2009 [dostęp 2022-01-29].
  23. a b Alex Chitu, New Languages in Google Translate, New Languages in Google Translate, 25 sierpnia 2009 [dostęp 2022-01-29].
  24. Five more languages on translate.google.com, Google Translate Blog [dostęp 2020-10-24].
  25. Veni, Vidi, Verba Verti, Google Translate Blog [dostęp 2020-10-24].
  26. Google Translate welcomes you to the Indic web, Google Translate Blog [dostęp 2020-10-24].
  27. Tutmonda helplingvo por ĉiuj homoj, Google Translate Blog [dostęp 2020-10-24].
  28. Translating Lao, Google Translate Blog [dostęp 2020-10-24].
  29. Google Translate now supports Khmer, Google Translate Blog [dostęp 2020-10-24].
  30. More than 70 of the world’s languages in the blink of an eye, Google Translate Blog [dostęp 2020-10-24].
  31. Google Translate – now in 80 languages, Google Translate Blog [dostęp 2020-10-24].
  32. Google Translate – 10 More Languages with your Help, Google Translate Blog [dostęp 2020-10-24].
  33. From Amharic to Xhosa, introducing Translate in 13 new languages – now over 100 in total!, Google, 17 lutego 2016 [dostęp 2020-10-24].
  34. Google Translate adds five languages, Google, 26 lutego 2020 [dostęp 2020-10-24].
  35. Google Translate adds 24 languages, Google, 26 lutego 2020 [dostęp 2020-10-24].
  36. Introducing the Google Translate app for iPhone [dostęp 2022-02-07].
  37. Google Translate now for iPhone [dostęp 2022-02-07].
  38. Introduction: Into the Black Box of Google Translate, Teach You Backwards, 30 marca 2019 [dostęp 2022-02-07].
  39. Google Translate just got smarter: Word Lens and instant voice translations in latest update, Android Authority, 14 stycznia 2015 [dostęp 2022-02-07].
  40. Google Translate's New 'Conversation Mode': Hands On, PCMAG [dostęp 2022-02-07].
  41. BREAKING NEWS! Google to shut down Translate API – GTS Blog, web.archive.org, 31 maja 2011 [dostęp 2022-02-07] [zarchiwizowane z adresu 2011-05-31].
  42. Spring cleaning for some of our APIs – The official Google Code blog, Spring cleaning for some of our APIs – The official Google Code blog, 3 czerwca 2011 [dostęp 2022-02-07].
  43. Google Translate API – Google Code, web.archive.org, 22 sierpnia 2011 [dostęp 2022-02-07] [zarchiwizowane z adresu 2011-08-22].
  44. Google cancels plan to shutdown Translate API. To start charging for translations – GTS Blog, web.archive.org, 30 czerwca 2011 [dostęp 2022-02-07] [zarchiwizowane z adresu 2011-06-30].
  45. Cloud Translation, Google Cloud [dostęp 2022-02-07].
  46. New Google Crowdsource app asks you to help with translation and text transcription a few seconds at a time, Android Police, 29 sierpnia 2016 [dostęp 2022-02-07].
  47. Stephen Shankland, New Crowdsource app lets you work for Google for free, CNET [dostęp 2022-02-07].
  48. 49 Shares, 4 0k Reads, Google Seeks Community Help To Improve Google Translate, Search Engine Journal, 28 lipca 2014 [dostęp 2022-02-07].
  49. Translate Community: Help us improve Google Translate!, Google Translate Blog [dostęp 2022-02-07].
  50. Google Translate Adds Crowdsourcing Features To Improve Its Translations, TechCrunch [dostęp 2022-02-07].
  51. Nick Summers, Google sets up Community Site For Translate Service, TNW | Google, 25 lipca 2014 [dostęp 2022-02-07].
  52. Tłumacz Google, translate.google.pl [dostęp 2022-02-07].
  53. a b Qualitative Analysis of Google Translate across 108 Languages, Teach You Backwards, 1 kwietnia 2019 [dostęp 2022-02-07].
  54. A Neural Network for Machine Translation, at Production Scale, Google AI Blog [dostęp 2022-02-07].
  55. a b Statistical machine translation live, Google AI Blog [dostęp 2022-02-07].
  56. (PDF) Long Short-term Memory, ResearchGate [dostęp 2022-02-07].
  57. Felix A. Gers, Jürgen Schmidhuber, Fred Cummins, Learning to Forget: Continual Prediction with LSTM, „Neural Computation”, 12, 1999, s. 2451–2471 [dostęp 2022-02-07].
  58. Yonghui Wu i inni, Google’s Neural Machine Translation System: Bridging the Gap between Human and Machine Translation, „arXiv:1609.08144 [cs]”, 26 września 2016, arXiv:1609.08144 [dostęp 2018-05-01].
  59. Cade Metz, An Infusion of AI Makes Google Translate More Powerful Than Ever, „Wired”, ISSN 1059-1028 [dostęp 2022-02-07].
  60. Tłumacz Google z neuronowym silnikiem – by chińszczyznę było łatwiej pojąć, dobreprogramy, 29 września 2016 [dostęp 2022-02-07].
  61. Google Translate now uses neural machine translation for some languages, Android Police, 7 marca 2017 [dostęp 2022-02-07].
  62. Google adds Indonesian and eight new Indian languages to its neural machine translation, Android Police, 26 kwietnia 2017 [dostęp 2022-02-07].
  63. Chris McDonald, Ok slow down., Medium, 7 stycznia 2017 [dostęp 2022-02-07].
  64. Tłumacz Google z lepszą obsługą polskiego dzięki sieciom neuronowym, dobreprogramy, 21 marca 2017 [dostęp 2022-02-07].
  65. Zero-Shot Translation with Google’s Multilingual Neural Machine Translation System, Google AI Blog [dostęp 2022-02-07].
  66. Alex Chitu, Google Switches to Its Own Translation System, Google Switches to Its Own Translation System, 22 października 2007 [dostęp 2022-02-07].
  67. Google Translate Drops Systran For Home Brewed Translation, Search Engine Land, 23 października 2007 [dostęp 2022-02-07].
  68. Franz Och, Ph.D., Expert in Machine Learning and Machine Translation, Joins Human Longevity, Inc. as Chief Data Scientist – Human Longevity, Inc., web.archive.org, 16 stycznia 2015 [dostęp 2022-02-07] [zarchiwizowane z adresu 2015-01-16].
  69. Google seeks world of instant translations, „Reuters”, 28 marca 2007 [dostęp 2022-02-07].
  70. Google Translate and the battle for accurate translations by computer, the Guardian, 19 grudnia 2010 [dostęp 2022-02-07].
  71. Open Source Components & Language Licenses – Google Translate, translate.google.pl [dostęp 2022-02-04].
  72. Comparison of online translation tools, web.archive.org, 10 lutego 2011 [dostęp 2022-02-07] [zarchiwizowane z adresu 2011-02-10].
  73. Empirical Evaluation of Google Translate across 107 Languages, Teach You Backwards, 30 marca 2019 [dostęp 2022-02-07].
  74. Conclusions: Real Data, Fake Data & Google Translate, Teach You Backwards, 30 marca 2019 [dostęp 2022-02-07].
  75. Evaluation Scores of Google Translate in 107 Languages, Google Docs [dostęp 2022-02-07].
  76. An Analysis of Google Translate Accuracy, translationjournal.net [dostęp 2022-02-07].
  77. Haiying Li, A. Graesser, Zhiqiang Cai, Comparison of Google Translation with Human Translation, FLAIRS Conference, 2014 [dostęp 2022-02-07].
  78. How Accurate Is Google Translate in 2018? – Argo Translation, www.argotrans.com [dostęp 2022-02-07].
  79. Polysemy in top 100 Oxford English Corpus words within Wiktionary, by Martin Benjamin, released in the public domain, Google Docs [dostęp 2022-02-07].
  80. Twitter, Google translate can't recognise the fucking subjunctive so why should I have to., Twitter [dostęp 2022-02-07].
  81. Google translate doesn't really understand 'tu' and 'vous'. Particularly "tu"., r/French, 2 grudnia 2013 [dostęp 2022-02-07].
  82. The Astounding Mathematics of Machine Translation, Teach You Backwards, 1 kwietnia 2019 [dostęp 2022-02-07].
  83. Michael A Nielsen, Reinventing discovery. The new era of networked science, Princeton, N.J.: Princeton University Press, 2012, ISBN 978-0-691-14890-8, OCLC 724663975 [dostęp 2020-10-10].
  84. Kieran Corcoran, A British court was forced to rely on Google Translate because it had no interpreter, Business Insider [dostęp 2020-10-10].

Media użyte na tej stronie

Google 2015 logo.svg
Google logo since September 1, 2015. The letters of "Google" are each purely colored (from left to right) with blue, red, yellow, blue, green, and red in Product Sans font. The e is slightly angled.
Google Eng Accent v2.png
Autor: PorazonyCreeper, Licencja: CC BY-SA 4.0
Based on Google Eng Accent.png by User:Earth_Resident, a map of Google Translate's choice of English TTS voice by region (country).

Green (Europe, Central Asia, Africa w/o Nigeria; Iran, South Asia w/o India; Malaysia, Brunei, Hong Kong, Guyana) - British accent Pink (Americas w/o Guyana; Middle East w/o Iran; Caucasus states, East Asia w/o HK, Brunei or Malaysia; Oceania w/o Australia or NZ proper) - American accent Yellow (Australia, New Zealand proper) - Australian accent Orange (India) - Indian accent Blue (Nigeria) - Nigerian accent

Actual as of 14 Jan 2022.
GOOGLEjnmk.jpg
Autor: Daniel.krauz20, Licencja: CC BY-SA 4.0
Google Translate, ukázka překladu začátku Máchova Máje z češtiny do chorvatštiny.
Screenshot of Google Translate.png
Screenshot of Google Translate, is a free multilingual machine translation service developed by Google.