Google, Microsoft dhe DeepL, cili përkthen më mirë në epokën e machine learning?

Tuesday, 29 May 2018 08:05

Prej disa vitesh, gjigantët e teknologjisë këmbëngulin në përsosjen e sistemeve të veta të përkthimit. Merita i takon Inteligjencës Artificiale, që gjen këtu një ndër zbatimet kryesore. Po në çfarë pike jemi? A e rrezikon teknologjia profesionin e përkthyesit?

Nëse ka një fushë ku Inteligjenca Artificiale mund të bëjë ndryshimin është te përkthimi në kohë reale. Prej vitesh, kolosët e teknologjisë, nga Microsoft te Google, këmbëngulin tek aftësia e superkompjuterëve të vet për të përkthyer terma, fjali dhe paragrafë me kuptim, në kohë reale, por vetëm me përhapjen e Inteligjencës Artificiale dhe rrjeteve nervore artificiale, diskutimi ka marrë tjetër drejtim.
Jo se më parë rezultatet ishin të këqija, por një sistem i cili mbështetet te një studim statistikor (Statistical Machine Translation – SMT, i përdorur nga të gjithë pak vite më parë) nuk mund të krahasohet me zhvillimet më të fundit teknologjike në këtë fushë, të cilat bazohen në konceptin e rrjeteve nervore (Deep Neural Network – NN).
Fillesat e përkthimit gjuhësor automatik
Në historinë e përkthimit gjuhësor automatik, përpjekjet e para datojnë në vitet ’30 të shekullit të kaluar, por koncepti i përkthimit që i besohej një makine u konsiderua “i padobishëm” deri në vitet ‘60. Metoda e parë ishte intuitive: makinat përdornin algoritme përkthimi fjalë për fjalë, të ndjekura nga zbatimi i rregullave gjuhësore të paracaktuara. Quhej Rule-Based Machine Translation (RBMT) dhe ofronte një lloj drafti përkthimi, të cilit përkthyesit duhet t’i kushtonin orë të tëra. Rezultatet përmirësoheshin, por pa ndërhyrjen njerëzore, vështirë se do të konsideroheshin të pranueshme. Problemi nr. 1 i përkthimeve automatike është roli i kontekstit.
Pika e kthesës ndodhi në Japoni, në vitet ’80, kur çështja e ‘machine translation’ është konsideruar gjithnjë me rëndësi primare. Studiuesi Makoto Nagao hipotetizoi përdorimin e fjalive të përkthyera më parë si bazë për ato automatike. Kjo i hapi rrugë sistemit që për 25 vjet ka mbizotëruar në fushën e përkthimit automatik: ‘Statistical Machine Translation’ (SMT). Sistemi nisi të zhvillohej në fillim të viteve ’90 dhe ishte një hap i madh përpara krahasuar me të kaluarën. Makinat nuk kanë ‘vetëdije’ të rregullave gramatikore / apo sintaksore, por analizojnë miliona fjali dhe përkthime që lidhen me to për identifikimin e modeleve të konsoliduara për t’u përdorur në përkthimet e veta. Në këtë këndvështrim, SMT është një sistem i “Inteligjencës Artificiale”.
Sistemi ishte në gjendje të identifikonte fjalën më të përshtatshme ndër dhjetëra sinonime. Modelet e para përqendroheshin në fjalë të veçanta, më pas te vendndodhja e tyre në kontekstin e fjalisë dhe në fund erdhi Phrase-Based-SMT, që u bë i famshëm në botë, pasi ishte zemra e Google Translate të parë, që daton në vitin 2006. Mënyra e funksionimit është interesante: PBSMT analizon fjalinë për t’u përkthyer dhe e shpërbën si në fjalë të veçanta, si në kombinimin me dy, tre apo më shumë fjalë. Merr gjithçka dhe e ballafaqon me miliona modele që zotëron. Në këtë mënyrë gjen përkthimin më të saktë dhe më të mirë.
Më pas Google, në një njoftim historik, vendosi kalimin te një sistem me rrjete nervore artificiale, si bazë të Përkthyesit të vet. Google tha se kishte eksperimentuar prej vitesh Recurrent Neural Networks (RNN) për përkthimin automatik të teksteve të ndërlikuara. Avantazhi kryesor, krahasuar me modelin paraardhës, kishte të bënte me faktin e konsiderimit të të gjithë tekstit për t’u përkthyer si një më vete dhe si një tërësi fjalish dhe fjalësh për t’u përkthyer në mënyrë të pavarur.
Në praktikë, sistemi analizon fjalët më vete, por secila prej tyre konsiderohet si pjesë e kontekstit dhe jo si një element i ndarë nga të tjerët. Tani që gjithë kolosët e teknologjisë përdorin Rrjete Nervore për të përmirësuar përkthimet, le të shohim se në ç’mënyrë kompanitë janë aktive në fushën e përkthimit…
Google Translate është pikë referimi dhe më i përdoruri
I gjithë funksioni i Google në fushën e Inteligjencës Artificiale dhe Machine Learning e bën një pikë referimi në fushën e përkthimit. Aktualisht, Google Translate u shërben më shumë se 500 milionë personave në ditë dhe suporton më tepër se 100 gjuhë. Përvoja e përdorimit mbështetet te thjeshtësia: ju shkruani fjalinë në gjuhën që dëshironi, Google e njeh dhe e përkthen në kohë reale, të cilën mund ta përmirësoni më pas. Ata që duan të kontribuojnë mund të regjistrohen në Community dhe të përpiqen të përmirësojnë përkthimin e fjalëve dhe shprehjeve të ndërlikuara, në varësi të gjuhës që njihni më mirë. Versioni mobile ofron përkthim në kohë reale në bazë të inputit zanor, madje edhe atë offline – një shpëtim për ata që ndodhen në anën tjetër të botës me pak ose pa internet.
Microsoft Translate përkthen gjithçka, edhe fotot
Së bashku me Google, Microsoft po investon shumë në fushën e përkthimit. Po flasim për një përkthim “të thjeshtë”, d.m.th. atë klasik, por edhe atë zanor, dokumente, faqe të tëra web, madje edhe njohja e objekteve në brendësi të imazheve me interpretim dhe përkthim të mëvonshëm.
Jo rastësisht, në faqen zyrtare të Microsoft Translate, funksioni qendror është përkthimi i bisedave: persona me kombësi të ndryshme, që flasin pa probleme, edhe pse në gjuhën e tyre. Microsoft ka bërë hapa gjigantë në këtë drejtim: një shërbim për përkthimin mes gjuhëve të ndryshme u zhvillua madje në vitin 1999 si pjesë e Microsoft Research, ndërsa në 2007 propozohet Bing Translate si evolucion i Microsoft Live Translator.
Por ndryshimi më i rëndësishëm ndodhi në fund të vitit 2016, Microsoft zëvendësoi teknologjinë e përkthimit origjinal Statistical Machine Translation (SMT) me atë që bazohet në parimin kryesor të rrjeteve nervore, duke ofruar cilësi më të lartë në përkthim.
DeepL, më inteligjenti i klasës
Emri i tij nuk është aq i dëgjuar sa të tjerët, por DeepL ka një të ardhme të ndritshme përpara. I lindur në Gjermani në vitin 2017, si një startup inovative, partnere e Linguee, DeepL ofron një përkthim i cili bazohet në rrjetet nervore dhe konkurron, pavarësisht madhësisë së tij, me gjigantët amerikanë. Mjafton të themi që, deri në fund të vitit 2017, kompania kishte të punësuar rreth 20 inxhinierë dhe 500 freelancer të jashtëm për përmirësimin e përkthimeve dhe kontrollit të cilësisë, përkundrejt numrave pa dyshim më të mëdhenj të konkurrentëve të tjerë.
Që nga fillimet, DeepL është përshëndetur pozitivisht nga përdoruesit, që e kanë njohur saktësinë dhe aftësinë për të përkthyer në mënyrë besnike shprehjet komplekse në nivel semantik. Nuk është një përkthim fjalë për fjalë, shpesh pa gramatikë, por një punë e përpiktë, si të ishte realizuar nga një profesionist i vërtetë. Algoritmi BLEU (Bilingual Evaluation Understudy), që shërben për të vlerësuar cilësinë e një përkthimi automatik, e ka renditur gjithnjë në krye të listës, edhe në krahasim me konkurrentët e tjerë. I vetmi limit i dukshëm, për momentin suporton vetëm shtatë gjuhë.
Burimi: Digital Day

Modifikuar më Tuesday, 29 May 2018 16:37

Lini komentin tuaj!

Fyerjet dhe përdorimi i fjalëve banale, do të pasoj me fshirjen e komentit tuaj.

Lajmet e fundit

Koronavirusi/ Ambasada shqiptare ne Romë: Çfarë po ndodh me njerëzit tanë në Itali

Aktualitet

Koronavirusi/ Ambasada shqiptare ne Romë: Çfarë po ndodh me njerëzit tanë në Itali

Përhapja e Koronavirusit në disa rajone të Italisë ka sjellë dhe reagimin e ambasadës shqiptare në Romë, e cila përmes një deklarate, ka bërë të ditur se deri më tani, asnjë...

Bernie Sanders fiton Nevadën

Globi

Bernie Sanders fiton Nevadën

 Bernie Sanders fitoi të shtunën zgjedhjet brenda partisë në garën për zyrtarizimin e kandidatit demokrat që do të garojë kundër presidentit Trump në zgjedhjet e nëntorit. Me fitoren në Nevada zoti...

EMRAT/Aksioni për “Lojërat e fatit”, gjykata jep masat e sigurisë për të arrestuarit

Aktualitet

EMRAT/Aksioni për “Lojërat e fatit”, gjykata jep masat e sigurisë për të arrestuarit

Policia e Shtetit arrestoi ditë më parë disa persona, të cilët akuzohen se kanë organizuar lojëra fati në mënyrë të paligjshme. Gjykata e Tiranës ka dhënë sot masat e sigurisë për...

Sondazh

Nothing found!

Sondazh

Nothing found!