Jumat, 12 April 2013

Metodologi Penerjemahan Google Translate


Google Translate tidak menerapkan aturan tata bahasa, karena algoritma yang digunakan berdasarkan analisis statistik dan bukan analisis berbasis-aturan tradisional. Memang, pencipta asli sistem ini, Franz Josef Och, telah mengkritik efektivitas berbasis aturan algoritma yang mendukung pendekatan statistik. Hal ini didasarkan pada metode yang disebut terjemahan komputer berdasarkan statistik, dan lebih khusus lagi, penelitian oleh Och yang memenangkan kontes DARPA untuk kecepatan mesin terjemahan pada tahun 2003. Dia sekarang adalah ketua kelompok terjemahan mesin Google.
Google tidak menerjemahkan dari satu bahasa ke bahasa lain (L1 → L2), tetapi sering diterjemahkan pertama kali ke bahasa Inggris dan kemudian ke bahasa sasaran (L1 → EN → L2). Namun, karena bahasa Inggris, seperti semua bahasa manusia, adalah ambigu dan tergantung pada konteks, hal ini dapat menyebabkan kesalahan penerjemahan. Misalnya, menerjemahkanvous dari Prancis ke Rusia memberikan vous → you → ты OR Bы / вы. Jika Google menggunakan bahasa buatan sebagai perantara, akan menjadi vous → Anda → Bы / вы ATAU tu → thou → ты.Pemberian imbuhan kata seperti itu akan menegaskan perbedaan makna yang ada. Oleh karena itu, penulisan dalam bahasa Inggris, menggunakan kata-kata yang tidak ber-dwimakna, yang memberikan konteks, menggunakan ekspresi seperti “you all” sering membuat terjemahan satu langkah lebih baik.
Bahasa-bahasa berikut tidak memiliki terjemahan Google langsung ke atau dari bahasa Inggris. Bahasa-bahasa ini diterjemahkan melalui bahasa antara selain melalui bahasa Inggris:
  • Belarusia (be ↔ en ↔ ru ↔ lainnya)
  • Catalan (ca ↔ en ↔ es ↔ lainnya)
  • Galician (gl ↔ pt ↔ en ↔ lainnya)
  • Haiti Creole (ht ↔ fr ↔ en ↔ lainnya)
  • Macedonia (mk ↔ bg ↔ en ↔ lainnya)
  • Slowakia (sk ↔ cs ↔ en ↔ lainnya)
  • Ukraina (uk ↔ en ↔ ru ↔ lainnya) [62]
  • Urdu (ur ↔ hi ↔ en ↔ lainnya)
Mengabaikan tata bahasa dapat menyebabkan kesalahan. Sebagai contoh, perhatikan kalimat berikut:
Пишет (orang ketiga: it writes) вам (dativ: to you (all)) письмо (letter)семья (family) Дарьи (genitive: of Daria).
Berdasarkan urutan kata, Google menerjemahkan: You wrote a letter to family Darya.
Berdasarkan deklension (fungsi kata), artinya: [it's] Daria’s family [that]writes you a letter, justru sebaliknya.
Google mengambil you untuk to you, Daria untuk of Daria serta to the family untuk the family.
Ketika menerjemahkan kembali ke bahasa Rusia, meski begitu, Google mengatakan: Семья Дарьи пишет вам письмо.
Itu benar karena Google memahami urutan kata bahasa Inggris.
Menghormati urutan kata yang sama seperti dalam bahasa Inggris atau menerbitkan dalam bahasa Inggris seperti di atas dapat membantu.
Menurut Och, dasar yang kokoh untuk mengembangkan sistem penerjemahan mesin statistikal untuk pasangan bahasa baru dari awal, akan terdiri dari korpus teks bilingual (atau koleksi paralel) lebih dari satu juta kata, dan dua korpora monolingual dari masing-masing bahasa sebanyak lebih dari satu miliar kata.Model statistik dari data ini kemudian digunakan untuk menerjemahkan bahasa-bahasa tersebut.
Untuk mendapatkan ini sejumlah besar data linguistik, Google menggunakan dokumen PBB. PBB biasanya menerbitkan dokumen dalam enam bahasa resmi PBB, yang menghasilkan korpus 6-bahasa yang sangat besar.
Perwakilan Google telah terlibat dengan konferensi domestik di Jepang di mana ia telah mengumpulkan data bilingual dari para peneliti.
Kajian Google Translate
Tak lama setelah meluncurkan layanan penerjemahan, Google memenangkan kompetisi internasional untuk terjemahan mesin Inggris-Arab dan Inggris-Cina.
Kesalahan dan keanehan penerjemahan Google Translate
Karena Google Translate menggunakan pencocokan statistik untuk menerjemahkan dan bukan pendekatan aturan kamus atau tata bahasa, teks terjemahan seringkali menampilkan kesalahan yang jelas dan tampak tidak masuk akal, sering tertukar istilah untuk istilah umum yang serupa tapi tak sepadan dalam bahasa lain, dan juga membalikkan makna kalimat. Juga, untuk kemampuan bicara, Google Translate hanya menggunakan bahasa Perancis Eropa serta Amerika Latin Spanyol di seluruh dunia, namun keduanya Eropa dan Portugis Brazil (Eropa untuk translate.google.pt dan Brasil untuk semua situs Google Translate lainnya).
Google Translate Google Translate

Sumber:

Tidak ada komentar:

Posting Komentar