Senin, 20 Februari 2012

Kekuatan Komputasi Google Menyempurnakan Alat Penerjemah

Pada suatu pertemuan yang dilaksanakan di Google pada tahun 2004, pokok bahasannya terarah pada sebuah surel yang diterima perusahaan itu dari seorang penggemar di Korsel. Sergey Brin yang merupakan salah satu dari dua pendiri Perusahaan Google, menjalankan pesan itu melalui sebuah layanan terjemahan otomatis yang telah dipatenkan perusahaan itu.

Pesan itu berbunyi Google adalah mesin pencari favorit, tapi hasil terjemahan mengatakan: "Irisan ikan mentah memasang ladam kehendak. Hal bawang hijau Google!"

Pak Brin mengatakan Google harus bisa melakukannya lebih baik. Enam tahun kemudian, layanan gratis Penerjemahan Google menangani 52 bahasa, lebih dari sistem lain yang serupa, dan orang-orang menggunakannya ratusan juta kali seminggu untuk menerjemahkan halaman-halaman Web dan naskah lain.

"Apa yang anda lihat pada Penerjemahan Google merupakan karya seni" dalam penerjemahan komputer yang tak dibatasi oleh wilayah subyek tertentu, ujar Alon Lavie, seorang kolega profesor peneliti pada Institut Teknologi Bahasa di Universitas Carnegie Mellon, seperti yang dikutip The New York Times.

Usaha Google untuk berekspansi lebih dari sekedar mesin pencari telah menghasilkan berbagai kesuksesan. Buku-buku digitalnya telah digantung di pengadilan, dan pengenalan jejaring sosialnya, Buzz, meningkatkan ketakutan akan privasi. Contoh itu memperlihatkan bahwa Google bisa salah melangkah ketika dia mencoba untuk menantang tradisi bisnis dan konvensi kultural.

Namun kenaikan cepat Google ke tingkat eselon atas pada bisnis penerjemahan merupakan suatu pengingat tentang apa yang akan terjadi jika Google melepaskan kekuatan komputasinya yang dahsyat terhadap masalah-masalah rumit.

Jaringan pusat-pusat data yang dibangunya untuk pencarian Web sekarang bisa saja menjadi komputer terbesar di dunia jika digabungkan. Google menggunakan mesin itu untuk menekan batas-batas teknologi penerjemahan. Sebagai contoh, kira-kira dua bulan lalu dia mengatakan bahwa dia sedang bekerja menggabungkan alat penerjemahannya dengan analisis gambar yang dapat menerjemahkan tulisan dalam gambar.

"Penerjemahan Mesin merupakan salah satu contoh terbaik yang menunjukkan visi strategis Google," ujar Tim O'Reilly yang merupakan pendiri dan kepala technology publisher O'Reilly Media. "Itu bukanlah sesuatu yang ditanggapi sangat serius oleh siapa saja. Tapi Google mengerti sesuatu tentang data yang tak diketahui orang lain, dan dia sudi membuat investasi yang perlu untuk mengatasi masalah-masalah rumit ini lebih dulu dari pasar."

Menciptakan satu mesin penerjemah sudah lama dilihat sebagai salah satu tantangan tersulit dalam bidang kecerdasan buatan. Selama berpuluh-puluh tahun, para ilmuwan komputer mencoba menggunakan sebuah pendekatan berdasarkan aturan-aturan yaitu mengajarkan komputer aturan-aturan linguistik dua bahasa dan memberikannya kamus-kamus yang diperlukan.

Tapi di pertengahan 1990an, para peneliti mulai memfavoritkan pendekatan statistikal. Mereka menemukan bahwa jika mereka memberitahukan komputer ribuan atau jutaan paragraf beserta hasil terjemahan manusianya, komputer itu bisa belajar membuat terkaan akurat mengenai bagaimana menerjemahkan naskah-naskah baru.


Ternyata teknik ini yang memerlukan data yang sangat besar dan kekuatan komputasi, sangat cocok dengan situasi dan kondisi Google.

"Infrastruktur kami sangat sesuai dengan ini," kata Vic Gundotra yang merupakan wakil presiden bagian teknik di Google. "Kami bisa melakukan pendekatan-pendekatan yang bahkan tak bisa diimpikan pihak lain."

Sistem-sistem penerjemahan otomat masih jauh dari sempurna, bahkan Google tak akan membuat para penerjemah manusia kehilangan pekerjaan dalam waktu dekat ini. Para ahli mengatakan sangatlah sulit bagi sebuah komputer untuk memecahkan satu kalimat ke dalam bagian-bagian kemudian menerjemahkan dan menyatukan mereka kembali.

Tapi layanan Google cukup lumayan untuk menyampaikan inti dari sebuah artikel berita, dan itu telah menjadi sumber instan penerjemahan bagi jutaan orang. "Jika anda menginginkan sebuah terjemahan kasar siap saji, itu merupakan tempat untuk dikunjungi. ujar Philip Resnik yang merupakan ahli penerjemahan mesin dan seorang kolega profesor pada bagian linguistik di Universitas Maryland, College Park.

Seperti para pesaingnya di lapangan, yang paling dikenal Microsoft dan I.B.M., Google telah memasukkan mesin penerjemahnya dengan transkrip pembukaan Perserikatan Bangsa-Bangsa yang diterjemahkan oleh manusia ke dalam enam bahasa, dan dari Parlemen Eropa yang diterjemahkan ke dalam 23 bahasa. Materi-materi dasar ini digunakan untuk melatih sistemnya dengan bahasa-bahasa paling umum.

Tapi Google telah menjelajah naskah Web, begitu juga data dari proyek pemindaian buku dan sumber-sumber lain, untuk bergerak ke luar batas bahasa-bahasa itu. Untuk bahasa yang lebih tak jelas, dia menghadirkan sebuah "kotak peralatan" yang membantu para pengguna dalam penerjemahan dan kemudian menambahkan naskah-naskah tersebut ke dalam basis datanya.

Penawaran Google bisa merugikan penjualan perangkat lunak dari perusahaan seperti I.B.M. Tapi penerjemahan otomat nampaknya tidak akan pernah menjadi penghasil uang banyak, setidaknya bukan dari standar bisnis iklan Google. Tetap saja, kerja keras Google bisa menguntungkan dalam berbagai hal.

Oleh karena iklan-iklan Google online di mana-mana, apa pun yang membuat orang mudah menggunakan Web menguntungkan perusahaan itu. Dan sistem itu bisa mengarah kepada aplikasi-aplikasi baru. Beberapa minggu lalu, perusahaan itu mengatakan dia akan menggunakan pengenalan suara untuk membuat tulisan-tulisan di bawah gambar video YouTube berbahasa Inggris, yang kemudian bisa diterjemahkan ke dalam 50 bahasa lain.

"Teknologi ini bisa membuat barikade bahasa hilang," kata Franz Och yang merupakan kepala ilmuwan di Google yang mengepalai tim penerjemahan mesin perusahaan itu. "Itu bisa memperkenankan siapa saja untuk berkomunikasi dengan yang lain."

Pak Och seorang peneliti Jerman yang sebelumya bekerja di Universitas California Selatan, mengatakan dia pada mulanya enggan bergabung dengan Google, takut perusahaan itu akan memperlakukan penerjemahan sebagai proyek sampingan. Larry Page yang merupaka pendiri Google satunya, memanggil dan meyakinkan Pak Och.

"Pada dasarnya dia berkata bahwa ini merupakan sesuatu yang sangat penting bagi Google," kata Pak Och barusan. Pak Och masuk pada tahun 2004 dan segera membawa janji dari Pak Page ke dalam uji coba.

Sementara banyak sistem penerjemahan serupa dengan punya Google menggunakan hingga milyaran naskah kata-kata untuk membangun pemetaan sebuah bahasa, Google menggunakan lebih banyak lagi: beberapa ratus milyar kata-kata dalam bahasa Inggris. "Pemetaannya menjadi lebih baik dan terus membaik jika lebih banyak naskah yang diproses," ujar Pak Och.

Usaha keras akhirnya memberikan keuntungan. Setahun kemudian, Google memenangkan sebuah kompetisi yang diselenggarakan oleh pemerintah yang menguji berbagai sistem penerjemahan rumit.

Google telah menggunakan pendekatan serupa yaitu kekuatan komputasi besar, tumpukan data dan statistik, untuk mengatasi masalah-masalah rumit lainnya. Sebagai contoh, pada tahun 2007, perusahaan itu mulai menawarkan 800-GOOG-411 yang merupakan layanan direktori bantuan cuma-cuma yang menerjemahkan kata-kata yang diucapkan. Layanan ini memperkenankan Google mengumpulkan berbagai suara dari jutaan orang agar supaya lebih baik dalam hal mengenali bahasa Inggris yang diucapkan.

Setahun kemudian, Google meluncurkan sebuah sistem pencarian berdasarkan suara yang sama baiknya dengan buatan bertahun-tahun perusahaan lain.

Dan pada akhir tahun lalu, Google memperkenalkan sebuah layanan yang disebut Goggles yang menganalisa foto-foto telepon genggam, mencocokkannya dengan basis data lebih dari satu milyar gambar-gambar online, termasuk foto-foto berbagai jalan yang diambil untuk layanan Street Viewnya.

Pak Och mengakui bahwa sistem penerjemahan Google masih membutuhkan penyempurnaan, tapi dia mengatakan sistem itu cepat menjadi lebih baik. "Kurva penyempurnaan kualitas masih tetap tinggi," tambahnya.

Tidak ada komentar:

Posting Komentar