Next Previous Contents

2. Kesulitan-kesulitan dalam menggunakan bahasa Mandarin dalam sistem Linux

Bagian ini akan berusaha menjelaskan secara garis besar beberapa halangan dalam menggunakan bahasa Mandarin pada Linux; kemudian anda dapat menemukan titik-titik kunci jauh lebih mudah ketika anda menghadapi masalah-masalah ini. Pada kenyataannya, kesulitan-kesulitan yang dijelaskan di sini tidak hanya terdapat pada Linux tetapi juga sistem lain. Lebih lagi, kami dapat mengatakan bahwa seluruh lingkungan komputer adalah memprihatinkan. Jika bagian ini tidak sesuai dengan selera anda atau atau ingin segera bertindak, maka anda dapat lompat ke bagian Tampilan dan Masukan berbahasa Mandarin!

Sebagaimana kita tahu, sebuah kata bahasa Mandarin terdiri dari dua byte di komputer. Metode pengkodean yang paling populer mencakup kode-kode BIG5 yang ada di Taiwan dan kode-kode GB yang ada di Cina. Byte pertama setiap kata hampir lebih besar dari 128, yang kita sebut kode-kode non-ASCII. (Kode-kode ASCII berarti kode-kode dengan nilai lebih kecil dari 128).

Ya! Lalu bagaimana? Ini adalah intinya! Oleh karena berbagai alasan, dahulu banyak program yang tidak memperhitungkan kemungkinan kode-kode ASCII sebagai bagian dari pemasukan data.

Program-program macam ini selalu berasumsi bahwa data yang disiapkan untuk dimanipulasi seluruhnya dalam daerah kode-kode ASCII, dan yang paling buruknya adalah ketika mereka menjumpai kode-kode non-ASCII, sebuah asumsi tentang ketidakadaan mereka dan pemotongan bit ke-8 adalah merupakan satu metode yang sering diambil. Ini disebut masalah pembersihan 8-bit.

Program anda, sebagai contoh, selalu menerima bahwa input anda seluruhnya adalah kode-kode ASCII lebar 7-bit. Ketika anda memasukan kata-kata Mandarin, ia akan menghapus bit ke-8 sehingga masukan tersebut akan menjadi tidak bermakna dalam bahasa Mandarin. Program-program komunikasi di Internet biasanya hanya dapat mentransmisikan data 7-bit. Suatu substansi yang terkenal pada program sendmail awal. Sendmail hanya dapat mengirim dan menerima surat-surat 7-bit, menyebabkan strategi-strategi metode pengkodean yang ganjil, "Encoding" yang menyebabkan penerima terganggu, dikenali sebagai mengirimkan surat-surat berbahasa Mandarin (seperti uuencode, base64, QP dan sebagainya). (Seringkali, saya memikirkan bahwa jika para pembuat email memiliki pandangan yang cukup jauh ke depan, mungkin kita akan memiliki sedikit masalah saat ini).

Masalah ini tampaknya lebih rumit di Internet. Meskipun anda dan penerima anda memiliki mesin yang terpasang dengan program sendmail yang mampu memanipulasi surat-surat berbahasa Mandarin, penerima mungkin masih akan memperoleh surat-surat pengganggu. Hal ini dikarenakan surat sebelum tiba pada sasaran mungkin melalui beberapa host di Internet, jika salah satu sendmailnya memotong bit ke-8, maka akan ada masalah. Untuk program-program dengan arsitektur client/server, masalahnya mungkin ada pada client, atau pada server; jika tidak, mungkin pada keduanya.

Aplikasi-aplikasi yang tidak mampu mengidentifikasi pengkodean bahasa Mandarin juga merupakan masalah utama, selain karena tidak dapat menangani data berkode non-ASCII. Banyak program (bahkan jika mampu menangani 8-bit secara tepat) menganggap sebuah kata Mandarin sebagai dua buah byte individual. Hal ini tidak akan menyebabkan masalah dalam kondisi tertentu, namun akan menimbulkan kekacauan di situasi tertentu.

Alasan yang paling jelas adalah, sebagai contoh, bahkan jika anda mampu memasukkan kata-kata Mandarin secara tepat, tetapi ketika anda menekan tombol backspace berusaha menghapus seluruh kata, semua kata akan terbagi ke dalam dua bagian arti yang hanya satu byte (kolom) yang dapat dihapus dari monitor dan satu bagian lagi menjadi kode pengganggu. Terlebih lagi, anda mungkin mengganti baris pada byte kedua kata Mandarin dalam suatu editor teks dan kemudian kode penganggu muncul. Selain itu, editor teks ini mungkin menganggap kalimat Mandarin yang panjang sebagai suatu kalimat Inggris yang panjang tanpa mengadakan pergantian baris, menjadikan layar buruk dan kacau.

Terdapat hal-hal yang lebih buruk lagi! Beberapa kata Mandarin mengandung kode-kode khusus yang berkaitan dengan arti tertentu pada beberapa aplikasi dan mungkin membuat program-program ini menghasilkan kesalahan fatal saat mengikuti kode tersebut atau hanya diam (collapse).

Di bawah ini terdapat beberapa usulan untuk menanganinya namun tidak lengkap, terpecah-pecah dan juga tidak memuaskan. Hanya ketika seluruh software sesuai dengan bahasa Mandarin, maka permasalahan mungkin dapat terpecahkan.

Namun, semakin banyak program memperhatikan pentingnya internasionalisasi, sebagai contoh, kebanyakan program sendmail host sekarang mampu menangani surat-surat 8-bit secara tepat--Tidak hanya mentransmisikan surat Mandarin yang membutuhkan 8-bit, tetapi juga banyak surat-surat multimedia membutuhkan 8-bit. "Banyak Software" sudah tidak memerlukan modifikasi sama sekali atau hanya membuka beberapa pilihan (option) tertentu untuk dapat menggunakan bahasa Mandarin. Secara bersamaan, kini semakin banyak orang yang terlibat pada kelahiran software berbahasa Mandarin. Mari kita tunggu dan mengharapkannya.


Next Previous Contents