Pengodean karakter

Pengodean karakter atau penyandian huruf (bahasa Inggris: character encoding, character set) terdiri dari sandi atau kode yang memasangkan serangkaian aksara berurutan dari suatu kumpulan dengan sesuatu yang lain, seperti urutan bilangan asli (natural numbers), perlapanan (octet) atau denyut listrik, untuk mempermudah penyimpanan naskah pada komputer dan pengalirhantaran naskah melalui jaringan telekomunikasi. Misalnya sandi Morse, yang menyandikan huruf alfabet Latin ke dalam rangkaian tekanan panjang dan pendek dari kunci telegraf; serta ASCII, yang menyandikan huruf, bilangan, dan simbol-simbol lain, sebagai bilangan bulat dan versi perduaan (binary) 7-bita dari bilangan bulat tersebut; umumnya ditambahkan nol-bita untuk mempermudah penyimpanan dalam bita perlapanan.

Pada masa-masa awal komputer, pengenalan penyandiaksaraan seperti ASCII (1963) dan EBCDIC (1964) mengawali proses pembakuan. Keterbatasan kumpulan tersebut mulai tampak, dan beberapa metode seterjadinya (ad hoc) dikembangkan untuk memperluaskannya. Kebutuhan untuk mendukung berbagai macam tata tulisan, termasuk rumpun aksara CJK dari tulisan Asia Timur, membutuhkan dukungan untuk jauh lebih banyak aksara dan menuntut pendekatan yang tersusun rapi untuk penyandiaksaraan, dan bukan pendekatan seterjadinya seperti sebelumnya.

Acuan penyandiaksaraan sunting

Unicode dan bakuan serupa lainnya, Universal Character Set (ISO/IEC 10646), bersama-sama merumuskan penyandiaksaraan seragam. Ada empat tingkat acuan penyandiaksaraan Unicode:^[1]

Khasanah Aksara Mujarad (Abstract Character Repertoire)
Serangkaian Aksara Tersandikan (Coded Character Set)
Borang Penyandiaksaraan (Character Encoding Form)
Pola Rencana Penyandiaksaraan (Character Encoding Scheme)

Catatan kaki sunting

^ "Unicode Technical Report #17: Unicode Character Encoding Model". 2008-11-11. Diakses tanggal 2012-10-28.

Pranala luar sunting

(Inggris) Character sets registered by Internet Assigned Numbers Authority
(Inggris) Unicode Technical Report #17: Character Encoding Model
(Inggris) ICU Converter Explorer
(Inggris) The Cyrillic Charset soup
(Inggris) Early history of character set standardization Diarsipkan 2010-01-16 di Wayback Machine.
(Inggris) A complete introduction to Japanese character encodings Diarsipkan 2006-05-27 di Wayback Machine.
(Inggris) A tutorial on character code issues Diarsipkan 2017-09-17 di Wayback Machine.
(Inggris) Online Char (ASCII), HEX, Binary, Base64, etc... Encoder/Decoder with MD2, MD4, MD5, SHA1+2, etc. hashing algorithms

Artikel bertopik perangkat lunak ini adalah sebuah rintisan. Anda dapat membantu Wikipedia dengan mengembangkannya.

[1] "Unicode Technical Report #17: Unicode Character Encoding Model". 2008-11-11. Diakses tanggal 2012-10-28.

[1]