British National Corpus

British National Corpus (BNC) atau Korpus Nasional Inggris adalah korpus monolingual berupa data atau kumpulan teks berbahasa Inggris yang berjumlah lebih dari 100 juta kata.[1] BNC juga disebut sebagai “bank of English” atau bank data bahasa Inggris yang terdiri atas data lisan dan data tulis, serta dikumpulkan melalui berbagai sumber dan topik.

Sejarah sunting

British National Corpus dibuat pertama kali oleh Penerbit Universitas Oxford pada 1980 hingga awal 1990.[1] Saat ini, proyek ini merupakan kolaborasi beberapa pihak yaitu, Penerbit Universitas Oxford, Longman, Chambers, Universitas Lancaster, dan Perpustakaan Inggris.[2]

Konten sunting

Sumber data BNC berasal dari 90% data tulis dan 10% data lisan. Data tulis diambil dari surat kabar, jurnal penelitian, majalah, dan buku-buku fiksi. Selain itu, data lisan antara lain bersumber dari transkripsi percakapan alami dan transkripsi rekaman acara-acara.[2]

Kegunaan sunting

BNC berfungsi untuk membantu pekerjaan-pekerjaan di bidang linguistik, seperti:

  • Penyusunan kamus monolingual dan bilingual Dalam penyusunan kamus, BNC berperan untuk membantu pemerolehan data perkembangan bahasa secara alami atau apa adanya. Sampel-sampel kalimatnya digunakan untuk mendukung pembuatan senarai istilah, definisi istilah, contoh lema (entri dalam kamus), penentuan kelas kata, dan kolokasi.[3]
  • Uji dan evaluasi bahasa Inggris BNC berfungsi untuk membantu evaluasi semantik atau subkategorial dalam bahasa Inggris dalam rangka analisis makna berbasis komputasi.
  • Penyusunan modul berbahasa Inggris BNC berguna untuk membantu mengetahui frekuensi kalimat dan polanya. Hasilnya menjadi bahan pembelajaran atau sumber referensi dalam produksi modul pembelajaran.[2]
  • Penelitian linguistik lainnya.

Pemutakhiran sunting

Saat ini, BNC2014 telah dibuat sebagai bentuk pemutakhiran BNC1994. Perbandingan keduanya cukup seimbang dan secara umum memiliki genre atau register yang sama. Pada BNC2014 terdapat tambahan fitur ‘E-language’. Meski begitu, mayoritas proporsi data dari setiap subdivisi korpora memiliki kemiripan.[2]

Referensi sunting

  1. ^ a b "British National Corpus (BNC)". www.english-corpora.org. Diakses tanggal 2022-02-03. 
  2. ^ a b c d Brezina, Vaclav (12 Agustus 2021). "The Written British National Corpus 2014 – design and comparability". De Gruyter Mouton. Diakses tanggal 2022-02-03. 
  3. ^ Budiwiyanto, Adi. "Korpus Dalam Penyusunan Kamus". badanbahasa.kemdikbud.go.id. Diarsipkan dari versi asli tanggal 2022-02-02. Diakses tanggal 2 Februari 2022.