Pengkodean informasi terdiri dari. Prinsip pengkodean alfabet berurutan

Informasi teks terdiri dari simbol: huruf, angka, tanda baca, dll. Satu byte cukup untuk menyimpan 256 nilai berbeda, yang memungkinkan Anda menempatkan karakter alfanumerik apa pun di dalamnya. 128 karakter pertama (menempati tujuh bit paling tidak signifikan) distandarisasi menggunakan pengkodean ASCII (American Standard Code for Information Interchange). Inti dari pengkodean adalah bahwa setiap karakter diberi kode biner dari 00000000 hingga 11111111 atau kode desimal yang sesuai dari 0 hingga 255. Untuk mengkodekan huruf Rusia, berbagai tabel kode digunakan (KOI-8R, CP1251, CP10007, ISO-8859- 5 ):

KOI8R- standar delapan bit untuk menyandikan huruf alfabet Sirilik (untuk sistem operasi UNIX). Pengembang KOI8R menempatkan karakter alfabet Rusia di bagian atas tabel ASCII yang diperluas sehingga posisi karakter Sirilik sesuai dengan karakter fonetiknya dalam alfabet Inggris di bagian bawah tabel. Artinya dari teks yang tertulis di KOI8R, hasilnya adalah teks yang ditulis dalam karakter latin. Misalnya, kata “rumah tinggi” berbentuk “dom vysokiy”;

CP1251– standar pengkodean delapan bit yang digunakan di OS Windows;

CP10007- standar pengkodean delapan bit yang digunakan dalam alfabet Sirilik pada sistem operasi Macintosh (komputer Apple);

ISO-8859-5 – kode delapan bit yang disetujui sebagai standar untuk pengkodean bahasa Rusia.

Pengkodean informasi grafis

Informasi grafis dapat disajikan dalam dua bentuk: analog Dan terpisah. Lukisan kanvas diciptakan oleh seniman adalah contoh representasi analog, dan gambar dicetak menggunakan printer, terdiri dari titik-titik (elemen) individu dengan warna berbeda, adalah representasi diskrit.

Dengan memisahkan suatu gambar grafik (sampling), informasi grafik diubah dari bentuk analog menjadi bentuk diskrit. Dalam hal ini, pengkodean dilakukan - memberikan nilai tertentu dalam bentuk kode untuk setiap elemen gambar grafik. Pembuatan dan penyimpanan objek grafis dimungkinkan dalam beberapa jenis - seperti vektor, fraktal atau raster Gambar-gambar. Item terpisah dianggap grafik 3D (tiga dimensi)., yang menggabungkan metode pembuatan gambar vektor dan raster.

Grafik vektor digunakan untuk mewakili gambar grafis seperti gambar, gambar, diagram.

Mereka terbentuk dari objek - sekumpulan primitif geometris (titik, garis, lingkaran, persegi panjang), yang diberi karakteristik tertentu, misalnya ketebalan garis, warna isian.

Gambar dalam format vektor menyederhanakan proses pengeditan, karena gambar dapat diperbesar, diputar, dan diubah bentuknya tanpa kehilangan. Selain itu, setiap transformasi menghancurkan citra (atau fragmen) lama, dan yang baru dibangun sebagai gantinya. Metode presentasi ini bagus untuk diagram dan grafik bisnis. Saat mengkodekan gambar vektor, yang disimpan bukanlah gambar objek itu sendiri, tetapi koordinat titik-titiknya, yang digunakan program untuk membuat ulang gambar setiap saat.

Utama kerugian grafik vektor adalah ketidakmampuan menghasilkan gambar berkualitas fotografi. Dalam format vektor, gambar akan selalu terlihat seperti gambar.

Grafik raster. Gambar apa pun dapat dibagi menjadi kotak-kotak, sehingga diperoleh raster- array kotak dua dimensi. Kotak itu sendiri - elemen raster atau piksel(elemen gambar) - elemen gambar. Warna setiap piksel dikodekan dengan angka, yang memungkinkan Anda menentukan urutan nomor warna (dari kiri ke kanan atau atas ke bawah) untuk mendeskripsikan gambar. Jumlah masing-masing sel tempat piksel disimpan direkam dalam memori.

Menggambar dalam format raster

Setiap piksel diberi nilai kecerahan, warna, dan transparansi, atau kombinasi dari nilai-nilai ini. Gambar raster memiliki sejumlah baris dan kolom. Metode penyimpanan ini memiliki kelemahan: diperlukan lebih banyak memori untuk bekerja dengan gambar.

Volume gambar raster ditentukan dengan mengalikan jumlah piksel dengan volume informasi satu titik, yang bergantung pada jumlah kemungkinan warna. Komputer modern umumnya menggunakan resolusi layar berikut: 640 x 480, 800 x 600, 1024 x 768, dan 1280 x 1024 piksel. Kecerahan setiap titik dan koordinatnya dapat dinyatakan menggunakan bilangan bulat, yang memungkinkan penggunaan kode biner untuk memproses data grafik.

Dalam kasus paling sederhana (gambar hitam putih tanpa skala abu-abu), setiap titik di layar dapat memiliki salah satu dari dua status - "hitam" atau "putih", artinya, diperlukan 1 bit untuk menyimpan statusnya. Gambar berwarna dihasilkan berdasarkan kode warna biner dari setiap piksel yang disimpan dalam memori video. Gambar berwarna dapat memiliki kedalaman warna yang berbeda, yang ditentukan oleh jumlah bit yang digunakan untuk mengkodekan warna suatu titik. Kedalaman warna yang paling umum adalah 8, 16, 24, 32, 64 bit.

Untuk menyandikan gambar grafik berwarna, warna sembarang dibagi menjadi komponen-komponennya. Sistem pengkodean berikut digunakan:

HSB (H - rona, S - saturasi, B - kecerahan),

RGB (Merah - merah,Hijau - hijau, Biru- biru) Dan

CMYK ( C yan - biru, Magenta - ungu, Kuning - kuning dan Hitam - hitam).

Sistem pertama nyaman untuk orang, yang kedua - untuk pemrosesan komputer, dan yang terakhir adalah untuk percetakan. Penggunaan sistem warna ini disebabkan oleh fakta bahwa fluks cahaya dapat dibentuk oleh radiasi yang merupakan kombinasi warna spektral “murni”: merah, hijau, biru atau turunannya.

Fraktal adalah objek yang elemen individualnya mewarisi properti struktur induk. Karena penjelasan lebih rinci tentang elemen berskala lebih kecil terjadi dengan menggunakan algoritma sederhana, objek seperti itu dapat dijelaskan hanya dengan beberapa persamaan matematika. Fraktal memungkinkan Anda mendeskripsikan gambar yang memerlukan memori relatif sedikit untuk direpresentasikan secara detail.

Menggambar dalam format fraktal

Grafik 3D (3D) beroperasi dengan objek dalam ruang tiga dimensi. Grafik komputer tiga dimensi banyak digunakan dalam bioskop dan permainan komputer, di mana semua objek direpresentasikan sebagai sekumpulan permukaan atau partikel. Semua transformasi visual dalam grafik 3D dikontrol menggunakan operator yang memiliki representasi matriks.

Pengkodean informasi audio

Musik, seperti suara lainnya, tidak lebih dari getaran suara, yang jika didaftarkan, dapat direproduksi dengan cukup akurat. Untuk merepresentasikan sinyal audio dalam memori komputer, perlu untuk merepresentasikan getaran akustik yang diterima dalam bentuk digital, yaitu mengubahnya menjadi rangkaian nol dan satu. Dengan menggunakan mikrofon, suara diubah menjadi getaran listrik, setelah itu amplitudo getaran dapat diukur secara berkala (beberapa puluh ribu kali per detik) menggunakan perangkat khusus - konverter analog-ke-digital (ADC). Untuk mereproduksi suara, sinyal digital harus diubah menjadi sinyal analog konverter digital-ke-analog (DAC). Kedua perangkat ini sudah terpasang kartu suara komputer. Urutan transformasi yang ditunjukkan disajikan pada Gambar. 2.6..

Transformasi sinyal analog ke digital dan sebaliknya

Setiap pengukuran suara dicatat dalam kode biner. Proses ini disebut pengambilan sampel (pengambilan sampel), dilakukan dengan menggunakan ADC.

Sampel (sampel sampel bahasa Inggris) adalah interval waktu antara dua pengukuran amplitudo sinyal analog. Selain jangka waktu, sampel juga disebut urutan data digital yang diperoleh melalui konversi analog-ke-digital. Parameter penting contoh adalah frekuensi - jumlah pengukuran amplitudo sinyal analog per detik. Kisaran laju pengambilan sampel audio adalah dari 8000 hingga 48000 pengukuran per detik.

Representasi grafis dari proses pengambilan sampel

Kualitas pemutaran terpengaruh laju sampel dan resolusi(ukuran sel yang dialokasikan untuk mencatat nilai amplitudo). Misalnya, merekam musik ke CD menggunakan nilai 16-bit dan sampling rate 44032 Hz.

Melalui pendengaran, seseorang mempersepsikan gelombang suara dengan frekuensi berkisar antara 16 Hz sampai 20 kHz (1 Hz - 1 getaran per detik).

Dalam format Audio DVD CD, sinyal diukur 96.000 kali dalam satu detik, yaitu. Frekuensi sampling 96 kHz digunakan. Untuk menghemat ruang hard disk dalam aplikasi multimedia, frekuensi yang lebih rendah sering digunakan: 11, 22, 32 kHz. Hal ini menyebabkan penurunan rentang frekuensi suara, yang berarti apa yang didengar menjadi terdistorsi.

Pengkodean informasi teks di komputer terkadang merupakan kondisi penting untuk pengoperasian perangkat yang benar atau tampilan fragmen tertentu. Bagaimana proses ini terjadi selama pengoperasian komputer dengan informasi teks dan visual, suara - kami akan menganalisis semua ini di artikel ini.

Perkenalan

Komputer elektronik (yang kita sebut komputer dalam kehidupan sehari-hari) memahami teks dengan cara yang sangat spesifik. Baginya, pengkodean informasi teks sangat penting, karena ia memandang setiap fragmen teks sebagai sekelompok simbol yang terisolasi satu sama lain.

Apa saja simbol-simbolnya?

Tidak hanya huruf Rusia, Inggris, dan huruf lainnya yang berfungsi sebagai simbol komputer, tetapi juga tanda baca dan karakter lainnya. Bahkan ruang yang kita gunakan untuk memisahkan kata saat mengetik di komputer dianggap oleh perangkat sebagai simbol. Dalam beberapa hal ini sangat mirip dengan matematika tingkat tinggi, karena menurut banyak profesor, nol memiliki arti ganda: ia adalah angka dan sekaligus tidak berarti apa-apa. Bahkan bagi para filsuf, pertanyaan tentang white space bisa menjadi isu yang mendesak. Sebuah lelucon, tentu saja, tetapi, seperti kata mereka, ada benarnya dalam setiap lelucon.

Informasi macam apa yang ada di sana?

Jadi, untuk memahami informasi, komputer perlu memulai proses pemrosesan. Informasi macam apa yang ada di sana? Topik artikel ini adalah pengkodean informasi tekstual. Kami akan memberikan perhatian khusus pada tugas ini, tetapi kami juga akan membahas topik mikro lainnya.

Informasi dapat berupa teks, numerik, audio, grafik. Komputer harus menjalankan proses yang mengkodekan informasi tekstual untuk menampilkan di layar apa yang kita, misalnya, ketik di keyboard. Kita akan melihat simbol dan huruf, hal ini bisa dimaklumi. Apa yang dilihat mesin? Dia benar-benar memahami semua informasi - dan sekarang kita tidak hanya berbicara tentang teks - sebagai urutan nol dan satu tertentu. Mereka membentuk dasar dari apa yang disebut kode biner. Oleh karena itu, proses yang mengubah informasi yang diterima oleh perangkat menjadi sesuatu yang dapat dipahami disebut “pengkodean biner informasi teks.”

Prinsip singkat pengoperasian kode biner

Mengapa pengkodean informasi biner paling banyak digunakan di mesin elektronik? Basis teks, yang dikodekan menggunakan angka nol dan satu, dapat berupa rangkaian simbol dan tanda apa pun. Namun, ini bukan satu-satunya keuntungan yang dimiliki pengkodean informasi teks biner. Masalahnya adalah prinsip yang mendasari metode pengkodean ini sangat sederhana, tetapi pada saat yang sama cukup fungsional. Bila ada impuls listrik, ditandai (tentu saja dengan syarat) dengan satuan. Tidak ada impuls - ditandai dengan nol. Artinya, pengkodean informasi dalam bentuk teks didasarkan pada prinsip membangun rangkaian impuls listrik. Urutan logis yang terdiri dari simbol kode biner disebut bahasa mesin. Pada saat yang sama, pengkodean dan pemrosesan informasi teks menggunakan kode biner memungkinkan operasi dilakukan dalam waktu yang cukup singkat.

Bit dan byte

Sejumlah yang dirasakan oleh mesin mengandung sejumlah informasi tertentu. Itu sama dengan satu bit. Ini berlaku untuk setiap angka nol yang membentuk satu atau beberapa rangkaian informasi terenkripsi.

Oleh karena itu, jumlah informasi dalam hal apa pun dapat ditentukan hanya dengan mengetahui jumlah karakter dalam urutan kode biner. Jumlahnya akan sama satu sama lain. 2 digit dalam kode membawa 2 bit informasi, 10 digit - 10 bit, dan seterusnya. Prinsip menentukan volume informasi yang terletak pada satu atau beberapa fragmen kode biner cukup sederhana, seperti yang Anda lihat.

Mengkodekan informasi teks di komputer

Saat ini Anda sedang membaca artikel yang, seperti yang kami yakini, terdiri dari rangkaian huruf alfabet Rusia. Dan komputer, seperti yang disebutkan sebelumnya, memandang semua informasi (dan dalam hal ini juga) sebagai rangkaian bukan huruf, tetapi nol dan satu, yang menunjukkan ada dan adanya impuls listrik.

Masalahnya adalah Anda dapat menyandikan satu karakter yang kita lihat di layar menggunakan satuan ukuran konvensional yang disebut byte. Seperti tertulis di atas, kode biner memiliki apa yang disebut muatan informasi. Mari kita ingat bahwa secara numerik sama dengan jumlah total nol dan satu dalam fragmen kode yang dipilih. Jadi, 8 bit menghasilkan 1 byte. Kombinasi sinyal bisa sangat berbeda, seperti yang mudah dilihat dengan menggambar persegi panjang di atas kertas yang terdiri dari 8 sel dengan ukuran yang sama.

Ternyata informasi teks dapat dikodekan menggunakan alfabet berkapasitas 256 karakter. Apa gunanya? Maknanya terletak pada kenyataan bahwa setiap karakter akan memiliki kode binernya sendiri. Kombinasi yang “terikat” dengan karakter tertentu dimulai dari 00000000 dan diakhiri dengan 11111111. Jika Anda berpindah dari sistem bilangan biner ke desimal, maka Anda dapat menyandikan informasi dalam sistem tersebut dari 0 hingga 255.

Jangan lupa sekarang ada berbagai tabel yang menggunakan pengkodean huruf alfabet Rusia. Ini adalah, misalnya, ISO dan KOI-8, Mac dan CP dalam dua variasi: 1251 dan 866. Sangat mudah untuk memastikan bahwa teks yang dikodekan dalam salah satu tabel ini tidak akan ditampilkan dengan benar dalam pengkodean selain yang ini. Hal ini disebabkan oleh fakta bahwa dalam tabel yang berbeda, simbol yang berbeda berhubungan dengan kode biner yang sama.

Ini adalah masalah pada awalnya. Namun, saat ini program sudah memiliki algoritma khusus bawaan yang mengubah teks, menjadikannya bentuk yang benar. Tahun 1997 ditandai dengan terciptanya sebuah pengkodean yang disebut Unicode. Di dalamnya, setiap karakter memiliki 2 byte. Ini memungkinkan Anda menyandikan teks dengan jumlah karakter yang jauh lebih banyak. 256 dan 65536: apakah ada perbedaan?

Pengkodean grafis

Pengkodean teks dan informasi grafis memiliki beberapa kesamaan. Seperti yang Anda ketahui, perangkat periferal komputer yang disebut “monitor” digunakan untuk menampilkan informasi grafis. Grafik sekarang (sekarang kita berbicara tentang grafik komputer) banyak digunakan di berbagai bidang. Untungnya, kemampuan perangkat keras komputer pribadi memungkinkan penyelesaian masalah grafis yang cukup kompleks.

Pemrosesan informasi video telah menjadi mungkin dalam beberapa tahun terakhir. Namun teksnya jauh “lebih ringan” daripada grafiknya, yang pada prinsipnya dapat dimengerti. Oleh karena itu, ukuran akhir file grafik harus diperbesar. Permasalahan tersebut dapat diatasi dengan mengetahui esensi penyajian informasi grafis.

Pertama-tama mari kita cari tahu di kelompok mana jenis informasi ini dibagi. Pertama, ini adalah raster. Kedua, vektor.

Gambar raster sangat mirip dengan kertas kotak-kotak. Setiap sel pada kertas tersebut dicat dengan satu warna atau lainnya. Prinsip ini agak mengingatkan pada mosaik. Artinya, ternyata dalam grafik raster gambar dibagi menjadi bagian-bagian dasar yang terpisah. Mereka disebut piksel. Diterjemahkan ke dalam bahasa Rusia, piksel berarti “titik”. Adalah logis bahwa piksel diurutkan relatif terhadap garis. Grid grafis hanya terdiri dari sejumlah piksel tertentu. Ini juga disebut raster. Mengingat dua definisi ini, kita dapat mengatakan bahwa gambar raster tidak lebih dari kumpulan piksel yang ditampilkan pada kotak persegi panjang.

Ukuran raster dan piksel monitor mempengaruhi kualitas gambar. Semakin besar raster monitor, maka akan semakin tinggi. Ukuran raster adalah resolusi layar yang mungkin pernah didengar oleh setiap pengguna. Salah satu karakteristik terpenting yang dimiliki layar komputer adalah resolusi, bukan hanya resolusi. Ini menunjukkan berapa banyak piksel yang ada per satuan panjang. Biasanya, resolusi monitor diukur dalam piksel per inci. Semakin banyak piksel per satuan panjang, semakin tinggi kualitasnya, karena “butir” berkurang.

Pemrosesan aliran audio

Pengkodean informasi teks dan audio, seperti jenis pengkodean lainnya, memiliki beberapa kekhasan. Sekarang kita akan berbicara tentang proses terakhir: pengkodean informasi audio.

Representasi aliran audio (serta suara individual) dapat dihasilkan dengan menggunakan dua metode.

Bentuk analog dari representasi informasi audio

Dalam hal ini, kuantitas dapat memiliki nilai yang berbeda-beda dalam jumlah yang sangat besar. Selain itu, nilai-nilai yang sama ini tidak tetap: mereka berubah dengan sangat cepat, dan proses ini berkelanjutan.

Bentuk representasi informasi audio yang diskrit

Jika kita berbicara tentang metode diskrit, maka dalam hal ini besaran hanya dapat mengambil sejumlah nilai terbatas. Dalam hal ini, perubahan terjadi secara spasmodik. Anda dapat menyandikan secara diam-diam tidak hanya audio, tetapi juga informasi grafis. Sedangkan untuk bentuk analognya.

Informasi audio analog disimpan pada piringan hitam, misalnya. Namun CD sudah menjadi cara tersendiri dalam menyajikan informasi audio.

Pada awalnya, kita berbicara tentang fakta bahwa komputer menerima semua informasi dalam bahasa mesin. Untuk melakukan ini, informasi dikodekan dalam bentuk rangkaian impuls listrik - nol dan satu. Pengkodean informasi audio tidak terkecuali dalam aturan ini. Untuk memproses suara di komputer, Anda harus mengubahnya terlebih dahulu menjadi urutan tersebut. Hanya setelah ini operasi dapat dilakukan pada aliran atau satu suara.

Ketika proses pengkodean terjadi, aliran tersebut tunduk pada pengambilan sampel waktu. Gelombang suara bersifat kontinyu; ia berkembang dalam periode waktu yang kecil. Nilai amplitudo diatur untuk setiap interval tertentu secara terpisah.

Kesimpulan

Jadi, apa yang kita temukan dalam artikel ini? Pertama, semua informasi yang ditampilkan pada monitor komputer dikodekan sebelum muncul di sana. Kedua, pengkodean ini melibatkan penerjemahan informasi ke dalam bahasa mesin. Ketiga, bahasa mesin tidak lebih dari rangkaian impuls listrik - nol dan satu. Keempat, ada tabel terpisah untuk pengkodean karakter yang berbeda. Dan kelima, informasi grafis dan suara dapat disajikan dalam bentuk analog dan diskrit. Mungkin inilah poin-poin utama yang telah kita bahas. Salah satu disiplin ilmu yang mempelajari bidang ini adalah ilmu komputer. Pengkodean informasi tekstual dan dasar-dasarnya dijelaskan di sekolah, karena tidak ada yang rumit di dalamnya.

Gambar vektor dan fraktal.

Gambar vektor adalah objek grafis yang terdiri dari segmen dasar dan busur. Elemen dasar dari pencitraan adalah garis. Seperti benda apa pun, ia memiliki sifat: bentuk (lurus, melengkung), ketebalan, warna, gaya (titik, padat). Garis tertutup mempunyai sifat terisi (baik dengan objek lain atau dengan warna yang dipilih). Semua objek grafik vektor lainnya terdiri dari garis. Karena garis digambarkan secara matematis sebagai objek tunggal, jumlah data untuk menampilkan objek menggunakan grafik vektor jauh lebih sedikit dibandingkan grafik raster. Informasi tentang gambar vektor dikodekan sebagai alfanumerik biasa dan diproses oleh program khusus.

Perangkat lunak untuk membuat dan memproses grafik vektor meliputi GR berikut: CorelDraw, Adobe Illustrator, serta vektorizer (pelacak) - paket khusus untuk mengubah gambar raster menjadi gambar vektor.

Grafik fraktal didasarkan pada perhitungan matematis, seperti vektor. Namun berbeda dengan vektor, unsur dasarnya adalah rumus matematika itu sendiri. Hal ini mengarah pada fakta bahwa tidak ada objek yang disimpan dalam memori komputer dan gambar dibuat hanya menggunakan persamaan. Dengan menggunakan metode ini, Anda dapat membangun struktur biasa yang paling sederhana, serta ilustrasi kompleks yang meniru lanskap.

Tugas.

Diketahui memori video suatu komputer berkapasitas 512 KB. Resolusi layar adalah 640 x 200. Berapa banyak halaman layar yang dapat ditempatkan secara bersamaan di memori video dengan palet
a) dari 8 warna;
b) 16 warna;
c) 256 warna?

Berapa bit yang diperlukan untuk mengkodekan informasi sekitar 130 warna? Tidak sulit untuk menghitung 8 (yaitu 1 byte), karena dengan 7 bit Anda dapat menyimpan nomor rona dari 0 hingga 127, dan 8 bit menyimpan dari 0 hingga 255. Sangat mudah untuk melihat bahwa metode pengkodean ini adalah tidak optimal: 130 terasa kurang dari 255. Coba pikirkan, bagaimana menyingkat informasi tentang gambar saat menulisnya ke file, jika diketahui bahwa
a) gambar secara bersamaan hanya berisi 16 corak warna dari 138 kemungkinan;
b) gambar tersebut berisi 130 warna sekaligus, tetapi jumlah titik yang dilukis dengan warna berbeda sangat bervariasi.

A) jelas bahwa 4 bit (setengah byte) cukup untuk menyimpan informasi tentang 16 warna. Namun, karena 16 warna ini dipilih dari 130, warna tersebut mungkin memiliki angka yang tidak sesuai dengan 4 bit. Oleh karena itu, kita akan menggunakan metode palet. Mari kita tetapkan 16 warna yang digunakan dalam gambar kita dengan nomor “lokal” dari 1 hingga 15 dan mengkodekan keseluruhan gambar dengan kecepatan 2 poin per byte. Dan kemudian kita akan menambahkan informasi ini (di akhir file yang memuatnya) tabel korespondensi yang terdiri dari 16 pasang byte dengan nomor bayangan: 1 byte adalah nomor "lokal" kita di gambar ini, yang kedua adalah nomor sebenarnya dari bayangan ini. (bila alih-alih yang terakhir, informasi yang dikodekan tentang rona itu sendiri digunakan, misalnya, informasi tentang kecerahan cahaya "senjata elektronik" Merah, Hijau, Biru dari tabung sinar katoda, maka tabel seperti itu akan menjadi a Palet warna). Jika gambarnya cukup besar, peningkatan ukuran file yang dihasilkan akan signifikan;
b) mari kita coba menerapkan algoritma paling sederhana untuk mengarsipkan informasi tentang suatu gambar. Mari kita tetapkan kode 128 - 130 untuk tiga warna yang jumlah titik minimumnya dicat, dan kode 1 -127 untuk warna yang tersisa. Kami akan menulis ke dalam file (yang dalam hal ini bukan urutan byte, tetapi aliran bit kontinu) kode tujuh bit untuk warna dengan angka dari 1 hingga 127. Untuk tiga warna tersisa dalam aliran bit kami akan menulis a tanda nomor - tujuh bit 0 - dan segera diikuti oleh dua bit nomor "lokal", dan di akhir file kita akan menambahkan tabel korespondensi antara bilangan "lokal" dan bilangan real. Karena bayangan dengan kode 128 - 130 jarang terjadi, hanya ada sedikit angka nol tujuh bit.

Perhatikan bahwa mengajukan pertanyaan dalam masalah ini tidak mengecualikan solusi lain, tanpa mengacu pada komposisi warna gambar - pengarsipan:
a) berdasarkan identifikasi rangkaian titik yang dicat dengan corak yang sama dan mengganti setiap rangkaian tersebut dengan sepasang angka (warna), (kuantitas) (prinsip ini mendasari format grafik PCX);
b) dengan membandingkan garis-garis piksel (mencatat jumlah bayangan titik-titik pada halaman pertama secara keseluruhan, dan untuk garis-garis berikutnya mencatat jumlah bayangan hanya pada titik-titik yang bayangannya berbeda dengan bayangan titik-titik yang terletak pada posisi yang sama di halaman baris sebelumnya - ini adalah dasar dari format GIF);
c) menggunakan algoritma pengemasan gambar fraktal (format YPEG). (IO 6,1999)

Dunia dipenuhi dengan berbagai macam suara: detak jam dan dengungan mesin, deru angin dan gemerisik dedaunan, kicauan burung dan suara manusia. Orang-orang mulai menebak-nebak tentang bagaimana suara dilahirkan dan apa yang diwakilinya sejak lama. Bahkan filsuf dan ilmuwan Yunani kuno - ensiklopedis Aristoteles, berdasarkan pengamatan, menjelaskan sifat suara, percaya bahwa benda yang berbunyi menciptakan kompresi dan penghalusan udara secara bergantian. Jadi, tali yang berosilasi melepaskan atau memampatkan udara, dan karena elastisitas udara, efek bolak-balik ini ditransmisikan lebih jauh ke luar angkasa - gelombang elastis muncul dari lapisan ke lapisan. Ketika mencapai telinga kita, mereka berdampak pada gendang telinga dan menimbulkan sensasi suara.

Melalui telinga, seseorang merasakan gelombang elastis yang memiliki frekuensi berkisar antara 16 Hz hingga 20 kHz (1 Hz - 1 getaran per detik). Sesuai dengan ini, gelombang elastik dalam medium apapun, yang frekuensinya berada dalam batas tertentu, disebut gelombang bunyi atau sekadar bunyi. Dalam studi tentang bunyi, konsep-konsep seperti nada Dan warnanada suara. Suara nyata apa pun, baik itu permainan alat musik atau suara manusia, merupakan semacam campuran dari banyak getaran harmonik dengan serangkaian frekuensi tertentu.

Getaran yang frekuensinya paling kecil disebut nada utama, lainnya - nada tambahan.

Warnanada- sejumlah nada tambahan berbeda yang melekat pada suara tertentu, yang memberinya warna khusus. Perbedaan timbre yang satu dengan timbre yang lain tidak hanya ditentukan oleh jumlahnya, tetapi juga oleh intensitas nada tambahan yang mengiringi bunyi nada dasar tersebut. Berdasarkan timbre kita dapat dengan mudah membedakan suara piano dan biola, gitar dan seruling, serta mengenali suara orang yang kita kenal.

Bunyi musik dapat dicirikan oleh tiga kualitas: timbre, yaitu warna bunyi, yang bergantung pada bentuk getarannya, nada, ditentukan oleh jumlah getaran per detik (frekuensi), dan volume, bergantung pada intensitas getaran. getaran.

Komputer kini banyak digunakan dalam berbagai bidang. Pemrosesan informasi suara dan musik tidak terkecuali. Hingga tahun 1983, semua rekaman musik dirilis dalam bentuk piringan hitam dan kaset kompak. Saat ini, CD banyak digunakan. Jika Anda memiliki komputer dengan kartu suara studio terpasang, dengan keyboard MIDI dan mikrofon tersambung, maka Anda dapat bekerja dengan perangkat lunak musik khusus.

Secara konvensional dapat dibagi menjadi beberapa jenis:

1) semua jenis utilitas dan driver yang dirancang untuk bekerja dengan kartu suara dan perangkat eksternal tertentu;
2) editor audio, yang dirancang untuk bekerja dengan file suara, memungkinkan Anda melakukan operasi apa pun dengannya - mulai dari memecahnya menjadi beberapa bagian hingga memprosesnya dengan efek;
3) penyintesis perangkat lunak yang muncul relatif baru dan hanya berfungsi dengan benar di komputer yang kuat. Mereka memungkinkan Anda bereksperimen dengan menciptakan suara yang berbeda;
dan lain-lain.

Kelompok pertama mencakup semua utilitas sistem operasi. Misalnya, win 95 dan 98 memiliki program mixer dan utilitasnya sendiri untuk memutar/merekam suara, memutar CD, dan file MIDI standar. Setelah memasang kartu suara, Anda dapat menggunakan program ini untuk memeriksa fungsinya. Misalnya, program Phonograph dirancang untuk bekerja dengan file wave (file rekaman suara dalam format Windows). File-file ini memiliki ekstensi .WAV. Program ini memberikan kemampuan untuk memutar, merekam, dan mengedit rekaman suara menggunakan teknik yang serupa dengan yang digunakan pada tape recorder. Dianjurkan untuk menghubungkan mikrofon ke komputer untuk bekerja dengan Fonograf. Jika Anda perlu membuat rekaman suara, maka Anda perlu menentukan kualitas suaranya, karena durasi rekaman suara bergantung padanya. Semakin tinggi kualitas rekaman, semakin pendek kemungkinan durasi suara. Dengan kualitas rekaman rata-rata, Anda dapat merekam ucapan dengan memuaskan, membuat file berdurasi hingga 60 detik. Sekitar 6 detik akan menjadi durasi rekaman yang memiliki kualitas CD musik.

Bagaimana cara kerja pengkodean audio? Sejak kecil, kita telah mengenal rekaman musik di berbagai media: kaset, kaset, CD, dll. Saat ini, ada dua cara utama untuk merekam suara: analog dan digital. Namun untuk merekam suara pada media apapun, suara tersebut harus diubah menjadi sinyal listrik.

Ini dilakukan dengan menggunakan mikrofon. Mikrofon paling sederhana memiliki membran yang bergetar di bawah pengaruh gelombang suara. Sebuah kumparan dipasang pada membran, bergerak serentak dengan membran dalam medan magnet. Arus listrik bolak-balik terjadi pada kumparan. Perubahan tegangan secara akurat mencerminkan gelombang suara.

Arus listrik bolak-balik yang muncul pada keluaran mikrofon disebut analog sinyal. Ketika diterapkan pada sinyal listrik, “analog” berarti sinyal tersebut kontinu dalam waktu dan amplitudo. Ini secara akurat mencerminkan bentuk gelombang suara saat bergerak di udara.

Informasi audio dapat direpresentasikan dalam bentuk diskrit atau analog. Perbedaannya adalah bahwa dengan representasi informasi yang terpisah, besaran fisik berubah secara tiba-tiba (“tangga”), mengambil sekumpulan nilai yang terbatas. Jika informasi disajikan dalam bentuk analog, maka suatu besaran fisis dapat memiliki jumlah nilai tak terhingga yang terus berubah.

Piringan hitam adalah contoh penyimpanan analog informasi suara, karena trek suara terus berubah bentuknya. Namun rekaman analog pada pita magnetik memiliki kelemahan besar - penuaan media. Selama setahun, rekaman suara yang memiliki tingkat frekuensi tinggi normal mungkin kehilangan frekuensi tersebut. Rekaman vinil kehilangan kualitas beberapa kali saat diputar. Oleh karena itu, preferensi diberikan pada perekaman digital.

Pada awal tahun 80-an, compact disc muncul. Ini adalah contoh penyimpanan informasi audio yang terpisah, karena trek audio CD berisi area dengan reflektifitas yang berbeda-beda. Secara teori, cakram digital ini dapat bertahan selamanya jika tidak tergores, mis. keunggulannya adalah daya tahan dan ketahanan terhadap penuaan mekanis. Keunggulan lainnya adalah tidak ada penurunan kualitas suara saat melakukan dubbing secara digital.

Pada kartu suara multimedia Anda dapat menemukan preamp dan mixer mikrofon analog.

Konversi informasi audio digital-ke-analog dan analog-ke-digital.

Mari kita lihat secara singkat proses konversi suara dari analog ke digital dan sebaliknya. Memiliki gambaran kasar tentang apa yang terjadi di kartu suara Anda dapat membantu Anda menghindari beberapa kesalahan saat bekerja dengan audio.

Gelombang suara diubah menjadi sinyal listrik bolak-balik analog menggunakan mikrofon. Ia melewati jalur audio (lihat lampiran gambar 1.11, diagram 1) dan memasuki konverter analog-ke-digital (ADC) - perangkat yang mengubah sinyal menjadi bentuk digital.

Dalam bentuk yang disederhanakan, prinsip pengoperasian ADC adalah sebagai berikut: ia mengukur amplitudo sinyal pada interval tertentu dan mentransmisikan lebih lanjut, sepanjang jalur digital, serangkaian angka yang membawa informasi tentang perubahan amplitudo (lihat Lampiran Gambar 1.11, Skema 2 ).

Selama konversi analog-ke-digital, tidak ada konversi fisik yang terjadi. Seolah-olah sidik jari atau sampel diambil dari sinyal listrik, yang merupakan model digital fluktuasi tegangan pada jalur audio. Jika digambarkan dalam bentuk diagram, maka model ini disajikan sebagai rangkaian kolom, yang masing-masing sesuai dengan nilai numerik tertentu. Sinyal digital pada dasarnya bersifat diskrit - yaitu terputus-putus - sehingga model digital tidak sama persis dengan bentuk sinyal analog.

Sampel adalah interval waktu antara dua pengukuran amplitudo sinyal analog.

Sampel secara harfiah diterjemahkan dari bahasa Inggris sebagai “sampel”. Dalam terminologi multimedia dan audio profesional, kata ini memiliki beberapa arti. Selain jangka waktu, sampel juga disebut urutan data digital yang diperoleh melalui konversi analog-ke-digital. Proses transformasi itu sendiri disebut contoh. Dalam bahasa teknis Rusia mereka menyebutnya contoh.

Audio digital dikeluarkan menggunakan konverter digital-ke-analog (DAC), yang berdasarkan data digital yang masuk, menghasilkan sinyal listrik dengan amplitudo yang diperlukan pada waktu yang tepat (lihat lampiran gambar 1.11, diagram 3).

Pilihan contoh

Parameter penting contoh adalah frekuensi dan kedalaman bit.
Frekuensi- jumlah pengukuran amplitudo sinyal analog per detik.

Jika frekuensi sampling tidak lebih dari dua kali frekuensi batas atas jangkauan audio, maka kerugian akan terjadi pada frekuensi tinggi. Hal ini menjelaskan mengapa frekuensi standar untuk CD audio adalah 44,1 kHz. Karena rentang osilasi gelombang suara adalah dari 20 Hz hingga 20 kHz, jumlah pengukuran sinyal per detik harus lebih besar daripada jumlah osilasi dalam periode waktu yang sama. Jika frekuensi pengambilan sampel jauh lebih rendah daripada frekuensi gelombang suara, maka amplitudo sinyal memiliki waktu untuk berubah beberapa kali antara pengukuran, dan ini mengarah pada fakta bahwa sidik jari digital membawa kumpulan data yang kacau. Selama konversi digital ke analog, sampel tersebut tidak mengirimkan sinyal utama, tetapi hanya menghasilkan noise.

Dalam format Audio DVD baru, sinyal diukur 96.000 kali dalam satu detik, yaitu. Frekuensi sampling 96 kHz digunakan. Untuk menghemat ruang hard disk dalam aplikasi multimedia, frekuensi yang lebih rendah sering digunakan: 11, 22, 32 kHz. Hal ini menyebabkan penurunan rentang frekuensi suara, yang berarti terdapat distorsi yang kuat terhadap apa yang didengar.

Jika Anda membuat grafik suara yang sama pada 1 kHz (nada hingga oktaf ketujuh piano kira-kira sesuai dengan frekuensi ini), tetapi diambil sampelnya pada frekuensi yang berbeda (bagian bawah gelombang sinus tidak ditampilkan di semua grafik), maka perbedaannya akan terlihat. Satu pembagian pada sumbu horizontal, yang menunjukkan waktu, setara dengan 10 sampel. Skala yang diambil sama (lihat Lampiran Gambar 1.13). Anda dapat melihat bahwa pada 11 kHz terdapat sekitar lima osilasi gelombang suara untuk setiap 50 sampel, yang berarti satu periode gelombang sinus diwakili hanya dengan 10 nilai. Ini adalah rendering yang agak tidak akurat. Sementara itu, jika kita memperhitungkan frekuensi digitalisasi 44 kHz, maka untuk setiap periode sinusoidal sudah terdapat hampir 50 sampel. Ini memungkinkan Anda mendapatkan sinyal berkualitas baik.

Kedalaman sedikit menunjukkan dengan akurasi berapa perubahan amplitudo sinyal analog terjadi. Keakuratan nilai amplitudo sinyal pada setiap waktu yang ditransmisikan selama digitalisasi menentukan kualitas sinyal setelah konversi digital ke analog. Keandalan rekonstruksi bentuk gelombang bergantung pada kedalaman bit.

Untuk mengkodekan nilai amplitudo digunakan prinsip pengkodean biner. Sinyal suara harus direpresentasikan sebagai rangkaian pulsa listrik (biner nol dan satu). Biasanya, representasi nilai amplitudo 8, 16-bit, atau 20-bit digunakan. Saat mengkodekan sinyal audio kontinu secara biner, sinyal tersebut digantikan oleh urutan level sinyal diskrit. Kualitas pengkodean tergantung pada frekuensi sampling (jumlah pengukuran level sinyal per satuan waktu). Ketika frekuensi pengambilan sampel meningkat, keakuratan representasi informasi biner meningkat. Pada frekuensi 8 kHz (jumlah sampel per detik 8000), kualitas sinyal audio sampel sesuai dengan kualitas siaran radio, dan pada frekuensi 48 kHz (jumlah sampel per detik 48000) - kualitas suara dari CD audio.

Jika Anda menggunakan pengkodean 8-bit, Anda dapat mencapai akurasi amplitudo sinyal analog hingga 1/256 rentang dinamis perangkat digital (2 8 = 256).

Jika Anda menggunakan pengkodean 16-bit untuk mewakili nilai amplitudo sinyal audio, akurasi pengukuran akan meningkat 256 kali lipat.

Konverter modern biasanya menggunakan pengkodean sinyal 20-bit, yang memungkinkan digitalisasi audio berkualitas tinggi.

Mari kita ingat rumus K = 2 a. Di sini K adalah jumlah semua kemungkinan suara (jumlah level atau status sinyal berbeda) yang dapat diperoleh dengan menyandikan suara dengan bit

Pengkodean terdiri dari pemberian kode desimal unik untuk setiap karakter dari 0 hingga 255 atau kode biner yang sesuai dari 00000000 hingga 11111111. Jumlah karakter dalam alfabet adalah kekuatannya. Setiap jenis menggunakan metode pengkodean informasi grafisnya sendiri. Secara kronologis, salah satu standar pertama untuk pengkodean huruf Rusia di komputer adalah KOI8 (“Kode Pertukaran Informasi, 8-bit”).

Ya, jangan heran: ruang kosong di teks juga harus memiliki sebutan tersendiri. Kumpulan simbol yang digunakan untuk menulis teks disebut alfabet. Kode biner setiap karakter dalam teks komputer membutuhkan 1 byte memori. Teks dimasukkan ke dalam memori komputer menggunakan keyboard.

Di sisi lain, 256 karakter merupakan jumlah yang cukup untuk mewakili beragam informasi simbolik. Kode ini hanyalah nomor seri karakter dalam sistem bilangan biner. Hanya paruh pertama tabel yang merupakan standar internasional, yaitu karakter dengan angka dari 0 (00000000), hingga 127 (01111111).

Pengkodean informasi teks

Harap dicatat bahwa dalam tabel pengkodean, huruf (huruf besar dan kecil) disusun menurut abjad, dan angka diurutkan dalam urutan menaik. Untuk huruf alfabet Rusia, prinsip pengkodean berurutan juga diperhatikan. Sayangnya, saat ini terdapat lima pengkodean Cyrillic yang berbeda (KOI8-R, Windows.MS-DOS, Macintosh dan ISO). Oleh karena itu, sering kali timbul masalah saat mentransfer teks bahasa Rusia dari satu komputer ke komputer lain, dari satu sistem perangkat lunak ke sistem perangkat lunak lainnya.

Pengkodean informasi di komputer

Selain itu, Organisasi Standar Internasional (ISO) telah menyetujui pengkodean lain yang disebut ISO 8859-5 sebagai standar untuk bahasa Rusia. Pengkodean yang paling umum digunakan saat ini adalah Microsoft Windows, disingkat CP1251. Sejak akhir tahun 90an, masalah standarisasi pengkodean karakter telah diselesaikan dengan diperkenalkannya standar internasional baru yang disebut Unicode.

Tentu saja, ini meningkatkan jumlah memori yang digunakan sebanyak 2 kali lipat. Namun tabel kode seperti itu memungkinkan penyertaan hingga 65536 karakter. Spesifikasi lengkap standar Unicode mencakup semua alfabet dunia yang ada, punah, dan dibuat secara artifisial, serta banyak simbol matematika, musik, kimia, dan lainnya.

Kadang-kadang teks yang terdiri dari huruf-huruf alfabet Rusia yang diterima dari komputer lain tidak dapat dibaca - semacam "abracadabra" terlihat di layar monitor. Komputer modern dapat memproses informasi numerik, teks, grafik, suara dan video. Ini dapat direpresentasikan secara visual sebagai bagian dari tabel pengkodean karakter gabungan.

Namun, dalam banyak kasus, pengguna mengurus transcoding dokumen teks, dan program khusus adalah konverter yang dibangun ke dalam aplikasi.

Untuk menentukan kode numerik suatu karakter dalam pengkodean Windows (CP1251), Anda perlu menggunakan tombol mouse atau kursor untuk memilih karakter yang diinginkan, lalu klik tombol Kunci.

Saya = 1/512*1024*1024*8 = 16384 bit. — mengubah volume informasi pesan menjadi bit. Pada pertengahan tahun 50-an, untuk pertama kalinya, representasi data diimplementasikan dalam bentuk grafik untuk komputer besar yang digunakan dalam penelitian ilmiah dan militer. Dengan memisahkan suatu gambar grafik (sampling), informasi grafik diubah dari bentuk analog menjadi bentuk diskrit.

Semakin kecil ukuran titik, yang berarti gambar terdiri dari lebih banyak titik, semakin tinggi kualitas pengkodeannya. Pembuatan dan penyimpanan objek grafis dimungkinkan dalam beberapa jenis - dalam bentuk gambar vektor, fraktal, atau raster. Subjek terpisah adalah grafik 3D (tiga dimensi), yang menggabungkan metode pembentukan gambar vektor dan raster. Ia mempelajari metode dan teknik membangun model objek tiga dimensi di ruang virtual.

Semakin tinggi, yaitu semakin banyak jumlah garis raster dan titik per baris, semakin tinggi kualitas gambarnya. Hal ini terjadi sebagai hasil analisis fluks cahaya yang masuk ke retina dari benda yang dipantulkan atau dipancarkan.

Bagaimana informasi teks direpresentasikan dalam memori komputer?

Contoh benda jenis pertama adalah tabung sinar katoda monitor, dan contoh jenis kedua adalah cetakan percetakan. Model warna ini paling baik digunakan di editor grafis tempat mereka membuat gambar sendiri, dan tidak memproses gambar yang sudah jadi. Arah vektor ditentukan dalam derajat sudut dan menentukan corak warna.

Representasi internal kata-kata dalam memori komputer

Setiap warna primer dikaitkan dengan warna tambahan (melengkapi warna utama menjadi putih). Metode ini terutama diadopsi dalam percetakan. Ini cukup dekat dengan sensitivitas mata manusia. Saat pengkodean menggunakan sistem CMYK, untuk merepresentasikan grafik berwarna Anda harus memiliki 8*4=32 bit biner.

Mari kita coba menggunakan tabel ASCII untuk membayangkan seperti apa kata-kata yang ada di memori komputer.

Kode titik raster itu sendiri dalam hal ini bukan berarti warna itu sendiri, melainkan hanya nomornya (indeks) pada palet. Kode biner dari gambar yang ditampilkan di layar disimpan dalam memori video. Informasi tentang gambar vektor dikodekan sebagai alfanumerik biasa dan diproses oleh program khusus. Namun berbeda dengan vektor, unsur dasarnya adalah rumus matematika itu sendiri.

Subjek: Teks dalam memori komputer

Tujuan pelajaran. Perkenalkan siswa pada cara merepresentasikan dan mengatur teks dalam memori komputer.

Pertanyaan yang dipelajari:

1 Keuntungan penyimpanan file teks.

2 Pengkodean teks.

3 Tabel pengkodean, ASCII standar internasional.

Literatur: I. Semakin dan lain-lain.Ilmu Komputer. Kursus dasar 7 – 9.

Selama kelas:

Waktu pengorganisasian

Penjelasan materi baru

Subjek pelajaran hari ini: " Teks dalam memori komputer"

Target pelajaran: menjadi akrab dengan cara merepresentasikan dan mengatur teks dalam memori komputer.

Komputer dapat bekerja dengan empat jenis informasi: teks, grafik, numerik, dan suara. Salah satu aplikasi komputer yang paling luas adalah bekerja dengan teks: membuat dokumen teks dan menyimpannya pada media magnetik dalam bentuk file.

Mengapa bekerja dengan informasi pengujian di komputer menjadi begitu luas?

Mengapa dalam waktu yang sangat singkat (10-15 tahun) di hampir semua perusahaan dan organisasi, termasuk sekolah kita, mesin tik digantikan oleh komputer?

Untuk menjawab pertanyaan-pertanyaan ini, mari kita perhatikan perbedaan antara memproses dan menyimpan teks saat menulis secara manual dan saat membuat teks di komputer.

Aktifkan slide Pemrosesan dan penyimpanan teks presentasi Pengkodean teks

Keuntungan penyimpanan file teks:

1) menghemat kertas;

2) penempatan kompak;

3) kemampuan untuk menggunakan kembali media magnetik untuk menyimpan dokumen yang berbeda;

4) kemampuan untuk menyalin dengan cepat ke media magnetik lainnya;

5) kemampuan untuk mengirimkan teks melalui jalur komunikasi komputer.

Perbedaan paling mencolok antara teks komputer dan teks kertas adalah informasi di dalamnya disusun menurut prinsip hypertext. Hiperteks adalah cara mengatur informasi tekstual di mana hubungan semantik (hiperkoneksi) terjalin antara berbagai fragmennya. Anda telah menemukan hypertext saat bekerja dengan sistem bantuan Windows.

Kadang-kadang teks yang terdiri dari huruf-huruf alfabet Rusia yang diterima dari komputer lain tidak dapat dibaca - semacam "abrakadabra" terlihat di layar monitor.

Teman-teman, menurut Anda mengapa hal ini terjadi?

Anda belum mempunyai jawaban yang pasti. Di akhir pelajaran kami akan mencoba menjawab pertanyaan ini lagi.

Dari sudut pandang komputer teks adalah urutan karakter apa pun dari alfabet komputer. Sama sekali tidak perlu teks dalam salah satu bahasa alami (Rusia, Inggris, dll.). Ini bisa berupa rumus matematika atau kimia, nomor telepon, tabel numerik. Yang paling penting adalah semua karakter yang digunakan disertakan alfabet komputer .

Aktifkan slide Alfabet komputer presentasi Pengkodean teks

Untuk merepresentasikan informasi dalam komputer digunakan alfabet dengan kapasitas 256 karakter.

Berapa bobot informasi dari satu karakter alfabet tersebut?

Mari kita ingat rumus yang menghubungkan bobot informasi simbol alfabet dan kekuatan alfabet: 2i = N

Jika pangkat alfabet adalah 256, maka i = 8, sehingga satu karakter membawa 8 bit informasi.

Setiap informasi direpresentasikan dalam memori komputer dalam bentuk biner, yang berarti setiap karakter diwakili oleh kode biner 8-bit.

8 bit = 1 byte, jadi Kode biner setiap karakter dalam teks komputer membutuhkan 1 byte memori.

Kenyamanan pengkodean karakter byte demi byte terlihat jelas karena byte adalah bagian terkecil dari memori yang dapat dialamatkan dan, oleh karena itu, prosesor dapat mengakses setiap karakter secara terpisah saat memproses teks. Di sisi lain, 256 karakter merupakan jumlah yang cukup untuk mewakili beragam informasi simbolik.

Sekarang muncul pertanyaan, kode biner delapan bit mana yang harus ditetapkan ke setiap karakter. Jelas bahwa ini adalah masalah bersyarat, Anda dapat menemukan banyak metode pengkodean.

Semua karakter alfabet komputer diberi nomor dari 0 hingga 255. Setiap angka sesuai dengan kode biner delapan bit dari hingga. Kode ini hanyalah nomor seri karakter dalam sistem bilangan biner.

Sebuah tabel di mana semua karakter alfabet komputer diberi nomor seri disebut tabel pengkodean.

Standar internasional untuk PC telah menjadi tabel ASCII (baca bertanya) (Kode Standar Amerika untuk Pertukaran Informasi). Dalam praktiknya, Anda dapat menemukan tabel lain - KOI-8 (Kode Pertukaran Informasi), yang digunakan dalam jaringan komputer global.

Mari kita lihat tabel kode ASCII (buku teks, hal. 75).

Aktifkan slide Pengkodean karakter presentasi Pengkodean teks

Tabel kode ASCII dibagi menjadi dua bagian.

Standar internasional hanya paruh pertama tabel, yaitu karakter dengan angka dari 0 (), hingga. Ini termasuk huruf kecil dan besar dari alfabet Latin, angka desimal, tanda baca, semua jenis tanda kurung, komersial dan lainnya simbol.

Karakter dengan angka dari 0 hingga 31 biasanya dipanggil manajer. Fungsinya untuk mengontrol proses menampilkan teks di layar atau mencetak, membunyikan sinyal suara, menandai teks, dll.

Karakter 32 adalah spasi, yaitu posisi kosong dalam teks. Segala sesuatu yang lain tercermin dalam tanda-tanda tertentu.

Saya menarik perhatian Anda pada fakta itu dalam tabel pengkodean, huruf (huruf besar dan kecil) disusun menurut abjad, dan angka diurutkan dalam urutan menaik. Ketaatan pada tatanan leksikografis dalam susunan karakter disebut prinsip pengkodean alfabet berurutan.

Paruh kedua dari kumpulan karakter ASCII, disebut halaman kode(128 kode, mulai dari dan berakhir), dapat memiliki pilihan yang berbeda-beda, setiap pilihan memiliki nomornya sendiri.

Halaman kode terutama digunakan untuk mengakomodasi alfabet nasional selain Latin. Dalam pengkodean nasional Rusia, karakter dari alfabet Rusia ditempatkan di bagian tabel ini. Untuk huruf alfabet Rusia, prinsip pengkodean berurutan juga diperhatikan.

Sayangnya, saat ini ada lima pengkodean berbeda Alfabet Sirilik(KOI8-R, Windows.MS-DOS, Macintosh dan ISO). Oleh karena itu, sering kali timbul masalah saat mentransfer teks bahasa Rusia dari satu komputer ke komputer lain, dari satu sistem perangkat lunak ke sistem perangkat lunak lainnya.

Secara kronologis, salah satu standar pertama untuk pengkodean huruf Rusia di komputer adalah KOI8 ("Kode pertukaran informasi, 8-bit"). Pengkodean ini digunakan pada tahun 70-an pada komputer seri komputer ES, dan sejak pertengahan tahun 80-an mulai digunakan pada versi Russified pertama dari sistem operasi UNIX.

Sejak awal tahun 90an, saat dominasi sistem operasi MS DOS, pengkodean CP866 tetap ada ("CP" adalah singkatan dari "Halaman Kode").

Komputer Apple yang menjalankan sistem operasi Mac OS menggunakan pengkodean Mac mereka sendiri.

Selain itu, Organisasi Internasional untuk Standardisasi (Organisasi Standar Internasional, ISO) menyetujui pengkodean lain yang disebut ISO 8859-5 sebagai standar untuk bahasa Rusia.

Pengkodean yang paling umum digunakan saat ini adalah Microsoft Windows, disingkat CP1251.

Sejak akhir tahun 90an, masalah standarisasi pengkodean karakter telah diselesaikan dengan diperkenalkannya standar internasional baru yang disebut Unicode. Ini adalah pengkodean 16-bit, yaitu mengalokasikan 2 byte memori untuk setiap karakter. Tentu saja, ini meningkatkan jumlah memori yang digunakan sebanyak 2 kali lipat. Namun tabel kode seperti itu memungkinkan penyertaan hingga 65536 karakter. Spesifikasi lengkap standar Unicode mencakup semua alfabet dunia yang ada, punah, dan dibuat secara artifisial, serta banyak simbol matematika, musik, kimia, dan lainnya.

Teman-teman, pertanyaan apa yang Anda miliki tentang topik pelajaran?

Sekarang mari kita coba lagi menjawab pertanyaan yang diajukan di awal pelajaran:

Mengapa terkadang kita melihat teks yang terdiri dari huruf-huruf alfabet Rusia, yang diterima dari komputer lain, di komputer kita dalam bentuk “abracadabra”?

Respons yang diharapkan . Komputer menggunakan pengkodean karakter berbeda untuk bahasa Rusia.

Sekarang kita akan memecahkan beberapa contoh.

Contoh 1. Berapa bit memori komputer yang ditempati oleh kata MICROPROCESSOR?

Sebelum kita mulai memecahkan contohnya, ingatlah

Berapa banyak memori yang digunakan oleh satu karakter teks komputer?

Respons yang diharapkan . 1 byte

Larutan . Kata tersebut terdiri dari 14 huruf. Setiap huruf adalah simbol alfabet komputer dan karenanya memakan 1 byte memori. Sebuah kata akan membutuhkan 14 byte = 112 bit memori, karena 1 byte = 8 bit.

Apa prinsip pengkodean alfabet berurutan?

Respons yang diharapkan . Dalam tabel pengkodean, huruf (huruf besar dan kecil) disusun menurut abjad, dan angka diurutkan dalam urutan menaik.

Mengetahui prinsip pengkodean sekuensial memungkinkan kita untuk memecahkan beberapa masalah tanpa menggunakan tabel pengkodean karakter.

Contoh 2. Yang dienkripsi dengan rangkaian kode desimal: jika hurufnya Saya di tabel pengkodean karakter memiliki kode desimal 105?

Larutan. Mari kita ingat urutan huruf dalam alfabet Latin - ... i, j, k, l, m, n, o .... Huruf j akan memiliki kode 106, k - kode 107 dan i. d.Oleh karena itu, kata tersebut dikodekan tautan.

Apa arti istilah "halaman kode"?

Respons yang diharapkan . Ini adalah nama paruh kedua tabel kode ASCII, yang dirancang untuk mengakomodasi alfabet nasional selain Latin.

Apakah prinsip pengkodean sekuensial diamati di halaman kode?

Respons yang diharapkan . Dipatuhi

Mari kita cari tahu dengan menyelesaikan contoh berikut.

Contoh 3. Menggunakan urutan kode desimal: sebuah kata dienkripsi sedikit. Temukan urutan kode desimal dari kata yang sama, yang ditulis dengan huruf kapital.

Larutan. Saat menyelesaikannya, kami memperhitungkan bahwa perbedaan antara kode desimal huruf Sirilik kecil dan kode desimal huruf kapital yang sesuai adalah 32. Jika huruf B sesuai dengan kode 225, huruf kapital B memiliki kode desimal 225-32=193. Oleh karena itu, kata BIT sesuai dengan urutan kode:

4. Jumlah RAM komputer yang kosong adalah 640 KB. Berapa halaman sebuah buku yang dapat ditampung jika halaman tersebut memiliki 16 baris dengan 64 karakter per baris?

Jawaban:(640´ 1024)/(16 ´ 64)=640 hal.

5. Teks menempati 10 sektor penuh pada floppy disk satu sisi dengan kapasitas 180 KB. Floppy disk dibagi menjadi 40 track dari 9 sektor. Berapa banyak karakter yang terkandung dalam teks tersebut?

Jawaban:((180´ 1024)/(40 ´ 9)) ´ 10=5120 karakter

Menyimpulkan pelajaran