KomputerPengaturcaraan

Kod ASCII (Kod standard Amerika untuk pertukaran maklumat) - pengekodan teks asas untuk huruf Latin

Menurut Kesatuan Telekomunikasi Antarabangsa, pada 2016 Internet dengan lebih atau kurang kerap menggunakan tiga setengah bilion orang. Kebanyakan mereka tidak terfikir bahawa apa-apa mesej yang dihantar kepada mereka melalui PC atau alat mudah alih, serta teks yang dipaparkan pada monitor semua jenis, sebenarnya, adalah gabungan 0 dan 1. Ini dipanggil perwakilan dikodkan maklumat. Ia menyediakan dan membantu pelaksanaan penyimpanan, pemprosesan dan penghantaran. Pada tahun 1963, kod ASCII US telah dibangunkan, yang menjadi subjek artikel ini.

Pembentangan maklumat dalam komputer

Dari segi mana-mana teks komputer elektronik adalah koleksi aksara individu. Antaranya bukan sahaja surat itu, termasuk ibu negara, tetapi juga tanda baca, nombor. Di samping itu, simbol khas digunakan "=", "&", "(" dan ruang.

A kemajmukan simbol yang membentuk teks, yang dipanggil abjad, dan jumlah - kuasa (ditandakan sebagai N). Untuk menentukan ungkapan N = 2 ^ b, di mana b - bilangan bit maklumat atau berat simbol tertentu.

Ia membuktikan bahawa kuasa 256 aksara abjad membolehkan anda untuk menghantar semua watak-watak perlu.

Sejak 256 adalah 8 darjah dua, maka berat setiap watak adalah 8 bit.

Unit ukuran 8 bit yang dipanggil 1 bait, jadi kita katakan bahawa kod perduaan bagi mana-mana watak dalam teks yang disimpan pada komputer anda, menduduki satu bait memori.

Bagaimana pengekodan

Sebarang teks yang dimasukkan dalam memori PC melalui kekunci papan kekunci, nombor pada yang telah ditulis, huruf, tanda baca dan simbol-simbol lain. Dalam ingatan mereka dihantar dalam kod binari, iaitu, setiap simbol dipetakan kepada kod perpuluhan yang biasa bagi seseorang 0-255, yang sepadan dengan kod binari - .. Dari 00.000.000-11.111.111.

pengekodan aksara bait membolehkan pemproses menjalankan pemprosesan teks, merujuk kepada setiap watak secara berasingan. Pada masa yang sama, 256 aksara cukup untuk mewakili mana-mana maklumat watak.

Pengekodan aksara ASCII

singkatan ini bermaksud kod standard bahasa Inggeris Amerika untuk pertukaran maklumat.

Walaupun pada awal pengkomputeran, ia menjadi jelas bahawa ia adalah mungkin untuk datang dengan pelbagai cara pengekodan maklumat. Walau bagaimanapun, untuk memindahkan maklumat dari satu komputer kepada yang lain diperlukan untuk membangunkan satu standard. Jadi, pada tahun 1963 terdapat ASCII meja di Amerika Syarikat. Apa-apa abjad komputer watak diberikan nombor urutan dalam perwakilan binari. Pada mulanya, kod ASCII hanya digunakan di Amerika Syarikat, dan kemudian menjadi standard antarabangsa untuk PC.

jadual kandungan

Kod ASCII dibahagikan kepada 2 bahagian. standard antarabangsa dianggap hanya separuh pertama liga. Ia termasuk kod dari urutan nombor 0 (dikodkan sebagai 00000000) kepada 127 (kod 01.111.111).

nombor siri

N

Pengekodan teks ASCII

simbol

0-31

0000 0000 - 0001 1111

Aksara dengan N 0-31 dipanggil pengurus. Fungsi mereka adalah untuk "panduan" proses output teks kepada monitor atau percetakan peranti, bunyi bip, dan lain-lain

32-127

0010 0000 - 0111 1111

Simbol-simbol dengan N 32-127 (sebahagian standard jadual) - huruf besar dan huruf kecil abjad Latin, nombor 10-nye, tanda baca, dan pelbagai kurungan, perdagangan dan watak-watak lain .. Simbol 32 menunjukkan ruang.

128-255

1000 0000 - 1111 1111

Simbol-simbol dengan N 128-255 (merupakan sebahagian alternatif meja atau kod halaman) boleh mempunyai pelbagai pilihan, setiap yang mempunyai nombor sendiri. Laman kod yang digunakan untuk menetapkan huruf kebangsaan, yang berbeza dari bahasa Latin. Khususnya, ia dijalankan dengan bantuan kod ASCII bagi aksara Rusia.

Jadual pengekodan huruf besar dan huruf kecil mengikuti antara satu sama lain dalam usaha dan nombor abjad - nilai menaik. Prinsip ini berlaku untuk abjad Rusia.

aksara kawalan

Rajah pengekodan ASCII pada asalnya direka untuk penerimaan dan penghantaran maklumat di halaman tidak lagi digunakan oleh peranti sebagai teletaip a. Dalam hal ini, set aksara tak cetak termasuk digunakan sebagai arahan untuk mengawal peranti. arahan seperti telah digunakan dalam teknik pesanan pra-komputer itu seperti kod Morse, dan sebagainya.

Yang paling biasa "teletaip" simbol adalah NUL (00 "sifar"). Dia masih digunakan dalam kebanyakan bahasa pengaturcaraan, yang menunjukkan tanda-tanda akhir barisan.

Mana pengekodan ASCII digunakan

Amerika Kod Standard memerlukan bukan sahaja papan kekunci entri teks. Ia juga digunakan dalam carta. Khususnya, Art ASCII imej program Maker mewakili berbeza sambungan spektrum pengekodan aksara ASCII.

Produk-produk ini datang dalam dua jenis: editor grafik melaksanakan fungsi dengan menukar imej ke dalam teks dan menukarkan "Gambar" dalam ASCII grafik. Sebagai contoh, yang dikenali adalah contoh utama Smiley simbol Coding.

ASCII boleh digunakan semasa membuat HTML dokumen itu. Dalam kes ini, anda boleh memasukkan satu set huruf dan simbol yang sepadan dengan kod ini akan muncul apabila melihat halaman pada skrin.

ASCII diperlukan untuk mencipta laman web pelbagai bahasa, sebagai tanda-tanda yang tidak tergolong dalam jadual tertentu negara, digantikan oleh ASCII-kod.

beberapa ciri-ciri

Untuk mengekod maklumat teks dalam ASCII pada asalnya digunakan 7 bit (satu kekal kosong), tetapi hari ini dia bekerja sebagai 8-bit.

Huruf, yang terletak di ruangan yang di atas dan di bawah, berbeza antara satu sama lain hanya dengan sedikit tunggal. Ini mengurangkan kerumitan ujian.

permohonan ASCII dalam Office Microsoft

Jika perlu, jenis maklumat pengekodan teks boleh digunakan dalam editor teks dengan Microsoft, seperti Notepad, dan Office Word. Walau bagaimanapun, apabila menaip dalam kes ini, anda tidak boleh menggunakan sesetengah fungsi. Sebagai contoh, anda tidak akan dapat untuk menjalankan berani sebagai watak ASCII mengekalkan hanya maksud maklumat, mengabaikan bentuk keseluruhan dan bentuk.

standardisasi

organisasi yang diguna pakai ISO standard ISO 8859. Kumpulan ini mentakrifkan pengekodan lapan-bit untuk kumpulan bahasa yang berbeza. Khususnya, ISO 8859-1 - adalah ASCII Lanjutan, yang adalah jadual untuk Amerika Syarikat dan Eropah Barat. A ISO 8859-5 - adalah jadual yang digunakan untuk abjad Cyrillic, termasuk bahasa Rusia.

Atas sebab-sebab sejarah untuk ISO 8859-5 ia digunakan untuk masa yang singkat.

Untuk bahasa Rusia pada masa pengekodan sebenarnya digunakan:

  • CP866 (Kod Page 866), atau DOS, yang sering dipanggil alternatif pengekodan GOST. Ia telah digunakan secara aktif sehingga pertengahan 90-ies abad yang lalu. Pada masa ini, hampir tidak pernah digunakan.
  • KOI-8. Pengekodan telah dibangunkan dalam 1970-80s, dan pada masa ini ia adalah satu standard biasa untuk mesej e-mel dalam RuNet. Ia digunakan secara meluas dalam keluarga OS Unix, termasuk Linux. "Rusia" versi KOI-8, yang dipanggil KOI-8R. Di samping itu, terdapat versi untuk bahasa Cyrillic lain seperti Ukraine.
  • Kod Page 1251 (CP 1251, Windows - 1251). Dibangunkan oleh Microsoft untuk memberi sokongan kepada bahasa Rusia dalam persekitaran Windows.

Kelebihan utama CP866 standard pertama adalah untuk mengekalkan watak-watak pseudo-grafik dalam kedudukan yang sama seperti dalam ASCII Extended. Ini membolehkan anda untuk menjalankan teks berubah program ini, pengeluaran asing, seperti Norton Commander yang terkenal. Pada ketika ini CP866 digunakan untuk program yang direka untuk Windows, yang beroperasi di paparan teks skrin penuh atau dalam kotak teks, termasuk dalam Pengurus FAR.

teks komputer ditulis dalam CP866 pengekodan, akhir-akhir ini agak jarang berlaku, tetapi ia digunakan untuk nama fail Rusia di "Vindous".

"Unicode"

Pada masa ini, yang paling meluas adalah pengekodan ini. Kod "Unicode" di atas padang. Pertama (dari 0000 hingga U + U + 007F) termasuk satu set aksara ASCII dengan kod. Diikuti oleh watak-watak bidang kesusasteraan yang berbeza negara, serta tanda baca dan simbol teknikal. Di samping itu, sebahagian daripada kod "Unicode" dikhaskan dalam kes keperluan untuk memasukkan watak-watak baru pada masa hadapan.

Sekarang anda tahu bahawa dalam ASCII setiap aksara diwakili sebagai gabungan 8 sifar dan satu. Orang biasa, maklumat ini mungkin kelihatan tidak perlu dan tidak menarik, tetapi anda tidak mahu tahu apa yang sedang berlaku "di dalam otak" komputer anda!

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 ms.birmiss.com. Theme powered by WordPress.