KomputerTeknologi maklumat

Pendekatan yang bermakna dan abjad untuk mengukur maklumat

Perkembangan teknologi komputer dalam era maklumat baru menimbulkan banyak soalan tambahan, membuka peluang dan pengetahuan baru. Tetapi dengan ini, terdapat banyak dilema yang perlu diselesaikan. Sebagai contoh, ketika mempelajari perkakasan komputer, penting untuk memahami bagaimana ia memproses, mengingati dan memindahkan fail, apakah pengekodan data dan maklumat format apa yang diukur. Tetapi subjek utama perbincangan adalah persoalan mengenai pendekatan utama untuk mengukur maklumat. Contoh dan penjelasan setiap aspek akan diterangkan secara terperinci dalam artikel ini.

Maklumat dalam Sains Komputer

Untuk mula memahami pendekatan maklumat pada penyimpanan data, pertama sekali perlu untuk mengetahui apa bidang maklumat mewakili dalam lingkungan komputer dan apa yang ditunjukkan. Lagipun, jika kita mengambil sains komputer sebagai sains, maka objek utama kajiannya adalah maklumat. Perkataan asal Latin dan penterjemahan dalam bahasa kami bermaksud "kenalan", "penjelasan", "pencampuran". Setiap sains menggunakan definisi konsep yang berbeza. Di dalam bidang komputer, ini semua maklumat tentang pelbagai fenomena dan objek yang mengelilingi kita, yang mengurangkan ukuran ketidakpastian dan tahap ketidaktahuan kita terhadap mereka. Tetapi, untuk menyimpan semua fail, data, simbol dalam komputer elektronik, perlu mengetahui algoritma untuk terjemahannya dalam bentuk binari dan unit sedia ada untuk mengukur jumlah data. Pendekatan abjad untuk mengukur maklumat menunjukkan bagaimana mesin komputer menukarkan simbol ke dalam kod biner nol dan yang.

Maklumat Pengekodan oleh Komputer Elektronik

Teknologi komputer dapat mengenali, memproses, menyimpan dan menghantar hanya data maklumat dalam kod perduaan. Tetapi jika ia rakaman audio, teks, video, imej grafik, bagaimana mesin boleh menukar jenis data yang berlainan ke dalam jenis binari? Dan bagaimanakah mereka dalam bentuk ini disimpan dalam ingatan? Soalan-soalan ini boleh dijawab jika anda tahu pendekatan abjad untuk menentukan jumlah maklumat, aspek kandungan dan intipati teknikal pengekodan.

Pengekodan maklumat adalah untuk menyulitkan aksara dalam kod perduaan yang mengandungi tanda-tanda "0" dan "1". Secara teknikalnya mudah untuk diatur. Isyarat ialah, jika terdapat satu, nol menunjukkan sebaliknya. Ada yang tertanya-tanya kenapa komputer tidak boleh, seperti otak manusia, menyimpan nombor kompleks, kerana saiznya lebih kecil. Tetapi pengkomputeran elektronik lebih mudah dikendalikan dengan kod binari yang besar, daripada menyimpan nombor rumit dalam ingatan anda.

Sistem Kalkulus Komputer

Kami digunakan untuk mengira dari 1 hingga 10, tambah, tolak, berganda dan melakukan pelbagai operasi pada nombor. Komputer ini hanya boleh beroperasi dengan dua nombor. Tetapi adakah ia dalam pecahan milisaat. Bagaimanakah mesin komputer menyandi dan menyahkod aksara? Ini adalah algoritma yang agak mudah, yang boleh dipertimbangkan untuk contoh. Pendekatan alfabetis untuk mengukur maklumat, unit pengukuran data, kami akan mempertimbangkan sedikit kemudian, selepas intipati pengekodan dan penyahkodan data menjadi jelas.

Terdapat banyak program komputer yang secara visual menerjemahkan sistem kalkulus atau rentetan teks ke dalam kod binari dan sebaliknya.

Kami akan menjalankan pengiraan secara manual. Pengekodan maklumat dibuat oleh pembahagian biasa oleh 2. Jadi, katakan kami mempunyai nombor perpuluhan sebanyak 217. Kita perlu mengubahnya menjadi kod binari. Untuk melakukan ini, bahagikannya dengan nombor 2 hingga selebihnya adalah sifar atau satu.

  • 217/2 = 108 dengan bakinya 1. Secara berasingan, kita menuliskan jenazah, dan mereka akan membuat jawapan terakhir kami.
  • 108/2 = 54. Di sini sisanya adalah bilangan 0, sejak 108 dibahagikan sepenuhnya. Jangan lupa untuk menandai diri anda dengan sisa makanan. Lagipun, jika anda kehilangan sekurang-kurangnya satu nombor, nombor asal akan berbeza.
  • 54/2 = 27, selebihnya ialah 0.
  • 27/2 = 13, tulis 1 kepada bakinya. Nombor kami dari sisanya membuat kod binari, yang mesti dibaca dalam susunan terbalik.
  • 13/2 = 6. Di sini unit berada dalam bakinya, kami menulisnya.
  • 6/2 = 3 dengan baki 0. Dalam jawapan terakhir, nombor-nombor itu harus satu lagi daripada semua tindakan yang anda lakukan.
  • 3/2 = 1 dengan baki 1. Kami menuliskan baki dan angka 1, yang merupakan bahagian terakhir.

Jika anda memformat jawapannya, bermula dengan nombor dalam tindakan pertama, hasilnya adalah 10011011, tetapi ini tidak betul. Nombor binari mesti ditulis semula dalam urutan terbalik. Berikut adalah hasil terakhir terjemahan nombor: 11011001. Pendekatan yang bermakna dan abjad untuk mengukur maklumat menggunakan data yang betul-betul format ini untuk penyimpanan dan penghantaran. Kod binari ditulis pada jadual kod dan disimpan di sana sehingga anda perlu memaparkannya pada skrin monitor. Kemudian, maklumat itu diterjemahkan ke dalam bentuk yang biasa, yang disebut decoding.

Gambar jelas menunjukkan algoritma untuk menerjemahkan dari binari ke perpuluhan. Ia dijalankan dengan formula mudah. Kod pertama kod tersebut didarab dengan 2 hingga kuasa 0, kita tambahkannya digit seterusnya didarab dengan 2 ke tahap yang lebih besar, dan sebagainya. Akibatnya, seperti yang dapat dilihat dari gambar, kita mendapat nombor yang sama dengan yang asal apabila pengekodan.

Pendekatan abjad untuk mengukur maklumat: intipati, unit

Untuk mengukur jumlah data dalam urutan teks aksara, anda perlu menggunakan pendekatan yang sedia ada. Kandungan teks tidak penting di sini, perkara utama adalah korelasi kuantitatif tanda-tanda. Disebabkan aspek ini, nilai mesej teks yang dikodkan pada komputer dikira. Selaras dengan pendekatan ini, nilai kuantitatif teks adalah berkadar dengan bilangan aksara yang dimasukkan dari papan kekunci. Oleh kerana kaedah ini mengukur jumlah maklumat sering disebut volumetrik. Simbol-simbol boleh agak berbeza dalam magnitud. Adalah jelas bahawa angka seperti 0 dan 1 membawa 1 bit maklumat, dan huruf, tanda baca, ruang - berat lain. Anda boleh melihat jadual ASCII untuk mengetahui kod perduaan watak tertentu. Untuk mengira jumlah teks yang diperlukan, anda perlu menambah berat semua tanda - bahagian konstituen keseluruhan teks. Ini adalah pendekatan abjad untuk menentukan jumlah maklumat.

Dalam sains komputer, terdapat banyak istilah yang semakin banyak digunakan dalam kehidupan seharian. Jadi, abjad dalam sains komputer bermaksud satu set semua simbol, termasuk kurungan, ruang, tanda baca, simbol Cyrillic, aksara Latin, yang tidak lain hanyalah komponen teks. Di sini terdapat dua definisi, mengikut mana nilai yang diberikan akan dikira.

1. Oleh sebab takrif pertama, adalah mungkin untuk mengira berlakunya aksara dalam mesej teks, apabila kebarangkalian kejadiannya adalah sama sekali berbeza. Jadi, kita boleh mengatakan bahawa beberapa huruf dalam kata-kata Rusia kelihatan sangat jarang, sebagai contoh, "ъ" atau "g".

2. Tetapi dalam sesetengah keadaan lebih bijaksana untuk mengira kuantiti yang kita perlukan dengan memperkenalkan penampilan yang sama dengan setiap simbol. Dan kemudian formula pengiraan lain akan digunakan.

Ini adalah pendekatan abjad untuk mengukur maklumat.

Probabiliti kebarangkalian kebarangkalian aksara dalam fail teks

Untuk menjelaskan definisi ini, adalah perlu untuk mengandaikan bahawa semua tanda dalam teks atau mesej muncul dengan kekerapan yang sama. Untuk mengira berapa banyak memori yang mereka hadapi dalam komputer, adalah perlu untuk terjun ke dalam teori kebarangkalian dan kesimpulan logik sederhana.

Katakan teks dipaparkan pada skrin monitor. Kita berhadapan dengan tugas mengira berapa banyak memori komputer yang diperlukan. Biarkan teks terdiri daripada 100 aksara. Ternyata kebarangkalian penampilan satu huruf, simbol atau tanda akan menjadi satu ratus bagian dari jumlah keseluruhan. Sekiranya anda membaca sebuah buku mengenai teori kebarangkalian, anda boleh mencari formula mudah seperti yang akan menentukan nilai berangka peluang untuk penampilan suatu tanda dalam sebarang kedudukan teks.

Mungkin, bukti formula dan teorema tidak akan menarik kepada semua orang, oleh itu, dengan mengambil kira formula saintis yang terkenal, ungkapan terhitung diperolehi:

I = log 2 (1 / p) = log 2 N (bit); 2 i = N,

Di mana saya adalah nilai yang perlu kita ketahui, p adalah nilai berangka kemungkinan tanda dalam kedudukan teks, N kebanyakannya sama dengan 2, kerana mesin komputer mengkodekan data ke dalam kod binari yang terdiri daripada dua kuantiti.

Pendekatan volumetrik abjad untuk mengukur maklumat mengandaikan bahawa berat satu tanda watak bersamaan dengan 1 bit - unit pengukuran minimum. Dengan formula, anda boleh menentukan apa yang sama dengan bait, kilobyte, megabyte, dll.

Kebarangkalian berlainan simbol dalam teks

Jika kita mengandaikan bahawa tanda-tanda itu muncul dengan frekuensi yang berlainan (masing-masing, dan di mana-mana kedudukan teks kebarangkalian kejadiannya berbeza), maka kita boleh mengatakan bahawa berat maklumat mereka juga berbeza. Ia perlu untuk mengira ukuran maklumat mengikut formula lain. Pendekatan abjad topik adalah universal, yang membayangkan kedua-dua kemungkinan yang sama dan berlainan kekerapan berlakunya tanda dalam teks. Kami tidak akan menyentuh formula kompleks untuk mengira kuantiti ini, dengan mengambil kira kebarangkalian berlainan simbol. Perlu difahami bahawa huruf-huruf seperti "ъ", "х", "ф", "ч", dalam kata-kata Rusia adalah kurang biasa. Oleh itu, ia perlu untuk mempertimbangkan kekerapan penampilan mengikut formula yang lain. Selepas membuat beberapa pengiraan, saintis menyimpulkan bahawa berat maklumat simbol yang jarang ditemui jauh lebih besar daripada berat huruf yang sering ditemui. Untuk mengira jumlah teks, anda perlu mengambil kira jumlah pengulangan setiap watak dan berat maklumatnya, serta saiz abjad.

Pengukuran maklumat: kehalusan aspek kandungan

Anda boleh mengabaikan pendekatan abjad untuk mengukur maklumat. Informatika menawarkan satu lagi aspek mengukur data - bermakna. Di sini, masalah yang sedikit berbeza sedang diselesaikan. Katakan seseorang yang duduk di komputer menerima maklumat mengenai fenomena atau objek tertentu. Sudah jelas terlebih dahulu bahawa dia tidak tahu apa-apa, jadi ada sejumlah pilihan yang mungkin atau dijangka. Setelah membaca mesej, ketidakpastian akan hilang, meninggalkan satu pilihan, nilai yang harus dikira. Kami berpaling kepada formula tambahan. Nilai akan dikira dalam unit minimum - bit. Seperti pendekatan abjad untuk mengukur jumlah maklumat, formula yang betul akan dipilih dengan mengambil kira 2 situasi yang mungkin: kebarangkalian berlainan dan sama kejadian.

Peristiwa yang dihadapi dengan kebarangkalian yang sama

Seperti dalam hal apabila pendekatan abjad objektif untuk pengukuran maklumat diterapkan, formula yang diperlukan dalam pendekatan yang bermakna dikira dengan mengambil kira kekerapan yang telah diketahui oleh saintis Hartley:

2 i = N,

Di mana saya adalah magnitud peristiwa yang perlu kita temukan, dan N ialah bilangan peristiwa yang ditemui pada kekerapan yang boleh diterima. Nilai i dianggap dalam unit pengiraan minimum - bit. Seseorang boleh meluahkan saya melalui logaritma.

Contoh perhitungan peristiwa equiprobability

Katakan kita mempunyai 64 pelan di atas pinggan, di mana satu kejutan tersembunyi daripada daging. Ia perlu untuk mengira berapa banyak maklumat yang terkandung di dalam peristiwa apabila pelmen ini ditarik dengan kejutan, iaitu, untuk mengukur maklumat. Pendekatan abjad adalah semudah yang objektif. Dalam dua kes, formula yang sama akan digunakan untuk mengira kuantiti bahan maklumat. Kami menggantikan formula terkenal untuk kuantiti: 2 i = 64 = 2 6 . Keputusan: i = 6 bit.

Pengukuran maklumat dengan mengambil kira kebarangkalian berlainan kejadian

Katakan kita mempunyai peristiwa dengan kebarangkalian kejadian p. Kami akan mengandaikan bahawa nilai i, yang dikira dalam bit, adalah nombor yang menggambarkan hakikat bahawa peristiwa itu berlaku. Berdasarkan ini, boleh dikatakan bahawa nilai-nilai itu dapat dikira dari formula yang ada: 2 i = 1 / p.

Perbezaan antara pendekatan abjad dan maklumat kepada dimensi maklumat

Daripada pendekatan kelantangan berbeza dari yang besar? Lagipun, formula untuk mengira kuantiti maklumat adalah sama. Perbezaannya ialah aspek abjad boleh digunakan jika anda bekerja dengan teks, sedangkan kandungan yang membolehkan anda untuk menyelesaikan sebarang masalah teori kebarangkalian, hitung jumlah maklumat dari beberapa peristiwa dengan mengambil kira penampilan yang mungkin.

Kesimpulan

Pendekatan abjad untuk mengukur maklumat dengan cara yang sama seperti yang bermakna, memberi peluang untuk mengetahui unit data mana dan isipadu apa yang akan diduduki oleh tanda teks atau maklumat lain. Kita boleh menterjemahkan apa-apa teks dan fail berangka, mesej ke dalam kod komputer dan belakang, sambil sentiasa mengetahui berapa banyak memori yang akan mereka hadapi dalam komputer.

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 ms.birmiss.com. Theme powered by WordPress.