ГЛАВА 3. КОДИРОВАНИЕ ИНФОРМАЦИИ

Кодирование информации — это трансформация информации из одной формы в другую, более удобную для ее передачи, обработки, хранения с помощью некоторого кода.
Код — это система знаков, символов, которые необходимы для передачи данных, это закономерность отражения одного комплекта знаков в другом.
Двоичный код — это вариант передачи, хранения, представления информации с применением 2 вариантов знаков — 0 и 1, который применяется в вычислительной технике.

Информационный объем сообщений

📌 Формула:📌

I=N×b
I – объем информации (бит, байт)
N – количество символов
b – количество бит на 1 символ

Что встречается в тестах:
1. Кодирование символов:

  • ASCII (8 бит/символ) – стандартная английская раскладка (Hello! = 6 * 8 = 48 бит).
  • Unicode (16 бит/символ) – русские, казахские символы (Казахстан = 8 * 16 = 128 бит).
  • 7-битное кодирование – встречается в старых системах (Coder = 5 * 7 = 35 бит).

2.Примеры из тестов:

  • «Python» в 16-битном коде → 6×16=96 бит
  • «1234567890» в 8-битном коде → 10×8=80 бит
  • «Binary» в 8-битном коде → 6×8=48 бит
  • ASCII (8 бит/символ) – стандартная английская раскладка (Hello! = 6 * 8 = 48 бит).
  • Unicode (16 бит/символ) – русские, казахские символы (Казахстан = 8 * 16 = 128 бит).

📌 Запомни:📌
‼️1 байт = 8 бит‼️
‼️1 КБ (килобайт) = 1024 байта‼️
‼️1 МБ (мегабайт) = 1024 КБ‼️

Как определить количество символов по объему информации

📌 Формула:📌


N – количество символов
I – объем информации (бит, байт)
b – количество бит на 1 символ

Что встречается в тестах:
1.Примеры из тестов:

  • Сколько символов можно закодировать 64 битами (8-битное кодирование)?

  • Сколько символов можно закодировать 128 байтами (16-битное кодирование)?

📌 Запомни:📌
‼️Если кодировка 8 бит/символ → делим на 8.‼️
‼️Если кодировка 16 бит/символ → делим на 16.‼️

Определение объема информации по количеству символов и мощности алфавита

Мощность алфавита — это количество различных символов, которые можно использовать.

  • Чем больше символов в алфавите, тем больше бит нужно для кодирования каждого символа.
  • Например, если алфавит состоит из 4 символов, то на каждый символ нужно 2 бита.

📌Формула (по Хартли):📌

I=N×log2M
I – объем информации (бит)
N – количество символов
M – мощность алфавита (количество различных символов)
log2M – сколько бит нужно для кодирования 1 символа

Логарифм log2M это число, показывающее, сколько бит нужно, чтобы закодировать M различных символов.
Простое объяснение: Если у тебя есть алфавит из 2 символов (0 и 1), то тебе нужно 1 бит на каждый символ. Если алфавит из 4 символов (например, A, B, C, D), то можно закодировать их с помощью 2 бит

  • A = 00
  • B = 01
  • C = 10
  • D = 11

Если алфавит из 8 символов, то потребуется 3 бита, потому что 23=8
Примеры расчётов log2
Пример 1: Если алфавит 16 символов, сколько бит на 1 символ?

log216=4

📌Ответ: 4 бита на символ.📌
Почему?
Потому что 24=16, то есть 4 бита позволяют закодировать 16 символов.

Пример 2: Если алфавит 32 символа, сколько бит на 1 символ?

log232=5

📌 Ответ: 5 бит на символ.📌
Почему?
Потому что 25=32, значит 5 бит позволяют закодировать 32 символа.

Что встречается в тестах:
1.Если алфавит 16 символов, сколько бит на 1 символ?

log216=4 бита/символ

2.Сколько информации несет слово из 20 символов, если алфавит = 16 символов?

I=20×4=80 бит

3.Если алфавит 32 символа, сколько бит на 1 символ?

log232=5 бит/символ

Кодирование сообщений

Что встречается в тестах:
1.Если строка содержит 15 символов и алфавит 64 символа, какой объем информации?

I=15×log264=15×6=90 бит

2.Если сообщение из 10 символов и алфавит 256 символов?

I=10×8=80 бит

📌 Запомни:📌
‼️Чем больше мощность алфавита, тем больше бит на 1 символ.‼️
‼️Латинские буквы и цифры обычно кодируются в 8-битном ASCII.‼️
‼️Русские, казахские и другие национальные алфавиты – в 16-битном Unicode.‼️

Таблица мощностей алфавита и бит на символ
📌 Чтобы не считать каждый раз логарифмы, запомни эту таблицу:📌

Алфавит (M)log2M (бит/символ)
2 символа1 бит
4 символа2 бит
8 символов3 бит
16 символов4 бит
32 символа5 бит
64 символа6 бит
128 символов7 бит
256 символов8 бит