Кодирование информации — это трансформация информации из одной формы в другую, более удобную для ее передачи, обработки, хранения с помощью некоторого кода.
Код — это система знаков, символов, которые необходимы для передачи данных, это закономерность отражения одного комплекта знаков в другом.
Двоичный код — это вариант передачи, хранения, представления информации с применением 2 вариантов знаков — 0 и 1, который применяется в вычислительной технике.
Информационный объем сообщений
📌 Формула:📌
I=N×b
I – объем информации (бит, байт)
N – количество символов
b – количество бит на 1 символ
Что встречается в тестах:
1. Кодирование символов:
- ASCII (8 бит/символ) – стандартная английская раскладка (Hello! = 6 * 8 = 48 бит).
- Unicode (16 бит/символ) – русские, казахские символы (Казахстан = 8 * 16 = 128 бит).
- 7-битное кодирование – встречается в старых системах (Coder = 5 * 7 = 35 бит).
2.Примеры из тестов:
- «Python» в 16-битном коде → 6×16=96 бит
- «1234567890» в 8-битном коде → 10×8=80 бит
- «Binary» в 8-битном коде → 6×8=48 бит
- ASCII (8 бит/символ) – стандартная английская раскладка (Hello! = 6 * 8 = 48 бит).
- Unicode (16 бит/символ) – русские, казахские символы (Казахстан = 8 * 16 = 128 бит).
📌 Запомни:📌
‼️1 байт = 8 бит‼️
‼️1 КБ (килобайт) = 1024 байта‼️
‼️1 МБ (мегабайт) = 1024 КБ‼️
Как определить количество символов по объему информации
📌 Формула:📌
N – количество символов
I – объем информации (бит, байт)
b – количество бит на 1 символ
Что встречается в тестах:
1.Примеры из тестов:
- Сколько символов можно закодировать 64 битами (8-битное кодирование)?
- Сколько символов можно закодировать 128 байтами (16-битное кодирование)?
📌 Запомни:📌
‼️Если кодировка 8 бит/символ → делим на 8.‼️
‼️Если кодировка 16 бит/символ → делим на 16.‼️
Определение объема информации по количеству символов и мощности алфавита
Мощность алфавита — это количество различных символов, которые можно использовать.
- Чем больше символов в алфавите, тем больше бит нужно для кодирования каждого символа.
- Например, если алфавит состоит из 4 символов, то на каждый символ нужно 2 бита.
📌Формула (по Хартли):📌
I=N×log2M
I – объем информации (бит)
N – количество символов
M – мощность алфавита (количество различных символов)
log2M – сколько бит нужно для кодирования 1 символа
Логарифм log2M – это число, показывающее, сколько бит нужно, чтобы закодировать M различных символов.
Простое объяснение: Если у тебя есть алфавит из 2 символов (0 и 1), то тебе нужно 1 бит на каждый символ. Если алфавит из 4 символов (например, A, B, C, D), то можно закодировать их с помощью 2 бит
- A = 00
- B = 01
- C = 10
- D = 11
Если алфавит из 8 символов, то потребуется 3 бита, потому что 23=8
Примеры расчётов log2
Пример 1: Если алфавит 16 символов, сколько бит на 1 символ?
log216=4
📌Ответ: 4 бита на символ.📌
Почему?
Потому что 24=16, то есть 4 бита позволяют закодировать 16 символов.
Пример 2: Если алфавит 32 символа, сколько бит на 1 символ?
log232=5
📌 Ответ: 5 бит на символ.📌
Почему?
Потому что 25=32, значит 5 бит позволяют закодировать 32 символа.
Что встречается в тестах:
1.Если алфавит 16 символов, сколько бит на 1 символ?
log216=4 бита/символ
2.Сколько информации несет слово из 20 символов, если алфавит = 16 символов?
I=20×4=80 бит
3.Если алфавит 32 символа, сколько бит на 1 символ?
log232=5 бит/символ
Кодирование сообщений
Что встречается в тестах:
1.Если строка содержит 15 символов и алфавит 64 символа, какой объем информации?
I=15×log264=15×6=90 бит
2.Если сообщение из 10 символов и алфавит 256 символов?
I=10×8=80 бит
📌 Запомни:📌
‼️Чем больше мощность алфавита, тем больше бит на 1 символ.‼️
‼️Латинские буквы и цифры обычно кодируются в 8-битном ASCII.‼️
‼️Русские, казахские и другие национальные алфавиты – в 16-битном Unicode.‼️
Таблица мощностей алфавита и бит на символ
📌 Чтобы не считать каждый раз логарифмы, запомни эту таблицу:📌
Алфавит (M) | log2M (бит/символ) |
2 символа | 1 бит |
4 символа | 2 бит |
8 символов | 3 бит |
16 символов | 4 бит |
32 символа | 5 бит |
64 символа | 6 бит |
128 символов | 7 бит |
256 символов | 8 бит |