Какой объем памяти потребуется для хранения 32 символов в кодировке koi 8
Для представления текстовой (символьной) информации в компьютере используется алфавит мощностью 256 символов. Один символ из такого алфавита несет 8 бит информации (2 8 =256). 8 бит =1 байту, следовательно, двоичный код каждого символа в компьютерном тексте занимает 1 байт памяти.
Уровень «3»
1. Сколько бит памяти займет слово «Микропроцессор»?([1], c .131, пример 1)
Слово состоит из 14 букв. Каждая буква – символ компьютерного алфавита, занимает 1 байт памяти. Слово занимает 14 байт =14*8=112 бит памяти.
Ответ: 112 бит
2. Текст занимает 0, 25 Кбайт памяти компьютера. Сколько символов содержит этот текст? ([1], c .133, №31)
Переведем Кб в байты: 0, 25 Кб * 1024 =256 байт. Так как текст занимает объем 256 байт, а каждый символ – 1 байт, то в тексте 256 символов.
Ответ: 256 символов
3. Текст занимает полных 5 страниц. На каждой странице размещается 30 строк по 70 символов в строке. Какой объем оперативной памяти (в байтах) займет этот текст? ([1], c .133, №32)
30*70*5 = 10500 символов в тексте на 5 страницах. Текст займет 10500 байт оперативной памяти.
Ответ: 10500 байт
4. Считая, что каждый символ кодируется одним байтом, оцените информационный объем следующего предложения из пушкинского четверостишия:
Певец-Давид был ростом мал, Но повалил же Голиафа! (ЕГЭ_2005. демо, уровень А)
400 бит
50 бит
400 байт
5 байт
В тексте 50 символов, включая пробелы и знаки препинания. При кодировании каждого символа одним байтом на символ будет приходиться по 8 бит, Следовательно, переведем в биты 50*8= 400 бит.
Ответ: 400 бит
5 . Считая, что каждый символ кодируется одним байтом, оцените информационный объем следующего предложения в кодировке КОИ-8: Сегодня метеорологи предсказывали дождь. (ЕГЭ_2005, уровень А)
В таблице КОИ-8 каждый символ закодирован с помощью 8 бит. См. решение задачи №4.
6. Считая, что каждый символ кодируется 16 битами, оцените информационный объем следующего предложения в кодировке Unicode :
Каждый символ кодируется 8 битами.
(ЕГЭ_2005, уровень А)
34 символа в предложении. Переведем в биты: 34*16=544 бита.
7. Каждый символ закодирован двухбайтным словом. Оцените информационный объем следующего предложения в этой кодировке:
В одном килограмме 100 грамм.
(ЕГЭ_2005, уровень А)
19 символов в предложении. 19*2 =38 байт
Уровень «4»
8. Текст занимает полных 10 секторов на односторонней дискете объемом 180 Кбайт. Дискета разбита на 40 дорожек по 9 секторов. Сколько символов содержит текст? ([1], c .133, №34)
40*9 = 360 -секторов на дискете.
180 Кбайт : 360 * 10 =5 Кбайт – поместится на одном секторе.
5*1024= 5120 символов содержит текст.
Ответ: 5120 символов
Переведем результат в байты. 14000 : 8 =1750 байт
Ответ: 1750 байт.
Уровень «5»
Ответ: 50 секунд
Переведем 225 Кб в биты.225 Кб *1024*8 = 1843200 бит.
Ответ: 128 секунд
Кодирование (декодирование) текстовой информации.
Методические рекомендации:
В задачах такого типа используются понятия:
Код (от французского слова code – кодекс, свод законов) – правило по которому выполняется кодирование.
Кодовая таблица (или кодовая страница) – таблица, устанавливающая соответствие между символами алфавита и двоичными числами.
Примеры кодовых таблиц (имеются на CD диске к учебнику Н. Угринович):
КОИ-7, КОИ-8 – кодирование русских букв и символов (семи-, восьми -битное кодирование)
ASCII – American Standard Code for Information Interchange (американский стандарт кодов для обмена информацией) – это восьмиразрядная кодовая таблица, в ней закодировано 256 символов (127- стандартные коды символов английского языка, спецсимволы, цифры, а коды от 128 до 255 – национальный стандарт, алфавит языка, символы псевдографики, научные символы, коды от 0 до 32 отведены не символам, а функциональным клавишам).
Рис. 2 Международная кодировка ASCII
Unicode – стандарт, согласно которому для представления каждого символа используется 2 байта. (можно кодировать математические символы, русские, английские, греческие, и даже китайские). C его помощью можно закодировать не 256, а 65536 различных символов. Полная спецификация стандарта Unicode включает в себя все существующие, вымершие и искусственно созданные алфавиты мира, а также множество математических, музыкальных, химических и прочих символов
СР1251 - наиболее распространенной в настоящее время является кодировка Microsoft Windows, ("CP" означает "Code Page", "кодовая страница").
Рис. 3 Кодировка CP 1251
СР866 - кодировка под MS DOS
Рис. 4 Кодировка СР866
Мас – кодировка в ПК фирмы Apple, работающих под управлением операционной системы Mac OS .
Рис. 5 Кодировка Mac
ISO 8859-5 - Международная организация по стандартизации (International Standards Organization, ISO) утвердила в качестве стандарта для русского языка еще одну кодировку.
Рис. 6 Кодировка ISO 8859-5
Уровень «3»
Используем кодировочные таблицы
12. Как будет выглядеть слово "диск", записанное в кодировке СР1251, в других кодировках. ([2], стр. 68 №2.63)
Последовательность десятичных кодов слова "диск" составляем на основе кодировочных таблиц
Кодовая таблица
228 232 241 234
228 232 241 234
228 232 241 234
228 232 241 234
228 232 241 234
Используем ПО ( текстовый редактор Hieroglyph, Wise Calculator )
13. Перейдите от двоичного кода к десятичному и декодируйте следующие тексты:
а) 01010101 01110000 0100000 00100110 00100000 01000100 1101111 01110111 01101110;
б) 01001001 01000010 01001101;
в) 01000101 01101110 01110100 01100101 01110010
([2], стр. 68 №2.60)
Решение:
1. Переведите коды из двоичной системы счисления в десятичную.
а) 01010101 01110000 00100000 00100110 00100000 01000100 1101111 01110111 01101110 → 85 112 32 38 32 68 111 119 110
б) 01001001 01000010 01001101 → 73 66 77
в) 01000101 01101110 01110100 01100101 01110010 → 69 110 116 101 114
2. Запустите текстовый редактор Hieroglyph
3. Включить клавишу Num Lock. Удерживая клавишу Alt, набрать код символа на цифровой клавиатуре. Отпустить клавишу Alt, на экране появится соответствующая буква.
а ) 85 112 32 26 32 68 111 119 110 → Up & Down;
б ) 73 66 77 → IBM;
в ) 69 110 116 101 114 → Enter
Ответ : Up & Down; IBM; Enter
1 4. Декодируйте следующие тексты, заданные десятичным кодом:
а) 087 111 114 100;
б) 068 079 083;
в) 080 097 105 110 116 098 114 117 115 104.
([2], стр. 68 №2.61)
Решение:
Запустите текстовый редактор Hieroglyph. Включить клавишу Num Lock. Удерживая клавишу Alt, набрать код символа на цифровой клавиатуре. Отпустить клавишу Alt, на экране появится соответствующая буква.
а) 087 111 114 100 → Word;
б) 068 079 083 → DOS;
в) 080 097 105 110 116 098 114 117 115 104 → Paintbrush.
Ответ : Word; DOS; Paintbrush.
Уровень «4»
Не используем кодировочные таблицы
15. Буква « I »в таблице кодировки символов имеет десятичный код 105. что зашифровано последовательностью десятичных кодов: 108 105 110 107? ([1],пример 2, стр.132)
Учитываем принцип последовательности кодирования и порядок букв в латинском алфавите и, можно, не обращаться к таблице кодировки символов.
Латинская буква
Ответ: Закодировано слово « link »
16. Десятичный код (номер) буквы «е» в таблице кодировки символов ASCII равен 101. Какая последовательность десятичных кодов будет соответствовать слову:
1) file ; 2) help ? ([1], №35, стр.133)
Учитываем принцип последовательности кодирования и порядок букв в латинском алфавите:
Десятичный код
11 2
Латинская буква
1) 102 105 108 101
2) 104 101 108 112
17. Десятичный код (номер) буквы «о» в таблице кодировки символов равен 111. Что зашифровано с помощью последовательности десятичных кодов:
1) 115 112 111 114 116
2) 109 111 117 115 101
([1], №36, стр.133)
Речь идет о латинской букве «о», а не о русской, так как код меньше 127. Учитывая принцип последовательности кодирования и порядок букв в латинском алфавите, имеем:
Решая его найдём следовательно, .
16 бит = 2 байт, 8 бит = 1 байт.
4096 = 1024⋅4, 16 бит = 2 байта, 8 бит = 1 байт
Было в Unicode: 2 12 * 2 = 2 13 байт
Стало в Windows-1251: 2 12 байт.
Объём файла уменьшился на 2 13 байт - 2 12 байт = 2 12 байт = 4 Кбайта
Объем информации в кодировке КОИ-8: 5120 символов * 1 байт = 5120 байт.
Объем информации в 16-битной кодировке Unicode: 5120 символов * 2 байта = 10240 байт.
10240 байт - 5120 байт = 5120 байт.
5120 : 1024 = 5 Кбайт.
Источник: Яндекс: Тренировочная работа ЕГЭ по информатике. Вариант 1.Обозначим количество символов в документе за .
Тогда объем информации в кодировке КОИ-8: бит = байт
Объем информации в 16-битной кодировке Unicode: бит = байт.
Размер памяти увеличился на байт = 4*1024 байт .
Ответ: 4096 символов.
N — количество символов.
16 * N — объём информации в 16-битной кодировке.
Считая, что каждый символ кодируется двумя байтами, оцените информационный объем следующего предложения в кодировке Unicode:
Диаметр окружности равен 2R.
Подсчитаем количество символов в заданном предложении, включая пробелы и точку: их 28. Поскольку один символ кодируется 2 байтами, 28 символов кодируются 56 байтами.
Считая, что каждый символ кодируется 16 битами, оцените информационный объем следующей фразы в кодировке Unicode:
«Word» — по-русски «слово».
Подсчитаем количество символов в заданном предложении, включая кавычки, пробелы, тире, дефис и точку: всего их 27. Поскольку один символ кодируется 16 битами, 27 символов кодируются 432 битами.
Считая, что каждый символ кодируется 8 битами, оцените информационный объем следующей пушкинской фразы в кодировке Unicode:
Хвалу и клевету приемли равнодушно и не оспаривай глупца.
Подсчитаем количество символов в заданном предложении, включая пробелы: всего их 57. По условию задачи один символ кодируется 8 битами. Знаем: 8 бит = 1 байт. Имеем: 1 символ = 8 бит = 1 байт. Т. к. всего символов 57, то в байтах объём фразы 57 байт.
Скорость передачи данных через ADSL-соединение равна 128000 бит/с. Передача текстового файла через это соединение заняла 1 минуту. Определите, сколько символов содержал переданный текст, если известно, что он был представлен в 16-битной кодировке Unicode.
Q = 128000 бит/c * 60 c.
Каждый символ в данной кодировке кодируется 16-ю битами. Следовательно, количество символов определится так:
N = 128000 бит/c * 60 c : 16 = 8000 * 60 = 480 000.
Скорость передачи данных через модемное соединение равна 4096 бит/с. Передача текстового файла через это соединение заняла 10 с. Определите, сколько символов содержал переданный текст, если известно, что он был представлен в 16-битной кодировке Unicode.
Объём информации вычисляется по формуле Q = q * t, где t — время передачи q — cкорость передачи данных. Поэтому
Q = 4096 бит/c * 10 c = 2 12 бит/c * 10 c .
Читайте также: