Компьютерное представление текста в котором автоматически поддерживаются смысловые связи между
- информационная программа, выводящая на экран дисплея гипертекст и выполняющая переходы по смысловым связям.
Гипертекст позволяет с помощью клавиатуры или мыши сразу получить на экране определения или пояснения слов или словосочетаний, выделенных в тексте подсветкой, ссылки на литературные источники и рекомендации по дальнейшему чтению. В форме гипертекста создаются справочные системы (Help) современных программных продуктов. Гипертекст применяется в компьютерных обучающих системах, толковых словарях и т.п. Гипертекст широко используется в Интернете.
Основными компонентами технологий, состоящих в применении гипертекстовой модели к информационным ресурсам, распределенным в Интернете, являются:
- URL - универсальный способ адресации ресурсов в сети;
- HTML - язык гипертекстовой разметки документов;
- дополнительные средства (CGI, Java, JavaScript).
Гипертекстовая база данных - это набор текстовых файлов, написанных на языке HTML, который определяет форму представления информации (разметка) и структуру связей этих файлов (гипертекстовые ссылки).
Такой подход предполагает наличие еще одной компоненты технологии - интерпретатора языка. В World Wide Web функции интерпретатора разделены между сервером гипертекстовой базы данных и интерфейсом пользователя.
Сервер, кроме обеспечения доступа к документам и реализации гипертекстовых ссылок, осуществляет также препроцессорную обработку документов, в то время как интерфейс пользователя проводит интерпретацию конструкций языка, связанных с представлением информации.
Универсальный идентификатор ресурсов (URL)
Система универсальных идентификаторов ресурсов (URL) разработана для использования в системах Интернет и в ее основу заложены следующие принципы:
- расширяемость - новые адресные схемы должны были легко вписываться в существующий синтаксис;
- полнота - по возможности любая из существовавших схем должна была описываться посредством URL;
- читаемость - адрес должен легко пониматься человеком.
Формат URL включает:
- IP- или доменный адрес машины;
- адрес ресурса на сервере (каталог или путь);
- имя HTML-файла и метку;
- критерий поиска данных.
Для каждого вида протокола приложений выбирается свое подмножество полей из представленного выше списка.
HTML- язык разметки гипертекста
HTML ориентирован на решение нескольких важных задач, в которых участвуют его различные конструкции и элементы:
- описание структуры документа (head, body, H1-Н6, шрифты, списки и пр.);
- адресация ресурсов (base, link, href и пр.);
- создание гипертекстовых ссылок и управление навигацией в БД локальных и WWW Internet (HREF и т.п.);
- реализация интерфейсов с пользователем (isindex, menu, form и пр.).
Приведем некоторые элементы HTML, относящиеся к представлению документа.
Заголовки разделов документа:
Н1 - жирный, очень крупный шрифт, текст центрирован. Между заголовком и последующим текстом вставляется одна или две пустые строки. При выводе на принтер заголовок печатается на новой странице;
Н2 - жирный крупный шрифт, до и после заголовка помещаются одна или две пустые строки;
Н3 - наклонный крупный шрифт, до и после заголовка помещаются одна или две пустые строки. Печатается с небольшим отступом;
Н4 - жирный нормальный шрифт, до и после заголовка помещается пустая строка;
Н5 - наклонный шрифт, как и для Н4, пустая строка ставится перед заголовком;
Н6 - жирный шрифт, перед заголовком ставится пустая строка.
Некоторые дополнительные возможности. В HTML предусмотрены следующие виды списков:
ul - ненумерованный список (неупорядоченный);
ol - нумерованный список (упорядоченный);
dl - список определений.
Для описания таблиц служит элемент table, который является контейнером для других элементов описания таблицы. Наиболее часто он употребляется с атрибутом border, oпределяющим разделительные линии граф таблицы, которые могут быть либо трехмерными, либо обычными.
Элемент TR (Table Row) дает общее описание строки таблицы. Обычно используется для выравнивания содержания граф строки. Способ выравнивания определяют: атрибут align - горизонтальное выравнивание, который принимает значения left, right, center, justify, decimal, и атрибут VALIGN - вертикальное выравнивание, который принимает значения top, bottom, middle, baseline. По умолчанию графы-заголовки центрируются, а графы-данные выравниваются по левому верхнему углу.
Элементы ТН (Table Header) и TD (Table Data) используются для описания граф таблицы. Кроме выравнивания, тн и td позволяют еще и объединять графы. Это делается с помощью атрибутов rowspan (пропуск строки) и colspan (пропуск столбца). Цифра в этих атрибутах определяет количество последовательно расположенных граф таблицы, объединенных в одну графу.
Описание интерфейсов и навигация
Все рассмотренные ранее средства управления отображением текста являются дополнительными к основному элементу документа - гипертекстовым ссылкам. Вот некоторые элементы HTML, реализующие данный механизм:
- LINK - элемент заголовка - используется для описания общих для всего документа гипертекстовых ссылок. Элемент имеет три атрибута: rel, rev и href. Rel задает тип ссылки, rev - обратную ссылку, a href определяет ссылку в форме URL. На данный элемент возложена нагрузка по программированию средств управления интерфейсом пользователя. При выборе соответствующей позиции в меню интерфейса пользователя или соответствующей этой позиции пиктограммы, программа интерфейса должна генерировать запрос к серверу на получение документа, указанного в атрибуте href;
- элемент <А. > (</А>), который называют «якорь» (anchor), применяется для записи гипертекстовой ссылки из тела документа; имеет несколько атрибутов, главным из которых является HREF (HyperText Reference). Содержание элемента А, заключенное между метками начала и конца элемента, выделяется в тексте цветом, определенным для контекстных гипертекстовых ссылок.
Система World Wide Web была ориентирована на графические средства представления информации, на любой информационный объект можно сослаться из документа HTML, вызвав его через внешнюю программу просмотра.
Программа-клиент посылает после установления соединения запрос серверу. Этот запрос может быть в двух формах: в форме полного запроса и в форме простого запроса. Простой запрос содержит метод доступа и запрос ресурса. Например:
В практике World Wide Web реально используются три метода доступа: POST, GET, HEAD.
get - метод, позволяющий получить данные, заданные в форме URL, в запросе ресурса. Если ссылаются на программу, то возвращается результат выполнения этой программы, но не ее текст. Дополнительные данные, которые надо передать для обработки, кодируются в запрос ресурса.
head - в отличие от GET не возвращает тела ресурса. Используется для получения информации о ресурсе и для тестирования гипертекстовых ссылок.
POST - метод разработан для передачи большого объема информации на сервер. В отличие от GET и HEAD в POST передается тело ресурса, которое является информацией из поля форм или других источников ввода.
Ответ сервера может быть, как и запрос, упрощенным или полным. При упрощенном ответе сервер возвращает только тело ресурса (например, текст HTML-документа). При полном ответе клиенту возвращаются строка состояния (status-Line), общий заголовок, заголовок ответа, заголовок ресурса и тело ресурса.
Программное обеспечение World Wide Web можно разделить на группы по направлениям использования. Принята следующая классификация программного обеспечения World Wide Web:
- программы-клиенты (в том числе мультипротокольные браузеры);
- программы просмотра документов в форматах, отличных от стандартных форматов Web;
- программы-серверы протокола обмена гипертекстовой информацией (Web-серверы);
- программы подготовки публикаций;
- программы анализа статистики посещений.
Сервер WWW - программа, которая принимает запросы от WWW-клиентов и отвечает на них. В качестве ответа может быть возвращен HTML-документ, хранящийся в базе данных сервера, графический образ, аудиозапись, фильм или ответ внешней программы. Сервер обменивается данными не только с клиентами, но и с CGI-скриптами.
В настоящее время серверы WWW существуют для всех типов компьютерных платформ и операционных систем.
Серверы для Unix-систем:
Apachie - некоммерческое развитие сервера NCSA с учетом спецификаций защиты данных от несанкционированного доступа;
Первыми распространенными некоммерческими программами этого типа являлись Mosaic (графический интерфейс) и Lynx для алфавитно-цифрового режима доступа.
Arena позволяет интерпретировать версии языка, которые в дополнение к возможностям, существующим в Mosaic, также реализует математические формулы, обтекание графики текстом, прозрачные графические образы и ряд других изобразительных средств.
Мультпротоколъные программы-браузеры. На роль стандартов в этом классе программного обеспечения претендуют две программы: Netscape Communicator (NC) и Microsoft Internet Explorer (IE). По своим возможностям и внешнему оформлению они довольно похожи. Основная задача этих программ - интерпретация разметки на языке HTML, интерпретация встроенных в HTML программ на одном из командных языков Web - JavaScript или VBScript, интерпретация байт-кодов Java, разбор спецификации ресурсов сети (обработка URL), взаимодействие с серверами по протоколам прикладного уровня стека протоколов TCP/IP.
1. ____________________ — определение, устанавливающее, что следует делать в данной конкретной ситуации, и состоящее из двух частей: условия, которое может выполняться или нет, и действия, которое следует произвести, если условие выполняется.
• Правило
3. ____________________ — уровень доступа в Lotus Notes, выполняющий все операции с базой данных, включая чтение, запись и редактирование документов и форм.
• Manager
4. ____________________ — уровень доступа в Lotus Notes, предназначенный для создания и редактирования новых документов, а также чтения, но не редактирования других документов.
• Author
5. ____________________ — уровень доступа в Lotus Notes, предназначенный для чтения, записи и редактирования всех документов в базе данных, но ему не разрешается модифицировать формы и отчеты.
• Editor
6. ____________________ — это компьютерное представление текста, в котором автоматически поддерживаются смысловые связи между выделенными понятиями, терминами или разделами.
• Гипертекст
7. ____________________ — это специальным образом организованные файлы, хранящие систематизированную совокупность понятий, правил и фактов, относящихся к некоторой предметной области.
• База знаний
8. ____________________ Lotus Notes — это системы для коллективной работы, которые разрабатываются для координации деятельности людей, совместно реализующих конкретный бизнес-процесс.
• Приложения
9. ____________________ Notes дает(-ют) возможность разработчикам управлять выполнением приложений Notes и программировать процессы, функционирующие на сервере.
• Макроязык
10. ____________________ документа — представление документа при поиске, просмотре, печати, в котором фигурируют значения полей документов или вычисленные на их основании выражения.
• Вид
11. ____________________ документа соответствует каждому типу документа и представляет собой комбинацию статического текста и полей.
• Шаблон
12. ____________________ документация — комплекс методик по всем этапам разработки технического обеспечения.
• Специализированная
13. ____________________ документация включает государственные и отраслевые стандарты по техническому обеспечению.
• Общесистемная
14. ____________________ документация используется при выполнении расчетов по техническому обеспечению.
• Нормативно-справочная
15. ____________________ задача — задача, где известны все ее элементы и взаимосвязи между ними.
• Структурированная
_ - компьютерное представление текста, в котором автоматом поддерживаются смысловые связи меж выделенными понятиями, определениями или разделами
(*ответ*) Гипертекст
nbsp;Ссылка
nbsp;Гипермедиа
nbsp;Гиперзнание
_ - составная часть имени компьютера в сети Интернет
(*ответ*) Домен
nbsp;Кортеж
nbsp;Контент
nbsp;Атрибут
_ данных - предметно-направленный, встроенный, неизменяемый, поддерживающий хронологию набор данных, организованный для целей помощи принятия решений
(*ответ*) Хранилище
nbsp;Банк
nbsp;Файл
nbsp;Архив
_ система - это система программных средств, способная на основании методов искусственного ума и предоставляемых юзером фактов идентифицировать ситуацию, поставить диагноз, сделать прогноз, сгенерировать решение либо дать рекомендацию для выбора действия
(*ответ*) Экспертная
nbsp;Диагностическая
nbsp;Имитационная
nbsp;Интерактивная
_ акт целенаправленного воздействия на объект управления, основанный на анализе ситуации, определении цели, разработке программы достижения этой цели
(*ответ*) Принятие решения
nbsp;Мониторинг
nbsp;Аудит
nbsp;Мозговой штурм
_ вещественный объект, система математических зависимостей либо программка, имитирующая структуру или функционирование исследуемого объекта
(*ответ*) Модель
nbsp;Образец
nbsp;Элемент
nbsp;Модуль
_информационная система - это человеко-машинная система, непосредственно исполняющая организационную, управленческую и производственную деятельность предприятия
(*ответ*) Корпоративная
nbsp;Кооперативная
nbsp;Фирменная
nbsp;Функциональная
_ уравнения обрисовывают проблемные ситуации, зависящие от фактора медли, то есть математическая модель проблемной ситуации может выслеживать временную динамику
(*ответ*) Дифференциальные
nbsp;Интегральные
nbsp;Иррациональные
nbsp;Линейные
_ входные характеристики поведения объекта характеристики, знаменитые только с определенной ступенью вероятности
(*ответ*) Стохастические
nbsp;Детерминированные
nbsp;Недетерминированные
nbsp;Комбинаторные
_ моделирование исследование поведения сложной системы на ее модели
(*ответ*) Имитационное
nbsp;Игровое
nbsp;Дескриптивное
nbsp;Оптимизационное
_ управление - функция управления, обеспечивающая функционирование управляемых процессов в рамках характеристик, данных текущим планом, программкой, регламентом
(*ответ*) Оперативное
nbsp;Стратегическое
nbsp;Тактическое
nbsp;Перспективное
_ режим принятия решений, когда предварительная подготовка материала и инфы для принятия решений сведена к минимуму, а состав информации, нужной для обсуждения неожиданно появившейся задачи, определяется в процессе обсуждения
(*ответ*) Чрезвычайный режим
nbsp;Мозговой штурм
nbsp;Мониторинг
nbsp;Аудит
сущности представляются как совокупность атрибутов и их значений; состав сущностей неизменяемый; база знаний не структурирована; решаются статические задачи анализа, используются только специализированные исполняемые утверждения
сущности представляются в виде атрибутов со значениями или вырожденных объектов (фреймов); состав сущностей неизменяемый; иерархия базы данных либо отсутствует, либо слабо выражена (нет наследования свойств); решаются статические задачи анализа, используются специализированные исполняемые утверждения
сущности представляются в виде объектов; состав сущностей изменяемый; база знаний структурирована; решаются статические задачи анализа и синтеза, используются общие и специализированные исполняемые утверждения
сущности представляются совокупностью атрибутов и их значений; состав сущностей неизменяемый; база знаний не структурирована; решаются динамические задачи анализа, используются специализированные исполняемые утверждения
Информатика (курс 4)
Информационно-______________ системы производят ввод, систематизацию, хранение, выдачу информации по запросу пользователя без сложных преобразований данных
Информатика (курс 4)
____________ информационные технологии существовали в условиях централизованной обработки данных, до периода массового использования ПК
Информатика (курс 4)
____________ гипертекстовой базы данных, кроме обеспечения доступа к документам и реализации гипертекстовых ссылок, осуществляет также препроцессорную обработку документов
Информатика (курс 4)
_______ система - совокупность информационных технологий, ориентированная на совместное и скоординированное использование «электронных» методов сбора, обработки, хранения и передачи информации
Информатика (курс 4)
В крупных организациях наряду с персональным компьютером в состав технической базы информационной системы может входить __________ или суперЭВМ
Информатика (курс 4)
К ____________ изображениям относят, как правило, коммерческую (деловую) и иллюстрационную графику
Информатика (курс 4)
___________ интерфейс предполагает выдачу на экран приглашения для ввода команды
Информатика (курс 4)
Информатика (курс 4)
Параметром, по которому нельзя классифицировать компьютерные вирусы, является
Информатика (курс 4)
___________ – это компьютерное представление текста, в котором автоматически поддерживаются смысловые связи между выделенными понятиями, терминами или разделами
Информатика (курс 4)
Поставьте в соответствие типу правил выборки его особенность
соединяет тип информации с запросами пользователя: тип информации: – вопрос
связывает задачу с составляющими ее подзадачами, что можно выразить так: тип задачи: – тип задачи 1, тип задачи 2,…
определяет информацию, полезную для решения задачи: тип задачи: – информация
Информатика (курс 4)
_____________ база данных - это набор текстовых файлов, написанных на языке HTML, который определяет форму представления информации (разметка) и структуру связей этих файлов (гипертекстовые ссылки)
Информатика (курс 4)
Правило обработки _________ - определение, что следует делать в данной конкретной ситуации
Информатика (курс 4)
создаются по запросам управленцев или когда в компании произошло что-то незапланированное
создаются в соответствии с установленным графиком, определяющим время их создания
содержат данные, полученные из различных источников или классифицированные по различным признакам и используемые для целей сравнения
Информатика (курс 4)
В сложных ЭС доказательства выводов основываются на знаниях, полученных из
Информатика (курс 4)
__________ информационных потоков отражают маршруты движения информации и ее объемы, места возникновения первичной информации и использования результатной информации
Информатика (курс 4)
Система ____________ принятия решений - система, использующая модели объекта управления, опирающаяся на вычислительные или имитационные модели и расчетные методы
Информатика (курс 4)
Поставьте в соответствие этапу разработки ЭС его особенность
определяются задачи, которые подлежат решению, выявляются цели разработки, определяются эксперты и типы пользователей
проводится анализ проблемной области, выявляются используемые понятия и их взаимосвязи, определяются методы решения задач
выбираются информационные системы и определяются способы представления всех видов знаний, формализуются основные понятия, определяются способы интерпретации знаний, моделируется работа системы, оценивается адекватность целям системы зафиксированных понятий, методов решений, средств представления и манипулирования знаниями
В данный момент вы не можете посмотреть или раздать видеоурок ученикам
Чтобы получить доступ к этому и другим видеоурокам комплекта, вам нужно добавить его в личный кабинет, приобрев в каталоге.
Получите невероятные возможности
Конспект урока "Представление текста в компьютере"
· использование таблицы кодировок;
· информационный объём текста.
Компьютер может работать с пятью видами информации:
Одним из самых массовых приложений ЭВМ является работа с текстами.
Имея компьютер, можно создавать тексты, не тратя на это много времени и бумагу. Носителем текста становится память компьютера. Текст на внешних носителях сохраняется в виде файла.
Как вы уже знаете, вся информация, независимо от того, какая она графическая, видео или звуковая, представляется в компьютере с помощью чисел, это всего два символа двоичного кода, 0 и 1, которые легко перевести в сигналы.
Прежде всего, вспомним о байтовом принципе организации памяти компьютера.
Как вы помните, каждая клетка обозначает бит памяти. Восемь подряд идущих битов образуют байт памяти. Байты пронумерованы. Порядковый номер байта определяет его адрес в памяти компьютера. По этим адресам процессор обращается к данным, считывает их или записывает в память.
Схема представления текста в памяти компьютера очень проста. Каждая буква алфавита, цифра, знак препинания или любой другой символ необходимый для записи текста обозначается определённым двоичным кодом, длина которого фиксирована.
Например, в системах кодировки Windows – 1251 и KОИ-8 каждый символ заменяется на восьмиразрядное целое положительное двоичное число, оно хранится в одном байте памяти. Это число является порядковым номером символа в кодовой таблице.
Мы уже говорили о том, что разрядность ячейки памяти i и количество различных целых положительных чисел, которые можно записать в эту ячейку n связаны соотношением:
Восьмиразрядный двоичный код позволяет получить 256 различных кодовых комбинаций, то есть 2 8 = 256.
С помощью 256 кодовых комбинаций можно закодировать все символы двух алфавитов (английского и русского) и все остальные дополнительные символы, расположенные на клавиатуре компьютера — цифры и знаки арифметических операций, знаки препинания и скобки и так далее, а также ряд управляющих символов, без которых невозможно создание текстового документа (удаление предыдущего символа, переход на новую строку, пробел и другие).
Мощность алфавита равна 256 символов. Сколько Килобайт памяти потребуется для сохранения 160 страниц текста, содержащего в среднем 192 символа на каждой странице?
В современном мире около 6700 живых языков и около 25 алфавитов.
Он является результатом сотрудничества Международной организации по стандартизации (ISO) с ведущими производителями компьютеров и программного обеспечения.
Этот стандарт был предложен в 1991 году некоммерческой организацией «Консорциум Юникода». С помощью этого стандарта можно закодировать очень большое число символов из разных письменностей: в документах Unicode могут соседствовать китайские иероглифы, математические символы, буквы греческого алфавита, латиницы и кириллицы, при этом становится ненужным переключение кодовых страниц.
В Юникод каждый символ кодируется 16-битовым двоичным кодом, то есть два байта на символ. В данном случае можно закодировать 2 16 = 65536 различных символов.
Однако в последнее время объединение Unicode приступило к кодированию письменности мёртвых языков и в этом случае 16-битового кодирования уже недостаточно. Поэтому Unicode приступил к освоению новых кодов.
Текстовый документ, который хранится в памяти компьютера, состоит из кодов символьного алфавита, кодов управления форматами текста. Также текстовые процессоры, например, Microsoft Word позволяют включать и редактировать такие объекты как таблицы, оглавления, ссылки и гиперссылки, историю вносимых изменений и так далее. Все это также представляется в виде последовательности байтовых кодов.
В зависимости от разрядности используемой кодировки информационный вес символа текста, создаваемого на компьютере, может быть равен:
• 8 бит или 1 байт — если используется восьмиразрядная кодировка;
• 16 бит или 2 байта — если используется шестнадцатиразрядная кодировка.
Информационным объёмом фрагмента текста будем называть количество битов, байтов или производных единиц (килобайтов, мегабайтов и так далее), необходимых для записи этого фрагмента заранее оговорённым способом двоичного кодирования.
Информационный объем текста, набранного на компьютере с использованием кодировки UNICODE равен 4 Килобайта. Определить количество символов в тексте.
Как мы уже говорили бывают случаи, когда, работая с текстом, программа может запросить воспользоваться другой кодировкой, например, текст в восьмибитном коде Windows перекодировать в кодировку Unicode. Давайте выясним, что произойдёт с информационным объёмом текста.
Итак, рассмотрим такой пример.
Соответствие между изображениями и кодами символов устанавливается с помощью кодовых таблиц.
В зависимости от разрядности используемой кодировки информационный вес символа текста, создаваемого на компьютере, может быть равен:
• 16 бит (2 байта) — если используется 16-разрядная кодировка.
Информационный объём фрагмента текста — это количество битов, байтов и производных единиц, необходимых для записи фрагмента оговорённым способом кодирования.
Читайте также: