К приложениям для обработки текстовой информации можно отнести
Информация, выраженная с помощью естественных и формальных языков в письменной форме, называется текстовой.
В общем случае электронная система обработки текстовой информации состоит из видеотерминала, возможно, специально сконструированного или модифицированного для этих целей, некоторой внешней памяти для хранения специального программного обеспечения и файлов с текстовой информацией, а также печатающего устройства, позволяющего получать качественные копии созданных документов. Средства обработки текстовой информации, несмотря на их весьма широкий спектр, обеспечивают следующие основные функции:
- создание и редактирование текстового документа, включая: вставки, удаления, копирование, перемещение текста в документе, поиск и замена элементов документа, добавление в документ текстовой и графической информации;
- форматирование и распечатка документов с выбором размеров бумаги и форматов, а также с указанием числа копий и выводимой части документа;
- выравнивание документа и/или его отдельных частей по указанным границам с автоматической обработкой переносов строк;
- возможность создания документа по стандартному шаблону;
- использование различных шрифтов распространенных алфавитов;
- размещение в документе таблиц, диаграмм, рисунков и т.д.,
- а также ряд других функций, состав которых определяется уровнем и назначением конкретного программного средства.
Данный материал посвящён программным средствам и технологиям обработки текстовой информации, т.к. ввод информации с бумаги в компьютер является в настоящее время часто выполняемой задачей.
В начале 1975 года кинорежиссёр и программист из Нью-Йорка Майкл Шрейер стал обладателем комплекта для сборки микрокомпьютера «Альтаир 8800». Он собрал машину и вскоре начал создавать и продавать небольшие программы, которые со временем получались всё более и более сложными, а потому и руководства к ним усложнялись. Шрейер пришёл к выводу, что целесообразно готовить эти руководства с помощью компьютера, а не печатать их на машинке.
Целый год он упорно трудился над новой программой, дав ей название «Электрический карандаш». Через некоторое время Шрейер понял, что подобная программа может заинтересовать обладателей микрокомпьютеров и создал 78 вариантов «Электрического карандаша», учитывая особенности целого ряда принтеров. Распространялась данная программа при помощи почты, потому что магазинов, занимающихся продажей программного обеспечения, практически не было.
В первые два года после своего выхода «Электрический карандаш» являлся, по сути дела, единственным текстовым редактором, доступным массовому потребителю. Однако по мере расширения рынка персональных компьютеров другие предприниматели тоже стали делать шаги в данном направлении.
Одним из них был житель Нью-Йорка Сеймур Рубинштейн, в планы которого входило создание текстового процессора. Совместно с программистом Джоном Барнэби при помощи многочисленных опросов было выяснено, какими возможностями должен обладать текстовый процессор, чтобы привлечь внимание потенциальных покупателей.
Так, в 1978 году появилась довольно удачная система, которая получила название WordStar, которая практически сразу же стала стандартом текстовых процессоров для микрокомпьютеров. «Электронный карандаш», WordStar являлись предшественниками популярнейшей сегодня компьютерной программы для обработки текстовой информации — Microsoft Office Word.
Текстовые редакторы — это программы для создания, редактирования, форматирования, сохранения и печати документов. Современный документ может содержать, кроме текста, и другие- объекты (таблицы, диаграммы, рисунки и т. д.).
Простые текстовые редакторы (например, Блокнот) позволяют редактировать текст и осуществлять простейшее форматирование шрифта.
Более совершенные текстовые редакторы, имеющие целый спектр возможностей по созданию документов (например, поиск и замена символов, средства проверки орфографии, вставка таблиц и др.), называют иногда текстовыми процессорами. Примером такой программы является Word из офисного пакета MicrosoftOffice, или Writer из пакета StarOffice.
Мощные программы обработки текста — настольные издательские системы — предназначены для подготовки документов к публикации. Пример подобной системы — Adobe PageMaker.
Для подготовки к публикации в Интернете web-страниц используют специализированные приложения (например, Microsoft FrontPage или Macromedia Dreamweaver).
World Wide Web («Всемирная паутина») обеспечивает хранение, обработку и распространение публикаций в виде:
- рекламных страниц;
- электронной периодики;
- справочников, каталогов;
- периодических иллюстрированных журналов;
- электронных газет;
- различного рода энциклопедии;
- учебников (гипермедийные издания в рамках виртуального публичного университета).
Инструментальные программы для подготовки текстов программ, документов, описаний называются текстовыми редакторами (text-editor), мощные текстовые редакторы с расширенным спектром функций называют также текстовыми процессорами (word-processor). Некоторые текстовые процессоры могут работать не только с текстами, но и с изображениями, например, редактировать иллюстрированные документы.
Основные функции текстовых редакторов и процессоров:
Текстовые редакторы разделяются на три группы:
- редакторы общего назначения (сюда относятся, например, редакторы «Лексикон», MS Word, WordPerfect и др.);
- редакторы научных текстов (ChiWriter, ТеХ и др.);
- редакторы исходных текстов программ (например, Multi-Edit или встроенные редакторы систем программирования для языков Бейсик, Фортран, Си и др.).
По сравнению с редакторами общего назначения специализированные редакторы позволяют легче готовить и редактировать соответствующие тексты: например, редакторы научных текстов удобнее для набора математических или химических формул.
Программы оптического распознавания символов
- изображение, считываемое сканером, хранится в электронном виде;
- сканер не может отличать текст от рисунков и представляет их в виде отдельных графических фрагментов из черных и белых эле-ментов.
Если созданное сканером изображение содержит текст и рисунки, то при помощи специальной программы оптического распознавания тек-ста (OCR) можно: - отделить текст от рисунков;
- записать этот текст в формате файла текстового процессора.
Программное обеспечение в современных системах OCR выполняет анализ форм букв и создание текстового файла, в который распознаваемый текст записывается посимвольно с последовательным формированием слов и предложений.
Основные технологические требования к OCR при использовании компьютерных издательских систем:
- умение распознавать начало и конец отдельных символов, поскольку сам сканер лишь оцифровывает изображение и, кроме того, многие шрифты являются пропорциональными;
- возможность работать с большим диапазоном гарнитур, кеглей, начертаний шрифтов, которые могут использоваться при полиграфическом оформлении документа;
- возможность работать с оригиналами различного качества (в том числе созданными типографским способом или на лазерном принтере);
- возможность распознавать многоколонный текст;
возможность распознавать текст, имеющий в составе таблицы и рисунки; - достаточно высокая достоверность распознавания (не менее 90-96 %).
Существует два типа пакетов OCR: обучаемые и интеллектуальные.
Первые пакеты оптического распознавания символов имели четкое разделение по типу. В последнее время наблюдается тенденция к объединению этих двух типов в одном пакете, что перекликается с попытками разработать принципиально новые алгоритмы распознавания. В случае обучаемых систем происходит поточечное сравнение оцифрованного символа с образцом в справочной таблице. Оно осуществляется путем наложения масок символов на символ из считанного документа и проверки на полное совпадение. Как только совпадение достигается, символ добавляется в файл. В процессе распознавания символа при наложении маски размеры шрифта документа и маски должны быть одинаковыми. Это означает, что необходимо иметь маски для каждого размера шрифта и что система оказывается более эффективной в случае однотипного текста. С учетом этих ограничений, при разрешающей способности сканера 300 dpi обеспечивается достаточная точность обработки для того ограниченного набора шрифтов, который система “знает”.
В случае интеллектуальной системы — более мощном методе преобразования считанного документа в текстовый файл — программа самостоятельно идентифицирует каждый оцифрованный символ. Здесь маска символа заменяется на его контур. Такой эталонный контур может быть использован для любых размеров шрифтов. Стандартная система, основанная на этом методе, может распознавать несколько тысяч шрифтов. Поскольку такие системы не пользуются фиксированными масками, не возникает проблем, связанных с совпадением одной маски с несколькими разными символами. Кроме определения символа по контуру система выполняет ряд перекрестных проверок полученного текста.
Развитие индустрии систем электронного документооборота требует новых средств обработки полнотекстовой информации, основанных на лингвистическом анализе текста и включающих элементы искусственного интеллекта. Доступные сегодня вычислительные мощности позволяют применить широкий класс методов для обработки больших массивов документов, эффективно решая задачи поиска, классификации, кластерного анализа, выявления скрытых закономерностей и другие.
Сегодня актуальна фраза: “Кто владеет информацией, тот владеет миром”.
Умение овладевать новой информацией и корректно располагать ее при подготовке документов – одно из условий совершенствования информационной культуры человека. А понятие информационной культуры весьма многозначно и содержит в себе множество видов работы, ключевым из которых является обработка текста.
Текстовые редакторы предназначены для работы с текстовыми файлами в интерактивном режиме. Они позволяют просматривать содержимое текстовых файлов и производить над ними различные действия — вставку, удаление и копирование текста, контекстный поиск и замену, сортировку строк, просмотр кодов символов и конвертацию кодировок , печать и т. п.
Часто интерактивные текстовые редакторы содержат дополнительную функциональность, призванную автоматизировать действия по редактированию, или отображают текстовые данные специальным образом (например, с подсветкой синтаксиса ).
Многие текстовые редакторы являются редакторами исходного кода , то есть они ориентированы на работу с текстами программ на тех или иных компьютерных языках .
Текстовые редакторы, способные видоизменять содержание документа, также называют текстовыми процессорами. Текстовые процессоры ориентированы на оформление и форматирование текстов и внедрение в них сторонних объектов (шрифтов, таблиц, формул, графиков т. п.) и характеризуются наличием WYSIWYG-режимов. Поскольку в текстовом формате не предусмотрено хранение информации об оформлении текста, текстовые процессоры работают либо с файлами, в которых тексты представлены в обрамлении какого-либо языка разметки вроде HTML , либо с файлами в собственных « двоичных » форматах. Текстовый редактор Word с автоматической проверкой орфографии.Также нужно упомянуть удобный интерфейс, позволяющий быстро освоить приложение. Казалось бы, зачем искать что-то еще, но… есть одно «но». Microsoft Word – не бесплатное приложение. Конечно, тем, для кого работа на дому в интернете, к примеру, по набору текста стала источником стабильного и достаточно высокого дохода, имеет смысл купить этот редактор. Но, если человек использует подобное ПО достаточно редко, можно выбрать что-то похожее, только бесплатно.
Текстовый редактор LibreOffice Writer.
LibreOffice Writer – на данный момент это самый мощный среди бесплатных текстовых редакторов. Он позволяет работать с документами Microsoft Word, RTF, создавать HTML документы. В нем также можно вставлять в тексты таблицы, картинки, мультимедийные объекты и другие элементы. В LibreOffice Writer имеется редактируемый словарь и функция проверки орфографии. Интерфейс программы напоминает ранние версии Word, поэтому освоить его несложно. Тем более что есть русская версия приложения. Одним словом, этот редактор можно смело назвать бесплатным аналогом или упрощенной версией Microsoft Word. Есть и другие бесплатные приложения (AbiWord, OpenOffice), но, судя по отзывам пользователей, им далеко до LibreOffice Writer.
Текстовый редактор Блокнот.
Блокнот – это самый простой текстовый редактор, который входит в стандартный пакет установки системы Windows. Он работает с расширением TXT, но может открывать файлы INF, INI, LOG.
Редактор Блокнот имеет совсем небольшой набор функций. Он позволяет набирать тексты, выбирать шрифты, осуществлять поиск, автоматически заменять слова, сохранять документы и отправлять их на печать. Такие функции, как форматирование, проверка орфографии , вставка изображений, использование разных цветов в этом приложении недоступны.
Тем не менее, Блокнот полезен не только начинающим, но и опытным пользователям, как простой и удобный вспомогательный инструмент. Вот лишь некоторые возможности этой программы:
Блокнот работает с текстами в кодировках Unicode, UTF-8 и ANSI и позволяет выполнять преобразование одной кодировки в другую. Для этого можно просто выбрать нужную кодировку при сохранении файла.
Если набрать текст в Microsoft Word или другом аналогичном редакторе, а потом опубликовать на сайте или в блоге, там появится много лишнего. Конечно, если движок нормальный, этого не произойдет. Но лучше сначала вставить текст в блокнот, а уже оттуда скопировать его для публикации. Для этого можно использовать горячие клавиши Ctrl+C (скопировать) и Ctrl+V (вставить).
В Блокноте можно делать или редактировать несложные Web-страницы. Для сохранения файла в формате HTML достаточно в поле «имя файла» ввести «название.html», а в поле «тип файла» выбрать «все файлы».
Блокнот позволяет убрать и тот «мусор», который может появиться при копировании текста из каких-нибудь редакторов. Например, есть такая программа для распознавания текста, которая расшифровывает сканированные документы. Очень удобно, но все распознать она не может, и в тексте остается много непонятных значков. Чтобы их убрать, достаточно скопировать результат в Блокнот.
Редактор текста Google, позволяющий печатать текст онлайн бесплатно.
В Google есть замечательный редактор, позволяющий набирать текст прямо в браузере, в режиме онлайн, без установки приложения на компьютер. Правда, чтобы получить к нему доступ, надо создать аккуант в Google или воспользоваться уже существующим. После этого пользователю будут доступны удобные сервисы для работы с документами, в том числе и редактор текста онлайн , о котором хочу сказать пару слов.
Этот онлайн сервис находится во вкладке «Диск», которая появляется в верхней части браузера при выборе системы поиска Google. Чтобы начать печатать текст , надо нажать на яркую красную кнопку «Создать», потом «Документ», после этого в новой вкладке откроется редактор.
По своим функциональным возможностям редактор текста Google – это что-то среднее между Microsoft Word и Блокнотом. Он поддерживает несколько текстовых форматов (DOCX, RTF, TXT), а также HTML, PDF. В нем можно форматировать тексты, использовать разные шрифты и стили, менять цвет текста, вставлять таблицы, рисунки, формулы, ссылки, специальные символы, номера страниц, сноски и комментарии, осуществлять поиск и проверку орфографии (редактор подчеркивает слова с ошибками и предлагает варианты их написания). Еще одна уникальная функция – это перевод текста на разные языки. Переведенный текст открывается в новом окне, что позволяет сравнить его с оригиналом.
Все документы автоматически сохраняются в разделе «Мой диск», где их можно оставить, если тексты еще нужны, или скачать на компьютер. Кстати, все это можно делать с мобильного телефона.
В общем, в онлайн редакторе Google есть все, что нужно для работы с текстами. Если бы он еще позволял в автоматическом режиме выполнять проверку документа на антиплагиат , это был бы лучший на данный момент бесплатный редактор. К сожалению, такого редактора текста онлайн в Яндексе пока нет.
Бесплатный текстовый редактор Notepad для программистов и веб-мастеров.
Есть еще один редактор, о котором хотелось бы упомянуть, так как сам им пользуюсь. Это Notepad, который является аналогом блокнота и ориентирован на работу с исходным кодом PHP и Html. Он является незаменимым инструментом для блогеров и тех, кого интересует создание сайтов самостоятельно, и кто уже сталкивался с проблемой чистки и редактирования кода.
Приложение распространяется бесплатно, скачать текстовой редактор Notepad можно на сайте разработчиков. Программа очень легкая и обеспечивает максимальную скорость работы. К сожалению, подробно рассказать о редакторе в этом материале не получится, отмечу лишь некоторые особенности:
В Notepad Plus есть подсветка синтаксиса, то есть разные элементы кода выделяются определенными цветами, а обычный текст остается черным.
Редактор позволяет легко находить закрывающие теги, выделяя их цветом, для этого достаточно кликнуть мышкой по открывающему тегу.
Есть нумерация строк, что тоже очень удобно. Можно убирать и отображать отдельные участки текста. Для этого достаточно нажать на значок (-) или (+) на вертикальной полосе, расположенной вдоль шкалы с номерами строк.
Немаловажно, что редактор Notepad поддерживает русский язык.
Редактор позволяет отменять действия неограниченное количество раз с помощью стрелки возврата. • Встроенный в Notepad FTP-клиент позволяет редактировать файлы прямо на хостинге.
Есть в Notepad и функция поиска, что позволяет сэкономить много времени.
По статистике, редактором Notepad Plus пользуются до 70% Web-мастеров.
Пожалуй, на этом можно и завершить краткий обзор самых популярных текстовых редакторов. Желаю всем удачи и успехов!
Текстовый редактор – самостоятельная компьютерная программа (приложение) или часть программного комплекса, которая предназначена для создания и редактирования текстовых данных.
Текстовые редакторы предназначены в основном лишь для ввода и редактирования текста, но не имеют средств для оформления внешнего вида текста (форматирования). Таким образом, применяются в тех случаях, когда оформление текста является лишним или не нужным (например, при подготовке документов для отправки электронной почтой).
Созданный текстовый файл в одном редакторе можно редактировать с помощью другого редактора, т.к. текстовый файл при сохранении содержит только коды введенных символов.
Кроме создания и просмотра текста текстовые редакторы позволяют выполнять следующие операции редактирования текста – перемещение, копирование, вставка текста, поиск по тексту и замена, сортировка строк, просмотр кодов символов и конвертация кодировок, печать документа и т.п.
Данная программа служит в основном для просмотра и редактирования текстовых документов, которые имеют разрешение *.txt.
Популярные текстовые редакторы: Poet, TextPad, RJ TextEd, AkelPad, jEdit, DPAD, Notepad, Notepad++, Notepad2, EditPlus, EmEditor, UltraEdit.
Текстовый процессор — компьютерная программа, предназначенная для создания и редактирования текстовых документов, компоновки макета текста и предварительного просмотра документов в том виде, в котором они будут напечатаны.
Текстовые процессоры умеют форматировать текст, вставлять в документ графику и другие объекты, не относящиеся к классическому понятию «текст».
Современные текстовые процессоры позволяют выполнять форматирование шрифтов и абзацев, проверку орфографии, вставку таблиц и графических объектов, а также включают некоторые возможности настольных издательских систем.
Текстовые процессоры используют в случаях, когда кроме содержания текста имеет значение и его внешний вид (подготовка официальных документов). Документ, созданный с помощью текстового процессора, содержит кроме текста еще и информацию о его форматировании, которая сохраняется в кодах, не видимых пользователю.
1) Microsoft Word — мощный текстовый процессор, предназначенный для создания, просмотра и редактирования текстовых документов.
Рис. 2. Окно текстового процессора Microsoft Word
Интерфейс текстовых процессоров имеют похожую структуру . В качестве примера посмотрим интерфейс текстового процессора Microsoft Word (рис. 2):
для обработки изображений в процессе создания доклада.
А2. Текстовая информация-это
информация, представленная в форме письменного текста;
рисунки схемы, графики;
полный набор букв алфавита.
А3. Какие операции выполняют при редактировании текста?
Совершают операции по оформлению текста.
Просматривают текст, исправляют ошибки, вносят изменения.
Выводят текст на печать.
А4. Какие из перечисленных ниже расширений соответствуют текстовому файлу?
А5. Какую программу нужно выбирать для обработки текстовой информации?
А6. Гипертекст – это…
очень большой текст;
текст, в котором используется шрифт большого размера;
это текст, организованный так, что его можно просматривать в последовательности смысловых связей между его отдельными фрагментами.
А7. При задании параметров страницы в текстовом редакторе устанавливаются:
гарнитура, начертание, размер;
В заданиях группы Б представить решение задачи, дать полный ответ на поставленный вопрос.
Б1. Заполните пропуск в ряду:
Символ- … - строка – абзац.
Б2. Как называется процесс изменения внешнего вида текста?
Б3. Установите соответствие:
Программа оптического распознавания документов.
Б) Abbyy Fine Reader
Программа для редактирования текстов.
Программа для формирования навыков печати.
Б4. Установите соответствие:
А) Объект текста, используемый для указания нескольких элементов.
Б) Объект текста, используемый для наглядного представления информации.
В) Объект текста, используемый для указания нескольких элементов в определенном порядке.
Контрольная работа по теме
«Обработка текстовой информации»
В заданиях группы А выбрать только один ответ.
А1. Для создания, редактирования и форматирования текстовой информации необходим
А2. Основные объекты текстового документа – это
символ, слово, строка, абзац;
шрифт, формат, курсор;
буквы, рисунки, знаки.
А3. Какие операции выполняют при форматировании текста?
Совершают операции по оформлению текста.
Просматривают текст, исправляют ошибки, вносят изменения.
Выводят текст на печать.
А4. К приложениям для обработки текстовой информации можно отнести:
MS Excel, Super Calc;
Word Pad, MS Word, Star Office Writer;
А5. Выбери из списка файл с текстовой информацией.
А6. Текст, организованный так, что его можно просматривать в последовательности смысловых связей между его отдельными фрагментами, называют –
А7. При задании параметров абзаца в текстовом редакторе устанавливаются:
гарнитура, начертание, размер;
В заданиях группы Б представить решение задачи, дать полный ответ на поставленный вопрос.
Б1. Заполните пропуск в ряду:
Б2. Как называется процесс исправления ошибок в тексте?
Б3. Установите соответствие:
Программа оптического распознавания документов.
Б) Abbyy Fine Reader
Программа для редактирования текстов.
Программа для формирования навыков печати.
Б4. Установите соответствие:
А) Объект текста, используемый для указания нескольких элементов в определенном порядке.
Читайте также: