Постройте программу которая составляет алфавитно частотный словарь для заданного файла паскаль
Частотный анализ текста
П рограмма BX Language acquisition позволяет Вам автоматически составлять словари на основе частотного анализа текста. Для этого Вам необходимо перейти в закладку Текст основного окна обучения .
Н а этой же закладке кнопкой "Субтитры" можно вызвать форму Проекта словарей из субтитров к фильмам .
О кно редактора Текста состоит из панели управления текстом , самого текста и панели параметров частотного анализа текста . Кнопки на панели управления текстом позволяют Вам сохранить текст в текстовом файле , открыть текст из текстового файла или создать новый текст . Загрузить текст из файлов других форматов можно через буфер обмена Windows с помощью кнопки Вставить. Вы можете набрать текст вручную и потом сохранить его в новом файле. Редактирование, поиск и замена текста выполняется также как и в стандартном редакторе Windows Блокнот . Вы можете открывать текстовые файлы в кодировке WIN или Unicode. Сохранение новых файлов осуществляется в кодировке Unicode.
П анель параметров частотного анализа текста ограничивает спектр слов Текста для создания частотного словаря. Вы можете ограничить частотный словарь только теми словами, которые встречаются в тексте, начиная с определённого количества раз. Можно ограничить частотный словарь только теми словами, на которые есть перевод в Базовом словаре. Выбрать Базовый словарь можно на панели управления текстом по кнопке Выбрать Базовый словарь . Вы можете отобразить количество повторений слов в тексте, а также создать частотный словарь, упорядоченный по частоте или по встречаемости слов в тексте . Во втором случае слова можно будет учить сначала для первой главы книги, потом для второй и так далее.
В ы можете добавить дополнительные категории в создаваемый частотный словарь . Для этого введите их в поле "добавить категории". Если категорий несколько, то разделите их точкой с запятой ( ; ). Категории будут добавлены в частотный словарь вместе с категориями Базового словаря .
Е сли Вы установите галочку "формировать пример", то для каждого слова в частотном словаре, будет сформирован пример применения , то есть одно из предложений текста, в котором встретилось данное слово . Если слово встречается в нескольких предложениях , то выбирается предложение средней длины: не более 6-ти слов или не длиннее 50 символов. В случае сортировки по тексту пример применения слова формируется из предложения, в котором это слово встречается впервые. В программе под предложением понимается текст, завершённый следующими символами: точка( . ), восклицательный знак( ! ), вопросительный знак( ? ), точка с запятой( ; ).
Внимание!
При использовании этой опции значительно повышаюся требования программы к ресурсам компьютера.
Например, при 1Gb оперативной памяти можно пропустить текст объёмом не более 38 Мб или 13 тыс страниц.
Д ля создания частотного словаря из текста необходимо выполнить следующие шаги:
1 - Загрузить текст в текстовый редактор программы (из файла или буфера обмена Windows)
2 - Выбрать Базовый словарь для подстановки из него перевода и транскрипции в новый частотный словарь.
3 - Нажать кнопку Создать частотный словарь на панели управления текcтом
4 - В диалоге создания словаря указать имя частотного словаря.
П о окончании частотного анализа текста программа загрузит Новый словарь и перейдёт в закладку Словарь для его просмотра и редактирования. В частотном словаре будут заполнены поля Слово, порядок и Пример в котором отобразится количество повторений слова в тексте (если такая опция включена) . Вы можете изменить параметры частотного анализа , после чего пересоздать частотный словарь . Например: ограничить словарь словами, которые повторяются в тексте, начиная от 2 и более раз, или изменить вид сортировки. Для слов Нового словаря, которых нет в Базовом словаре, переводы и транскрипцию нужно будет ввести вручную. Чтобы свести ручную работу к минимуму, в качестве Базового словаря необходимо выбирать самый большой словарь или выставить опцию на панели параметров частотного анализа - только базовые слова.
В ы можете загрузить статистику слов из ранее выученных словарей в Новый словарь .
В ы можете загрузить перевод, транскрипцию или пример использования из других словарей в Новый словарь .
Сайт учителя информатики. Технологические карты уроков, Подготовка к ОГЭ и ЕГЭ, полезный материал и многое другое.
Информатика. 11 класс. Углубленный уровень. В 2 ч. Поляков К.Ю., Еремин Е.А.
§ 41. Списки
Вопросы и задания
1. Что такое список? Какие операции он допускает?
2. Верно ли, что элементы в списке упорядочены?
3. Какой метод поиска в списке можно использовать? Обсудите разные варианты.
4. Как добавить элемент в линейный список, сохранив заданный порядок сортировки?
5. Как можно представить список в программе? В каких случаях для этого можно использовать обычный массив?
6. Объясните запись L.data [i] .word.
7. Что такое модуль? Зачем используют модули?
8. Как оформляется текст модуля? Как по нему отличить модуль от основной программы?
9. Что размещается в секциях interface и implementation?
10. Можно ли все переменные и подпрограммы поместить в секцию interface? Чем это плохо?
11. Как подключается модуль к основной программе или другому модулю?
12. Что такое связный список?
13. Что такое циклический список? Попытайтесь придумать задачу, где после завершения просмотра списка нужно начать просмотр заново.
14. Сравните односвязный и двусвязный списки. Покажите на примерах. В чём достоинства и недостатки одного и второго типов?
а) «Списки в языке Си»
б) «Ассоциативные массивы в языке Javascript»
в) «Словари в языке Python»
Задача
1. Постройте программу, которая составляет алфавитно-частотный словарь для заданного файла со списком слов. Используйте модуль, содержащий все операции со списком.
*2. В программе из задачи 1 измените функцию Find так, чтобы в ней использовался двоичный поиск.
3. В программе из задачи 2 объедините функции Find и FindPlace, заменив их на одну функцию. Если слово найдено в списке, функция работает так же, как Find: возвращает номер слова в списке. Если слово не найдено, функция должна вернуть отрицательное число: номер элемента массива, перед которым нужно вставить слово, со знаком минус.
*4. В программе из задачи 3 выведите все найденные слова в файл в порядке убывания частоты, т. е. в начале списка должны стоять слова, которые встречаются в файле чаще всех.
Прочтите прежде чем задавать вопрос!
1. Заголовок темы должен быть информативным. В противном случае тема удаляется .
2. Все тексты программ должны помещаться в теги [code=pas] . [/code], либо быть опубликованы на нашем PasteBin в режиме вечного хранения.
3. Прежде чем задавать вопрос, см. "FAQ", если там не нашли ответа, воспользуйтесь ПОИСКОМ, возможно такую задачу уже решали!
4. Не предлагайте свои решения на других языках, кроме Паскаля (исключение - только с согласия модератора).
5. НЕ используйте форум для личного общения, все что не относится к обсуждению темы - на PM!
6. Одна тема - один вопрос (задача)
7. Проверяйте программы перед тем, как разместить их на форуме.
8. Спрашивайте и отвечайте четко и по существу.
вообще моя задача выглядит так:
На входе текстовый файл на языке логлан. Результат работы — алфавитно-частотный словарь лексем заданного текста. В полученном файле должно быть указано следующее: лексема, ее принадлежность к тому или иному грамматическому классу, частота лексемы, ранг.
Логлан — язык аналитического типа. Грамматических классов три: предикаты, имена, «грамматические слова». Предикаты характеризуются наличием стыка согласных, оканчиваются на гласную. Имена оканчиваются на согласный звук. «Грамматические слова» не имеют стыков согласных и обязательно оканчиваются на гласную. Гласные: a, e, i, o, u, y. Согласные: b, c, d, f, g, h, j, k, l, m, n, p, q, r, s, t, v, z.
буду очень признательна даже на маленький намёк по концепции решения. а то моих знаний явно на хватает, а попытки приводят к .
спасибо
Репутация: 45
Смысл задачи состоит в разборе читаемых строк.
Общий алгоритм таков:
1.читаем очередную строку.
2. разбираем ее на слова.
3. анализируем слова.
Это называется структурный метод решения задачи, а теперь разбьираем каждый пункт подробнее, подробнее, до тех пор, пока это можно будет описать в виде предложений на алгоритмическом языке Паскаль.
Читайте также: