Word cloud как работать

Обновлено: 22.01.2025

Одним из инструментов социальных сервисов Web 2.0 являются Облака слов (Wordclouds). Как показывает практика, облако слов может применяться на уроках для решения различных учебных задач. Облако слов – это графический способ визуализации наиболее часто используемых или наиболее значимых слов в речи, в книге, в стихотворении, тексте, историческом документе и т. д. Сервисы выделяют наиболее крупно слова, которые чаще встречаются в тексте. В процессе создания облака можно настраивать цветовую гамму, использовать разные шрифты, выбирать форму облака, расположение и направление слов. Все сервисы бесплатные и легкие в использовании.

Вложение	Размер
oblako_slov.docx	27.59 КБ

Предварительный просмотр:

как средство мотивации монологической и диалогической речи на уроках английского языка.

В связи с модернизацией российского образования актуальным становится вопрос компетентностного подхода в обучении. Среди ключевых компетенций важное значение имеет коммуникативная компетенция .

Эта компетенция означает овладение всеми видами речевой деятельности, культурой устной и письменной речи, умениями и навыками использования языка в различных сферах и ситуациях общения. Проще говоря, коммуникативная компетенция заключается в умении общаться.

Сегодня, в век развития коммуникационных технологий, знание иностранного языка необходимо каждому. Одним из лидирующих направлений ИКТ в современном образовании являются современные сервисы Web 2.0. Сегодня сервисы Web 2.0 активно используются педагогами.

Применение социальных сервисов в учебном процессе позволяет организовать урок на новом, более высоком уровне: сделать его интересным, интерактивным, личностно ориентированным, результативным. Одно из направлений социальных сервисов – Интернет-инструменты, при помощи которых участники образовательного процесса – педагоги и учащиеся – могут создавать необходимые для обучения материалы. Социальные сервисы позволяют визуализировать и структурировать информацию, встраивать изображения, видео, можно привязывать ссылки, отмечать даты, создавать различные образы и т.д.

Разработанные современными средствами методические и дидактические материалы могут стать одним из благоприятных условий для развития аналитических способностей учащихся, критического мышления, способствовать формированию эмоциональных, ценностных составляющих развития, способствуют приобретению навыков использования информации в разных форматах, навыков классификации и моделирования, умения выделять главное, формулировать логические выводы, развивают творческие способности и самовыражение учащихся.

Данные средства позволяют создавать увлекательные, эстетические, познавательные, проблемные материалы и тем самым повышать мотивацию, познавательный интерес и потребность к самообразованию учащихся.

Облако слов – это графический способ визуализации наиболее часто используемых или наиболее значимых слов в речи, в книге, в стихотворении, тексте, историческом документе и т. д. Сервисы выделяют наиболее крупно слова, которые чаще встречаются в тексте. В процессе создания облака можно настраивать цветовую гамму, использовать разные шрифты, выбирать форму облака, расположение и направление слов. Все сервисы бесплатные и легкие в использовании.

Знакомство с возможностями использования облака слов на уроке необходимо начать с представления самих сервисов, генерирующих облака слов.

Облако слов, созданное при помощи сервисов Интернет, успешно применяется в практике обучения английскому языку на разных этапах формирования речемыслительной деятельности. Сгенерированное облако можно использовать как раздаточный материал, вывести на экран. Облака слов могут использоваться учителем в качестве самостоятельной подготовки учащихся к домашнему заданию.

Рассмотрим некоторые примеры использования Wordcloudsв качестве упражнений, направленных на формирование и развитие коммуникативных навыков.

На уроках по формированию лексических навыков.

Использование сгенерированных облаков слов возможно на разных этапах работы над лексическими единицами по любой теме. В данном случае облако слов может выступать в качестве зрительной опоры, что облегчит выполнение задания, вызовет интерес у учащихся. Особенно полезным и эффективным окажется этот прием для детей-визуалов.

УМК М. З. Биболетовой «EnjoyEnglish 5-6». Раздел 4. Узнаем больше о Лондоне.

Задание: соедините пары слов, имеющие противоположные значения. На основе полученных словосочетаний составьте предложения.

The sea is different from the river.

The nice day is different from the stormy day.

Hot summer is different from frosty winter.

Составленные словосочетания и предложения записываются в тетради. Такой вид упражнений расширяет лексический запас учащихся, развивает языковую интуицию.

УМКМ. З. Биболетовой «Enjoy English 5-6». Unit 3. Learning more about each other.

Задание: найдите слова с одинаковым или противоположным (синонимы или антонимы) значением, составьте с ними предложения и аргументируйте свое мнение.

- My sister is talkative and intelligent. She talks early morning till late at night. SheisgoodatMathsandEnglish.

Таким образом, учитель использует облако слов для развития умений аргументированного высказывания. Для формирования навыков построения вопросительных предложений можно попросить учащихся задать вопросы с данными словами:

- Is your sister clever?

- Are you creative?

При изучении числительных: показать и назвать числительные по порядку.
УМКМ. З. Биболетовой «Enjoy English 11». Unit 3. Heading for a better new world. Section 1. How dependent you are on modern technologies.

В начале урока учитель может показать облако слов учащимся и попросить их догадаться, о чем пойдет речь на уроке.

E. g. I guess we’ll speak about modern technologies and electronic devices.

Задание: образуйте словосочетание со словами technologies,devices, составьте предложения с данными словосочетаниями.

Использовать облака слов можно и при работе над алфавитом.

Задания могут быть самыми разнообразными: назовите (запишите) буквы в алфавитном порядке, напишите пары букв (прописную и строчную), найдите и покажите букву … и т. д.

Ключевые и опорные слова, сгенерированные в облако слов, помогут учащимся составить собственное монологическое высказывание на английском языке по любой теме учебного курса. Возможности использования облака слов на уроке неисчерпаемы. Облака слов – замечательное средство, которое можно применять на этапах актуализации знаний (повторение лексики), активизации лексики и ее закрепления. Творчески работающий учитель безусловно увидит возможности применения данного инструмента на своем уроке, составит задания в соответствии с целями и задачами своего урока.

На уроках формирования лексико-грамматических навыков.

Облака слов можно использовать при работе над словообразованием и грамматическими конструкциями. Приведу несколько примеров.

УМК М. З. Биболетовой «EnjoyEnglish 8». Раздел 3. Средства массовой информации. Упр. 99,100 с. 82

Задание: образуйте прилагательные с суффиксом – less, запишите получившиеся слова в тетрадь, составьте словосочетания и переведите их русский язык.

Яркое, красочное, необычно представленное задание без сомнения вызовет интерес у учащихся. Облака слов можно использовать не только на уроках по словообразованию, но и при работе со словарным ядром.

Облако слов может помочь учителю при работе над грамматическими конструкциями. Например, чтобы активизировать в употреблении грамматическую структуру Haveyoueverbeento. было сгенерировано облако слов. Учащиеся работали в парах. Таким образом,учащиеся с опорой на облако слов составляли вопросы и давали краткие и развернутые ответы.

УМКМ. З. Биболетовой «Enjoy English 5-6». Unit 5. Faces of London.

Have you ever ben to the Zoo? – Yes, I have. I was at the Zoo last week. I saw a big tiger. The tiger walked along his cage. I liked it there.

При помощи данного упражнения можно не только отработать грамматическую конструкцию в PresentPerfect в речи, но и повторить правила употребления PastSimple, а также провести сопоставление времен английского языка.

Упражнения на развитие навыков критического мышления.

Это очевидно, что облака слов очень удобны для заданий, где учащимся предлагается предсказать развитие событий (Prediction). Можно показать облако слов учащимся и попросить их предположить, о чем пойдет речь на уроке или в тексте, который вы собираетесь прочитать.

УМКМ. З. Биболетовой «Enjoy English 8». Unit 1. It’s a wonderful planet we live on! Ex. 89,p. 26

Текст был отсканирован программой ABBYYFineReader, сохранен как WordDoc, скопирован и вставлен в текстовое поле для генерации облака слов.

УМКМ. З. Биболетовой «Enjoy English 8». Unit 3. Heading for a better new world.

Задание: какие книги вы любите читать и почему? Поработайте в парах и выясните у своих одноклассников, какие книги они любят читать. Расскажите об этом классу.

E. g. Ilikefairytales. Most of all I like wonderful magic world of the tale. I am always full of ideas of the plot.

- Do you like reading detective stories? Why?

- Ann enjoys reading love stories because…

Итак, сервисы по генерированию облако слов могут успешно применяться на уроках английского языка. Как результат, упражнения, представленные в образе облака слов, будут способствовать языковой интуиции, критического мышления и речемыслительной деятельности в целом. Совместная творческая деятельность учителя и учащихся по использованию облака слов на уроке позволит активизировать мыслительные процессы, познавательный интерес учащихся, облегчить такой отрицательный фактор, как боязнь ответа, реализовать личностно-ориентированный подход на уроке. Облака слов могут быть использованы в разных формах организации работы на уроке: индивидуальной, парной, групповой. Сгенерированное облако можно проецировать на экран во вредя урока, а также можно распечатать и использовать как раздаточный материал.

По теме: методические разработки, презентации и конспекты

Личностно – ориентированный подход при обучении устной (монологической и диалогической) речи на уроках английского языка.

Актуальные проблемы иноязычного образования в современном социокультурном контексте.

Облако слов как средство мотивации монологической и диалогической речи на уроках английского языка.

«Ролевая игра как средство развития мотивации студентов при обучении диалогической речи на уроках английского языка»

В данной статье изложен теоретический материал по вопросу использования ролевых игр для совершенствования иноязычной диалогической речи обучаемых, создания атмосферы сотрудничества и личной заинтересо.

Пересказ как средство развития навыков монологической и диалогической речи на уроках английского языка

Нетрадиционные методы обучения монологической и диалогической речи на уроках английского языка в старших классах

Актуальность работы состоит в том, что на современном этапе развития школьного образования одной из наиболее актуальных проблем, требующих новых путей решения, является необходимость качественного улу.

Статья на тему: "Пересказ как средство формирования навыков монологической и диалогической речи на уроках английского языка в средней школе"

Формирование монологической и диалогической речи на уроках английского языка

В связи с усилением социальной мобильности нашего общества и резкими изменениями ценностных ориентиров, особенно актуальной становиться проблема формирования толерантного сознания и коммуникативной ко.

Всем привет! Хочу продемонстрировать вам, как я использовал библиотеку WordCloud для создания подарка для друга/подруги. Я решил составить облако слов по переписке с человеком, чтобы выделить основные темы, которые мы обсуждаем.

Выгружаем переписку

Для начала нам нужно будет выгрузить переписку из ВК. Как это сделать? Очень просто! Я пользовался расширением для браузера "VkOpt". Скачиваем его и устанавливаем. Теперь заходим в диалог с человеком, переписку с которым хотим скачать.

Наводим на три точки и выбираем "сохранить переписку". Далее будет окно с выбором типа файла. Я предпочитаю json.

Обработка переписки

Импортируем json и открываем наш файл с перепиской.

Теперь давайте выведем его и посмотрим как он выглядит.

Теперь у нас есть массив data, в котором каждый элемент - это одно слово. Далее создадим большую строку, в которую просто запишем через пробел все наши слова.

WordCloud

Почти всё готово, теперь давайте воспользуемся библиотекой WordCloud и построим наше облако слов.

Убираем стоп-слова

Далее создадим массив clear_data, куда будем заносить слова из массива data, которые не содержатся в списке стоп-слов(т. е. нормальные слова).

А теперь формируем нашу большую строку, только теперь из нового массива и заново строим WordCloud.

Результат на лицо. Начинает проявляться оттенок переписки с тем или иным человеком. Ну и, естественно, куда же мы русского могучего, он тоже начинает проявляться на изображении, приходится его замазывать :)

Переходим на ручное управление

Так, вроде стоп-слова убрали, но картинка всё равно не выглядит привлекательной. В выборке остались различные выражения, которые мы часто используем в переписке. Например, мои слова паразиты: "ок", "ща", "крч". Что делать? Все просто. Открываем наш текстовик с русскими стоп-слова и просто вписываем туда слова, которые не должны присутствовать в новом облаке слов(не забудьте сохранить текстовик, перед повторным чтением).

P.S. На самом деле есть и второй вариант удалить слова паразиты. Создадим массив, который заполним словами паразитами, и подадим его как параметр в WordCloud. Тоже хороший вариант, но мне больше нравится с текстовиком.

Таким образом, мы всё глубже и глубже погружаемся в чертоги нашей переписки. Обычно появляются слова, соответствующие темам, которые вы и ваш друг часто обсуждаете.

Форма облака слов

Теперь давайте воспользуемся одной фишкой WordCloud. Оформим наше облако слов в виде какой-то картинки. Я выберу банальное сердечко)

Подадим в функцию нашу картинку как параметр mask.

Вот такая штука у меня получилась.

По-хорошему, нужно удалить ещё около десятка слов, для более-менее приятной картины, но я уверен ту вы справитесь сами)

P.S. Выбирайте черно-белые изображения предметов. Лучше всего, если они выглядят как силуэты. С .jpg у меня не прошло, поэтому я сохранял в .jpg, может быть у вас получится.

Я нарисовал облако слов, которое отражает тональность переписки с тем или иным человеком. Дополнительно, в облаке содержатся слова, которые соответствуют тем темам, которые вы часто обсуждали в диалоге. Как вариант, можно сохранить эту картинку, распечатать, поставить в рамочку и вручить как подарок вашему собеседнику. Ему будет очень приятно, ведь всегда интересно посмотреть на то, как оценивает вашу переписку алгоритм)

Частотный анализ является одним из сравнительно простых методов обработки текста на естественном языке (NLP). Его результатом является список слов, наиболее часто встречающихся в тексте. Частотный анализ также позволяет получить представление о тематике и основных понятиях текста. Визуализировать его результаты удобно в виде «облака слов». Эта диаграмма содержит слова, размер шрифта которых отражает их популярность в тексте.

Обработку текста на естественном языке удобно производить с помощью Python, поскольку он является достаточно высокоуровневым инструментом программирования, имеет развитую инфраструктуру, хорошо зарекомендовал себя в сфере анализа данных и машинного обучения. Сообществом разработано несколько библиотек и фреймворков для решения задач NLP на Python. Мы в своей работе будем использовать интерактивный веб-инструмент для разработки python-скриптов Jupyter Notebook, библиотеку NLTK для анализа текста и библиотеку wordcloud для построения облака слов.

В сети представлено достаточно большое количество материала по теме анализа текста, но во многих статьях (в том числе русскоязычных) предлагается анализировать текст на английском языке. Анализ русского текста имеет некоторую специфику применения инструментария NLP. В качестве примера рассмотрим частотный анализ текста повести «Метель» А. С. Пушкина.

Проведение частотного анализа можно условно разделить на несколько этапов:

Загрузка и обзор данных
Очистка и предварительная обработка текста
Удаление стоп-слов
Перевод слов в основную форму
Подсчёт статистики встречаемости слов в тексте
Визуализация популярности слов в виде облака

Загрузка данных

Открываем файл с помощью встроенной функции open, указываем режим чтения и кодировку. Читаем всё содержимое файла, в результате получаем строку text:

Длину текста – количество символов – можно получить стандартной функцией len:

Строка в python может быть представлена как список символов, поэтому для работы со строками также возможны операции доступа по индексам и получения срезов. Например, для просмотра первых 300 символов текста достаточно выполнить команду:

Предварительная обработка (препроцессинг) текста

Для проведения частотного анализа и определения тематики текста рекомендуется выполнить очистку текста от знаков пунктуации, лишних пробельных символов и цифр. Сделать это можно различными способами – с помощью встроенных функций работы со строками, с помощью регулярных выражений, с помощью операций обработки списков или другим способом.

Для начала переведём символы в единый регистр, например, нижний:

Используем стандартный набор символов пунктуации из модуля string:

string.punctuation представляет собой строку. Набор специальных символов, которые будут удалены из текста может быть расширен. Необходимо проанализировать исходный текст и выявить символы, которые следует удалить. Добавим к знакам пунктуации символы переноса строки, табуляции и другие символы, которые встречаются в нашем исходном тексте (например, символ с кодом \xa0):

Для удаления символов используем поэлементную обработку строки – разделим исходную строку text на символы, оставим только символы, не входящие в набор spec_chars и снова объединим список символов в строку:

Можно объявить простую функцию, которая удаляет указанный набор символов из исходного текста:

Её можно использовать как для удаления спец.символов, так и для удаления цифр из исходного текста:

Токенизация текста

Для последующей обработки очищенный текст необходимо разбить на составные части – токены. В анализе текста на естественном языке применяется разбиение на символы, слова и предложения. Процесс разбиения называется токенизация. Для нашей задачи частотного анализа необходимо разбить текст на слова. Для этого можно использовать готовый метод библиотеки NLTK:

Переменная text_tokens представляет собой список слов (токенов). Для вычисления количества слов в предобработанном тексте можно получить длину списка токенов:

Для вывода первых 10 слов воспользуемся операцией среза:

Для применения инструментов частотного анализа библиотеки NLTK необходимо список токенов преобразовать к классу Text, который входит в эту библиотеку:

Выведем тип переменной text:

К переменной этого типа также применимы операции среза. Например, это действие выведет 10 первых токенов из текста:

Подсчёт статистики встречаемости слов в тексте

Для подсчёта статистики распределения частот слов в тексте применяется класс FreqDist (frequency distributions):

Попытка вывести переменную fdist отобразит словарь, содержащий токены и их частоты – количество раз, которые эти слова встречаются в тексте:

Также можно воспользоваться методом most_common для получения списка кортежей с наиболее часто встречающимися токенами:

Частота распределения слов тексте может быть визуализирована с помощью графика. Класс FreqDist содержит встроенный метод plot для построения такого графика. Необходимо указать количество токенов, частоты которых будут показаны на графике. С параметром cumulative=False график иллюстрирует закон Ципфа: если все слова достаточно длинного текста упорядочить по убыванию частоты их использования, то частота n-го слова в таком списке окажется приблизительно обратно пропорциональной его порядковому номеру n.

Можно заметить, что в данный момент наибольшие частоты имеют союзы, предлоги и другие служебные части речи, не несущие смысловой нагрузки, а только выражающие семантико-синтаксические отношения между словами. Для того, чтобы результаты частотного анализа отражали тематику текста, необходимо удалить эти слова из текста.

Удаление стоп-слов

К стоп-словам (или шумовым словам), как правило, относят предлоги, союзы, междометия, частицы и другие части речи, которые часто встречаются в тексте, являются служебными и не несут смысловой нагрузки – являются избыточными.

Библиотека NLTK содержит готовые списки стоп-слов для различных языков. Получим список сто-слов для русского языка:

Следует отметить, что стоп-слова являются контекстно зависимыми – для текстов различной тематики стоп-слова могут отличаться. Как и в случае со спец.символами, необходимо проанализировать исходный текст и выявить стоп-слова, которые не вошли в типовой набор.

Список стоп-слов может быть расширен с помощью стандартного метода extend:

После удаления стоп-слов частота распределения токенов в тексте выглядит следующим образом:

Как видно, результаты частотного анализа стали более информативными и точнее стали отражать основную тематику текста. Однако, мы видим в результатах такие токены, как «владимир» и «владимира», которые являются, по сути, одним словом, но в разных формах. Для исправления этой ситуации необходимо слова исходного текста привести к их основам или изначальной форме – провести стемминг или лемматизацию.

Визуализация популярности слов в виде облака

В завершение нашей работы визуализируем результаты частотного анализа текста в виде «облака слов».

Для этого нам потребуются библиотеки wordcloud и matplotlib:

Для построения облака слов на вход методу необходимо передать строку. Для преобразования списка токенов после предобработки и удаления стоп-слов воспользуемся методом join, указав в качестве разделителя пробел:

Выполним вызов метода построения облака:

В результате получаем такое «облако слов» для нашего текста:

Глядя на него, можно получить общее представление о тематике и главных персонажах произведения.

Облако слов представляет собой изображение составленное на основе текста. Воспользовавшись сервисом Word's Cloud вы получите картинку, в формате png, составленную из слов содержащихся в предоставленном вами тексте. Слова в облаке будут разного размера и цвета. Размер и цвет будет зависеть от частоты появления данного слова в тексте.

Зачем мне облако слов?

Возможности в использовании облака слов ограничиватся только вашей фантазией. Привлекательно выглядящие картинки могут использоваться во многих случаях. Давайте немного пофантазируем и придумаем вместе с вами способы их использования. Ко мне приходит сразу мысль об изображении комплиментов для вашей второй половинке в виде сердечка. Подберите самые красивые и трогательные слова для нее, а WordsCloud красиво их оформит.

Если у вас есть свой интернет-блог вы можете использовать наш сервис для оформления ваших статей, используя облака в качестве изображения к статье.

Работаете учителем? У вас нескончаемое количество способов использования нашего сайта. Можете разнообразить ваши уроки используя Word's Cloud. Создавайте учебное пособие для ваших учеников. На уроке по иностранному языку можно использовать облако слов для повторения слов или их изучения. На уроках по литературе можно зашифровывать разнообразные произведения и проводить викторины. Физика, история, биология, математика - все эти предметы можно сделать интереснее для ваших учеников.

Облако слов можно использовать как принт для сувенирной продукции: кружек, футболок, чехлов для телефонов. Такой необычный рисунок точно подчеркнет вашу индивидуальность.

Почему стоит использовать Word's Cloud?

Давайте рассмотрим плюсы сервиса. Простой, удобный и интуитивно понятный интерфейс будет прост в использовании. В нем присутствует настройка цвета фона и текста, а также возможность выбора различных трафаретов для придания разнообразных форм облакам из слов. Все это способствует созданию интересного результата за минимальное количество времени.

Читайте также: