Как удалить дубли в google excel
На официальном портале посвященном всем сервисам Google вышло несколько новых очень полезных обновлений. Теперь пользователи Гугл Таблиц смогут удалять пробелы и дубликаты через меню интерфейса самих Гугл таблиц, а так же теперь можно будет вставлять изображения прямо в ячейку, без использования функций Image
Теперь что бы удалить пробелы или удалить дубликаты в Google таблице, необходимо просто выделить необходимый вам диапазон значений и в панели инструментов выбрать “ Данные ” , а после нажать либо “ Удалить дубликаты ” либо “ Удалить пробелы “. Обратите внимание на то, что функция удаления пробелов удаляет их только в начале и в конце текстового значения в ячейке, в середине пробелы останутся.
Данные функции удобны в том случае если вы работаете со статичными данными, которые ни откуда не выгружаются и не импортируются. Один раз нажали и всё. В ином случае лучше использовать функции unique , для получения уникальных значений и функцию trim , для удаления лишних пробелов.
Ещё одно новшество, это вставка изображения в ячейку таблицы. Вам придется только выделить необходимую ячейку и нажать в верхнем меню “ Вставка “-“ Изображение “- “ Изображение в ячейке ” , после чего в открывшемся окне необходимо будет выбрать нужное вам изображение и нажать ок. В ячейку сразу будет добавлено изображение, которое будет подчиняться общим правилам форматирования ячеек.
Недостаток здесь в том что к данному изображению нет возможности добавлять макросы и скрипты. Плюс данного метода в том, что в отличии от функции image вы не ссылаетесь на изображение в интернете, которое может, в любой момент измениться или быть удалено, а сразу загружаете его в таблицу, и уже никуда оно не денется.
Более подробно о всех новшествах и функциях Гугл таблиц вы можете посмотреть на моем канале в Youtube.
Видео с демонстрацией возможностей на эту новость ниже.
Если у вас есть вопросы, пишите в комментариях, постараюсь на все ответить.
При работе с данными в Google Таблицах рано или поздно вы столкнетесь с проблемой дублирования данных. Это могут быть повторяющиеся данные в одном столбце или повторяющиеся строки в наборе данных. Приложив немного условного форматирования, вы можете легко выделить дубликаты в Google Таблицах. После того, как вы их выделите, вы можете решить, сохранить их или удалить.
В этом уроке я покажу вам несколько простых способов выделить дубликаты в Google Таблицах .
Выделите повторяющиеся ячейки в столбце
Например, предположим, что у вас есть набор данных, показанный ниже, где вы хотите выделить все имена, повторяющиеся в столбце A.
Ниже приведены шаги по выделению дубликатов в столбце:
Вышеупомянутые шаги выделят все ячейки с повторяющимися именами указанным цветом.
В условном форматировании замечательно то, что оно динамическое . Это означает, что если вы измените данные в любой из ячеек, форматирование обновится автоматически. Например, если вы удалите одно из имен, у которых есть дубликаты, выделение этого имени (в другой ячейке) исчезнет, поскольку теперь оно стало уникальным.
Как это работает?
При использовании настраиваемой формулы в условном форматировании каждая ячейка проверяется по указанной формуле.
Если формула возвращает значение ИСТИНА для ячейки, она выделяется в указанном формате, а если она возвращает ЛОЖЬ, это не так.
В приведенном выше примере проверяется каждая ячейка, и если имя появляется в диапазоне более одного раза, для формулы СЧЁТЕСЛИ возвращается ИСТИНА, и ячейка выделяется. В остальном он остается без изменений.
Также обратите внимание, что я использовал диапазон $ A $ 2: $ A $ 10 (где перед алфавитом столбца и номером строки стоит знак доллара). Это действительно важно, так как гарантирует, что, когда формула переходит в следующую ячейку (в строке ниже), общий диапазон, который проверяется на количество имен, остается неизменным.
Если вы хотите удалить выделенные ячейки, вам необходимо удалить условное форматирование. Для этого выберите ячейки, к которым применено форматирование, щелкните параметр «Формат», щелкните «Условное форматирование» и удалите правило из панели, которая открывается справа.
Выделите повторяющиеся ячейки в нескольких столбцах
В приведенном выше примере у нас были все имена в одном столбце.
Но что, если имена находятся в нескольких столбцах (как показано ниже).
Вы по-прежнему можете использовать условное форматирование, чтобы выделить повторяющиеся имена (которые могут быть именем, которое встречается более одного раза во всех трех столбцах, вместе взятых.
Ниже приведены шаги по выделению дубликатов в нескольких столбцах:
Вышеупомянутые шаги будут выделять ячейку, если имя появляется более одного раза во всех трех выбранных столбцах вместе.
Как это работает?
Этот тоже работал последним.
В формуле СЧЁТЕСЛИ (COUNTIF) мы охватили все ячейки в трех столбцах. Таким образом, каждая ячейка в диапазоне проверяется с использованием указанной формулы и возвращает либо ИСТИНА, либо ЛОЖЬ.
Если есть имя, которое повторяется в любом из столбцов, оно будет выделено в указанном формате.
Опять же, обратите внимание, что я использовал диапазон $ A $ 2: $ C $ 10 (где перед алфавитом столбца и номером строки стоит знак доллара). Это действительно важно, так как гарантирует, что диапазон остается неизменным, в то время как условное форматирование проверяет количество имени в ячейке.
Выделите повторяющиеся строки / записи
Это немного сложно.
Предположим, у вас есть набор данных, как показано ниже, и вы хотите выделить все повторяющиеся записи.
В этом случае запись будет дубликатом, если она имеет точно такое же значение в каждой ячейке в строке (например, в строках 2 и 7 в приведенном выше примере).
Причина, по которой это немного сложно, заключается в том, что теперь вам не нужно проверять отдельные ячейки. Вы должны проверить всю строку и выделить только те строки, в которых повторяются все ячейки.
Но не волнуйтесь, это не так уж и сложно.
Ниже приведены шаги по выделению повторяющихся строк с использованием условного форматирования:
Вышеупомянутые шаги выделят все записи, которые повторяются в наборе данных (как показано ниже).
Как это работает?
Этот работает так же, как наш первый пример (где мы просто выделили ячейки в столбце, в котором были дубликаты).
Но поскольку есть целая строка, которую нам нужно сравнить со всеми другими строками, мы объединили содержимое всех строк и создали одну строку для каждой строки.
Следующая часть формулы создает массив строк, в котором объединено все содержимое ячеек в строке (выполняется конкатенация с использованием знака амперсанда).
Этот массив используется в формуле Countif, и используемое условие снова представляет собой объединенную строку, которая имеет все значения в строке. Это делается с использованием следующих критериев:
Теперь это преобразовано в простую конструкцию типа столбца, в которой функция COUNTIF проверяет, сколько раз эта объединенная строка повторяется в созданном нами массиве строк.
В результате будут выделены все повторяющиеся записи.
Иногда может случиться так, что вы выполните все вышеперечисленные шаги и используете те же формулы, но Google Таблицы по-прежнему не выделяют дубликаты.
Вот несколько возможных причин, по которым вы можете проверить:
Лишние места в камерах
Есть ли лишние пробелы (начальные или конечные пробелы) в тексте в одной ячейке, а не в другой?
Поскольку мы ищем точное совпадение двух или более ячеек, которые будут считаться дубликатами, если в ячейках есть лишние пробелы, это приведет к несоответствию.
Поэтому, даже если вы видите дубликат, он может не выделиться.
Чтобы избавиться от этого, вы можете использовать функцию TRIM (и функцию CLEAN), чтобы избавиться от всех лишних пробелов.
Неправильная ссылка
В Google Таблицах есть три разных типа ссылок.
Если формула требует одного типа ссылки, а вы в конечном итоге используете другие, у вас, скорее всего, возникнет проблема.
Поэтому проверьте ссылки, чтобы убедиться, что Google Таблицы выделяют дубликаты должным образом.
Таким образом, вы можете выделить дубликаты в Google Таблицах с помощью условного форматирования.
Google Таблицы постепенно становятся для многих выбором электронных таблиц. Легкость, с которой вы можете сотрудничать в Google Таблицах, намного превосходит все другие инструменты для работы с электронными таблицами.
Еще одна причина, по которой Google Таблицы так широко используются, связана с простотой использования. Команда, стоящая за ним, постоянно добавляет новые функции и возможности, которые упрощают и ускоряют работу.
В этом уроке я покажу вам несколько способов удаления дубликатов в Google Таблицах.
Удалите дубликаты с помощью инструмента «Удалить дубликаты»
Предположим, у вас есть набор данных, как показано ниже, и вы хотите удалить все повторяющиеся записи из этого набора данных.
Ниже приведены шаги по удалению дубликатов из набора данных в Google Таблицах:
Вышеупомянутые шаги мгновенно удалят все повторяющиеся записи из набора данных, и вы получите результат, как показано ниже.
Когда вы используете опцию «Удалить дубликаты», чтобы избавиться от повторяющихся записей, это не повлияет на данные вокруг них. Это означает, что при его использовании не удаляются строки и не удаляются ячейки. Он просто удаляет повторяющиеся записи из ячеек (без нарушения ячеек в наборе данных).
Удалите дубликаты с помощью УНИКАЛЬНОЙ функции
В Google Таблицах также есть функция, которую вы можете использовать для удаления повторяющихся значений и сохранения только уникальных значений.
Это УНИКАЛЬНАЯ функция.
Предположим, у вас есть набор данных, как показано ниже, и вы хотите удалить все повторяющиеся записи из этого набора данных:
Приведенная ниже формула удалит все повторяющиеся записи, и вы получите все уникальные:
= УНИКАЛЬНЫЙ (A2: B17)
Приведенная выше формула даст вам результат, начиная с ячейки, в которую вы ввели формулу.
Одним из ограничений использования функции UNIQUE является то, что она будет рассматривать как дубликаты только те записи, где повторяется все содержимое строки. Если вы хотите сохранить только один экземпляр названия страны и удалить все остальные, UNIQUE сделает это только в том случае, если остальные значения столбца для этой записи также совпадают.
Если в ваших данных есть начальные, конечные или дополнительные пробелы, уникальная функция будет рассматривать записи как разные. В таком случае вы можете использовать следующую формулу:
= МассивФормула (УНИКАЛЬНО (ОБРЕЗАТЬ (A2: B17)))
Удалить дубликат с помощью надстройки
Google Таблицы, как правило, поддерживают огромную библиотеку различных надстроек, чтобы решить все мыслимые проблемы или проблемы.
Все надстройки для удаления дубликатов могут использоваться для одной и той же цели. В Выкрутить Дубликаты надстройка по AbleBits является одним из лучших дополнений для удаления повторяющихся записей из набора данных.
Чтобы использовать надстройку, вам сначала нужно добавить ее в свой документ Google Таблиц.
Ниже приведены шаги по добавлению надстройки в документ Google Таблиц:
Вышеупомянутые шаги добавят надстройку Remove Duplicate в ваш документ Google Sheets, и теперь вы можете начать ее использовать.
Ниже приведены шаги по использованию этого дополнения для удаления повторяющихся записей в Google Таблицах:
Вышеупомянутые шаги мгновенно удалят повторяющиеся записи, и у вас останутся только уникальные записи.
Обновление: теперь вы можете сделать это с помощью встроенного «Удалить дубликаты »В Google Таблицах.
Удаление дубликатов с помощью уникальной функции
Первый метод, который мы рассмотрим, использует встроенную функцию Google Sheets, которая находит все уникальные записи, позволяя вам избавиться от всего остального в наборе данных.
Запустите браузер и откройте электронную таблицу, чтобы начать работу.
Затем щелкните пустую ячейку, в которую вы хотите выводить данные, введите = UNIQUE, а затем щелкните предложенную функцию, которая появляется в диалоговом окне.
Отсюда вы можете вручную ввести диапазон ячеек или выделить их, чтобы функция проанализировала. Когда вы закончите, нажмите Enter.
Как по волшебству, Таблицы выделяют все уникальные результаты и отображают их в выбранной ячейке.
Удаление дубликатов с помощью надстройки
Для следующего метода вам необходимо установить надстройку для Google Таблиц. Если вы никогда раньше не использовали надстройки, они похожи на расширения браузера, которые открывают для вас дополнительные функции внутри приложений Google, такие как Документы, Таблицы и Презентации.
В этом примере мы будем использовать Удаление дубликатов с помощью AbleBits . Поставляется с 30-дневной бесплатной пробной версией; Премиум-членство стоит 59,60 долларов за пожизненную подписку или 33,60 доллара в год.
Установка дополнения
Чтобы получить надстройку, откройте файл в Google Таблицах, нажмите «Надстройки», а затем «Получить надстройки».
Введите «Дубликаты» в строку поиска и нажмите кнопку «Бесплатно».
Щелкните учетную запись Google, которую хотите использовать для установки надстройки.
После установки надстроек вам необходимо предоставить им определенные разрешения. Это основа для работы надстройки. Убедитесь, что вы полностью понимаете разрешения и доверяете разработчику перед установкой любого дополнения.
Использование надстройки
Вы можете использовать надстройку «Удалить дубликаты» для одного столбца или для нескольких строк. В этом примере мы будем искать дубликаты в строках, но в основном это работает одинаково для одного столбца.
В своей электронной таблице выделите все строки, в которых вы хотите найти дубликаты. После этого нажмите «Надстройки»> «Удалить дубликаты»> «Найти повторяющиеся или уникальные строки».
После открытия надстройки убедитесь, что указан правильный диапазон, а затем нажмите «Далее».
Затем выберите тип данных, которые вы хотите найти. Поскольку мы удаляем дубликаты, выберите «Дубликаты» и нажмите «Далее».
Наконец, выберите, что надстройка будет делать со своими результатами, и нажмите «Готово».
На странице результатов надстройка сообщает нам, что были найдены и удалены четыре повторяющиеся строки.
Вуаля! Все повторяющиеся строки исчезнут с вашего листа.
Удалите повторяющиеся строки с помощью редактора скриптов Google
Последний метод удаления дубликатов на вашем листе включает использование Google App Script, бесплатной облачной платформы разработки для создания настраиваемых легких веб-приложений. Хотя это связано с написанием кода, пусть это вас не пугает. Google предоставляет обширная документация и даже предоставляет вам скрипт для удаления дубликатов. Просто скопируйте код, проверьте надстройку, а затем запустите ее на своем листе.
В текущей таблице Google нажмите «Инструменты», а затем «Редактор скриптов».
Скрипт Google Apps открывается в новой вкладке с пустым скриптом.
Удалите пустую функцию внутри файла и вставьте следующий код:
Сохраните и переименуйте ваш скрипт. Когда закончите, нажмите значок «Выполнить».
Вам нужно будет просмотреть разрешения, необходимые для вашего скрипта, и предоставить ему доступ к вашей электронной таблице. Щелкните «Просмотр разрешений», чтобы узнать, какой доступ требует этот сценарий.
Примите запросы и нажмите «Разрешить», чтобы авторизовать сценарий.
После того, как он закончит работу, вернитесь к своему Листу и, как и в предыдущих методах, все повторяющиеся записи исчезнут из вашего файла!
Это все, что нужно сделать. Независимо от того, хотите ли вы использовать встроенную функцию Unique, надстройку стороннего производителя или создать собственную надстройку с помощью скрипта приложений, Google предлагает несколько способов управления дубликатами в вашей электронной таблице.
Читайте также: