Повтор excel на английском
Поиск дубликатов в Excel осложняется множеством факторов. Это могут быть лишние пробелы, знаки препинания, перестановки слов. К тому же, часто хочется ограничиться только поиском дублей без их удаления. Если же вы спокойны и готовы избавиться от дублей в 1 шаг, не проверяя их, вам в раздел «удалить дубликаты«.
Иногда дубли хочется найти внутри колонки, другой раз интересует поиск значений, повторяющихся в другой колонке.
Ситуаций множество, но ключевых моментов всего три:
1. Какие ячейки мы готовы считать дубликатами — все кроме первого или включая его?
2. Считаем ли дублями строки, отличающиеся только пробелами до, после слов или лишними пробелами между словами?
3. Где мы будем искать дубли — внутри текущего диапазона, или производим сравнение с другим диапазоном?
Итак, обо всем по порядку
Выделить повторяющиеся значения в Excel цветом
Зачастую под словом «найти» рядовой пользователь Excel подразумевает «найти и выделить цветом», когда дело заходит о повторяющихся значениях.
Идеальным кандидатом для решения задачи в таком случае выступает условное форматирование. В Excel для условного форматирования уже вшиты готовые правила, в том числе и для отбора повторяющихся значений.
Процедура находится на вкладке «Главная»:
Процедура интуитивно понятна:
- выделяем диапазон, в котором хотим найти дубликаты,
- вызываем процедуру,
- выбираем форматирование для отобранных ячеек, есть заготовленные форматы, можно выбрать свой вариант
Важно понимать, что процедура находит дубликаты внутри всего диапазона и поэтому может не быть применима для сравнения двух столбцов. Достаточно иметь дубликаты внутри одного столбца — и процедура подсветит их оба, хотя во втором их не будет:
Данное поведение является неочевидным, и об этом факте часто забывают. Если дальше вы планируете удалять повторы, можете потерять оба варианта в одном столбце.
Как избежать подобной ситуации, если хочется найти именно дубли в другом столбце? Простейшее решение — удалить дубли внутри каждого столбца перед применением условного форматирования.
Но есть и другие решения — о них дальше.
Формула проверки наличия дублей в диапазонах
Использование собственной формулы для проверки дубликатов в списке или диапазоне имеет ряд преимуществ, единственная задача — составление такой формулы. Но её я возьму на себя.
Внутри диапазона
Чтобы проверить, есть ли в диапазоне повторяющиеся значения, можно использовать такую формулу массива:
Так выглядит на практике применение формулы:
Формула возвращает ИСТИНА, если в адресованном диапазоне появляется дубликат
В чем же преимущество такой формулы, ведь она полностью дублирует опцию условного форматирования? — Спросите вы.
А дело все в том, что формулу несложно видоизменить и улучшить.
Например, можно улучшить эффективность формулы, добавив в нее функцию СЖПРОБЕЛЫ — это позволит находить дубликаты, отличающиеся незаметными лишними пробелами:
Эта формула слегка отличается, так как проверяет встречаемость в диапазоне значения одной ячейки.
Если внести ее как правило отбора условного форматирования, она позволит выявлять неявные дубли. Ниже наглядная демонстрация:
Применение формулы для условного форматирования и поиска неявных дубликатовОбратите внимание на пару моментов этой демонстрации:
- диапазон закреплен ($A$1:$B$4), а искомая ячейка — нет (A1).
- именно это позволяет условному форматированию находить все дубликаты в диапазоне
Выделить цветом совпадения из другого столбца/диапазона
Поиск дубликатов с !SEMTools
В свое время я много намаялся с перечисленными выше методами поиска повторяющихся значений, как внутри столбца, так и при сравнении столбцов, и все они мне не нравились. Основная причина — это попросту долго.
Поэтому я пришел к тому, чтобы сделать процесс удаления дубликатов максимально быстрым и удобным — сделал для этого отдельные процедуры в своей надстройке. Далее покажу, как они работают.
Найти дубли ячеек внутри диапазона, кроме первого
Найти в диапазоне дубли ячеек, включая первый
Найти дубли без учета лишних пробелов
Если мы считаем дубликатами фразы, отличающиеся количеством пробелов между словами или после — наша задача сначала избавиться от лишних пробелов, и далее — произвести тот же поиск пробелов.
Для первой операции есть отдельный макрос — удалить лишние пробелы
Как найти дубли ячеек, не учитывая лишние пробелы
The TEXT function lets you change the way a number appears by applying formatting to it with format codes. It's useful in situations where you want to display numbers in a more readable format, or you want to combine numbers with text or symbols.
Note: The TEXT function will convert numbers to text, which may make it difficult to reference in later calculations. It’s best to keep your original value in one cell, then use the TEXT function in another cell. Then, if you need to build other formulas, always reference the original value and not the TEXT function result.
TEXT(value, format_text)
The TEXT function syntax has the following arguments:
Argument Name
Description
A numeric value that you want to be converted into text.
format_text
A text string that defines the formatting that you want to be applied to the supplied value.
Overview
In its simplest form, the TEXT function says:
=TEXT(Value you want to format, "Format code you want to apply")
Here are some popular examples, which you can copy directly into Excel to experiment with on your own. Notice the format codes within quotation marks.
Description
Currency with a thousands separator and 2 decimals, like $1,234.57. Note that Excel rounds the value to 2 decimal places.
=TEXT(TODAY(),"MM/DD/YY")
Today’s date in MM/DD/YY format, like 03/14/12
=TEXT(TODAY(),"DDDD")
Today’s day of the week, like Monday
=TEXT(NOW(),"H:MM AM/PM")
Current time, like 1:29 PM
Percentage, like 28.5%
Fraction, like 4 1/3
Fraction, like 1/3. Note this uses the TRIM function to remove the leading space with a decimal value.
=TEXT(12200000,"0.00E+00")
Scientific notation, like 1.22E+07
Special (Phone number), like (123) 456-7898
=TEXT(1234,"0000000")
Add leading zeros (0), like 0001234
Note: Although you can use the TEXT function to change formatting, it’s not the only way. You can change the format without a formula by pressing CTRL+1 (or +1 on the Mac), then pick the format you want from the Format Cells > Number dialog.
Download our examples
You can download an example workbook with all of the TEXT function examples you'll find in this article, plus some extras. You can follow along, or create your own TEXT function format codes.
Other format codes that are available
You can use the Format Cells dialog to find the other available format codes:
Press Ctrl+1 (+1 on the Mac) to bring up the Format Cells dialog.
Select the format you want from the Number tab.
Select the Custom option,
The format code you want is now shown in the Type box. In this case, select everything from the Type box except the semicolon (;) and @ symbol. In the example below, we selected and copied just mm/dd/yy.
Press Ctrl+C to copy the format code, then press Cancel to dismiss the Format Cells dialog.
Now, all you need to do is press Ctrl+V to paste the format code into your TEXT formula, like: =TEXT(B2,"mm/dd/yy"). Make sure that you paste the format code within quotes ("format code"), otherwise Excel will throw an error message.
Format codes by category
Following are some examples of how you can apply different number formats to your values by using the Format Cells dialog, then use the Custom option to copy those format codes to your TEXT function.
Why does Excel delete my leading 0’s?
Excel is trained to look for numbers being entered in cells, not numbers that look like text, like part numbers or SKU's. To retain leading zeros, format the input range as Text before you paste or enter values. Select the column, or range where you'll be putting the values, then use CTRL+1 to bring up the Format > Cells dialog and on the Number tab select Text. Now Excel will keep your leading 0's.
If you’ve already entered data and Excel has removed your leading 0's, you can use the TEXT function to add them back. You can reference the top cell with the values and use =TEXT(value,"00000"), where the number of 0’s in the formula represents the total number of characters you want, then copy and paste to the rest of your range.
If for some reason you need to convert text values back to numbers you can multiply by 1, like =D4*1, or use the double-unary operator (--), like =--D4.
The thousands separator is dependent on your regional settings. In the US it's a comma, but in other locales it might be a period (.).
The thousands separator is available for the number, currency and accounting formats.
Following are examples of standard number (thousands separator and decimals only), currency and accounting formats. Currency format allows you to insert the currency symbol of your choice and aligns it next to your value, while accounting format will align the currency symbol to the left of the cell and the value to the right. Note the difference between the currency and accounting format codes below, where accounting uses an asterisk (*) to create separation between the symbol and the value.
To find the format code for a currency symbol, first press Ctrl+1 (or +1 on the Mac), select the format you want, then choose a symbol from the Symbol drop-down:
Then click Custom on the left from the Category section, and copy the format code, including the currency symbol.
You can alter the way a date displays by using a mix of "M" for month, "D" for days, and "Y" for years.
Format codes in the TEXT function aren't case sensitive, so you can use either "M" or "m", "D" or "d", "Y" or "y".
Mynda Recommends.
If you share Excel files and reports with users from different countries, then you might want to give them a report in their language. Excel MVP, Mynda Treacy has a great solution in this Excel Dates Displayed in Different Languages article. It also includes a sample workbook you can download.
You can alter the way time displays by using a mix of "H" for hours, "M" for minutes, or "S" for seconds, and "AM/PM" for a 12-hour clock.
If you leave out the "AM/PM" or "A/P", then time will display based on a 24-hour clock.
Format codes in the TEXT function aren't case sensitive, so you can use either "H" or "h", "M" or "m", "S" or "s", "AM/PM" or "am/pm".
You can alter the way decimal values display with percentage (%) formats.
You can alter the way decimal values display with fraction (?/?) formats.
Scientific notation is a way of displaying numbers in terms of a decimal between 1 and 10, multiplied by a power of 10. It is often used to shorten the way that large numbers display.
Excel provides 4 special formats:
Zip Code - "00000"
Zip Code + 4 - "00000-0000"
Social Security Number - "000-00-0000"
Special formats will be different depending on locale, but if there aren't any special formats for your locale, or if these don't meet your needs then you can create your own through the Format Cells > Custom dialog.
Common scenario
The TEXT function is rarely used by itself, and is most often used in conjunction with something else. Let’s say you want to combine text and a number value, like “Report Printed on: 03/14/12”, or “Weekly Revenue: $66,348.72”. You could type that into Excel manually, but that defeats the purpose of having Excel do it for you. Unfortunately, when you combine text and formatted numbers, like dates, times, currency, etc., Excel doesn’t know how you want to display them, so it drops the number formatting. This is where the TEXT function is invaluable, because it allows you to force Excel to format the values the way you want by using a format code, like "MM/DD/YY" for date format.
In the following example, you’ll see what happens if you try to join text and a number without using the TEXT function. In this case, we’re using the ampersand (&) to concatenate a text string, a space (" "), and a value with =A2&" "&B2.
As you can see, Excel removed the formatting from the date in cell B2. In the next example, you'll see how the TEXT function lets you apply the format you want.
Our updated formula is:
Cell C2:=A2&" "&TEXT(B2,"mm/dd/yy") - Date format
Frequently Asked Questions
How can I convert numbers to text, like 123 to One Hundred Twenty-Three?Unfortunately, you can’t do that with the TEXT function, you need to use Visual Basic for Applications (VBA) code. The following link has a method: How to convert a numeric value into English words in Excel
Yes, you can use the UPPER, LOWER and PROPER functions. For example, =UPPER("hello") would return "HELLO".
Can I add a new line (line break) with the TEXT function, like I can with Alt+Enter in a cell?Yes, but it takes a few steps. First, select the cell or cells where you want this to happen and use Ctrl+1 to bring up the Format > Cells dialog, then Alignment > Text control > check the Wrap Text option. Next, adjust your completed TEXT function to include the ASCII function CHAR(10) where you want the line break. You might need to adjust your column width depending on how the final result aligns.
In this case, we used: ="Today is: "&CHAR(10)&TEXT(TODAY(),"mm/dd/yy")
Why does Excel convert my number entries to something like this: 1.22E+07This is called Scientific Notation, and Excel will automatically convert numbers longer than 12 digits if a cell(s) is formatted as General, and 15 digits if a cell(s) is formatted as a Number. If you need to enter long numeric strings, but don't want them converted, then format the cells in question as Text before you input or paste your values into Excel.
Mynda Recommends.
If you share Excel files and reports with users from different countries, then you might want to give them a report in their language. Excel MVP, Mynda Treacy has a great solution in this Excel Dates Displayed in Different Languages article. It also includes a sample workbook you can download.
Данный справочник содержит более 150 функций Excel с примерами использования из реальной жизни. Функции представлены как единым списком, так и отдельными таблицами по категориям.
Официальная справка по функциям Excel — замечательный и довольно исчерпывающий ресурс, но порой чересчур исчерпывающий и оторванный от реальности. Поэтому и был создан этот список. :)
Некоторые функции отнесены к двум категориям в отличие от официальной иерархии в Excel. Но это не делает справочник менее удобным, а скорее, наоборот, позволяет взглянуть на них с нескольких сторон.
Он постоянно обновляется и дополняется новыми примерами.
Почему вам понравится этот справочник функций
Для каждой функции явно и в строгом порядке даны:
- Эквивалент на английском языке — для тех, кто пользуется англоязычным пакетом Excel
- Полный разбор синтаксиса
- Примеры формул, не оторванные от реальности
- Ограничения и ошибки, которые могут возникать
- Форматирование — требования к входящим значениям и формат вывода
- Волатильность (пересчет формулы на основе функции при обновлении листа)
- Похожие функции
- Смежные функции, с которыми она наиболее часто используется и рекомендуется к использованию в составных формулах
- Примеры с использованием как формулы массива или с формулами массива на основе других функций, если это имеет смысл
Просто кликните по названию функции, чтобы перейти на страницу с ее детальным описанием и примерами.
Функции по категориям
Дата и время
ВРЕМЗНАЧ, ВРЕМЯ, ГОД, ДАТА, ДАТАЗНАЧ, ДАТАМЕС, ДЕНЬ, ДЕНЬНЕД, ДНЕЙ360, ДОЛЯГОДА, КОНМЕСЯЦА, МЕСЯЦ, МИНУТЫ, РАБДЕНЬ, РАЗНДАТ, СЕГОДНЯ, СЕКУНДЫ, ТДАТА, ЧАС, ЧИСТРАБДНИ
Инженерные
Информация
ЕЛОГИЧ, ЕОШ, ЕОШИБКА, ЕПУСТО, ЕЧЁТН, ЕНД, ЕНЕТЕКСТ, ЕНЕЧЁТ, ЕССЫЛКА, ЕТЕКСТ, ЕЧИСЛО, ИНФОРМ, НД, СЧИТАТЬПУСТОТЫ, ТИП.ОШИБКИ, Ч, ЯЧЕЙКА
Логические
Математические
ABS, ЗНАК, МУМНОЖ, НЕЧЁТ, НОД, НОК, ОКРВВЕРХ, ОКРВНИЗ, ОКРУГЛ, ОКРУГЛВВЕРХ, ОКРУГЛВНИЗ, ОКРУГЛТ, ОСТАТ, ОТБР, ПИ, ПРОИЗВЕД, РИМСКОЕ, СЛУЧМЕЖДУ, СЛЧИС, СТЕПЕНЬ, СУММ, СУММЕСЛИ, СУММПРОИЗВ, СЧЁТЕСЛИ, ФАКТР, ЦЕЛОЕ, ЧАСТНОЕ, ЧЁТН, ЧИСЛКОМБ
Работа с БД
БДСУММ, БИЗВЛЕЧЬ, БСЧЁТ, БСЧЁТА, ДМАКС, ДМИН, ДСРЗНАЧ
Статистические
ДИСП, ДИСПР, КВАРТИЛЬ, КОРРЕЛ, МАКС, МЕДИАНА, МИН, МОДА, НАИБОЛЬШИЙ, НАИМЕНЬШИЙ, ПЕРЕСТ, ПРЕДСКАЗ, РАНГ, СРЗНАЧ, СТАНДОТКЛОН, СТАНДОТКЛОНП, СЧЁТ, СЧЁТЗ, ТЕНДЕНЦИЯ, ЧАСТОТА
Текстовые
Финансовые
Функции поиска
ВПР, ВЫБОР, ГПР, ДВССЫЛ, ИНДЕКС, НАЙТИ, ПОИСК, ПОИСКПОЗ, ПРОСМОТР, ТРАНСП
Большие таблицы Эксель могут содержать повторяющиеся данные, что зачастую увеличивает объем информации и может привести к ошибкам в результате обработки данных при помощи формул и прочих инструментов. Это особенно критично, например, при работе с денежными и прочими финансовыми данными.
В данной статье мы рассмотрим методы поиска и удаления дублирующихся данных (дубликатов), в частности, строк в Excel.
Метод 1: удаление дублирующихся строк вручную
Первый метод максимально прост и предполагает удаление дублированных строк при помощи специального инструмента на ленте вкладки “Данные”.
- Полностью выделяем все ячейки таблицы с данными, воспользовавшись, например, зажатой левой кнопкой мыши.
- Если обрабатываемая таблица содержит шапку, то проверяем пункт “Мои данные содержат заголовки” – он должен быть отмечен галочкой.
- Ниже, в основном окне, перечислены названия столбцов, по которым будет осуществляться поиск дубликатов. Система считает совпадением ситуацию, в которой в строках повторяются значения всех выбранных в настройке столбцов. Если убрать часть столбцов из сравнения, повышается вероятность увеличения количества похожих строк.
- Тщательно все проверяем и нажимаем ОК.
Метод 2: удаление повторений при помощи “умной таблицы”
Еще один способ удаления повторяющихся строк – использование “умной таблицы“. Давайте рассмотрим алгоритм пошагово.
- Для начала, нам нужно выделить всю таблицу, как в первом шаге предыдущего раздела.
- Во вкладке “Главная” находим кнопку “Форматировать как таблицу” (раздел инструментов “Стили“). Кликаем на стрелку вниз справа от названия кнопки и выбираем понравившуюся цветовую схему таблицы.
- После выбора стиля откроется окно настроек, в котором указывается диапазон для создания “умной таблицы“. Так как ячейки были выделены заранее, то следует просто убедиться, что в окошке указаны верные данные. Если это не так, то вносим исправления, проверяем, чтобы пункт “Таблица с заголовками” был отмечен галочкой и нажимаем ОК. На этом процесс создания “умной таблицы” завершен.
- ставим курсор на произвольную ячейку таблицы;
- переключаемся во вкладку “Конструктор” (если после создания “умной таблицы” переход не был осуществлен автоматически);
- в разделе “Инструменты” жмем кнопку “Удалить дубликаты“.
Примечание: Из всех описываемых в данной статье методов этот является наиболее гибким и универсальным, позволяя комфортно работать с таблицами различной структуры и объема.
Метод 3: использование фильтра
Следующий метод не удаляет повторяющиеся строки физически, но позволяет настроить режим отображения таблицы таким образом, чтобы при просмотре они скрывались.
Метод 4: условное форматирование
Условное форматирование – гибкий и мощный инструмент, используемый для решения широкого спектра задач в Excel. В этом примере мы будем использовать его для выбора задвоенных строк, после чего их можно удалить любым удобным способом.
- Выделяем все ячейки нашей таблицы.
- Во вкладке “Главная” кликаем по кнопке “Условное форматирование“, которая находится в разделе инструментов “Стили“.
- Откроется перечень, в котором выбираем группу “Правила выделения ячеек“, а внутри нее – пункт “Повторяющиеся значения“.
- Окно настроек форматирования оставляем без изменений. Единственный его параметр, который можно поменять в соответствии с собственными цветовыми предпочтениями – это используемая для заливки выделяемых строк цветовая схема. По готовности нажимаем кнопку ОК.
- Теперь все повторяющиеся ячейки в таблице “подсвечены”, и с ними можно работать – редактировать содержимое или удалить строки целиком любым удобным способом.
Важно! Этом метод не настолько универсален, как описанные выше, так как выделяет все ячейки с одинаковыми значениями, а не только те, для которых совпадает вся строка целиком. Это видно на предыдущем скриншоте, когда нужные задвоения по названиям регионов были выделены, но вместе с ними отмечены и все ячейки с категориями регионов, потому что значения этих категорий повторяются.
Метод 5: формула для удаления повторяющихся строк
Последний метод достаточно сложен, и им мало, кто пользуется, так как здесь предполагается использование сложной формулы, объединяющей в себе несколько простых функций. И чтобы настроить формулу для собственной таблицы с данными, нужен определенный опыт и навыки работы в Эксель.
Формула, позволяющая искать пересечения в пределах конкретного столбца в общем виде выглядит так:
Давайте посмотрим, как с ней работать на примере нашей таблицы:
- Добавляем в конце таблицы новый столбец, специально предназначенный для отображения повторяющихся значений (дубликаты).
- В верхнюю ячейку нового столбца (не считая шапки) вводим формулу, которая для данного конкретного примера будет иметь вид ниже, и жмем Enter:
=ЕСЛИОШИБКА(ИНДЕКС(A2:A90;ПОИСКПОЗ(0;СЧЁТЕСЛИ(E1:$E$1;A2:A90)+ЕСЛИ(СЧЁТЕСЛИ(A2:A90;A2:A90)>1;0;1);0));"") . - Выделяем до конца новый столбец для задвоенных данных, шапку при этом не трогаем. Далее действуем строго по инструкции:
- ставим курсор в конец строки формул (нужно убедиться, что это, действительно, конец строки, так как в некоторых случаях длинная формула не помещается в пределах одной строки);
- жмем служебную клавишу F2 на клавиатуре;
- затем нажимаем сочетание клавиш Ctrl+SHIFT+Enter.
- Эти действия позволяют корректно заполнить формулой, содержащей ссылки на массивы, все ячейки столбца. Проверяем результат.
Как уже было сказано выше, этот метод сложен и функционально ограничен, так как не предполагает удаления найденных столбцов. Поэтому, при прочих равных условиях, рекомендуется использовать один из ранее описанных методов, более логически понятных и, зачастую, более эффективных.
Заключение
Excel предлагает несколько инструментов для нахождения и удаления строк или ячеек с одинаковыми данными. Каждый из описанных методов специфичен и имеет свои ограничения. К универсальным варианту мы, пожалуй, отнесем использование “умной таблицы” и функции “Удалить дубликаты”. В целом, для выполнения поставленной задачи необходимо руководствоваться как особенностями структуры таблицы, так и преследуемыми целями и видением конечного результата.
Читайте также: