Как сделать первичный ключ в экселе
при разработке таблиц я выработал привычку иметь один столбец, который уникален и который я делаю первичным ключом. Это достигается тремя способами в зависимости от требований:
- столбец Identity integer, который автоматически увеличивается.
- уникальный идентификатор (GUID)
- короткий символ(x) или целое число (или другой относительно небольшой числовой тип) столбец, который может служить столбцом идентификатора строки
номер 3 будет использоваться для достаточно небольшой поиск, в основном чтение таблиц, которые могут иметь уникальный код строки статической длины или числовое значение, такое как год или другое число.
по большей части все остальные таблицы будут иметь автоматически увеличивающееся целое число или уникальный первичный ключ идентификатора.
недавно я начал работать с базами данных, которые не имеют согласованного идентификатора строки, а первичные ключи в настоящее время кластеризованы по различным столбцам. Некоторые примеры:
- datetime / character
- datetime / integer
- datetime / varchar
- char/nvarchar / nvarchar
есть ли действительный случай для этого? Я бы всегда определил столбец идентификатора или уникального идентификатора для этих случаев.
кроме того, есть много таблиц без первичных ключей на всех. Каковы веские причины, если таковые имеются, для этого?
Я пытаюсь понять, почему были разработаны таблицы как они были, и это кажется мне большим беспорядком, но, возможно, для этого были веские причины.
третий вопрос, чтобы помочь мне расшифровать ответы: в случаях, когда несколько столбцов используются для создания составного первичного ключа, есть ли конкретное преимущество этого метода против суррогатного/искусственного ключа? Я думаю в основном о производительности, обслуживании,администрировании и т. д.?
Я следую нескольким правилам:
- первичные ключи должны быть как надо. Предпочитайте числовой тип, поскольку числовые типы хранятся в гораздо более компактном формате, чем символьные форматы. Это связано с тем, что большинство первичных ключей будут внешними ключами в другой таблице, а также использоваться в нескольких индексах. Чем меньше ключ, тем меньше индекс, тем меньше страниц в кэше вы будете использовать.
- первичные ключи никогда не должны меняться. Обновление первичного ключа всегда должно быть из Вопрос. Это связано с тем, что он, скорее всего, будет использоваться в нескольких индексах и использоваться как внешний ключ. Обновление одного первичного ключа может вызвать эффект пульсации изменений.
- не используйте "первичный ключ вашей проблемы" в качестве первичного ключа логической модели. Например, номер паспорта, номер социального страхования или номер контракта сотрудника, поскольку эти "первичный ключ" могут изменяться для реальных ситуаций.
на суррогатном vs естественном ключе я ссылаюсь на правила выше. Если естественный ключ мал и никогда не изменится, его можно использовать в качестве первичного ключа. Если естественный ключ большой или может измениться я использую суррогатные ключи. Если первичного ключа нет, я все равно делаю суррогатный ключ, потому что опыт показывает, что вы всегда добавляете таблицы в свою схему и хотите, чтобы вы поставили первичный ключ на место.
Natural verses artifical keys-это своего рода религиозная дискуссия среди сообщества баз данных - см. в этой статье и другие, на которые он ссылается. Я не сторонник всегда имея искусственные ключи, ни никогда имея их. Я бы решил на индивидуальной основе, например:
- штаты США: я бы пошел на state_code ('TX' для Техаса и т. д.), а не state_id=1 для Texas
- сотрудники: обычно я создаю исскуственный ид_сотрудника, поскольку трудно найти ничего, что работает. SSN или эквивалент могут работать, но могут быть проблемы, такие как новый столяр, который еще не предоставил свой SSN.
- история зарплаты сотрудника: (employee_id, start_date). Я бы не создайте искусственный employee_salary_history_id. Какой смысл это будет служить (кроме "глупой последовательности")
везде, где используются искусственные ключи, вы также должны объявить уникальные ограничения для естественных ключей. Например, используйте state_id, если необходимо, но тогда вам лучше объявить уникальное ограничение на state_code, иначе вы обязательно в конечном итоге получите:
просто дополнительный комментарий к чему-то, что часто упускается из виду. Иногда не использование суррогатного ключа имеет преимущества в дочерних таблицах. Предположим, у нас есть дизайн, который позволяет запускать несколько компаний в одной базе данных (возможно, это размещенное решение или что-то еще).
предположим, у нас есть эти таблицы и столбцы:
в этой модели невозможно испортить и ссылаться на CostElement от одной компании и CostCentre из другой компании. Если суррогатный ключ использовался на CostElement и таблицы CostCentre, это будет.
чем меньше шансов облажаться, тем лучше.
Я избегаю использовать естественные ключи по одной простой причине - человеческая ошибка. Хотя часто доступны естественные уникальные идентификаторы (SSN, VIN, номер счета и т. д.), они требуют, чтобы человек вошел в них правильно. Если вы используете SSNs в качестве первичного ключа, кто-то транспонирует пару чисел во время ввода данных, и ошибка не обнаруживается сразу, то вы столкнулись с изменением первичного ключа.
мои первичные ключи обрабатываются программой базы данных в фоновом режиме и пользователь никогда не знает о них.
нет проблем в создании вашего первичного ключа из разных полей, это Естественный Ключ.
вы можете использовать столбец идентификаторов (связанный с уникальным индексом в полях-кандидатах), чтобы сделать Суррогатный Ключ.
Это старая дискуссия. Я предпочитаю суррогатные ключи в большинстве ситуаций.
но нет никакого оправдания для отсутствия ключа.
Да, есть много спор об этом: D
Я не вижу никакого очевидного преимущества на естественных ключах, кроме того, что они являются естественным выбором. Вы всегда будете думать Имя, SocialNumber - или что - то в этом роде-вместо idPerson.
суррогатные ключи-это ответ на некоторые из проблем, которые имеют естественные ключи (например, распространение изменений).
когда вы привыкаете к суррогатам, он кажется более чистым и управляемым.
но в конце концов, вы узнаете, что это просто вопрос вкуса - или мышления -. Люди "думают лучше" с естественными ключами, а другие нет.
таблицы должны иметь первичный ключ все время. Когда это не так, это должны были быть поля AutoIncrement.
иногда люди опускают первичный ключ, потому что они передают много данных, и это может замедлить (зависит от базы данных) процесс. Но, это должно быть добавлено после него.
какой-то один комментарий о таблице ссылок, это правильно, это исключение, но поля должны быть FK для сохранения целостности, и в некоторых случаях эти поля могут быть первичными ключами тоже если дубликат в ссылках не авторизован. но чтобы сохранить в простой форме, потому что исключение часто является чем-то в программировании, первичный ключ должен присутствовать, чтобы сохранить целостность ваших данных.
Что особенного в первичном ключе?
какова цель таблицы в схеме? В чем назначение ключа стола? Что особенного в первичном ключе? Дискуссии вокруг первичных ключей, похоже, упускают из виду, что первичный ключ является частью таблицы, а эта таблица является частью схемы. То, что лучше всего подходит для таблицы и отношений таблиц, должно управлять используемым ключом.
таблицы (и отношения таблиц) содержат факты об информации вы хотите записать. Эти факты должны быть самодостаточными, осмысленными, легко понятыми и непротиворечивыми. С точки зрения дизайна другие таблицы, добавленные или удаленные из схемы, не должны влиять на рассматриваемую таблицу. Должна быть цель для хранения данных, связанных только с самой информацией. Понимание того, что хранится в таблице, не должны требовать прохождения научно-исследовательского проекта. Ни один факт, хранящийся для одной и той же цели, не должен храниться более одного раза. Ключи вся или часть записываемой информации, которая является уникальной, а первичный ключ-это специально назначенный ключ, который должен быть первичной точкой доступа к таблице (т. е. он должен быть выбран для согласованности и использования данных, а не только для производительности вставки).
- в сторону: к сожалению, побочный эффект большинства разрабатываемых баз данных и разработан программистами приложений (которые я иногда) является что лучше для приложений или приложений часто приводы выбор первичного ключа для таблиц. Это приводит к число и Ключи GUID (поскольку они просты в использовании для фреймворков приложений) и монолитные конструкции таблиц (по мере того как эти уменьшают число применения объекты framework, необходимые для представления данных в памяти). Эти решения по проектированию баз данных, управляемые приложениями, приводят к значительным данным проблемы согласованности при использовании в масштабе. Каркас приложения разработанный таким образом, естественно, привести к таблице в то время конструкций. Создаются "частичные записи" в таблицах и данных, заполненных с течением времени. Взаимодействие нескольких таблиц избегается или при использовании вызывает несогласованность данные, когда приложение работает неправильно. Эти конструкции ведут к данным, которые бессмысленны (или трудно понять), распространение данных над таблицами (вы должны посмотреть на другие таблицы, чтобы понять текущая таблица) и дублированные данные.
было сказано, что первичные ключи должны быть как надо. Я бы сказал, что ключи должны быть только такими большими, как необходимый. Следует избегать случайного добавления бессмысленных полей в таблицу. Еще хуже сделать ключ из случайно добавленного бессмысленного поля, особенно когда он уничтожает зависимость соединения от другой таблицы к неосновному ключу. Это разумно только в том случае, если в таблице нет хороших ключей-кандидатов, но это, безусловно, является признаком плохого дизайна схемы при использовании для всех таблиц.
также было сказано, что первичные ключи никогда не должны меняться по мере обновления основного о ключе не может быть и речи. Но update - это то же самое, что delete с последующей вставкой. По этой логике, вы не должны удалять запись из таблицы с одним ключом, а затем добавить другую запись со вторым ключом. Добавление суррогатного первичного ключа не устраняет тот факт, что другой ключ в таблице существует. Обновление непервичного ключа таблицы может уничтожить значение данных, если другие таблицы зависят от этого значения через суррогатный ключ (например, таблица состояния с суррогатный ключ, имеющий описание статуса, измененное с "обработано" на "отменено", определенно повредит данные). Что всегда должно быть вне вопроса уничтожает смысл данных.
просто процитировать несколько моментов:
разработчик должен применить несколько правил при выборе первичного ключа для каждой таблицы:
- первичный ключ должен однозначно идентифицировать каждую запись.
- значение первичного ключа записи не может быть null.
- первичный ключ-значение должно существовать, когда создается запись.
- первичный ключ должен оставаться стабильным-вы не можете изменить первичный ключ поле(с).
- первичный ключ должен быть компактным и содержать как можно меньше атрибутов.
- значение первичного ключа изменить нельзя.
естественные ключи (как правило) нарушает правила. Суррогатные ключи соответствуют правилам. (Вам лучше прочитать эту статью, это стоит вашего времени!)
естественный ключ, если он доступен, обычно лучше всего. Итак, если datetime / char однозначно определяет строку, и обе части имеют значение для строки, это здорово.
Если только datetime имеет смысл, и символ просто прикреплен, чтобы сделать его уникальным, то вы можете просто пойти с полем идентификации.
естественные и искусственные ключи для меня-это вопрос того, сколько бизнес-логики вы хотите в своей базе данных. номер социального обеспечения (SSN) - отличный пример.
" каждый клиент в моей базе данных будет и должен иметь SSN."Сделано, сделать его первичным ключом, и покончим с этим. Просто помни, когда твое бизнес-правило изменится, ты сгоришь.
Я сам не люблю естественные ключи, из-за моего опыта с изменением бизнес-правил. Но если ты уверен в этом . не изменится, это может помешать нескольким критическим соединениям.
Я подозреваю, что свернутая газетная терапия Стивена А. Лоу необходима для дизайнера исходной структуры данных.
кроме того, GUIDs в качестве первичного ключа может быть заграбастан производительности. Я бы не рекомендовал.
вы должны использовать "составной" или "составной" первичный ключ, который состоит из нескольких полей.
Это вполне приемлемое решение, go здесь для получения дополнительной информации :)
Я тоже всегда использую столбец numeric ID. В oracle я использую number(18,0) без реальной причины выше number (12,0) (или что-то вроде int, а не long), возможно, я просто не хочу беспокоиться о получении нескольких миллиардов строк в БД!
Я также включаю созданный и измененный столбец (тип timestamp) для базового отслеживания, где это кажется полезным.
Я не против настройки уникальных ограничений на другие комбинации столбцов, но мне очень нравится мой id, созданный, измененные базовые требования.
Я ищу естественные первичные ключи и использую их там, где могу.
Если нет естественных ключей, я предпочитаю GUID INT++, потому что SQL Server использует деревья, и плохо всегда добавлять ключи в конец в деревьях.
на таблицах, которые являются соединениями "многие ко многим", я использую составной первичный ключ внешних ключей.
поскольку мне повезло использовать SQL Server, я могу изучить планы выполнения и статистику с помощью профилировщика и анализатора запросов и узнать, как мои ключи работают очень легко.
Я всегда использую поле autonumber или identity.
Я работал на клиента, который использовал SSN в качестве первичного ключа, а затем из-за правил HIPAA был вынужден перейти на "MemberID", и это вызвало массу проблем при обновлении внешних ключей в связанных таблицах. Соблюдение последовательного стандарта столбца идентификаторов помогло мне избежать подобной проблемы во всех моих проектах.
все таблицы должны иметь первичный ключ. В противном случае у вас есть куча - в некоторых ситуациях это может быть то, что вы хотите (тяжелая загрузка вставки, когда данные затем реплицируются через Service broker в другую базу данных или таблицу, например).
для таблиц подстановки с низким объемом строк вы можете использовать код 3 символа в качестве первичного ключа, поскольку это занимает меньше места, чем INT, но разница в производительности незначительна. Кроме этого, я всегда буду использовать INT если у вас нет ссылочной таблицы, которая, возможно, имеет составной первичный ключ, состоящий из внешних ключей из связанных таблиц.
Если вы действительно хотите прочитать все назад и вперед по этой вековой дискуссии, выполните поиск "естественного ключа" при переполнении стека. Вы должны получить обратно страницы результатов.
GUIDs можно использовать в качестве первичного ключа, но вам нужно создать правильный тип GUID, чтобы он работал хорошо.
вам нужно создать GUID гребня. Хорошая статья об этом и статистике производительности стоимость GUID в качестве первичных ключей.
также некоторый код на построении guids гребня в среда SQL находится в Uniqueidentifier vs identity(архиве).
вот мое собственное правило больших пальцев, на котором я остановился после 25+ лет опыта развития.
- все таблицы должны иметь один первичный ключ столбца, который автоматически приросты.
- вы не должны использовать или ссылаться на первичный ключ по любой причине в ваше приложение.
- не используйте его во внешних ключах
- не используйте его для поиска
- включить его в любой вид, который предназначен для обновления
главная ключ используется базой данных для целей оптимизации, он не предназначен для использования и не имеет никакого значения в вашем приложении.
мы делаем много соединений, и составные первичные ключи только что стали свиньей производительности. Простой int или long решает многие проблемы, даже если вы вводите второй ключ кандидата, но гораздо проще и понятнее присоединиться к одному полю против трех.
Я буду впереди о моем предпочтении естественных ключей-используйте их, где это возможно, так как они сделают вашу жизнь администрирования базы данных намного проще. Я установил стандарт в нашей компании, что все таблицы имеют следующие столбцы:
- идентификатор строки (GUID)
- Creator (string; имеет значение по умолчанию для имени текущего пользователя ( SUSER_SNAME() в T-SQL))
- Создано (DateTime)
- метка
идентификатор строки имеет уникальный ключ на нем таблица, и в любом случае автоматически генерируется для каждой строки (и разрешения предотвращают ее редактирование), и разумно гарантируется уникальность во всех таблицах и базах данных. Если какие-либо системы ORM нуждаются в одном ключе ID, это тот, который нужно использовать.
между тем, фактический PK, если это возможно, является естественным ключом. Мои внутренние правила что-то типа:
- люди - используйте суррогатный ключ, например INT. Если он внутренний, идентификатор GUID пользователя Active Directory является приемлемым выбор
- таблицы поиска (например, StatusCodes) - используйте короткий код CHAR; его легче запомнить, чем INTs, и во многих случаях бумажные формы и пользователи также будут использовать его для краткости (например, Status = "E" для "Expired", "A" для "Approved", "NADIS" для "No Asbestos Detected In Sample")
- связывание таблиц-комбинация FKs (например, EventId, AttendeeId )
так идеально вы заканчиваете вверх с естественным, людск-читаемым и памятным PK, и ORM-содружественным ОДН-ID-в-таблицей идентификатор GUID.
предостережение: базы данных, которые я поддерживаю, имеют тенденцию к 100 000 записям, а не миллионам или миллиардам, поэтому, если у вас есть опыт больших систем, которые противоречат моим советам, не стесняйтесь игнорировать меня!
От автора: в этой статье мы поговорим про создание первичного ключа SQL. Первичный ключ — это поле в таблице, которое однозначно идентифицирует каждую строку/запись в таблице базы данных. Первичные ключи должны содержать уникальные значения. В столбце первичного ключа не может содержаться значений NULL.
В таблице может быть только один первичный ключ, который может состоять из одного или нескольких полей. Когда в качестве первичного ключа используются несколько полей, он называется составным.
Если для таблицы первичный ключ задан в определенном поле, то в этом поле не может содержаться двух записей с одинаковыми значениями.
Примечание. Вы должны учитывать данные принципы при создании таблиц базы данных.
Создание первичного ключа
Ниже приведен код, в котором столбец ID определяется в качестве первичного ключа для таблицы CUSTOMERS.
Бесплатный курс по PHP программированию
Освойте курс и узнайте, как создать динамичный сайт на PHP и MySQL с полного нуля, используя модель MVC
Добавить в избранное
P rimary Key (Первичный ключ) является полем в таблице, которое однозначно идентифицирует каждую строку/запись в таблице базы данных. Первичные ключи должны содержать уникальные значения. Первичный ключ столбец не может иметь значения NULL.
Таблица может иметь только один первичный ключ, который может состоять из одного или нескольких полей. Когда несколько полей используются в качестве первичного ключа, их называют составным ключом.
Если таблица имеет первичный ключ, определенный на любом поле (ях), то вы не можете иметь две записи, имеющие одинаковое значение этого поля (ей).
Примечание – Вы могли бы использовать эти понятия при создании таблиц базы данных.
Создание первичного ключа
Вот синтаксис для определения атрибута ID в качестве первичного ключа в таблице Customers.
Если вы используете оператор ALTER TABLE, чтобы добавить первичный ключ, столбец первичного ключа (ей) должен был уже объявлен как не содержащий NULL значения (если таблица была создана первым).
Для определения первичного ключа на нескольких столбцах, используйте синтаксис SQL приведенный ниже:
Удаление первичного ключа
Вы можете очистить ограничения первичного ключа из таблицы с помощью синтаксиса, приведенного ниже.
Если вы нашли ошибку, пожалуйста, выделите фрагмент текста и нажмите Ctrl+Enter.
Ограничение первичного ключа — это столбец или группа столбцов в таблице, которые однозначно определяют каждую строку в этой таблице. Первичный ключ не может быть дубликатом, то есть одно и то же значение не может появляться в таблице более одного раза.
Таблица должна иметь более одного первичного ключа. Первичный ключ может быть определен на уровне столбца или таблицы. Если вы создаете составной первичный ключ, он должен быть определен на уровне таблицы.
В этом уроке вы узнаете:
Что такое уникальный ключ?
Уникальный ключ — это группа из одного или нескольких полей или столбцов таблицы, которые однозначно идентифицируют запись базы данных.
Уникальный ключ такой же, как первичный ключ, но он может принимать одно нулевое значение для столбца таблицы. Он также не может содержать одинаковые значения. На уникальные ограничения ссылается внешний ключ других таблиц.
Зачем использовать первичный ключ?
Вот важные причины для использования первичного ключа:
- Основная цель первичного ключа — идентифицировать каждую запись в таблице базы данных.
- Вы можете использовать первичный ключ, если не разрешаете кому-либо вводить нулевые значения.
- Если вы удалите или обновите запись, то указанное вами действие будет предпринято для обеспечения целостности данных базы данных.
- Выполните операцию ограничения для отклонения операции удаления или обновления для родительской таблицы.
- Данные организуются в последовательности кластеризованного индекса всякий раз, когда вы физически организуете таблицу СУБД.
Зачем использовать уникальный ключ?
Вот важные причины для использования уникального ключа:
- Цель уникального ключа — убедиться, что информация в столбце для каждой записи таблицы уникальна.
- Когда вы позволяете пользователю ввести нулевое значение.
- Уникальный ключ используется, потому что он создает некластеризованный индекс по умолчанию.
- Уникальный ключ может быть использован, когда вам нужно сохранить нулевые значения в столбце.
- Когда одно или несколько полей / столбцов таблицы, однозначно идентифицируют запись в таблице базы данных.
Особенности первичного ключа
Вот важные особенности первичного ключа:
- Первичный ключ реализует целостность объекта таблицы.
- Вы можете сохранить только один основной элемент в таблице.
- Первичный ключ содержит один или несколько столбцов таблицы.
- Столбцы определены как не нулевые.
Особенности Уникального ключа
Вот важные особенности уникального ключа:
Пример создания первичного ключа
В следующем примере описано, что существует таблица с именем student. Он содержит пять атрибутов: 1) StudID, 2) Roll No, 3) Имя, 4) Фамилия и 5) Электронная почта.
Атрибут Roll No никогда не может содержать повторяющегося или нулевого значения. Это потому, что каждый студент, зачисленный в университет, может иметь уникальный номер броска. Вы можете легко идентифицировать каждый ряд таблицы по номеру ролика студента. Так что это считается первичным ключом.
Пример создания уникального ключа
Рассмотрим ту же таблицу учеников с атрибутами: 1) StudID, 2) Roll No, 3) Имя, 4) Фамилия и 5) Электронная почта.
Идентификатор студента может иметь уникальное ограничение, при котором записи в столбце Идентификатор студента могут быть уникальными, поскольку каждый студент университета должен иметь уникальный идентификационный номер. В случае, если студент меняет университет, в этом случае у него или нее не будет никакого студенческого билета. Запись может иметь нулевое значение, так как в ограничении уникального ключа допускается только одно нулевое значение.
Читайте также: