Как сделать составной первичный ключ в базе данных
У меня есть таблица из 3 полей, комбинация значений которых уникальна для каждой записи. Вот эти поля:
Ни одно из этих полей никогда не будет пустым, и ни один объект в один и тот же момент времени не будет иметь такое же значение Ticket_Number .
Поэтому мне кажется, что, вместо добавления нового поля, единственным назначением которого будет уникально идентифицировать строку в таблице, я могу использовать комбинацию этих трех полей. Но в руководстве PL/SQL Developer's Guide рекомендуется не использовать составные первичные ключи.
Что ты думаешь по этому поводу?
Надо учитывать также следующее:
Мне придется вставлять эти же значения для составных внешних ключей в несколько других таблиц. Не будет ли снижена производительность при использовании составных ключей по сравнению с простым ключом, с последовательными номерами записей? Может ли быть ее причиной необходимость сравнивать также строки и даты?
С другой стороны, если лучше добавить новое числовое поле для идентификации записей, как проще всего увеличивать значение этого поля при каждой вставке? Есть ли в Oracle подобие типа данных autonumber MS Access?
Ответ Тома Кайта
Если требуется, чтобы "эти три поля уникально идентифицировали запись в любом случае", придется задавать по ним ограничение уникальности (UNIQUE CONSTRAINT) в любом случае. Если дублирование object_id,ticket_number,start_datetime - ошибка, ограничение уникальности НЕОБХОДИМО.
Можно добавить еще одно поле в таблицу в качестве "первичного ключа", но это не снимает необходимости добавления ограничения уникальности по данным трем полям. Если на первичный ключ придется ссылаться во внешних ключах многих таблиц, имеет смысл использовать суррогатный ключ. Если внешних ключей немного, я бы просто использовал составной первичный ключ.
Чтобы получить тип " auto increment " в Oracle, необходимо выполнить:
Иногда высказывают опасение, что при генерации последовательных номеров таким образом возможны пропуски (связанные с откатом транзакции, например - В.К. ).
Да, использование последовательности не гарантирует отсутствие пропусков при нумерации - в любой не однопользовательской системе они точно будут. Единственный способ нумеровать без пропусков - обрабатывать транзакции по одной. Последовательности предназначались не для этого, и любая система с таким требованием не будет масштабироваться (для компьютерных систем оно вообще смешное - при обработке документов вручную еще куда ни шло, но в компьтерной системе - оно просто бессмысленно).
Последовательности - хорошо масштабируемый способ генерации суррогатных ключей.
Я считаю, что составные ключи прекрасно работают и могут использоваться при наличии внешних ключей, но:
Эти соображения необходимо учитывать. Как я уже писал, если составной первичный ключ не используется в качестве внешнего во многих таблицах - используйте его. В противном случае серьезно задумайтесь над использованием суррогатного ключа на базе последовательности (а про "пропуски" значений не думайте вовсе - важно, что получается уникальный идентфикатор).
Составной ключ в одном столбце
Мне интересно твое мнение о том, чтро делать, если клиенты настаивают на использовании "магических кодов" - составных ключей, впихнутых в один столбец.
Простой пример - следующий идентификатор события:
Лично я пыаюсь избегать такого рода идентификаторов (как бы они не генерировались) как чумы, по следующим, как мне кажется, очевидным, причинам:
- Если при вводе данных произошла ошибка, и ключ оказался неверным (например, событие было типа 3, а не 4) - все очень печално, ведь это событие уже всем известно как 03-40123
- Делаются конкретные предположения о максимальных значениях:
1) В году никогда не будет более 10000 событий типа 1
2) Нельзя добавить одиннадцатый тип события
3) Две цифры года - это мы уже проходили. - Такие ключи неудобно реализовывать
- Зачем вообще эта возможность узнать финансовый год и тип события без дополнительного запроса?
Я периодически сталкиваюсь с этой проблемой, обычно - при обновлении старых систем и/или систем "бумажного" документооборота, пользователи которых не хотят изменять систему нумерации. Часто мне удается уговорить клиента перейти на простые последовательности, но не всегда.
Я знаю, что ты не сторонник простых правил, но оправдывает ли природа данных или необходимость "запоминающегося" ключа создание такого типа ключей? Когда ты считаешь обоснованным использование такого составного ключевого столбца для идентфикации данных? Добавишь ли ты собственный суррогатный ключ и позволишь пользователям хранить свои магические коды где угодно, или будешь настаивать на использовании простой последовательности?
Ответ Тома Кайта
Такого рода поля могут (и должны) быть ПРОИЗВОДНЫМИ от других данных. Клиенту нет необходимости знать, как в физической схеме фактически реализован первичный ключ - это деталь реализации.
Так что, я бы сделал так:
Можно даже создать индекс по функции (function-based index) по полю their_field , если они собираются искать по его значениям.
Комментарий читателя от 23 ноября 2002 года
Как обычно, твое решение предельно ясно. Мне особенно понравилась идея про индекс по функции!
Однако это не рашает мою проблему "изменения адреса".
Как я попытался объяснить в первом пункте, как только значения fy , incident_type , и goofy_number определены и строка вставлена, значение their_number тоже неявно определено. С этого момента значение their_number может выдаваться в отчетах, сообщаться заинтересованным сторонам и т.д.
Если оказывается, что, например, значение incident_type перовначально оказалось ошибочным, и оно изменяется, значения their_number в базе данных и в отчетах, у заинтересованных сторон и т.д. перестают совпадать.
Можно строить their_number по столбцам, которые не меняются, но это не всегда соответствует требованиям клиента.
Можно строить значение their_number при вставке, помещать в отдельный столбец (с ограничением уникальности, а не первичного ключа), и больше никогда его не изменять при изменении базовых значений его компонентов.
В конечном итоге, меня интересует следующее:
Как "эксперт", нанятый для создания солидных моделей данных, не выхожу ли я за пределы моих полномочий (и не трачу ли зря время), часами пытаясь убедить клиентов не использовать their_number , а заменить его простым значением последовательности?
Ответ Тома Кайта
Если вы представили им все факты, как в вопросе, продемонстрировав, что это может привести к ошибкам в интерпретации данных, и они все равно настаивают на своем - вы сделали все, что могли. Можете включить СВОЙ первичный ключ в отчеты, чтобы при возникновении проблемы можно было получить соотвествующее значение. Вы не выходите за пределы своих полномочий. Я неоднократно повторял, что наша работа как раз и состоит в том, чтобы обращать на подобные вещи мнимание тех, кто не является профессиональным программистом. Последний раз пободная проблема возникла, когда меня спросили на сайте, как выбрать N случайных строк из таблицы. Я написал, как это сделать, но проблема все усложнялась, пока не выяснилось, что нужна случайная выборка 4 строк из сложного запроса со множеством соединений и т.п. Причем, выборка эта должна была делаться сотни/тысячи раз в день. Для этого требовалось множество ресурсов.
А зачем все это понадобилось? Чтобы на портале "вывесить" фотографии 4 случайно выбранных сотрудников. Я ответил: "Сообщите клиентам, что 90% ресурсов машины теперь будет уходить на выдачу этих 4 фотографий, - захотят ли они за это платить". Мнения разделились - надо ли "знать свое место" и тупо, как бараны, делать то, что требуют, или доказывать, что практически бесполезная возможность дается дорогой ценой, и не нужна.
Я бы продолжал настаивать на своем - ваши аргументы на 100% верны. Если они решат не прислушиваться к советам, попытайтесь, по возможности, защитить их от проблем (с помощью суррогатного ключа).
Не хотел бы я работать там, где за год происходит только 9999 событий. Маловато перспектив для роста. А первого января придется этот смешной счетчик снова в 0 сбрасывать.
Изменение составного первичного ключа
У нас есть две таблицы следующего вида:
Необходимо изменить значение c2 в таблице t1 . Нет ли способа изменить этот первичный ключ, не создавая суррогатного?
Ответ Тома Кайта
Раз так, c1,c2 не является первичным ключом - первичный ключ не должен меняться.
Если хотите, используйте ограничения с отложенной проверкой (deferrable constraints).
Можете использовать этот пакет, но если такое действие считается "нормальным", и изменения будут происходить постоянно - выбирайте другой первичный ключ.
Изменение первичного ключа. Комментарий от 15 января 2003 года
Пакет работает прекрасно.
- После изменения первичного ключа, как "отвязать" пакет от таблицы (он необходим для других таблиц, так что просто удалить его я не могу).
- Этот пакет кажестя лучшим решением в нашем случае, поскольку остальной код менять не придется. Помимо снижения производительности, какие еще недостатки имеет данное решение?
- "Ограничения с отложенной проверкой", о которых вы пишете, это когда добавляют ключевое слово deferrable для внешних ключей, так что можно сначала изменить первичный ключ, а потом - внешний. Вы это имеете в виду? Например:
Ответ Тома Кайта
Не знаю, как относиться к утверждения, что "Пакет работает прекрасно". Сомнительный комплимент, как по мне.
- Пакет не связывается с таблицей. Он создает ряд триггеров и хранимых процедур, для указанной таблицы - он генерирует специфический код. Сам по себе он ни с одним объектом не связан.
- Вы имеете ввиду помимо того факта, что изменение первичного ключа вообще недачная идея, связанная с ошибкой проектирования?
- Да, проверку внешних ключей можно отложить и делать так:
Изменение первичного ключа. Комментарий от 16 января 2003 года
Сразу после установки пакета и создания таблиц t1 , t2 , t3 , для изменения первичного ключа мне пришлось сначала выполнить команду:
Но если открыть новый сеанс после этого, изменить первичный ключ мне удалось и без команды ' exec update_cascade.on_table('t2') '. Но я не хочу, чтобы пользователи постоянно меняли этот первичный ключ.
SQL> connect UCDEMO/UCDEMO@e2rs Connected. SQL> update t2 2 set b=900 3 where b = 6; -- первичный ключ изменен без выполнения 'exec update_cascade.on_table('t2')' 1 row updated.
Ответ Тома Кайта
Команда exec update_cascade.on_table('t2') создала (как и описано на указанной странице) триггеры и пакеты для поддержки каскадного изменения. Если его больше не нужно поддерживать, УДАЛИТЕ их.
Как насчет использования sys_guid() вместо последовательности для генерации значений первичного ключа?
Какие преимущества и недостатки связаны с использованием sys_guid() (подозреваю, что используется больше места на диске?) sys_guid() можно указать в качестве стандартного значения (и не понадобиться триггер). Понятно, что "пропуски" значений - не проблема :)
Ответ Тома Кайта
Да, RAW(16) - больше по размеру, чем большинство числовых полей. Его не так удобно записывать, как число. Во многих случаях данные типа raw не обрабатываются - они неявно преобразуются в 32-байтовую строку типа varchar2 . Не уверен, что использовал бы этот подход без веских причин.
Первичный ключ: sys_guid или последовательность
Мы используем sys_guid вместо последовательности (есть требование глобальной уникальности первичных ключей) - в любом случае, имеет смысл сделать тест и поделиться результатами.
Результаты показали следующее:
-
По времени работы последовательности - быстрее (я использовал опцию cache с кэшем размером 5000) - разброс значений был велик, но на разных прогонах последовательности оказались от 52% до 90% быстрее, чем вызовы sys_guid .
Думаю, причина в кэшировании значений последовательностей в области sga , правильно? Однако странно, почему sys_guid работает медленнее - как внутренне реализована функция sys_guid ?
Не мог бы ты объяснить, что это за защелки - я думаю, последние две связаны с получением и установкой следующего значения для сеанса.
С чем связано большее количество db block gets и cache buffer chains при использовании последовательностей? Судя по руководству " Oracle Reference " cache buffer chains связаны с конфликтами при доступе к блоку, т.е. последовательности многократно обращаются к одному и тому же блоку (вероятно, во внутренней таблицеЮ используемой для хранения последовательностей - таблица seq$ )?
Ответ Тома Кайта
- Хотя это и сказано в документации, sys_guid обращается к ОС и, несомненно, требует больше ресурсов процессора
- Защелки для получения блоков из буферного кэша. Последовательности хранятся в блоках. Эти защелки связаны с получением буфера для изменения последовательности и/или получения ее текущего значения. Защелки в библиотечном кэше. Определение последовательности находится именно там. Обращение к последовательности вызывает установку этих защелок. Очевидно ;) Это действительно защелки, обеспечивающие поддержку последовательности.
Комментарий от 4 августа 2003 года
В документации Oracle 9.0.1.1.1 сказано, что: " Составной первичный ключ может содержать не более 32 столбцов ". Но я попробовал задать 33 столбца, и все получилось. Почему?
Вот как я это делал.
Ответ Тома Кайта
Похоже, предел - 33 столбца. Меня это не беспокоит, поскольку "1" - наиболее типичное количество, а 5 или 6 - разумный максимум. 32 будет "слегка перебор", а 33 - еще хуже.
Первичный ключ: sys_guid или последовательность - комментарий от 18 августа 2003 года
Мы используем sys_guid , поскольку хотим избежать конфликтов при переносе данных из одной базы в другую. Точная причина мне не известна, но при экспортировании данных из базы db1 и импортировании в другую базу данных, db2 , при использовании последовательностей возможны конфликты (поскольку одинаковые последовательности создавались в обеих схемах).
Сталкивались ли вы с такой ситуацией? Нет ли более элегантного решения проблемы, кроме использования sys_guid вместо последовательностей. Мы не знаем точного количества баз и не можем просто начинать последовательности с разных значений.
Ответ Тома Кайта
Пусть имеется N баз, которые потенциально придется поддерживать. Если не уверены, увеличьте количество в 100 раз.
Потом в перовй базе выполняем:
Пусть n = 10 , тогда в первой базе будут генерироваться числа:
Получили не перекрывающиеся последовательности для 1000 баз данных.
Не перекрывающиеся последовательности!
Я находил это решение на сайте. Оно очень элегантно, но надо заранее знать количество баз. В нашем случае требовалось, чтобы можно было наполнять данными любую локальную схему, а затем путем экспорта/импорта добавлять накопленные данные в центральную базу.
В идеале один и тот же сценарий установки должен работать всегда, не создавая конфликтов в любой базе. Да, кроме использования централизованной таблицы с начальными значениями для последовательностей, к которой будут обращаться последовательно, - другой достойной альтернативы не видно.
Первичный ключ — это поле или комбинация полей, которые однозначно идентифицируют запись. Первичный ключ — это столбец или набор столбцов, которые являются уникальными. Другими словами, каждое значение уникально для первичного ключа.
Правила для первичного ключа
- Каждая таблица может иметь только один первичный ключ.
- Все значения уникальны, и значение Первичного ключа может однозначно идентифицировать каждую строку.
- Система не позволит вставить строку с первичным ключом, который уже существует в таблице.
- Первичный ключ не может быть пустым.
Ниже на диаграмме обобщены все вышеперечисленные пункты для первичного ключа.
В этом уроке вы узнаете
Как создать первичный ключ
Мы можем создать первичный ключ двумя способами:
1. SQL Server Management Studio.
2. T-SQL: создайте основной файл при создании новой таблицы.
SQL Server Management Studio
Шаг 1) Щелкните правой кнопкой мыши по имени таблицы. Нажмите на дизайн.
Step 2) Right-click on the Column name. Click on ‘Set Primary Key’
Result: Course_Id is now a Primary Key.
T-SQL: Create a Primary key while creating a New Table.
Below is the syntax to create the table from T-SQL
Syntax:
Result: Course_Id is now a Primary Key.
Пример: давайте посмотрим, позволяет ли он вводить несколько записей с одинаковым идентификатором курса.
Шаг 1) Вставьте 4 строки с разными Course_ID
Шаг 2) Проверьте все введенные данные, выполнив запрос Выбрать.
Примечание . Мы можем вставить повторяющиеся значения в неосновный ключ.
Шаг 3) Теперь давайте попробуем Вставить Новые записи с существующим Course_ID, который является Первичным Ключом.
Результат: система не позволяет вводить новое значение, так как 4 есть столбец Course_ID, который является первичным ключом.
T-SQL: добавить первичный ключ в существующую таблицу, используя Alter Table
Вы можете использовать инструкцию ALTER для создания первичного ключа. Однако первичный ключ может быть создан только для столбцов, которые определены как NOT NULL. Вы не можете создать первичный ключ для столбца, который допускает значения NULL. Если вам нужно сделать, вы должны удалить и воссоздать таблицу.
Мы добавили ограничение первичного ключа к уже существующей таблице. В столбец допуска добавлено ограничение, которому присвоено имя Students_pk.
Сегодня я узнал, что вы можете иметь первичный ключ, используя два столбца (tsql). PK должен быть уникальным, но оба столбца не являются (комбо должно быть уникальным).
Я думал, что это очень круто. Было, по крайней мере, два вопроса SO, на которых я спросил, где люди кричали на меня, что я делаю свои (mysql) базы данных не так, как только один человек говорит, что я сделал это хорошо. Итак. это оставляет мне какое-то сомнение.
Делает ли это то, что я думаю, что он делает?
Я побежал ниже, так что кажется, что я делаю то, что думаю (комбо должно быть уникальным. Но одно и то же значение в столбце не обязательно должно быть уникальным). Должен ли я знать что-то? Должна быть причина, о которой никто не упоминал мне в отношении mysql?
ОТВЕТЫ
Ответ 1
Вы уже думали об этом:
- первичные ключи (независимо от того, сколько столбцов задействовано) должны быть уникальными
- ваш первичный ключ - это два столбца a, b
Поэтому a и b вместе должны быть уникальными.
Индивидуальное значение a и b не имеет значения.
Ответ 2
Да, это нормально делать в SQL, и он работает (имея составной первичный ключ, в котором несколько полей вместе составляют уникальное значение).
Убедитесь, что это необходимо. Это часто, и тогда это хорошо. Но иногда это признак того, что вам необходимо нормализовать вашу модель данных.
Я думаю, что вы не хотите делать, а b - это внешние ключи из другой таблицы, а затем сделать их составным первичным ключом вашей таблицы. Что произойдет, если вы настроите каскадное удаление, в котором один идентификатор пользователя, а не другой удаляется? Таким образом, составной первичный ключ прекрасен, но тогда вы не хотите получать "несвязанные" внешние ключи.
Ответ 3
Ваше мышление хорошее. Я часто использую многоадресные первичные ключи, просто потому, что делает мою структуру базы данных более логичной, управляемой и читаемой. Вы можете думать о многопольных первичных ключах, таких как уникальное имя. Например:
Первичные ключи с несколькими полями:
Может быть много людей с "Первым" именем "Майкл" и/или "Среднее" имя "А." и/или "Наилучшее" имя "Kline", но, что касается вашей базы данных, может быть только один "Майкл А. Клайн".
Обычно первичный ключ с несколькими полями представляет собой комбинацию других первичных ключей из других таблиц, а содержимое записи описывает контент, зависящий от конкретных значений ключа. Например:
Надеюсь, что это поможет.
Ответ 4
Да, вы должны знать о дублировании PRIMARY_KEY, который представляет собой комбинированный ключ в вашем случае, чтобы не дублироваться.
В любом случае, когда вы устанавливаете два PK, это означает, что ваша подпись PK1 + PK2, чтобы вы могли дублировать PK1 или PK2, но не оба.
Надеюсь, что я помог
Ответ 5
Также одно замечание: Первичные ключи автоматически индексируются в MySQL. И порядок столбцов, упоминаемый в первичном ключе, имеет значение для производительности, как указано здесь
Ответ 6
Я считаю, что происходит, что парные столбцы являются первичными. Например, вы знаете, что не можете иметь повторяющийся первичный столбец Ex: если col "a" является основным, вы не можете иметь две строки, которые имеют одинаковое значение для a.
В этом примере у вас есть два праймера; что означает, что вы можете иметь только одно уникальное значение для каждой пары col. Например, если col 'a' и 'b' являются первичными, а 'c' не является: | б | с 1,2,3 работы 1,4,5 работ а также 5,1,6 работ 9,1,10 работ
но вы не можете: 9,8,10 9,8,6, потому что для этой пары (9,8) вы можете иметь только одно уникальное значение.
Имеет ли это смысл или вы хотите, чтобы я подробно разбирался?
Ответ 7
ALTER TABLE TableName DROP PRIMARY KEY, ADD PRIMARY KEY ( column1 , column2 ); если вы установили первичный ключ ранее, попробуйте это.
Ответ 8
Чтобы было легче объяснить, я буду использовать только одну таблицу. Создайте таблицу с двумя столбцами типа int и PK на них обоих. Как и в вопросе.
Теперь мы можем добавлять строки, пока не получим ошибку
Это логично, поскольку объединенные значения двух столбцов, составляющих PK, больше не являются уникальными, когда будет выполняться этот последний оператор.
Разрешено хранить 2x значение 1 в a, потому что это не PK. PK - это объединенное значение столбцов a и b.
Примечание:
Во всех статьях текущей категории уроков по SQL используются примеры и задачи, основанные на учебной базе данных.
Приступая к изучению данного материала, рекомендуется ознакомиться с описанием учебной БД.
Каждая строка в таблицах реляционных баз данных должна отвечать требованию уникальности. Некоторые поля могут повторяться от записи к записи, но сочетание всех полей строки встречается только единожды. Если не соблюдать это правило, то можно ошибочно отнести свойства одного объекта к другому.
Допустим, существует таблица с перечнем студентов:
На примере видно, что 2 и 4 строки содержать ФИО студентов, являющихся полными тезками, которые учатся в одной группе. Такая ситуация маловероятна, но возможна. Если один из этих студентов не сдаст экзамены и его отчислят, то по ошибке можно отчислить другого, который не имеет проблем с успеваемостью.
Чтобы исключить подобные ошибки, потребуется добавить дополнительное свойство, которое потенциально может служить идентификатором: паспортные данные, номер личного дела и т.п.
Первичный ключ, состоящий из нескольких полей, называется составным ключом.
Читайте также: