Как выглядит компьютерный код программы
Исхо́дный код (также исхо́дный текст) — написанный человеком текст компьютерной программы на каком-либо языке программирования. В обобщённом смысле — любые входные данные длятранслятора. Исходный код транслируется в исполняемый код целиком до запуска программы при помощи компилятора, или может исполняться сразу при помощи интерпретатора.
Содержание
Назначение [ ]
Исходный код либо используется для получения объектного кода, либо выполняется интерпретатором. Изменения никогда не выполняются над объектным кодом, только над исходным, с последующим повторным преобразованием в объектный.
Другое важное назначение исходного кода — в качестве описания программы. По тексту программы можно восстановить логику её поведения. Для облегчения понимания исходного кода используются комментарии. Существуют также инструментальные средства, позволяющие автоматически получать документацию по исходному коду — т. н. генераторы документации.
Кроме того, исходный код имеет много других применений. Он может использоваться как инструмент обучения; начинающим программистам бывает полезно исследовать существующий исходный код для изучения техники и методологии программирования. Он также используется как инструм
ент общения между опытными программистами, благодаря своей лаконичной и недвусмысленной природе. Совместное использование кода разработчиками часто упоминается как фактор, способствующий улучшению опыта программистов.
Программисты часто переносят исходный код (в видемодулей, в имеющемся виде или с адаптацией) из одного проекта в другой, что носит название повторного использования кода.
Исходный код — важнейший компонент для процесса портирования программного обеспечения на другие платформы. Без исходного кода какой-либо части ПО, портирование либо слишком сложно, либо вообще невозможно.
Качество [ ]
В отличие от человека, для компьютера нет «хорошо написанного» или «плохо написанного» кода. Но то, как написан код, может сильно влиять на процесс сопровождения ПО. О качестве исходного кода можно судить по следующим параметрам:
- читаемость кода (в том числе наличие комментариев к коду);
- лёгкость в поддержке, тестировании, отладке и устранении ошибок, модификации и портировании;
- экономное использование ресурсов — памяти, процессора, дискового пространства;
- отсутствие замечаний, выводимых компилятором;
- отсутствие «мусора» — неиспользуемых переменных, недостижимых блоков кода, ненужных устаревших комментариев и т. д;
- адекватная обработка ошибок;
- учёт использования обработчика (компилятора, интерпретатора, транслятора) разных версий, или даже различныхОС;
- возможность интернационализации интерфейса.
Неисполняемый исходный код [ ]
Копилефтные лицензии для свободного ПОтребуют распространения исходного кода. Эти лицензии часто используются также для работ, не являющихся программами — например, документации, изображений, файлов данных для компьютерных игр.
В таких случаях исходным кодом считается форма данной работы, предпочтительная для её редактирования. В лицензиях, предназначенных не только для ПО, она также может называться версией в «прозрачном формате». Это может быть, например:
В предыдущей части мы затронули азы программирования, где рассказали о машинном языке, преобразователях, языках программирования и работе с CLI. Двигаемся дальше.
Исходным кодом называется основной файл вроде Microsoft (.doc), но немного другой. Это текстовый файл, написанный с помощью простых редакторов, таких как Windows Блокнот. В предыдущем разделе мы перечислили, что нужно, чтобы интерпретаторы или компиляторы конвертировали исходный код в двоичный. Первый должен быть сохранен в файле, что передается для ввода в переводчик (преобразователь).
В зависимости от выбранного языка, есть назначенные расширения для сохранения файла: Python – .py. Java – .java. PHP – .php, PERL – .pl и т. д.
Когда вы закончите писать код, запустите его через переводчик. Рассмотрим в качестве примера запуск кода на языке Python с использованием команды python.
Начало работы: ваша первая программа
- Следуйте приведенным здесь инструкциям, чтобы настроить Python в вашей компьютерной системе.
- Установите простой редактор, чтобы ввести исходный код. Для начала можете использовать этот текстовый редактор.
3. Откройте в нем новый файл и введите следующее:
- Не забудьте сохранить файл как main.py.
- Найдите путь к файлу через CLI и введите следующую команду:
Результат должен выглядеть так:
Анатомия типичного кода
Теперь мы рассмотрим содержимое типичного файла исходного кода. Ниже приведены регулярные компоненты.
Ключевые слова
Короткие человекочитаемые слова, обычно называемые ключевыми. Они свойственны изучаемому вами языку и они особенны. Их просто нужно знать. Вот небольшой набор ключевых слов, часто используемых в Python.
Идентификаторы
Слова, изобретенные вами. Да, не удивляйтесь! Вы, программист. Эти слова обычно называются идентификаторами. Они могут быть созданы вами или другими программистами. Они упакованы в плагины, более известные как библиотеки.
Примером является библиотека Math. Она позволяет получить доступ к функциям, таким как квадратный корень (Math.sqrt), используемый в JavaScript.
Многие языки программирования поставляются со множеством библиотек. Они обычно называются SDK (комплекты разработки программного обеспечения). Загружаются вместе с компилятором для дальнейшего создания технологий, приложений и проектов. Также существуют фреймворки, созданные, чтобы облегчить разработку проекта и объединить его различные составляющие.
Некоторые идентификаторы в комплекте с выбранным языком не могут использоваться в качестве идентификатора пользователя. Примером является слово string в Java. Такие идентификаторы вместе с ключевыми словами называются Зарезервированными Словами. Они также являются особыми.
Все ключевые слова являются зарезервированными. Также слова, которые вы выбираете, должны иметь смысл для тех, кто впервые их видит.
Основные типы данных
Исходный код – сосредоточение разных типов даннх: числа (3, 5.7, -100, 3.142) и символы (M, A). В некоторых языках программирования числа разбиваются на подтипы, такие как integers (целые числа).
Целые числа могут быть знаковыми и беззнаковыми, большими и малыми. Последние фактически зависят от объема памяти, зарезервированного для таких чисел. Есть числа с десятичными частями, обычно называемые double и float, в зависимости от языка, который вы изучаете.
Также существуют логические типы данных boolean, которые имеют значение true или false.
Сложные типы данных
Указанные выше типы известны как элементарные, первичные или базовые. Мы можем создавать более сложные типы данных из приведенных базовых.
Массив (Array) – это простейшая форма сложного типа. Строка (String) – это массив символов. Мы не можем обойтись без этих данных и часто используем их при написании кода.
Комбинация символов – это строка. Чтобы использовать аналогию, строка для компьютера означает, что слово принадлежит человеку. Слово «термометр» состоит из 9 символов – мы просто называем это строкой символов. Обработка строк – это обширная тема, которая должна изучаться каждым начинающим программистом.
Сложные типы данных поставляются с большинством языков программирования, которые используются. Есть и другие, такие как системы классов. Это явление также известно как объектно-ориентированное программирование (ООП).
Переменные
Переменные – это просто имена областей памяти. Иногда нужно сохранить данные в исходном коде в месте, откуда их можно вызвать, чтобы использовать. Обычно это место памяти, которое резервирует компилятор/интерпретатор. Нам нужно дать имя этим ячейкам памяти, чтобы потом их вспомнить. Рассмотрим фрагмент кода Python ниже:
pet_name – пример переменной, и тип данных, хранящихся в pet_name, является строкой, что делает переменную строковой. Существуют также числовые. Таким образом, переменные классифицируются по типам данных.
Константы
Константы – это значения, которые не изменяются на протяжении всего жизненного цикла программы. Чаще всего в их именах используются заглавные буквы. Некоторые языки поддерживают создание постоянных значений, а некоторые – нет.
Существуют строго типизированные языки программирования, в которых каждая переменная должна быть определенного типа. Выбрав тип один раз, вы больше не сможете его изменить. Java – хороший пример такого ЯП.
Другие же не предоставляют эти функции. Они являются свободно типизированными или динамическими языками программирования. Пример – Python.
Вот как объявить постоянное значение в JavaScript:
Литералы
В каждом исходном коде существуют типы данных, которые используются повсюду и изменяются только в том случае, если их отредактировали. Это литералы, которые не следует путать с переменными или константами. Ни один исходный код не обходится без них. Литералы могут быть строками, числами, десятичными знаками или любыми другими типами данных.
В приведенном выше фрагменте слово «Hippo» является строковым литералом. Это всегда будет «Hippo», пока вы не отредактируете исходный код. Когда вы научитесь кодить, узнаете, как управлять литералами таким образом, чтобы оставлять неизменной большую часть кода.
Пунктуация/Символы
В большинстве написанных программ вы найдете различные знаки препинания в зависимости от выбранного языка программирования. Например, в Java используется больше знаков препинания, чем в Python.
Основные знаки включают в себя запятую (,), точку с запятой (;), двоеточие (:), фигурные скобки (<>), обычные круглые скобки (()), квадратные скобки ([]), кавычки ("" или ''), вертикальную черту (|), слэш (\), точку (.), знак вопроса (?), карет (^) и процент (%).
Операторы
Шансы, что вы будете писать исходный код для выполнения какой-нибудь операции, крайне высоки. Любые языки программирования, которые мы используем, включают в себя множество операторов. Среди применяемых выделяют сложение (+), деление (/) умножение (*), вычитание (-) и знак больше (>).
Операторы обычно классифицируются следующим образом:
- Операторы присваивания. Они иногда истолковываются как equals, что неправильно. Равенство используется для сравнения двух значений. А вот оператор присваивания присваивает значение переменной, например pet_name = 'Hippo'
- Арифметические операторы. Состоят из операторов для выполнения арифметических задач, таких как сложение и вычитание. Некоторые языки программирования предоставляют арифметические операторы, когда другие могут их не иметь в своем арсенале. Например, оператор модуля/остатка (%) возвращает остаточное значение в операциях деления.
- Реляционные операторы. Используются для сравнения значений. Они включают в себя больше, меньше, равно, не равно. Их представление также зависит от того, какой язык программирования вы изучаете. Для некоторых ЯП не равно – это <>, для других же – != или !==.
- Логические операторы. Применяются для произведения логических операций. Обычно используемыми логическими операторами являются и, или, нет. Некоторые языки представляют эти операторы в виде специальных символов. Например, && для представления логического и, || – для или, и ! – для нет. Логические значения принято оценивать с помощью булевых значений true или false.
Комментарии
Документация будет важным аспектом деятельности в сфере программирования. Это то, как вы объясняете свой код другим программистам. Подобное делается с помощью комментариев, которые добавляются к различным частям кода. С помощью комментариев вы можете направлять других программистов через написанную программу.
Компилятор игнорирует строки кода, которые являются комментариями.
Вот пример комментария в Python:
Пробелы и вкладки
Это пробелы, созданные между кодом, который вы пишете. Они ставятся при нажатии пробела или клавиши табуляции на клавиатуре.
Двигаемся дальше
Вы познакомились с исходным кодом и изучили его содержимое. Скомпилированный или преобразованный код может не запускаться по ряду причин. Эти причины обычно связаны с ошибками. Действие поиска и удаления ошибок называется отладкой и является навыком, который вы должны изучить. Ошибки мы рассмотрим в следующей части.
Убедитесь, что вы правильно настроили Python в своей компьютерной системе, и запустите свою первую программу.
Викторина
Определите элементы, которые мы изучили, в приведенном ниже фрагменте кода Java:
Большинство новичков в программировании, при написании очередной программы на уровне "Hello world", просто нажимают кнопку Run и даже не задумывается о том, что происходит с их кодом в момент компиляции. А зря.
Подписывайтесь на канал, ставьте лайк и мы начинаем!
Для чего мне это нужно?
Если у вас сейчас появился такой вопрос, то вот ответ на него:
Не понимая основ программирования, как всё работает, вы не сможете писать по-настоящему оптимизированный код. И дело тут не в правилах вроде "Тщательно выбирайте имена для переменных".
Надеюсь, вы меня понимаете. Если всё Ok, давайте наконец начнём!
Компиляция - это перевод кода на языке высокого уровня в машинную форму представления. Иными словами, это перевод с одного языка на другой, более понятный компьютеру.
Шаг первый - Препроцессор
В момент нажатия кнопки Run , вы отправляете свой код в компилятор. Всё начинается с препроцессора:
На всякий случай, этот символ выглядит так:
Итак, препроцессор ищет в вашем коде директивы, затем выполняет их.
Директивы позволяют вставлять в программу текст (код) из других файлов, исключать из процесса компиляции фрагменты кода, выполнять замену одних фрагментов другими и т.п.
Один из самых распространённых примеров :
Ссылается на заголовочный файл stdio.h, в процессе компиляции библиотека stdio будет включена в наш проект. Ссылается на заголовочный файл stdio.h, в процессе компиляции библиотека stdio будет включена в наш проект.Шаг второй. Анализ.
Обработанный текст передаётся назад в компилятор, который выполняет синтаксический и лексический анализ полученного текста.
Лексический анализ
На этом этапе сканер (лексический анализатор) последовательно просматривает поступающий в него поток символов и выделяет допустимые лексемы , это могут быть имена / ключевые слова, знаки операций, разделители и т.п. Их границы определяются по разделителям, пробельным символам и другим лексемам.
Синтаксический анализ
После лексического анализа парсер (синтаксический анализатор), на основе грамматики языка, распознает построенные из лексем выражения и операторы, выявляет синтаксические ошибки.
Семантический анализ
Целью этого вида анализа является выявление разного рода смысловых ошибок. Например, повторное описание переменной.
Шаг три. Почти финал.
Вам было тяжело? Надеюсь, что нет. Мы скоро закончим.
Итак, если ошибок после всех предыдущих этапов нет - > начинается генерация кода. При этом, конкретный вид генерируемого кода зависит от того, приложение какого типа создаётся.
Для обычного Windows приложения строится объектник (объектный модуль) - заготовка исполняемой программы в машинном коде.
Финал?
Далее судьба этого приложения тоже зависит от типа приложения.
Для Windows приложения компоновщик (линкер) формирует исполняемый .exe файл, подключая к объектному модулю другие такие же модули, в том числе, содержащие элементы стандартных библиотек, которые вы используете в своём проекте (например, stdio).
Если программа состоит из нескольких файлов, они компилируются по-отдельности и объединяются на этапе компоновки. После всего этого мы имеем готовый .exe файл, который можно запускать.
Заключение
В заключение хочу сказать, что изучать компьютерную науку (CS) - очень важно. В данный момент на рынке очень много разработчиков без действительно-сильной теоретической базы. В том числе и я. Именно по этой причине я решил углубиться в CS.
Ставьте лайки и подписывайтесь на канал. Это не только мотивирует меня, но и способствует популяризации канала.
Чем больше подписчиков и лайков я получаю, тем больше у меня желание выдавать вам качественный и полезный контент, поэтому:
Спасибо за внимание, с вами был Дад.
Пишите в комментариях, что вы думаете о новом "логотипе" и названии канала, нравится ли вам?
Также пишите ваше мнение о данной статье, считаете ли вы её полезной. Любые ваши отклики улучшают качество контента на этом канале!
Рассказывает:
Роман Янковский,
советник практики IP & IT юридической фирмы «Томашевская и партнеры»
ГК РФ определяет программу для ЭВМ как совокупность данных и команд, предназначенных для функционирования компьютерных устройств. Программы могут быть выражены на любом языке и в любой форме, включая исходный текст и объектный код (ст. 1261 ГК РФ).
Благодаря такому определению многие юристы воспринимают исходный код программы как текст наподобие литературного произведения. Базовое представление о программе: это некие строки, которые компьютер читает и выполняет по очереди, и таким образом программа работает. Однако такое понимание не учитывает технические нюансы, которые влияют на возможность защиты права на программу.
Какие технические особенности влияют на защиту кода?
Особенность № 1
Большинство языков программирования являются компилируемыми. Это значит, что получить исходный текст чужой программы невозможно, если вам не передал его сам разработчик.
Языки программирования бывают интерпретируемыми и компилируемыми. Программу на интерпретируемом языке программирования компьютер, грубо говоря, построчно читает. Но на практике такие языки программирования используются достаточно редко.
Большинство программ сегодня пишут на компилируемых языках программирования. Такие программы работают только после прохождения специальной процедуры компиляции. Программа-компилятор собирает исходный текст программы, написанной, упаковывает и изменяет его и выдает так называемый исполняемый файл (обычно с расширением «.exe» – от англ. “executable”).
Иными словами, компилятор преобразует исходный текст программы в объектный код, и только после этого программу можно запустить на компьютере.
Если мы откроем файл программы — пресловутый .exe — в специальном редакторе, мы увидим то, что называют объектным кодом. Фактически это будет просто мешанина из цифр и букв в 16-ричной системе исчисления.
А куда делся исходный текст программы, который написал программист при разработке программы?
Компилятор преобразовал его в объектный код. Мы не можем вернуть его обратно. Максимум, что мы можем сделать с объектным кодом, — представить его в виде так называемых ассемблерных команд. Ассемблерные команды — это максимально очеловеченное и удобочитаемое представление машинного кода (хотя об удобочитаемости тут можно говорить весьма условно).
Таким образом различают:
- код высокого уровня, который предназначен для чтения человеком (исходный текст),
- код низкого уровня, предназначенный для чтения машиной (объектный код).
Теоретически небольшую программу можно сразу написать на языке низкого уровня (используя ассемблерные команды). Но сейчас так никто не делает, потому что написать даже простую программу на ассемблере — это большой объем работы. Программы пишут на языках программирования высокого уровня в виде исходного текста. Затем, как мы уже говорили, компилятор обрабатывает этот текст и превращает его в смесь цифр и букв – объектный код.
Какое значение это имеет для юристов?
Исходный текст есть только у разработчика программы. Когда разработчик распространяет программу, он делает это в виде скомпилированного файла. Технически из этого файла можно получить только объектный код.
Есть процедура так называемой декомпиляции: специалист пытается воссоздать первоначальный код из ассемблерных команд. Согласно ГК РФ, декомпиляция – это воспроизведение и преобразование объектного кода в исходный текст (ст. 1280 ГК РФ). Однако важно понимать, что даже если специалист смог воссоздать код на языке высокого уровня, который генерирует необходимый объектный код (то есть, по сути, восстановил программу), этот код высокого уровня не будет аналогичен первоначальному. То есть этот «исходный текст» не будет исходным в прямом смысле этого слова: после декомпиляции мы не получим исходный текст, который изначально разработчик обработал компилятором.
Из-за этого у правообладателей возникают сложности с тем, чтобы доказать нарушение прав на программное обеспечение.
В файле программы нет исходного текста. Если ваши права нарушены, вы можете только, грубо говоря, показать чужую программу в суде и сказать, что она очень похожа на вашу и делает то же самое. Однако до суда у вас не будет исходного текста чужой программы, чтобы подтвердить ее тождественность с вашей.
Чтобы доказать нарушение, потребуется судебная экспертиза. Для этого нужно через суд запросить исходный текст у потенциального нарушителя. Но здесь нужно учитывать, что под видом исходного текста оппонент может передать абсолютно сторонний файл. Поэтому правообладателю придется перепроверить, что на выходе переданный исходный текст действительно представляет собой спорную программу.
Особенность № 2
Программы занимают физически очень большой объем.
Количество строк кода в совсем небольшой игре для телефона сопоставимо с количеством строк в ГК РФ. Серьезные программы занимают значительно больший объем. Поэтому не так просто принести в суд распечатку кода своей и чужой программ и сравнить их: это будут две огромные кипы бумаги.
Есть и другой нюанс. Программы могут быть практически идентичны, при этом код в них может быть структурирован по-разному. Технически это возможно – расположение отдельных блоков кода в программе можно менять. В такой ситуации выявить сходство с учетом объема программы будет непросто даже разработчику.
Особенность № 3
Программы постоянно обновляются.
В программы постоянно вносятся изменения. Если программа объемная, то новые версии могут появляться несколько раз в день. Соответственно, у нее нет постоянного кода, который можно было бы депонировать раз и навсегда.
Особенность № 4
Большинство программ пишут на основании уже готового кода.
Программы сегодня не создаются с нуля. Разработчики пишут большинство программ на основе уже готовых модулей, так называемых библиотек. Они бывают платными и бесплатными. Бесплатные библиотеки часто распространяются на условиях открытой лицензии, что представляет проблему для юристов.
Дело в том, что разные типы свободных лицензий накладывают разные обязательства на правообладателя программы, в которой используется готовая библиотека. Так, по одним лицензиям права на библиотеку переходят в общественное достояние и могут использоваться кем угодно. По другим, наоборот, использование библиотек в составе коммерческих программ либо совсем запрещено, либо возможно лишь при условии раскрытия кода (то есть публикации результата в открытом доступе).
Есть два способа внедрить чужую библиотеку в свою программу:
- можно просто включить код внутрь программы – это называется статической библиотекой. В таком случае лицензия, по которой распространяется библиотека, автоматически распространится на программу в целом, так как программа станет фактически производным произведением от библиотеки;
- можно прикрепить код отдельным файлом и создать внутри программы ссылку на этот файл – так называемая «динамическая библиотека». Так можно использовать, к примеру, открытую библиотеку в составе закрытой программы.
На заметку
Не всё, что юристы называют «программой», выполняет какую-то активную функцию. Например, для создания сайтов используют так называемые языки гипертекстовой разметки. Сайты тоже имеют код, который не отображается при открытии сайта, но отвечает за его техническую функциональность. При этом такой код не является программой в традиционном понимании — это скорее что-то настроек отображения сайта, которые передаются пользователю и обрабатываются его браузером. Поэтому в разных браузерах сайты могут выглядеть по-разному, тогда как команда обычно выдает один и тот же результат на разных компьютерах.
Как оформить и защитить права на программу?
Возможны несколько вариантов оформления прав на программу, чтобы в последующем можно было отстоять права на нее.
- Зарегистрировать программу в реестре.
Программа для ЭВМ является объектом авторского права. По ГК РФ регистрация для защиты авторских прав не требуется (ст. 1259 ГК РФ).
Самое главное: регистрация в реестре не считается правопорождающим фактом. А сам реестр не считается публичным – перед покупкой программы у покупателя нет обязанности проверять в реестре, является ли продавец ее правообладателем.
По сути, регистрация в этом реестре представляет собой механизм добровольного депонирования. Автором программы считается лицо, указанное в реестре, но только пока не доказано иное (п. 6 ст. 1262 ГК РФ, п. 109 Постановления Пленума ВС РФ от 23.04.2019 № 10 «О применении части четвертой Гражданского кодекса Российской Федерации»).
На заметку
Существуют альтернативные способы депонирования программ. Например, у ВОИС недавно появилась услуга онлайн-депонирования интеллектуальных активов. Правда, пока нет практики использования таких сертификатов в качестве доказательств, потому что этот механизм совсем новый – работает с июня 2020 года.
- Запатентовать алгоритм работы программы.
ГК РФ напрямую не предусматривает такой способ защиты прав на программы. Наоборот, в законе указано, что программа для ЭВМ не является изобретением (ст. 1350 ГК РФ). Поэтому при патентовании программы как таковой можно столкнуться со сложностями.
Роман Янковский рекомендует патентовать не саму программу, а алгоритм ее работы. Такие патенты встречаются на практике (например, есть патенты на решения для распределенного реестра).
- Запатентовать интерфейс программы в качестве промышленного образца.
В качестве примера можно привести спор между приложением для знакомств Tinder и его конкурентом – Bumble. Сервис-конкурент запустили бывшие сотрудники Tinder. У обоих приложений были очень похожие функции, в частности механизм «свайпа», на который у Tinder был патент на промышленный образец.
- Установить режим коммерческой тайны.
Распространить режим коммерческой тайны на разработанный софт и потребовать от работников подписать соответствующие документы – это хорошее решение по двум причинам:
Читайте также: