files | ||
LICENSE | ||
README_ENG.md | ||
README.md |
Данный репозиторий представляет собой наглядную шпаргалку по основным темам в области Backend-разработки. Весь материал разбит на темы и подтемы. Структура материала состоит из трех частей:
- Визуальная часть - различные изображения/таблицы/шпаргалки для лучшего понимания (может отсутствовать). Все рисунки и таблицы сделаны с нуля, специально для этого репозитория.
- Краткое описание - очень краткая выжимка информации с перечнем основных терминов и понятий. На термины навешиваются гиперссылки ведущие на соответствующий раздел в Википедии или подобном справочном ресурсе.
- Ссылки на источники - ресурсы, где можно найти полную информацию по конкретному вопросу. По возможности, указываются максимально авторитетные источники, либо же те, которые предоставляют информацию максимально простым и понятным языком.
🛠 Репозиторий находится в стадии активной разработки, поэтому постоянно обновляется и дополняется (см. список будущих нововведений)
🤝 Если у Вас есть идеи как сделать проект лучше, не стесняйтесь присылать Issues и Pull requests
🌐 Разработка отдельной веб-страницы в процессе...
Содержание
Дополнительные и похожие ресурсы
Сеть и интернет
Интернет - это всемирная система объединяющая компьютерные сети со всего мира в единую сеть для хранения/передачи информации. Изначально Интернет разрабатывался для военных. Но вскоре он стал внедряться в учреждения образования (университеты), а затем его смогли использовать частные компании, которые начали организовывать сети провайдеров, предоставляющие услуги доступа в Интернет обычным гражданам. К началу 2020 года количество пользователей в сети Интернет перевалило за 4.5 млрд человек.
-
Как устроен Интернет
Ваш компьютер никогда не был связан с Интернетом напрямую. Поскольку он способен видеть только свою локальную сеть, в которую проводным (Ethernet) или беспроводным (Wi-Fi, Bluetooth) путем подключены другие устройства. Для связи с Интернетом в вашей локальной сети находиться специальный мини-компьютер – маршрутизатор. Далее он связывает вас с интернет-провайдером, который в свою очередь связан с другими провайдерами более высокого уровня. Таким образом, ваше сообщение, проходит транзитом через сеть нескольких провайдеров, прежде чем достигнет сеть назначения.
Интернет – это всего лишь длинный провод, к которому напрямую присоединены небольшое количество провайдеров первого уровня. Провайдеры уровня ниже просто арендуют доступ.
🔗 Ссылки на материалы
-
Что такое доменное имя
Доменные имена - это человеко-читаемые адреса веб-серверов, доступных в Интернете. Они состоят из частей (уровней) разделенных между собой точкой. Каждая из этих частей предоставляет специфическую информацию о доменном имени. Например страну, название сервиса, локализацию и т.д.
- Кто владеем доменными именами
Корпорация ICANN является основателем распределённой системы регистрации доменов. Она выдаёт аккредитации компаниям, которые хотят заниматься продажей доменов. Таким образом формируется конкурентный доменный рынок.
- Как купить доменное имя
Доменное имя нельзя купить навсегда. Оно выдается в аренду на определенный срок. Покупать домены лучше у аккредитованных регистраторов (найти их можно почти в любой стране).
- Кто владеем доменными именами
🔗 Ссылки на материалы
-
IP-адрес
IP-адрес – уникальный числовой адрес, который используется для распознавания того или иного устройства в сети.
- Уровни видимости
- Внешний и доступный всем IP-адрес, который принадлежит Вашему провайдеру и используется для выхода в интернет сотен других пользователей.
- IP-адрес вашего роутера в локальной сети провайдера, той самой, с IP-адресом которой вы выходите в интернет.
- IP-адрес вашего компьютера в локальной (домашней) сети, созданной роутером, к которой вы можете подключать свои устройства. Как правило, имеет вид 192.168.XXX.XXX.
- Внутренний IP-адрес компьютера, недоступный извне и используемый только для общения между запущенными процессами. У всех он одинаковый – 127.0.0.1 или просто localhost.
- Порт
На одном устройстве (компьютере) может работать множество приложений, которые используют сеть. Для того, чтобы правильно распознать, куда и какие данные, пришедшие по сети, нужно доставить (в какое из приложений) используется специальный числовой номер – порт. То есть, каждый запущенный процесс на компьютере, который использует сетевое подключение, имеет свой личный порт.
- IPv4
4 версия IP-протокола. Разработана в 1981 году и ограничивает адресное пространство около 4.3 млрд (2^32) возможными уникальными адресами.
- IPv6
Со временем распределение адресного пространства стало происходить значительно более быстрыми темпами, что вынудило создание новой версии IP-протокола для хранения большего количества адресов. IPv6 способен выдать 2^128 уникальных адресов.
- Уровни видимости
🔗 Ссылки на материалы
- 📄 IP адрес
- 📄 Всё об IP адресах и о том, как с ними работать – habr.com
- 📄 Как узнать IP-адрес в Linux
- 📺 Порты и перенаправление\открытие портов. Инструкция и объяснения на пальцах – YouTube
- 📄 Список зарезервированных портов TCP и UDP – Википедия
- 📄 Протоколы IPv4 и IPv6. В чем разница и что лучше?
- 📺 Адреса IPv6 | Компьютерные сети. Продвинутые темы – YouTube
- 📄 IPv6: как организовать миграцию и в чем преимущества перехода
- 📺 IPv6 - от слов к делу – YouTube
-
Что такое DNS
DNS (Domain Name System) - это децентрализованная система именования адресов в Интернете, которая позволяет создавать удобные для человека буквеные наименования (доменные имена) соответствующие числовым IP-адресам, которые используются компьютерами.
- Структура DNS
DNS состоит из множества независимых узлов, каждый из которых хранит только те данные, которые входят в его зону ответственности.
- DNS Resolver
Сервер, который расположен в непосредственной близости от вашего провайдера. Именно он выполняет поиск адресов по доменным именам, а также занимается их кэшированием (временным хранением для быстрой выдачи при последующих обращениях).
- DNS записи
- Запись A – связывает доменное имя с адресом IPv4.
- Запись AAAA – связывает доменное имя с адресом IPv6.
- Запись CNAME – перенаправляет на другое доменное имя.
- и другие – запись MX, запись NS, запись PTR, запись SOA.
- Структура DNS
🔗 Ссылки на материалы
-
Устройство веб-приложений
Современные веб-приложения состоят из двух частей: клиентской (frontend) и серверной (backend). Тем самым реализуя клиент-серверную архитектуру.
Задачами клиентской части являются:
- Реализация пользовательского интерфейса (внешний вид приложения)
Для создания веб-страниц используется специальный язык разметки – HTML
Для стилизации шрифтов, расположения содержимого и т.д. используется язык стилей – CSS
Для добавления динамики и интерактивности – язык программирования JavaScript
Как правило в чистом виде эти инструменты используются редко, поскольку для более удобной и быстрой разработки существуют так называемые фреймворки и препроцессоры. - Cоздание функционала для формирования запросов к серверу
Как правило это различного вида формы ввода, с которыми можно удобно взаимодействовать.
- Приём данных от сервера и их последующая обработка для вывода на клиент
Задачи серверной части:
- Обработка клиентских запросов
Проверка на наличие прав и доступа, разного рода валидации и т.д.
- Выполнение бизнес логики
Здесь может подразумевается широкий спектр задач: работа с базами данных, обработка информации, вычисления и т.д. Это, так сказать, самое сердце мира Backend. Здесь и происходит все самое важное и интересное.
- Формирование ответа и отправка его на клиент
- Реализация пользовательского интерфейса (внешний вид приложения)
🔗 Ссылки на материалы
- 📄 Как работают веб-приложения – habr.com
- 📺 Как устроены веб-приложения? (Frontend/Backend) – YouTube
- 📺 Архитектура современных WEB приложений. Эволюция от А до Я – YouTube
- 📄 Что такое HTML за 7 минут
- 📄 Базовый курс по фронтенду – (MDN) mozilla.org
- 📄 Frontend Developer roadmap
- 📄 Нативные, гибридные и web-приложения в сравнении – medium.com
-
Браузеры и как они работают
Браузер – клиент, с помощью которого можно отправлять запросы на сервер для получения файлов, которые впоследствии используются для отрисовки web-страниц. Если совсем упрощенно, то браузер можно воспринимать как программу для просмотра HTML-файлов, которая так же может искать и скачивать их из интернета.
- Принцип работы
Работа с запросами, отрисовка страниц, особенность работы вкладок (для каждой вкладки создается отдельный процесс, чтобы не допустить ситуации, при которой содержимое одной вкладки имеет возможность влиять на содержимое другой).
- Расширения (WebExtensions)
Позволяют менять пользовательский интерфейс браузера, модифицировать содержимое вебстраниц, изменять сетевые запросы браузера.
- Инструменты разработчика (DevTools)
Незаменимый инструмент любого веб-разработчика. Позволяет анализировать всю возможную информацию связанную с веб-страницами, мониторить их производительность, логи и, что для нас самое важное, отслеживать информацию о сетевых запросах.
- Принцип работы
🔗 Ссылки на материалы
- 📄 Как работают браузеры — MDN (mozilla.org)
- 📄 Как работают браузеры — введение в безопасность веб-приложений – habr.com
- 📄 Как браузер рисует страницы
- 📄 Важные аспекты работы браузера для разработчиков – habr.com
- 📄 Обзор всех инструментов разработчика Chrome DevTools – habr.com
- 📄 Что на самом деле происходит, когда пользователь вбивает в браузер адрес google.com – habr.com
- 📄 Принципы работы современных веб-браузеров
- 📄 Подробное объяснение того, как работает браузер (под капотом)
-
VPN и Proxy
Использование VPN и Proxy довольно распространённое явление в последние годы. С помощью этих технологий пользователи могут получить базовую анонимность при серфинге в сети, а также обходить различные региональные блокировки.
- VPN (Virtual Private Network)
Технология позволяющая стать участником приватной сети (подобной вашей локальной), где запросы всех участников проходят через единый публичный IP-адрес. Это позволяет Вам смешаться в общей массе запросов от других участников.
- Простая процедура подключения и использования.
- Надежное шифрование трафика.
- Нет гарантии 100% анонимности, поскольку владелец сети знает IP-адреса всех участников.
- VPN бесполезны для работы с мультиаккаунтами и некоторыми программами, поскольку все аккаунты, работающие с одного VPN легко обнаруживаются и блокируются.
- Бесплатные VPN, как правило, имеют большую нагруженность, что приводит к нестабильной работе и снижению скорости загрузки данных.
- Простая процедура подключения и использования.
- Proxy (прокси-сервер)
Прокси это специальный сервер в сети, который выполняет роль посредника между Вами и конечным сервером к которому Вы намереваетесь обратиться. Когда Вы подключены к прокси-серверу все Ваши запросы будут выполняться от имени этого сервера, то есть IP-адрес и местоположение будут подменены.
- Возможность использовать индивидуальный IP-адрес, что позволяет работать с мультиаккаунтами.
- Стабильность соединения из-за отсутствия высоких нагрузок.
- Подключение через прокси предусмотрено в самой ОС и браузере, поэтому доп. ПО не требуется.
- Существуют разновидности прокси, которые обеспечивают высокий уровень анонимности.
- Ненадежность бесплатных решений, поскольку прокси-сервер может видеть и контролировать всё, что вы делаете в интернете.
- Возможность использовать индивидуальный IP-адрес, что позволяет работать с мультиаккаунтами.
- VPN (Virtual Private Network)
🔗 Ссылки на материалы
-
Хостинг
Хостинг (hosting) - специальная услуга, предоставляемая хостинг-провайдерами, которая позволяет арендовать пространство на сервере (который круглосуточно подключён к сети Интернет), где могут храниться ваши данные и файлы. Существуют различные варианты хостинга, где вы можете использовать не только дисковое пространство сервера, но и так же процессорную мощность для работы ваших сетевых приложений.
- Виртуальный хостинг
Один физический сервер, который распределяет свои ресурсы на нескольких арендаторов.
- VPS/VDS
Виртуальные серверы, эмулирующие работу отдельного физического сервера и предоставляемые в аренду клиенту с максимальными привилегиями.
- Выделенный сервер
Аренда полноценного физического сервера с полным доступом ко всем ресурсам. Как правило, это самая дорогая услуга.
- Облачный хостинг
Услуга которая использует ресурсы нескольких серверов. При аренде пользователь платит только за используемые по факту ресурсы.
- Колокация
Услуга предоставляющая клиенту возможность установить свое оборудование на территории провайдера.
- Виртуальный хостинг
🔗 Ссылки на материалы
- 📺 Что такое хостинг, домен и как устроен интернет на понятном языке – YouTube
- 📄 Что такое хостинг и домен сайта простыми словами
- 📄 Хостинг: что это, зачем и как выбрать
- 📄 Хостинг: варианты, сравнения, пользовательская статистика — habr.com
- 📄 VPS-хостинг и облачный хостинг: что выбрать и в чем разница? – habr.com
- 📄 Колокейшн: как, зачем и почему – habr.com
-
Сетевая модель OSI
№ Уровень Используемые протоколы 7 Прикладной уровень HTTP, DNS, FTP, POP3 6 Уровень представления SSL, SSH, IMAP, JPEG 5 Сеансовый уровень APIs Sockets 4 Транспортный уровень TCP, UDP 3 Сетевой уровень IP, ICMP, IGMP 2 Канальный уровень Ethernet, MAC, HDLC 1 Физический уровень RS-232, RJ45, DSL OSI (The Open Systems Interconnection model) – это набор правил, который описивает то, как должны взамиодействовать друг с другом различные сетевые устройства. Модель разделяется на 7 уровней, каждый из которых отвечает за выполнение определенной функции. Все это нужно для того, чтобы процесс обмена информацией в сети происходил по единому шаблону и все устройства, будь-то умный холодильник и смартфон, могли без проблем понять друг друга.
- Физический уровень
На этом уровне происходит кодирование битов (единиц/нулей) в физические сигналы (ток, свет, радиоволны) и их дальнейшая передача проводным (Ethernet) или беспроводным (Wi-Fi) способом.
- Канальный уровень
Физические сигналы с первого уровня раскодируются обратно в единицы и нули, исправляются ошибки и дефекты, извлекаются MAC-адреса отправителя и получателя.
- Сетевой уровень
Происходит маршрутизация трафика, запросы к DNS и формирование IP-пакетов.
- Транспортный уровень
Уровень ответственный за передачу данных. Здесь существуют 2 важнейших протокола:
- TCP - обеспечивающий надежную передачу данных. TCP гарантирует доставку данных и сохранение порядка следования сообщений. Это сказывается на скорости передачи. Данный протокол используется там, где потеря информации недопустима, например при отправки почты или загрузке веб-страниц.
- UDP – простой протокол с быстрой передачей данных. Он не использует механизмов для гарантирования доставки и порядка следования данных. Используется, например в онлайн-играх, где частичная потеря пакетов не критична, но скорость передачи данных имеет гораздо более важное значение. Так же, запросы к DNS-серверам происходят через UDP протокол.
- TCP - обеспечивающий надежную передачу данных. TCP гарантирует доставку данных и сохранение порядка следования сообщений. Это сказывается на скорости передачи. Данный протокол используется там, где потеря информации недопустима, например при отправки почты или загрузке веб-страниц.
- Сеансовый уровень
Отвечает за открытие и закрытие связи (сеансов) между двумя устройствами. Гарантирует, что сеанс будет оставаться открытым достаточно долго для передачи всех необходимых данных, а затем быстро закроется, чтобы избежать траты ресурсов.
- Уровень представления
Трансляция, шифрование/расшифровка и сжатие данных. Именно здесь данные, которые приходят в виде нулей и единиц преобразуются в нужные форматы (PNG, MP3, PDF и т.д.)
- Прикладной уровень
Уровень работы с приложениями. Разрешает приложениям пользователя иметь доступ к сетевым службам, таким как обработчик запросов к базам данных, доступ к файлам, пересылке электронной почты.
- Физический уровень
🔗 Ссылки на материалы
- 📺 Модель OSI | 7 уровней за 7 минут – YouTube
- 📺 Модель OSI | Курс "Компьютерные сети" – YouTube
- 📄 Простое пособие по сетевой модели OSI для начинающих – selectel.ru
- 📄 Физика Ethernet для самых маленьких – habr.com
- 📄 Как работает Wi-fi. История беспроводных сетей – habr.com
- 📄 Wi-Fi или витая пара — что лучше? – habr.com
- 📄 Всё, что вы хотели знать о МАС адресе — habr.com
- 📺 Протокол IP: маршрутизация | Курс "Компьютерные сети" — YouTube
- 📺 Протокол TCP — YouTube
- 📺 Протокол UDP — YouTube
- 📺 Прикладной уровень | Курс "Компьютерные сети" — YouTube
-
Протокол HTTP
HTTP (HyperText Transport Protocol) - cамый важный протокол интернета. Используется для передачи данных любого формата. Сам по себе протокол работает по простому принципу: запрос –> ответ.
- Структура HTTP-сообщений
Стартовая строка > Заголовки > Тело сообщения
- Заголовки
Дополнительная служебная информация которая отправляется вместе с запросом/ответом.
Основные: Host, User-Agent, If-Modified-Since, Cookie, Referer, Authorization, Cache-Control, Content-Type, Content-Length, Last-Modified, Set-Cookie, Content-Encoding. - Методы запросов
GET - запрос на получение данных
POST - запрос с передачей данных для создания новой записи
PUT - запрос с передачей данных для изменения записи
DELETE - запрос на удаление записи
Другие: HEAD, CONNECT, OPTIONS, TRACE, PATCH. - Коды состояния
Каждый ответ от сервера имеет специальный числовой код, который характеризует состояние отправленного запроса. Эти коды делятся на 5 основных классов:
- 1хх - служебная информация
- 2хх - успешный запрос
- 3хх - перенаправление на другой адрес
- 4хх - ошибка на стороне клиента
- 5хх - ошибка на стороне сервера
- 1хх - служебная информация
- HTTPS
Тот же HTTP, но с поддержкой шифрования
- Cookie
Поскольку протокол HTTP не позволяет сохранять никакой информации о состояниях предыдущих запросов/ответов, возникает необходимость в использовании cookie. Куки позволяют серверу хранить различную информацию на стороне клиента, которую в последующем клиент может отсылать обратно на сервер. В частности куки могут использоваться для авторизации или для сохранения различных параметров/настроек.
- CORS (Cross origin resource sharing)
Технология, которая позволяет одному домену получать данные от другого.
- CSP (Content Security Policy)
Специальный заголовок позволяющий распознавать и устранять определённые типы уязвимостей веб-приложения.
- HTTP/1.0 vs HTTP/1.1 vs HTTP/2
Главным нововведением в вeрсии 1.1 является режим "постоянного соединения", который позволяет посылать несколько запросов за одно подключение. Во второй версии протокол стал бинарным, появилась возможность передачи данных нескольких потоков по одному каналу.
- Структура HTTP-сообщений
🔗 Ссылки на материалы
- 📄 Протокол HTTP – MDN (mozilla.org)
- 📺 Протокол HTTP | Курс компьютерные сети – YouTube
- 📄 Простым языком об HTTP – habr.com
- 📄 HTTP-запросы: структура, методы, строка статуса и коды состояния – selectel.ru
- 📄 Что такое протокол HTTPS, и как он защищает вас в интернете
- 📄 В чем разница протоколов HTTP и HTTPS – selectel.ru
- 📺 Как работает HTTPS? – YouTube
- 📺 Что такое cookies браузера – YouTube
- 📄 Что такое cookie в браузере и почему на многих сайтах предупреждают об их использовании?
- 📄 CORS для чайников: история возникновения, как устроен и оптимальные методы работы – habr.com
- 📄 Улучшение сетевой безопасности с помощью Content Security Policy – habr.com
- 📄 Путь к HTTP/2 – habr.com
- 📄 Evolution of HTTP – MDN (mozilla.org)
-
Cтек протоколов TCP/IP
По сравнению с моделью OSI стек TCP/IP имеет более простую архитектуру. Он получил широкое распространение и использовался сначала в качестве основы для создания глобальной сети, а после для описания работы интернета.
🔗 Ссылки на материалы
-
Проблемы сети
Качество работы сетей, и тем более интернета, далеко от идеала. Это обусловлено сложной и рассредоточенной по разным устройствам структурой сети. Поэтому на функционирование сети влияет огромное количеств факторов. Например: стабильность соединения между устройством клиента и его роутером, качество услуг провайдера, мощность и производительность сервера, физическое расстояние между клиентом и сервером и т.д.
- Latency (задержка)
Время которое требуется, чтобы пакет данных дошёл от отправителя к получателю. В большей степени зависит от физического расстояния.
- Packet loss (потеря пакетов)
Не все пакеты, путешествуя по сети, могут добраться до места назначения. Чаще всего такое происходит при использовании беспроводных сетей или из-за перегрузок сети.
- Round Trip Time (RTT)
Время, за которое пакет данных доходит до пункта назначения + время на ответ о том, что пакет был получен успешно.
- Jitter
Колебания задержки (нестабильный ping, например, то 50ms, то 120ms, то 35ms...).
- Packet reordering
Протокол IP не гарантирует, что пакеты будут доставляются в том порядке, в котором они были отправлены.
- Latency (задержка)
🔗 Ссылки на материалы
-
Диагностика сети
- Трассировка сетевого маршрута
Процедура, позволяющая отследить по каким узлам, с какими IP адресами, передаётся отправленный вами пакет прежде чем он достигнет точки назначения. Трассировка может применяться для выявления связанных с работой компьютерной сети проблем, а также для исследования/анализа сети.
- Ping-сканирование
Самый простой способ проверить сервер на работоспособность.
- Проверка на потерю пакетов
- Wireshark
Мощная программа с графическим интерфейсом для анализа всего трафика, проходящего по сети, в режиме реального времени.
- Трассировка сетевого маршрута
🔗 Ссылки на материалы
- 📄 Как находить проблемы с интернетом и кто виноват: часть 1 – habr.com
- 📄 Как находить проблемы с интернетом и кто виноват: часть 2 – habr.com
- 📄 Прочитай и сделай: проводим сканирование сети самостоятельно – habr.com
- 📺 Основы компьютерных сетей. Диагностика и устранение основных проблем – YouTube
- 📄 Трассировка сетевого маршрута — hackware.ru
- 📄 Wireshark — приручение акулы – habr.com
- 📺 Протокол HTTPS в WireShark – YouTube
Устройство ПК
-
Основные компоненты (железо)
- Материнская плата
Самый важный компонент ПК к которому подключаются все остальные элементы.
- Чипсет - набор микросхем, который отвечает за коммуникацию всех элементов материнской платы.
- Сокет - разъем для установки процессора.
- VRM (Voltage Regulator Module) - модуль который преобразовывает поступающие напряжение (как правило 12 В) в более низкое для работы процессора, встроенной графики и оперативной памяти.
- Слоты для оперативной памяти.
- Слоты расширения PCI-Express - предназначены для подключения видеокарт, внешних сетевых/звуковых карт.
- Слоты М.2 / SATA - предназначены для подключения жёстких дисков и SSD.
- Процессор (ЦП / CPU)
Важнейшее устройство, которое исполняет инструкции (код программы). Процессоры работают только с 1 и 0, поэтому все программы в конечном виде представляют из себя набор двоичного кода.
- Регистры - самая быстрая память в ПК, имеет крайне малый объем, встроена в процессор и предназначена для временного хранения обрабатываемых данных.
- Кэш (Cache) - чуть менее быстрая память, которая так же встроена в процессор и используемая для хранения копии данных из часто используемых ячеек основной памяти.
- Процессоры могут иметь разные архитектуры. В настоящее время наиболее распространена архитектура х86 (настольные ПК и ноутбуки) и ARM (мобильные девайсы, а также компьютеры фирмы Apple).
- Оперативная память (ОЗУ / RAM)
Быстрая память небольшого объема (4-16GB), предназначенная для временного хранения кода программы, а также входных, выходных и промежуточных данных, обрабатываемых процессором.
- Постоянная память
Память большого объема (256GB-1TB), предназначенная для долговременного хранения файлов и установленных программ.
- Видеокарта (GPU)
Отдельная плата, занимающаяся переводом и обработкой данных в изображения для вывода их на экран монитора. Такое устройство ещё называют дискретной видеокартой. Обычно нужны для тех, кто занимается 3D моделированием или играет в игры.
Встроенная видеокарта – это видеокарта встроенная в процессор. Подходит для повседневной работы. - Сетевая карта
Устройство, которое обеспечивает приём и передачу данных от других устройств подключённых к одной сети.
- Звуковая карта
Устройство позволяющее обрабатывать звук, выводить его на другие устройства, записывать с помощью микрофона и т.д.
- Блок питания
Устройство, предназначенное для преобразования напряжения переменного тока от сети в напряжение постоянного тока.
- Материнская плата
🔗 Ссылки на материалы
- 📺 Устройство Компьютера для чайников – YouTube
- 📺 Материнская плата. Из чего она состоит? – YouTube
- 📄 Внутри материнской платы: анализ технологий, лежащих в основе компонентов ПК – habr.com
- 📺 Как работает процессор – YouTube
- 📄 Как работает CPU: интерактивный урок – habr.com
- 📺 Как работает кэш процессора – YouTube
- 📺 Различия компьютерных архитектур – YouTube
- 📺 ПРОЦЕССОРЫ ARM vs x86: ОБЪЯСНЯЕМ – YouTube
- 📄 Чем архитектура ARM отличается от x86
- 📺 Как работает память компьютера – YouTube
- 📄 Анатомия оперативной памяти – habr.com
- 📺 Сетевая карта – YouTube
- 📄 О работе ПК на примере Windows 10 и клавиатуры – habr.com
-
Устройство операционной системы
Операционная система (ОС) – это комплексная программная система, которая предназначена для управления ресурсами компьютера. Благодаря операционным системам людям не приходится иметь дело непосредственно с процессором, оперативной памятью или другими составляющими ПК.
То есть, ОС можно представить как слой абстракции, который управляет железом (hardware) компьютера, тем самым предоставляя простую и удобную среду для работы пользовательского софта (software).
- Основные функции
- Управление оперативной памятью (выделение пространства для отдельных программ)
- Загрузка программ в оперативную память и их выполнение
- Выполнение запросов поступающих от пользовательских программ (ввод и вывод данных, запуск и остановка других программ, высвобождение памяти или выделение дополнительной...)
- Взаимодействие с устройствами ввода и вывода (мышь, клавиатура, монитор...)
- Взаимодействие с носителями информации (жесткие диски, SSD...)
- Предоставление пользовательского интерфейса (консольная оболочка или графичеcкий интерфейс)
- Ведение журнала об программных ошибках (сохранение логов)
- Управление оперативной памятью (выделение пространства для отдельных программ)
- Дополнительные функции (могут быть не во всех ОС)
- Организация многозадачности (одновременное выполнение нескольких программ)
- Разграничивание доступа к ресурсам для каждого процесса
- Взаимодействие между процессами (обмен данными, синхронизация)
- Организация защиты самой ОС от других программ и действий самого пользователя
- Предоставление многопользовательского режима и разграничение прав между разными пользователями ОС (админ, гость...)
- Организация многозадачности (одновременное выполнение нескольких программ)
- Ядро ОС
Центральная часть ОС, которая используется наиболее интенсивно. Ядро постоянно находится в памяти, в то время как другие части ОС загружаются в память и выгружаются из неё по мере надобности.
- Загрузчик ОС
Системный софт, который обеспечивает подготовку окружения для запуска ОС (приводит аппаратуру в нужное состояние, подготавливает память, загружает туда ядро ОС и передает ему (ядру) управление).
- Драйверы
Специальное ПО, которое позволяет ОС работать с тем или иным оборудованием.
- Основные функции
🔗 Ссылки на материалы
-
Процессы и потоки
- Процесс
Cвоего рода контейнер, в котором находятся все необходимые ресурсы для работы той или иной программы. Как правило в состав процесса входят:
- Исполняемый код программы
- Входные и выходные данные
- Стек вызовов (порядок инструкций для выполнения)
- Куча (структура для хранения промежуточных данных, создаваемых во время работы процесса)
- Дескриптор сегмента
- Файловые дескрипторы
- Информация о наборе допустимых полномочий
- Информация о состоянии процессора
- Исполняемый код программы
- Поток
Cущность, в которой выполняются последовательности действий (процедуры) программы. Потоки находятся внутри процесса и используют то же адресное пространство. В одном процессе может быть несколько потоков, что обеспечивает возможность выполнения нескольких задач. Эти задачи, благодаря потокам, могут обмениваться данными, использовать общие данные или результаты других задач.
- Процесс
🔗 Ссылки на материалы
-
Конкурентность и параллелизм
- Параллелизм (Parallelism)
Способность выполнять несколько задач одновременно используя несколько ядер процессора, где на каждом отдельном ядре выполняется отдельно взятая задача.
- Конкурентность (Concurrency)
Способность выполнять несколько задач, но используя одно ядро процессора. Это достигается путем разделения задач на отдельные блоки команд, которые выполняются по очереди, но переключение между этими блоками происходит настолько быстро, что для пользователей создается впечатление, будто эти процессы выполняются одновременно.
- Параллелизм (Parallelism)
🔗 Ссылки на материалы
-
Межпроцессорное взаимодействие
Механизм позволяющий организовать обмен данными между потоками одного или разных процессов. Причем, процессы могут быть запущены как на одном и том же компьютере, так и на разных, соединенных сетью. Межпроцессорные взаимодействия бывают разных типов.
- Файл
Самый простой способ организовать обмен данными. Один процесс записывает данные в определенный файл, другой процесс читает этот же файл и тем самым получает данные от первого процесса.
- Сигнал
Асинхронное уведомление одного процесса о событии произошедшем в другом процессе.
- Сокет
В частности для взаимодействия между компьютерами с помощью стека протоколов TCP/IP используются IP-адреса и порты. Эта пара определяет сокет («гнездо», соответствующее адресу и порту).
- Семафор
Счетчик над которым можно проводить только 2 операции: увеличение и уменьшение (причем для 0 операция уменьшения блокируется).
- Сообщения и очереди сообщений
- Каналы (akа конвейеры, pipes)
Перенаправление выходных данных одного процесса на вход другого процесса (подобие трубы).
- Файл
🔗 Ссылки на материалы
- 📺 Архитектура ЭВМ. Межпроцессное взаимодействие – YouTube
- 📺 Основы программирования. Межпроцессное взаимодействие – YouTube
- 📄 IPC: основы межпроцессного взаимодействия
- 📺 Интерфейс сокетов | Курс "Компьютерные сети" – YouTube
- 📺 Порты, сокеты, статика (для самых маленьких программистов) – YouTube
- 📺 Разделяемая память. Семафоры – YouTube
Основы Linux
Операционные системы на базе ядра Linux это стандарт в мире серверной разработки, поскольку большинство серверов работают именно на таких ОС. Использовать Linux на серверах выгодно, ведь он распространяется бесплатно.
Существует огромное количество дистрибутивов (сборок с набором предустановленного ПО) Linux на любой вкус и цвет. Одним из самых популярных является Ubuntu. Именно с него можно начать своё погружение в серверную разработку.
Установить Ubuntu можно на отдельный ПК или ноутбук. Если такой возможности нет, можно воспользоваться специальной программой Virtual Box, в которой можно запускать другие ОС поверх основной. Так же можно запустить Docker контейнер с образом Ubuntu (Docker - это отдельная тема, которая рассматривается в этом репозитории).
После этого можно быстро пройти вводный курс по Linux и Bash.
-
Работа с терминалом
Терминал (или консоль) - программа, в которой для управления компьютером используются специальные текстовые команды. Как правило, на серверах отсутствуют графические оболочки, поэтому вам обязательно понадобятся навыки работы с терминалом.
- Основные команды для навигации по файловой системе
ls # просмотр содержимого директории cd <путь> # переход в указанный каталог cd .. # переход на уровень выше (в родительский каталог) touch <файл> # создание файла cat > <файл> # ввод текста в файл из консоли (перезапись) cat >> <файл> # ввод текста в конец файла (добавление) cat/more/less <файл> # просмотр содержимого файла head/tail <файл> # просмотр первых/последних строк файла pwd # путь к текущей директории mkdir <имя> # создать директорию rmdir <имя> # удалить директорию cp <файл> <путь> # копировать файл или директорию mv <файл> <путь># перемещение или переименование rm <файл> # удаление файла или директории find <строка># поиск в файловой системе du <файл># вывод размера файла или каталога
- Команды для получения справочной информации
man <название_команды> # позволяет посмотреть руководство по любой команде apropos <слово> # поиск команды с описанием имеющим указанное слово man -k <слово> # аналогично команде выше whatis <название_команды> # краткое описание команды
- Права суперпользователя
Аналог запуска от имени администратора в Windows
sudo <команда> # выполняет команду с правами суперпользователя
- Текстовый редактор
Изучите любой для того чтобы свободно читать и редактировать файлы через терминал.
Самый простой – nano.
Самый продвинутый – Vim.
- Основные команды для навигации по файловой системе
🔗 Ссылки на материалы
- 📺 Linux для Начинающих (Плейлист) – YouTube
- 📄 Основные linux-команды для новичка – habr.com
- 📄 44 команды Linux которые вы должны знать – losst.ru
- 📄 Основные команды Linux: (почти) полное руководство с примерами – selectel.ru
- 📄 Шпаргалка для редактора Nano
- 📄 Основы редактора Vim (Плейлист) – YouTube
- 📄 Изучение терминала через прохождение челленджей
-
Менеджер пакетов
Менеджер пакетов – это утилита позволяющая устанавливать/обновлять программные пакеты с помощью терминала.
Linux дистрибутивы можно разделить на несколько групп, в зависимости от того, какой в них используется менеджер пакетов: apt (в дистрибутивах на основе Debian), RPM (система управления пакетами Red Hat) и Pacman (менеджер пакетов в Arch-подобных дистрибутивах)
Ubuntu основан на Debian, поэтому там используется менеджер пакетов apt (advanced packaging tool).
- Базовые команды
apt install <имя_пакета> # установить пакет apt remove <имя_пакета> # удалить пакет, но оставить конфигурацию apt purge <имя_пакета> # удалить пакет вместе с конфигурацией apt update # обновление информации о новых версиях пакетов apt upgrade # обновление пакетов, установленных в системе apt list --installed # список установленных в системе пакетов apt list --upgradable # список пакетов, которые требуют обновления apt search <имя> # поиск пакетов по имени в сети apt show <имя_пакета> # информация о пакете
- Базовые команды
🔗 Ссылки на материалы
-
Скрипты Bash
С помощью скриптов (сценариев) можно автоматизировать последовательный ввод любого количества команд. В Bash можно создавать различные условия (разветвления), циклы, таймеры и т.д. для выполнения всевозможных действий связанных с вводом в консоль.
- Основы Bash скриптов
Самые базовые и часто используемые возможности такие как: переменные, ввод/вывод, циклы, условия и т.д.
- Практика
Решайте задания на таких сайтах как HackerRank и Codewars.
Начните использовать Bash для автоматизации рутинных действий на своем компьютере. Если вы уже занимаетесь программированием, создавайте скрипты для удобной сборки вашего проекта, для установки настроек и так далее. - ShellCheck инструмент для анализа скриптов
Укажет Вам на возможные ошибки и научит лучшим практикам написания действительно качественных скриптов.
- Дополнительные ресурсы
В таких репозиториях, как awesome bash и awesome shell собраны целые коллекции полезных ресурсов и инструментов, которые помогут развить ещё больше навыков работы с Bash и терминалом в общем.
- Основы Bash скриптов
🔗 Ссылки на материалы
- 📺 Основы работы с Bash – YouTube
- 📄 Интерактивный онлайн-тренажёр по основам Bash
- 📄 Bash-скрипты: начало – habr.com
- 📄 Шпаргалка по Bash – Learn X in Y minutes
- 📄 Шпаргалка оп Bash – quickref.me
- 📄 Страница Bash на Reddit – reddit.com
- 📄 Лучшие практики Bash скриптов – habr.com
- 📄 Как работает bash: разбираемся в деталях – VK Cloud
-
Пользователи
ОС на базе Linux являются многопользовательскими. Это означает, что несколько людей могут запускать множество различных приложений одновременно на одном и том же компьютере. Чтобы система Linux смогла «узнать» пользователя, он должен войти в систему, соответственно каждый пользователь должен иметь уникальное имя и секретный пароль.
- Работа с пользователями
useradd <имя> [ключи] # создать нового пользователя passwd <имя> # установить пароль пользователю usermod <имя> [ключи] # редактировать пользователя usermod -L <имя> # заблокировать пользователя usermod -U <имя> # разблокировать пользователя userdel <имя> [ключи] # удалить пользователя
- Работа с группами
groupadd <группа> [ключи] # создать группу groupmod <группа> [опции] # редактировать группу groupdel <группа> [опции] # удалить группу usermod -a -G <группы(через запятую)> <пользователь> # добавить пользователя в группы gpasswd --delete <пользователь> <группы(через запятую)> # удалить пользователя из групп
- Системные файлы
/etc/passwd # файл паролей, содержащий основную информацию о пользователях /etc/shadow # файл теневых шифрованных паролей, содержащий зашифрованные пароли /etc/group # файл групп, содержащий основную информацию о группах /etc/gshadow # файл теневых групп, содержащий шифрованные пароли групп
- Работа с пользователями
🔗 Ссылки на материалы
-
Права доступа
В Linux можно разделять привилегии между пользователями, ограничить доступ к нежелательным файлам или возможностям, контролировать доступные действия для сервисов и многое другое. В Linux существует всего три вида прав - право на чтение, запись и выполнение, а также три категории пользователей, к которым они могут применяться - владелец файла, группа файла и все остальные.
- Основные команды для работы с правами
chown <пользователь> <файл> # изменяет владельца и/или группу для указанных файлов chmod <права> <файл> # изменяет права доступа к файлам и каталогам chgrp <группа> <файл> # позволяет пользователям изменять группы
- Расширенные права SUID, GUID и sticky bit
- ACL (Access control list)
Продвинутая подсистема для управления правами доступа.
- Основные команды для работы с правами
🔗 Ссылки на материалы
-
Работа с процессами
Процессы в Linux можно описать как контейнеры, в которых хранится вся информация о состоянии выполняемой программы. Если программа зависла и нужно восстановить её работу, тогда Вам понадобиться навыки работы по управлению процессами.
- Базовые команды
ps # вывести 'снимок' процессов всех пользователей top # диспетчер задач в реальном времени <команда> & # запуск процесса в фоновом режиме, то есть не занимая консоль jobs # список запущенных в фоновом режиме процессов fg <номер> # вернуть процесс обратно в активный режим по его номеру bg <номер> # запуск остановленного процесса в фоновый режим kill <id процесса> # завершить процесс по id killall <программа> # завершить все процессы связанные с одной программой
- Базовые команды
🔗 Ссылки на материалы
-
Работа с SSH
Служба SSH позволяет получить удаленный доступ к терминалу другого компьютера. В случае с персональным компьютером, это может понадобиться для срочного решения какой-либо проблемы, а в случае работы с сервером это вообще является основным методом подключения.
- Базовые команды
apt install openssh-server # установка SSH (хотя он почти везде идёт из коробки) service ssh start # запуск SSH service ssh stop # остановка SSH ssh -p <Порт> user@remotehost # подключение к удаленному ПК через SSH ssh-keygen -t rsa # генерация RSA-ключа для беспарольного входа ssh-copy-id -i ~/.ssh/id_rsa user@remotehost # копирование ключа на удаленную машину
- Базовые команды
🔗 Ссылки на материалы
-
Сетевые утилиты
Для Linux существует множество, как встроенных, так и сторонних утилит, которые помогут настроить сеть, проанализировать её или устранить возможные проблемы.
- Базовые утилиты
ip address # показать информацию об IPv4 и IPv6 адресах ваших устройств ip monitor # мониторинг состояния устройств в режиме реального времени ifconfig # параметры сетевого адаптера и IP-протокола traceroute <host> # показать маршрут, пройденный пакетами для достижения хоста tracepath <host> # отслеживает значения MTU до указанного хоста ping <host> # проверка соединения с хостом ss -at # показать список всех прослушиваемых TCP-соединений dig <host> # показать информацию о сервере имен DNS host <host | ip-address> # показать IP-адрес указанного домена mtr <host | ip-address> # комбинация утилит ping и traceroute nslookup # интерактивный запрос к серверам DNS whois <host> # показать информацию о регистрации домена ifplugstatus # определение состояния локальных устройств iftop # информация о пропускной способности ethtool <device name> # показать подробную информацию о устройстве nmap # инструмент для изучения и аудита безопасности сети bmon # монитор пропускной способности и скорости сети firewalld # добавление, настройка и удаление правил брандмауэра ipref # измерение и настройка производительности сети speedtest-cli # информация о скорости сети wget <link> # скачать файл из Интернета
tcpdump
Консольная утилита, позволяющая перехватывать и анализировать весь сетевой трафик, проходящий через ваш компьютер.
netcat
Утилита позволяющая устанавливать соединения по TCP и UDP, принимать оттуда данные и передавать их. Может выполнять сканирование портов, передачу файлов и прослушивание портов: как и любой сервер, она может быть использована как Бэкдор.
iptables
Пользовательская утилита, позволяющая настраивать правила фильтрации IP-пакетов брандмауэра ядра Linux. Фильтры организованы в виде таблиц, которые содержат цепочки правил обработки пакетов сетевого трафика.
nftables
Является современной заменой для
iptables
, а также объединяет в себе ряд других пакетов.curl
Инструмент командной строки для передачи данных с использованием различных сетевых протоколов.
- Базовые утилиты
🔗 Ссылки на материалы
- 📺 Linux для Начинающих - Сетевые комманды – YouTube
- 📄 Шпаргалка по сетевым инструментам Linux – habr.com
- 📄 7 важных сетевых Linux-команд – habr.com
- 📄 Используем tcpdump для анализа и перехвата сетевого трафика – habr.com
- 📄 Что такое Netcat? Bind Shell и Reverse Shell в действии – habr.com
- 📄 Переход с iptables на nftables. Краткий справочник – habr.com
- 📄 Что такое curl? Как работает эта команда? – habr.com
- 📄 Шпаргалка по метрикам производительности cURL – habr.com
-
Планировщик задач
Благодаря планировщикам можно гибко управлять отложенным запуском команд и скриптов. В Linux есть встроенный планировщик cron, с помощью которого можно легко выполнять необходимые действия через определенные интервалы времени.
- Основные команды
crontab -e # редактирование файла crontab текущего пользователя crontab -l # вывод содержимого текущего файла расписания crontab -r # удаление текущего файла расписания
- Конфигурационные файлы
/etc/crontab # основной конфиг /etc/cron.d/ # файлы crontab, используемые для управления всей системой # автоматически запускаемые программы: /etc/cron.daily/ # ежедневно /etc/cron.weekly/ # еженедельно /etc/cron.monthly/ # ежемесячно
- Основные команды
🔗 Ссылки на материалы
-
Системные логи
Файлы журнала (логи) - cпециальные текстовые файлы, в которые заносится вся информация о работе компьютера, программы или пользователя. Они особенно полезны при возникновении багов и ошибок в работе программы или сервера. Рекомендуется периодически просматривать логи, даже если ничего подозрительного не происходит.
- Основные лог файлы
/var/log/syslog или /var/log/messages # информация о ядре, различных службах, обнаруженных # устройствах, сетевых интерфейсах и т.д. /var/log/auth.log или /var/log/secure # информация об авторизации пользователей /var/log/faillog # неудачные попытки входа в систему /var/log/dmesg # информация о драйверах устройств /var/log/boot.log # информация о загрузке операционной системы /var/log/cron # отчёт о работе планировщика задач cron
- Утилита lnav
Предназначена для удобного просмотра лог файлов (подсветка, чтение разных форматов, поиск и т.д.)
- Ротация логов с помощью logrotate
Позволяет настроить автоматическое удаление (чистку) лог-файлов, чтобы не забивать память.
- Демон journald
Cобирает данные из всех доступных источников и сохраняет их в двоичном формате для удобного и динамичного управления
- Основные лог файлы
🔗 Ссылки на материалы
- 📄 Что такое логирование
- 📄 Как посмотреть логи в Linux – losst.ru
- 📄 Лог файлы Linux по порядку – habr.com
- 📄 Что такое «управление конфигурацией»
- 📄 Туториал по системным логам Linux
- 📄 Логи Linux. Всё о логах и журналировании
- 📄 Документация по lnav на русском
- 📄 Ротация логов в Linux с помощью logrotate
- 📄 Использование journalctl для просмотра и анализа логов: подробный гайд – habr.com
-
Проблемы в Linux
- Проблемы с командами в терминале
Возникают из-за ошибочных действий пользователя. Часто связано с опечатками, отсутствием прав, неправильно указанными опциями и т.д.
- Проблемы с драйверами
Все свободные драйвера Linux встроены прямо в его ядро. Поэтому после установки системы все должно работать "прямо из коробки" (проблемы могут быть с совсем новым оборудованием, которое только вышло в продажу). Драйвера, исходный код, которых закрыт, считаются проприетарными и не включаются в ядро, а доустанавливаются вручную (например как у Nvidia).
- Проблемы с ядром
Kernel panic может возникать из-за ошибки при монтировании корневой файловой системы.
Тут лучше всего поможет навык чтения логов для выявления проблем (командаdmesg
). - Ошибка сегментации (segmentation fault)
Возникает когда процесс обращается к недействительным участкам памяти.
- Проблемы с диском и файловой системой
Могут возникать из-за отсутствия свободного места.
- Проблемы с командами в терминале
🔗 Ссылки на материалы
Общие знания
-
Системы счисления
Система счисления (СС) представляет собой совокупность символов и правил для обозначения чисел. В информатике принято выделять четыре основных системы счисления: двоичная, восьмеричная, десятичная, шестнадцатеричная. Связано это, в первую очередь, с их использованием в различных отраслях программирования.
- Двоичная СС
Самая важная СС для вычислительной техники. Её использование обосновано тем, что логика работы процессора построена на основе всего двух состояний (включено/выключено, открыто/закрыто, высокий/низкий, истина/ложь, да/нет, больше/меньше).
- Восьмеричная СС
Используется, например, в Linux-системах для выдачи прав доступа.
- Десятичная СС
СС которая удобная для восприятия большинству людей.
- Шестнадцатеричная СС
Для записи используются дополнительно буквы: A, B, C, D, E, F. Широко используется в низкоуровневом программировании и компьютерной документации из-за, того что минимальной адресуемой единицей памяти является 8-битный байт, значения которого удобно записывать двумя шестнадцатеричными цифрами.
- Перевод из одной СС в другую
Для лучшего понимания можно попробовать онлайн конвертер
- Двоичная СС
🔗 Ссылки на материалы
-
Логические операции
Логические операции широко используются в программировании для проверки различных условий. Результатом логического выражения всегда является истина или ложь.
🔗 Ссылки на материалы
-
Структуры данных
Структуры данных (СД) – это контейнеры в которых данные хранятся по определенным правилам. В зависимости от этих правил структура данных будет эффективна в одних задачах и неэффективна в других. Поэтому необходимо понимать, когда и где использовать ту или иную структуру.
- Массив
СД, которая позволяет хранить данные одинакового типа, где каждому элементу присваивается свой порядковый номер.
- Связный список
СД где все элементы, помимо данных, содержат ссылки на последующий и/или предыдущий элемент. Существуют 3 разновидности:
- Односвязный список – СД, где каждый элемент хранит ссылку только на следующий (одно направление).
- Двусвязный список – СД, где элементы содержат ссылки, как на следующий элемент, так и на предыдущий (два направления).
- Кольцевой список – разновидность двусвязного списка, где последний элемент кольцевого списка содержит указатель на первый, а первый — на последний.
- Стек
СД где хранение данных работает по принципу "последним пришел – первым вышел".
- Очередь
СД где хранение данных происходит по принципу "первым пришел – первым вышел".
- Хеш-таблица
По другому ассоциативный массив. Здесь для обращения к каждому из элементов используется соответствующее ключевое значение, которое вычисляется с помощью хеш-функции по определенному алгоритму.
- Дерево
СД с иерархической моделью, в виде набора связанных между собой элементов, как правило, никак не упорядоченных.
- Куча
Аналогична дереву, но в куче, элементы с наибольшим ключом, является корневым узлом (max-куча). Но может быть и наоборот, тогда это min-кучи.
- Граф
Структура, которая предназначена для работы с большим количеством связей.
- Массив
🔗 Ссылки на материалы
- 📄 8 структур данных, которые должен знать каждый программист
- 📄 Структуры данных для самых маленьких – habr.com
- 📄 Обзор наиболее часто используемых структур данных – habr.com
- 📺 Вся правда о массивах – YouTube
- 📺 Как работает стек – YouTube
- 📺 Хэш-таблицы за 10 минут – YouTube
- 📺 Как работают хэш-таблицы – YouTube
-
Базовые алгоритмы
Алгоритмы подразумевают под собой наборы последовательных инструкций (шагов), которые приводят к решению поставленной задачи. За всю человеческую историю было придумано огромное количество алгоритмов, которые позволяют решать определенные задачи максимально эффективным способом. Соответственно правильный выбор алгоритмов в программировании позволит создавать максимально быстрые и ресурсоемкие решения.
Существует очень хорошая книжка по алгоритмам – Грокаем алгоритмы. С ней можно параллельно начать изучение языка программирования.
- Двоичный поиск
Максимально эффективный алгоритм поиска для отсортированных списков.
- Сортировка выбором
На каждом шаге алгоритма происходит поиск минимального элемента и затем он меняется местами с текущим элементом итерации.
- Рекурсия
Когда функция может вызывать сама себя и так до бесконечности. С одной стороны решения на основе рекурсии выглядят очень элегантно, а с другой стороны такой подход очень быстро приводит к переполнению стека и его рекомендуют избегать.
- Сортировка пузырьком
На каждой итерации последовательно сравниваются соседние элементы, и, если порядок в паре неверный, то элементы меняют местами.
- Быстрая сортировка
Усовершенствованный метод пузырьковой сортировки.
- Поиск в ширину
Позволяет находить все кратчайшие пути от заданной вершины графа.
- Алгоритм Дейкстры
Находит кратчайшие пути между всеми вершинами графа и их длину.
- Жадный алгоритм
Алгоритм, который на каждом шагу делает локально наилучший выбор в надежде, что итоговое решение будет оптимальным.
- Двоичный поиск
🔗 Ссылки на материалы
- 📺 Алгоритмы и структуры данных. Подготовительный курс (плейлист) – YouTube
- 📺 Алгоритмы и структуры данных на JavaScript – YouTube
- 📺 Как работают сортировки – YouTube
- 📄 Сортировки выбором – habr.com
- 📺 Сортировка выбором – YouTube
- 📄 Рекурсия. Занимательные задачки – habr.com
- 📄 Пузырьковая сортировка и все-все-все – habr.com
- 📄 Алгоритм Дейкстры – habr.com
- 📄 Жадные алгоритмы – habr.com
- 📄 Визуализация алгоритмов сортировки
- 📄 Сайт с алгоритмами и структурами данных
- 📄 Крупнейшая библиотека алгоритмов на разных языках
- 📄 Большая коллекция алгоритмов – GitHub
- 📘 Алгоритмы. Руководство по разработке – Скиена Стивен С., 2011
- 📘 Спортивное программирование – Халим С., 2020
-
Оценка сложности алгоритмов
В мире программирования существует специальная единица измерения Big О (Большое О или О-нотация). Она описывает то, как сложность алгоритма растёт с увеличением количества входных данных. Big O оценивает то, сколько действий (шагов/итераций) необходимо совершить для выполнения алгоритма, при этом всегда показывая худший вариант развития событий.
- Разновидности сложности алгоритмов
- Константная - O(1)
- Линейная - O(n)
- Логарифмическая - O(log n)
- Линеарифметическая - O(n * log n)
- Квадратичная - O(n^2)
- Степенная - О(2^n)
- Факториальная - O(!n)
- Константная - O(1)
- Разновидности сложности алгоритмов
🔗 Ссылки на материалы
-
Форматы хранения данных
Для хранения и передачи данных по сети могут использоваться файлы разных форматов. Текстовые файлы удобны для чтения человеку, поэтому они используются, например, для файлов конфигурации. Но передавать данные в текстовых форматах по сети не всегда рационально, поскольку они весят больше, чем соответствующие им бинарные файлы.
-
Текстовые форматы
- JSON (JavaScript Object Notation)
Представляет из себя объект, в котом данные хранятся в виде пар ключ-значение.
- YAML (Yet Another Markup Language)
Формат близкий к языкам разметки по типу HTML. Минималистичный, поскольку не имеет открывающих и закрывающих тегов. Удобный для редактирования.
- XML (eXtensible Markup Language)
Формат более близкий к HTML. Здесь данные оборачиваются в открывающие и закрывающие теги.
- JSON (JavaScript Object Notation)
-
Бинарные форматы
- Message Pack
Бинарный аналог JSON. Позволяет упаковывать данные на 15-20% эффективнее.
- BSON (Binary JavaScript Object Notation)
Является надмножеством JSON, включая дополнительно регулярные выражения, двоичные данные и даты.
- ProtoBuf (Protocol Buffers)
Бинарная альтернатива текстовому формату XML. Проще, компактнее и быстрее.
- Message Pack
-
🔗 Ссылки на материалы
- 📄 Форматы сериализации данных – habr.com
- 📄 Введение в JSON – medium.org
- 📄 Работа с JSON – (MDN) mozilla.org
- 📄 Шпаргалка по JSON – Learn X in Y Minutes
- 📄 Шпаргалка по YAML – Learn X in Y Minutes
- 📄 Шпаргалка по XML – Learn X in Y Minutes
- 📄 Краткое руководство по XML
- 📄 YAML за 5 минут: синтаксис и основные возможности – tproger.ru
- 📄 Universal Binary JSON — ещё один бинарный JSON – habr.com
-
Кодировки текста
Компьютеры работают только с числами, а если точнее только с 0 и 1. Как преобразовывать числа из разных систем счисления в двоичную, уже понятно. Но с текстом производить такие преобразования не получится. Именно поэтому были придуманы специальные таблицы, называемые кодировками, в которых текстовым символам присваиваются числовые эквиваленты.
- ASCII (American standard code for information interchange)
Самая простая кодировка, созданная специально для американского алфавита. Состоит из 128 символов.
- Unicode
Это международная таблица символов, которая помимо английского алфавита, содержит алфавиты почти всех стран. Способна вместить в себя более миллиона различных символов (на данный момент таблица заполнена не полностью).
- UTF-8
Unicode-кодировка переменной длинны, с помощью которой можно представить любой символ unicode.
- UTF-16
Главное ее отличие от UTF-8 состоит в том что структурной единицей в ней является не один а два байта. То есть в кодировке UTF-16 любой символ юникода может быть закодирован либо двумя, либо четырьмя байтами.
- ASCII (American standard code for information interchange)
🔗 Ссылки на материалы
Язык программирования
На этом этапе Вам предстоит выбрать для изучения один из языков программирования. В открытом доступе полно информации по различным языкам, (книги, курсы, тематические сайты и т.д.) поэтому у Вас не должно возникнуть проблем.
Ниже приведен список конкретных языков, которые лично по моему мнению хорошо подходят для backend-разработки (⚠️ может не совпадать с мнением других людей, в том числе более компетентных в этом вопросе).
- Python
Очень популярный язык с широким спектром применений. Лёгкий в изучении, благодаря простому синтаксису.
- JavaScript
Не менее популярный и практический единственный язык для полноценной Web-разработки. Благодаря платформе Node.js последнее несколько лет набирает популярность и в области backend-разработки.
- Go
Язык созданный внутри компании Google. Создавался специально для высоконагруженной серверной разработки. Минималистичный синтаксис, высокая производительность и богатая стандартная библиотека.
- Kotlin
Этакая современная версия Java. Более простой и лаконичный синтаксис, лучшая типобезопасность, наличие встроенных инструментов для многопоточности. Один из лучших выборов для разработки под Android.
Найти хорошую книгу или онлайн-учебник на русском можно в этом репозитории. Там собрана большая коллекция под разные ЯП и фреймворки.
Поищите специальный awesome-репозиторий – ресурс в котором собрано огромное количество полезных ссылок на материалы под Ваш ЯП (библиотеки, шпаргалки, блоги и другие различные ресурсы).
В будущем планируется создание шпаргалки по одному из вышеупомянутых языков.
-
Классификация языков программирования
Языков программирования много. Все они созданы не просто так. Некоторые языки могут быть совсем специфическими и использоваться только для определенных целей. Также, разные языки могут использовать разные подходы к написанию программ. А могут вообще по разному исполняться на компьютере. В общем существует множество различных классификаций, в которых было бы полезно разобраться.
- В зависимости от уровня языка
- Языки низкого уровня
Максимально близкие к машинному коду, сложные в написании, но максимально производительные. Как правило предоставляют доступ ко всем ресурсам компьютера.
- Языки высокого уровня
Имеют достаточно большой уровень абстракции, за счет чего достигается простота и удобство написания. Как правило безопаснее, поскольку не предоставляют доступ ко всем ресурсам компьютера.
- Языки низкого уровня
- Компилируемые, интерпретируемые и встраиваемые языки
- Компиляция
Позволяет преобразовать исходный код программы в исполняемый файл.
- Интерпретация
Исходный код программы транслируется и сразу выполняется (интерпретируется) с помощью специальной программы-интерпретатора.
- Компиляция
- В зависимости от парадигмы программирования
- В зависимости от уровня языка
🔗 Ссылки на материалы
-
Основы языка
Под основами подразумеваются некоторые фундаментальные идеи, присутствующие в каждом ЯП.
- Переменные и константы
- Типы данных
Строки, целые числа, дробные числа, boolean и т.д.
- Операторы
Математические операторы, операторы сравнения, побитовые операторы.
- Функции
Работа с аргументами и возвращаемыми данными.
Понимание области видимости переменных. - Управление потоком
Циклы for, условия if else, switch-case.
- Структуры данных
Массивы, объекты, словари, списки и т.д.
- Стандартная библиотека
Здесь имеется ввиду встроенные возможности языка для манипуляции со строками, числами, массивами и т.д.
- Регулярные выражения
Мощный инструмент для работы со строками. Обязательно ознакомьтесь с этим в своем ЯП, хотя бы на базовом уровне.
- Пакетный менеджер
Рано или поздно, возникнет желание воспользоваться сторонними библиотеками.
После освоения минимальной базы для написания простейших программ нет особого смысла продолжать изучение без наличия конкретных целей (без практики все забудется). Вам необходимо придумать/найти что-то, что вы хотели бы создать самостоятельно (игра, чат-бот, сайт, мобильное/десктопное приложение, что угодно). Для вдохновения посмотрите эти репозитории: Build your own x и Project based learning.
На этом моменте начинается самая продуктивная часть обучения: Вы просто ищите всевозможную информацию для реализации вашего проекта. Вашими лучшими друзьями становиться Google, YouTube и Stack Overflow.
🔗 Ссылки на материалы
- 📄 Metanit – русскоязычный учебный ресурс по основам разных ЯП
- 📄 Руководство по языку Python на русском – pydocs.ru
- 📄 Шпаргалка по основам Python – Learn X in Y minutes
- 📄 Шпаргалка по основам Python – quickref.me
- 📄 Современный учебник JavaScript на русском – learn.javascript.ru
- 📄 Шпаргалка по основам JavaScript – Learn X in Y minutes
- 📄 Шпаргалка по основам JavaScript – quickref.me
- 📄 Руководство по Go на русском – golangify.com
- 📄 Шпаргалка по основам Go – Learn X in Y minutes
- 📄 Шпаргалка по основам Go – quickref.me
- 📄 Изучение Go на примерах
- 📄 Руководство по языку Kotlin на русском – kotlinlang.ru
- 📄 Шпаргалка по основам Kotlin – Learn X in Y minutes
- 📄 Шпаргалка по основам Kotlin – devhints.io
- 📄 Интерактивный курс по регулярным выражениям
-
Объектно ориентированное программирование
ООП – это один из наиболее удачных и удобных подходов для моделирования предметов реального мира. Этот подход сочетает в себе несколько очень важных принципов, которые позволяют писать модульный, расширяемый и слабо-связанный код.
- Понятие класса
Класс можно понимать как кастомный тип данных (своего рода шаблон), в котором Вы описываете структуру будущих объектов, которые будут реализовывать данный класс. Классы могут содержать
свойства
(это конкретные поля, в которых могут храниться данные определенного типа данных) иметоды
(это функции, которые имеют доступ к свойствам и возможность ими манипулировать, изменять). - Понятие объекта
Объект – это конкретная реализация класса. Если в классе, например, описано свойство name с типом string, то объект будет иметь конкретное значение для этого поля, например "Alex".
- Принцип наследования
Возможность создавать новые классы, которые наследуют свойства и методы своих родителей. Это позволяет повторно использовать код и создавать иерархию классов.
- Принцип инкапсуляции
Возможность скрывать определенные свойства/методы от доступа из вне, оставляя только упрощенный интерфейс для взаимодействия с объектом.
- Принцип полиморфизма
Возможность реализовывать один и тот же метод по разному в классах наследниках.
- Композиция вместо наследования
Часто принцип
наследования
может усложнить и запутать Вашу программу, если хорошенько не поразмыслить над тем, как выстраивать будущую иерархию. Поэтому существует альтернативный (более гибкий) подход, который называют композицией. В частности, в языке Go отсутствуют классы и многие ООП принципы, но широко используется композиция.
- Понятие класса
🔗 Ссылки на материалы
-
Разработка серверов
- Создание и запуск локального HTTP-сервера
- Раздача статических файлов
Поднятие HTML-страничек; хостинг картинок, PDF-файлов и т.д.
- Маршрутизация
Создание эндпоинтов (URL-адресов) при обращении к которым на сервере будет вызывается соответствующий обработчик.
- Обработка запросов
Как правило в HTTP-обработчиках имеется специальный объект в который приходит вся информация о запросе пользователя (заголовки, метод, тело-запроса, полный url с параметрами и т.д.)
- Обработка ответов
Отправка соответствующего сообщения на поступивший запрос (HTTP-статус и код, тело-ответа, заголовки и т.д.)
- Обработка ошибок
Всегда нужно предусматривать варианты когда пользователь может отправить некорректные данные, база данных не выполнила операцию или просто в приложении произошла непредвиденная ошибка, чтобы сервер не падал, а отвечал ответом с информацией об ошибке.
- Отправка запросов
Часто внутри одного приложения вам придется обращаться по сети к другому. Поэтому важно уметь отправлять HTTP-запросы используя встроенные возможности ЯП.
- Шаблонизатор
Представляет собой специальный модуль, использующий более удобный синтаксис для формирования HTML на основе динамических данных.
🔗 Ссылки на материалы
- 📄 Руководство по веб-фреймворку Django (Python) – metanit.com
- 📺 Node JS фундаментальный курс от А до Я – YouTube
- 📄 Руководство по Node.js (JavaScript) – metanit.com
- 📄 Документация Node.js на русском
- 📄 Руководство по веб-фреймворку Express (JavaScript)
- 📄 Создание веб-приложения на Go – golangify.com
- 📄 Разработка веб-серверов на Golang — от простого к сложному – habr.com
- 📄 Разработка серверных приложений на Kotlin – kotlinlang.ru
-
Многопоточность
Сегодня компьютеры имеют процессоры с несколькими физическими и виртуальными ядрами, а если взять в расчет серверные машины, то там их количество может доходить до сотен. Все эти имеющиеся ресурсы хорошо бы задействовать по полной, для максимальной производительности приложения. Поэтому современная серверная разработка не обходится без реализации многопоточности и распараллеливания.
- Race conditions и data races
Основные проблемы которые возникают при использовании многопоточности.
- Создание процессов
- Создание потоков
- Сопрограммы (сorutines)
Легковесные потоки исполнения кода, которые организуются поверх аппаратных (системных) потоков. Могут существовать как отдельные библиотеки или быть уже встроенными в ЯП.
- Атомарные операции
Операции которые выполняются полностью, либо не выполняются вообще.
- Блокировки
Использование семафоров и мьютексов для синхронизации данных.
- Race conditions и data races
🔗 Ссылки на материалы
-
Продвинутые темы
- Сборщик мусора (garbage collector)
Процесс благодаря которому сильно популяризировались языки высокого уровня – позволяет программисту не заботится о выделении и очистке памяти. Обязательно ознакомьтесь с тонкостями его работы в своем ЯП.
- Отладчик кода (debuger)
Удобный инструмент для анализа работы кода программы и выявления ошибок.
- Сборщик мусора (garbage collector)
🔗 Ссылки на материалы
- 📺 Python Memory Management на пальцах – YouTube
- 📺 Управление памятью в python – YouTube
- 📺 Утечки памяти в Node.js и JavaScript, сборка мусора и профилирование – YouTube
- 📺 Примеры утечек памяти в JavaScript – YouTube
- 📺 Как устроена сборка мусора в Go – YouTube
- 📺 Потребление оперативной памяти в языке Go: проблемы и пути решения – YouTube
-
Качество кода
За эти долгие годы, что существует программирование было написано огромное количество кода, программ и целых систем. Ну и как следствие, при разработке всего этого возникали разного рода проблемы. В первую очередь они были связаны с масштабированием, поддержкой, а также порогом входа для новых разработчиков. Умные люди, естественно, не сидели на месте и начали решать эти проблемы, тем самым создавая так называемые паттерны/принципы/подходы для написания качественного кода.
Изучив лучшие практики программирования, вы не только сделаете лучше для себя, но и для других, поскольку с вашим кодом будут работать другие разработчики.
- DRY (Don't Repeat Yourself)
- KISS (Keep It Simple, Stupid)
- YAGNI (You Aren't Gonna Need It)
- SOLID принципы
- GRASP (General Responsibility Assignment Software Patterns)
Для многих языков существуют специальные руководства по стилю и соглашения по написанию кода. В них обычно сравнивается правильный и неправильный способ написания кода и объясняется, почему это так.
🔗 Ссылки на материалы
- 📄 Практика хорошего кода – habr.com
- 📄 Принципы для разработки: KISS, DRY, YAGNI... – habr.com
- 📺 SOLID принципы простым языком (много примеров) – YouTube
- 📄 Простое объяснение принципов SOLID – habr.com
- 📄 Принципы SOLID, о которых должен знать каждый разработчик – medium.com
- 📄 GRASP паттерны проектирования – habr.com
Базы данных
База данных (БД) – набор данных, которые организованы по определённым правилам. Например, библиотека является базой данных для книг.
Система управления базой данных (СУБД) – программное обеспечение, которое позволяет создать БД и удобно ей манипулировать (выполнять различные операции над данными). Примером СУБД может являться библиотекарь. Он может легко и эффективно работать с книгами в библиотеке: выдавать запрашиваемые книги, принимать их обратно, добавлять новые и т.д.
-
Классификация баз данных
БД могут существенно отличаться друг от друга и соответственно иметь разные области применения. Для понимания какая БД подойдёт для той или иной задачи, необходимо разобраться с классификацией.
- Реляционные БД (relation – отношение, связь)
Представляют из себя хранилища, где данные организованны в виде набора таблиц (со строками и столбцами). Взаимодействия между данными организуются на основе связей между этими таблицами. БД такого типа обеспечивает быстрый и эффективный доступ к структурированной информации.
- Объектно-ориентированные БД
Здесь данные представляются в виде объектов с набором атрибутов и методов. Подходят для тех случаев, когда требуется высокопроизводительная обработка данных, имеющих сложную структуру.
- Распределенные
Состоят из нескольких частей, расположенных на разных компьютерах (серверах). Такие БД могут полностью исключать дублирование информации, либо полностью её дублировать в каждой распределенной копии (например, как блокчейн)
- Не реляционные (NoSQL)
Хранят и обрабатывают неструктурированные или слабоструктурированные данные. Этот тип БД подразделяется на подтипы:
- Модель ключ-значение
- Семейство столбцов (строки и столбцы используются как ключи)
- Документо-ориентированные (хранят данные в виде иерархии документов)
- Графовые (применяются для данных с большим количеством связей)
- Модель ключ-значение
- Реляционные БД (relation – отношение, связь)
🔗 Ссылки на материалы
-
Реляционная база данных
Наиболее популярные реляционные БД: MySQL, PostgreSQL, MariaDB, Oracle. Для работы с ними используется специальный язык – SQL (Structured Query Language). Он довольно простой и интуитивно понятный.
- Основы SQL
Изучите основной цикл операций по созданию/получению/обновлению/удалению данных. Всё остальное по мере надобности.
- Объединение таблиц
- Запрос данных из нескольких таблиц
Оператор
JOIN
; Комбинации с другими операторами; типыJOIN
: (внешние/внутренние, левое/правое, перекрёстные, полные) - Связи между таблицами
Ссылки из одной таблицы на другую; внешние ключи (FOREIGN KEY)
- Запрос данных из нескольких таблиц
- Подзапросы
Запрос внутри другого запроса SQL
- Индексы
Структура данных, позволяющая быстро определить положение интересующих данных в базе.
- Транзакции
Последовательности команд, которые должны быть выполнены полностью, либо не выполнены вообще.
- Команда
START TRANSACTION
- Команды
COMMIT
иROLLBACK
- Команда
- Работа с языком программирования
Для этого необходимо установить специальный драйвер под ваш ЯП. Для более удобной работы существуют ORM-библиотеки, которые позволяют выполнять SQL-запросы, как если бы вы просто вызывали методы у объекта.
- Оптимизация и производительность
- Основы SQL
🔗 Ссылки на материалы
- 📺 Базы данных SQL уроки для начинающих – YouTube
- 📺 Что такое SQL и реляционные базы данных – YouTube
- 📺 Базы данных (плейлист) – YouTube
- 📺 Основы SQL (плейлист) – YouTube
- 📘 Изучаем SQL – Алан Бьюли, 2017
- 📺 Практика SQL (плейлист) – YouTube
- 📄 Онлайн-тренажёр по SQL
- 📘 SQL Сборник рецептов – Энтони Молинаро, 2009
- 📺 Расширенные возможности SQL (плейлист) – YouTube
- 📄 8 книг по PostgreSQL для новичков и профессионалов – selectel.ru
- 📺 Что такое SQL ИНДЕКСЫ за 10 минут: Объяснение с примерами – YouTube
- 📄 Индексы в PostgreSQL – habr.com
- 📺 PostgreSQL. Индексы: то, что вы всегда хотели узнать, но боялись спросить – YouTube
- 📺 Вся правда об индексах в PostgreSQL – YouTube
-
MongoDB
MongoDB – документо-ориентированная БД (является классическим примером NoSQL баз данных), не требующая описания схемы таблиц. Использует JSON-подобные документы и схему БД.
- Основные команды
Изучите основной цикл операций по созданию/получению/обновлению/удалению данных. Всё остальное по мере надобности.
- Агрегации
Группировка значений из нескольких документов.
Три способа выполнения агрегации: pipeline, Map-Reduce и одноцелевые методы агрегирования. - Работа с индексами
- Работа с языком программирования
Для этого необходимо установить драйвер MongoDB под ваш ЯП.
- Основные команды
🔗 Ссылки на материалы
-
Redis
Redis – быстрое хранилище данных работающее со структурами типа ключ-значение. Может использоваться в качестве базы данных, кэша, брокера сообщений или очереди.
- Типы данных
Строки / Списки / Множества (sets) / Хэш-таблицы (hashes) / Упорядоченные множества (sorted sets)
- Базовые операции
SET key "value" # установка ключа key со значение "value" GET key # получить значение по указанному ключу SETNX key "data" # установка значения / создания ключа MSET key1 "1" key2 "2" key3 "3" # установка нескольких ключей MGET key1 key2 key3 # получение значений сразу по нескольким ключам DEL key # удалить пару ключ-значение INCR someNumber # увеличение числового значения по ключу на 1 DECR someNumber # уменьшение числового значения по ключу на 1 EXPIRE key 1000 # установить таймер жизни ключа 1000 секунд TTL key # получить информацию о времени жизни пары ключ-значение # -1 ключ существует, но не имеет срока действия # -2 ключ не существует # <другое число> время жизни ключа в секундах SETEX key 1000 "value" # объединение команды SET и EXPIRE
- Транзакции
MULTI
— начать запись команд для транзакции.
EXEC
— выполнить записанные команды.
DISCARD
— удалить все записанные команды.
WATCH
— команда, обеспечивающая выполнение только в случае, если другие клиенты не изменили значение переменной. Иначе EXEC не выполнит записанные команды.
- Типы данных
🔗 Ссылки на материалы
-
Требования ACID
ACID – это аббревиатура состоящая из названий четырёх основных свойств, которые гарантируют надежность транзакций в БД.
- Atomicity (атомарность)
Гарантирует, что транзакция будет выполнена полностью, либо не выполнена вообще.
- Consistency (согласованность)
Гарантирует, что каждая успешная транзакция фиксирует только допустимые результаты (какие-либо несоответствия исключены).
- Isolation (изолированность)
Гарантирует, что одна транзакция никак не может повлиять на другую.
- Durability (стойкость)
Гарантирует сохранение изменений внесённые транзакцией.
- Atomicity (атомарность)
🔗 Ссылки на материалы
-
Проектирование баз данных
Проектирование баз данных очень важная тема, которая часто упускается из виду. Грамотно спроектированная БД обеспечит долговременную масштабируемость и простоту обслуживания данных. Можно выделить несколько основных этапов при проектировании:
- Концептуальная схема
Наиболее абстрактное видение всей системы – описание основных сущностей (таблиц) и связей между ними без ориентации на конкретную СУБД.
- Логическая схема
Работа с моделями данных будущей БД, обозначение необходимых полей с указанием типов, определение отношений и связей с указанием первичных и внешних ключей.
- Физическая реализация
Это уже непосредственная работа с СУБД, организация конкретных таблиц, реализация связей, создание индексов и так далее.
- Концептуальная схема
🔗 Ссылки на материалы
- 📄 Основы проектирования баз данных. – GitHub
- 📄 Руководство по проектированию реляционных баз данных – metanit.com
- 📺 Базы данных. Проектирование – YouTube
- 📺 Лекция по проектированию схем базы данных – YouTube
- 📺 Проектирование баз данных за 40 минут. Практика – YouTube
- 📄 Руководство по проектированию реляционных баз данных – habr.com
- 📄 Основы современных баз данных
Разработка API
API (Application Programming Interface) – программный интерфейс, который описывает определенный набор правил, по которым различные программы (приложения, боты, сайты...) могут взаимодействовать друг с другом. С помощью вызовов API можно выполнить определённые функции программы не зная, как она работает.
При разработке серверных приложений могут использоваться разные форматы API, в зависимости от поставленных задач и требований.
-
REST API
REST (Representational State Transfer) – архитектурный подход, который описывает набор правил того, как программисту организовать написание кода серверного приложения, чтобы все системы легко обменивались данными и приложение можно было легко масштабировать. При построении REST API широко используются методы HTTP-протокола.
Основные правила написания хорошего REST API:
- Каждый URL-эндпоинт должен быть существительным
Для выполнения разных операций (получение/создание/изменение/удаление) этот эндпоинт должен реализовывать обработчики на соответствующие HTTP-методы (GET/POST/PUT/DELETE).
- Использование множественных названий
Например эндпоинт на получение одной записи по id выглядит так:
/task/42
, а на получение всех записей так:/tasks
- Использование версионности
Подробная инструкция описана здесь.
- Отправка соответствующих HTTP-кодов ответа
Самые часто используемые: 200, 201, 204, 304, 400, 401, 403, 404, 405, 410, 415, 422, 429.
- Каждый URL-эндпоинт должен быть существительным
🔗 Ссылки на материалы
- 📄 Что такое API
- 📄 Что такое REST API
- 📺 Что такое REST API – YouTube
- 📺 Что такое CRUD за 6 минут – YouTube
- 📄 Введение в REST API
- 📄 Используем API как разработчики
- 📄 Основы REST: теория и практика – tproger.ru
- 📄 Глоссарий API и источники
- 📄 REST API Best Practices – habr.com
- 📄 Версионирование API или единая кодовая база для всех версий – habr.com
- 📄 JSON API – работаем по спецификации – habr.com
-
GraphQL
GraphQL – это язык запросов, который описывает как запрашивать данные, и, в основном, используется клиентом для загрузки данных с сервера. Имеет три основных особенности:
- Позволяет клиенту точно указать, какие данные ему нужны, тем самым уменьшая потребление трафика от ненужных данных.
- Облегчает агрегацию данных из нескольких источников.
- Использует систему типов для описания данных.
Основные моменты:
- Система типов
Типы в GraphQL это кастомные объекты с определенным набором полей.
- Запросы (queries)
Объекты которые описывают способ получения данных.
- Изменения (mutation)
Описывают способы модификации данных на сервере.
- Подписки (subscription)
С помощью подписок поддерживается постоянная связь между клиентами и сервером.
🔗 Ссылки на материалы
-
WebSockets
Веб-сокеты это продвинутая технология, позволяющая открыть постоянное двунаправленное сетевое соединение между клиентом и сервером. С помощью его API вы можете отправить сообщение на сервер и получить ответ без выполнения HTTP-запроса, тем самым реализуя real-time взаимодействие.
Основная идея в том, что вам ненужно посылать запросы на сервер для получения новой информации. Когда соединение установлено, сервер сам будет отправлять новую порцию данных подключенным клиентам, как только эти данные появятся. Веб-сокеты широко используются для создания чатов, онлайн-игр, трейдерских приложений и т.д.
- Открытие веб-сокета
Отправка HTTP-запроса с определенным набором заголовков:
Connection: Upgrade
,Upgrade: websocket
,Sec-WebSocket-Key
,Sec-WebSocket-Version
. - Состояния соединения
CONNECTING
,OPEN
,CLOSING
,CLOSED
. - События
Open
,Message
,Error
,Close
. - Коды закрытия соединения
1000
,1001
,1006
,1009
,1011
и т.д.
- Открытие веб-сокета
🔗 Ссылки на материалы
- 📺 Что такое веб-сокеты за 4 минуты – YouTube
- 📺 Что такое Websocket? Websockets простыми словами – YouTube
- 📺 Web сокеты | Компьютерные сети. Продвинутые темы – YouTube
- 📄 Использование WebSockets в браузере – learn.javascript.ru
- 📺 Пример использования WebSocket на Python – YouTube
- 📺 [ENG] Все об WebSocket на Node.js за 30 минут – YouTube
- 📺 [ENG] Приложение с WebSocket на Go – YouTube
- 📄 WebSocket и HTTP/2+SSE. Что выбрать? – habr.com
-
RPC и gRPC
RPC (remote procedure call) – технология удаленного вызова процедур. Фактически, это просто вызов функции на сервере с набором определенных аргументов, который ответом отдает результат вызова этой функции.
Основные RPC-протоколы:
- SOAP
Протокол работающий с использованием языка XML. Разработан в 1998 году. Из-за сложности XML и большого потребления трафика не рекомендуется к использованию.
- JSON-RPC
Протокол с очень простой спецификацией. Все вызовы и ответы это записи в формате JSON.
- gRPC
Бинарный протокол созданный Google и использующий язык Protobuf.
- SOAP
🔗 Ссылки на материалы
-
WebRTC
WebRTC – open-source проект для организации передачи потоковых данных (видео, звука) в браузере. Работа WebRTC основана на peer to peer соединении, однако существуют реализации позволяющие организовывать сложные групповые сеансы. Например, сервис видео-звонков Google Meet широко использует WebRTC.
🔗 Ссылки на материалы
Программное обеспечение
-
Система контроля версий Git
Git - специальная система для управления историей изменения исходного кода. Любые изменения которые вносятся в Git могут быть сохранены, что позволяет откатываться (возвращаться) на ранее сохраненную копию проекта. На данный момент Git является стандартом для разработки.
- Основные команды
git init # инициализация Git в текущей папке git add [файл] # добавить файл в Git git add . # добавить все файлы в папке в Git git reset [файл] # отменить добавление указанного файла git reset # отменить добавление всех файлов git commit -m "ваш текст" # создать коммит (сохранение) git status # показывает статус добавленных файлов git push # отправить текущие коммиты в удаленный репозиторий git pull # загрузить изменения с удаленного репозитория git clone [ссылка] # склонировать указанный репозиторий к себе на ПК
- Работа с ветками
Ветвление позволяет отклонятся от основной линии разработки и продолжать работу независимо.
git branch # показать список текущих веток git branch [имя] # создать новую ветку от текущего коммита git checkout [имя] # переключиться на указанную ветку git merge [имя] # слияние указанной ветки в текущую ветку git branch -d [имя] # удалить указанную ветку
- Отмена коммитов
git revert HEAD --no-edit # создать новый коммит который отменяет изменения предыдущего git revert [хэш_коммита] --no-edit # то же действие, но с указанным коммитом
- История изменений
git log [ветка] # показать коммиты указанной ветки git log -3 # показать 3 последних коммита текущей ветки git log [файл] # показать историю коммитов указанного файла
- Основные команды
🔗 Ссылки на материалы
-
Docker
Docker - специальная программа, которая позволяет запускать изолированные песочницы (контейнеры) с различным предустановленным окружением (будь то определенная операционная система, база данных и т.д.). Технология контейнеризации, которую предоставляет Docker, схожа с виртуальными машинами, но в отличие от виртуальных машин, контейнеры используют ядро хостовой ОС, что требует гораздо меньших ресурсов.
- Образ (image)
Специальный фиксированный шаблон, в котором содержится описание среды для запуска приложения (ОС, исходный код, библиотеки, переменные окружения, файлы конфигурации и т.д.). Образы можно скачивать с официального сайта и на их основе создавать свои.
- Контейнер (container)
Изолированная среда, созданная на основе какого-либо образа. По сути это является запущенным процессом на компьютере, который внутри содержит то окружение, которое описано в образе.
- Основные команды
docker pull [имя_образа] # Загрузить образ из сети docker images # Список доступных образов docker run [id_образа] # Запуск контейнера на основе выбранного образа # Некоторые флаги для команды run: -d # Запуск с возвратом в консоль --name [имя] # Задать имя контейнеру --rm # Удалить контейнер после остановки -p [локальный_порт][порт_внутри_контейнера] # Проброс портов docker build [путь_к_Dockerfile] # Создание образа на основе Dockerfile docker ps # Список запущенных контейнеров docker ps -a # Список всех контейнеров docker stop [id/имя_контейнера] # Остановить контейнер docker start [id/имя_контейнера] # Запустить существующий контейнер docker attach [id/имя_контейнера] # Подключится к консоли контейнера docker logs [id/имя_контейнера] # Вывести логи контейнера docker rm [id/имя_контейнера] # Удалить контейнер docker container prune # Удалить все контейнеры docker rmi [id_образа] # Удалить образ
- Инструкции Dockerfile
Dockerfile представляет собой файл с набором инструкций и аргументов для создания образов.
FROM [имя_образа] # Задание базового образа WORKDIR [путь] # Задание корневой директории внутри контейнера COPY [путь_относительно_Dockefile] [путь_в_контейнере] # Копирование файлов ADD [путь] [путь] # Аналогично команде выше RUN [команда] # Команда которая запускается только при инициализации образа CMD ["команда"] # Команда которая отрабатывает каждый раз при запуске контейнера ENV КЛЮЧ="ЗНАЧЕНИЕ" # Установка переменных окружения ARG ИМЯ=ЗНАЧЕНИЕ # Задание переменных для передачи Docker во время сборки образа ENTRYPOINT ["команда"] # Команда которая запускается во время работы контейнера EXPOSE порт/протокол # Указывает на необходимость открыть порт VOLUME ["путь"] # Создаёт точку монтирования для работы с постоянным хранилищем
- Docker-compose
Специальный инструмент позволяющий одновременно запускать несколько контейнеров с разной инфраструктурой. В каком-то смысле это Dockerfile на максималках.
- Образ (image)
🔗 Ссылки на материалы
- 📄 Что такое виртуализация и для чего она нужна
- 📄 Что такое Docker: для чего он нужен и где используется – selectel.ru
- 📄 Как и для чего использовать Docker
- 📺 Docker. Полный курс Docker для начинающих за 3 часа – YouTube
- 📺 Docker для Начинающих. Полный Курс – YouTube
- 📄 Полное практическое руководство по Docker – habr.com
- 📄 Изучаем Docker: файлы Dockerfile – habr.com
- 📄 Руководство по Docker Compose для начинающих – habr.com
- 📄 Установка и настройка PostgreSQL в Docker – selectel.ru
-
Postman/Insomnia
При создании серверной части приложения, возникает необходимость в тестировании его работоспособности. Это можно сделать разными способами. Один из самых простых – это воспользоваться консольной утилитой curl. Но такой способ годится для совсем простых приложений. Намного эффективнее использовать специальное ПО для тестирования, которое имеют удобный интерфейс и весь необходимый функционал для создания коллекций запросов.
- Postman
Очень популярная и многофункциональная программа. Здесь точно есть всё, что Вам может пригодиться и даже больше: начиная от банального создания коллекций до поднятия mock-серверов. Основной функционал приложения предоставляется бесплатно.
- Insomnia
Не такой популярный, но очень приятный инструмент. Интерфейс в Insomnia, минималистичный и понятный. Здесь поменьше функционала, но все самое необходимое есть: коллекции, переменные, работа с GraphQL, gRPC, WebSocket и т.д. Имеется возможность установки сторонних плагинов.
- Postman
🔗 Ссылки на материалы
-
Веб-сервера
Веб-сервер – это программа предназначенная для обработки входящих запросов по протоколу HTTP. Также он может вести журналы ошибок (логи), производить аунтефикацию и авторизацию, хранить правила на обработку файлов и т.д.
- Зачем нужен?
- Не все языки могут иметь встроенный веб-сервер (например PHP). Поэтому для запуска веб-приложений, написанных на таких языках, необходим сторонний.
- На одном сервере (виртуальном или выделенном) может быть запущенно несколько приложений, но внешний IP-адрес только один. Сконфигурированный веб-сервер способен перенаправлять поступающие запросы в нужные приложения.
- Популярные веб-серверы
- Зачем нужен?
🔗 Ссылки на материалы
- 📺 Что такое веб сервер и для чего он нужен? – YouTube
- 📄 Веб-сервер: краткий обзор
- 📄 Что такое Nginx
- 📄 Веб-сервер Nginx: краткий обзор
- 📺 Основы Nginx (плейлист) – YouTube
- 📄 NGINX изнутри: рожден для производительности и масштабирования – habr.com
- 📄 Что такое Apache
- 📄 Веб-сервер Apache: краткий обзор
- 📄 Apache vs Nginx: практический взгляд – habr.com
- 📺 Установка web-сервера Apache на Linux Ubuntu и публикация web-сайта – YouTube
- 📺 Web-технологии. Web сервера | Технострим – YouTube
- 📺 Веб-сервер на Ubuntu 18 с нуля: nginx, HTTP/2, Brotli и HTTPS – YouTube
-
Брокеры сообщений
При создании масштабной backend-системы может возникать проблема коммуникации между большим количеством микросервисов. Чтобы не усложнять уже имеющиеся сервисы (налаживать надёжную систему коммуникации, распределять нагрузку, предусматривать различные ошибки и т.д.) можно использовать отдельный сервис, который называется брокером сообщений (очередью сообщений).
Брокер берет на себя ответственность создания надежной и отказоустойчивой системы коммуникации между сервисами (выполняет балансировку, гарантирует доставки, мониторит получателей, ведёт логи, буферизацию и т.д.)
Под сообщением понимается обычный HTTP запрос/ответ с данными определенного формата.
🔗 Ссылки на материалы
- 📺 Системы доставки сообщений, для чего они нужны? – YouTube
- 📄 Что такое очередь сообщений? – Amazon)
- 📄 Понимание брокеров сообщений. Изучение механики обмена сообщениями – habr.com
- 📺 Микросервисы: Коммуникации через очередь сообщений – YouTube
- 📺 RabbitMQ Tutorial на русском (плейлист) – YouTube
- 📄 Что такое Apache Kafka за 5 минут – YouTube
- 📄 Apache Kafka: основы технологии – habr.com
- 📺 Про Kafka (основы) – YouTube
- 📺 Брокер сообщений Kafka в условиях повышенной нагрузки – YouTube
- 📄 Выбор MQ для высоконагруженного проекта – habr.com
Безопасность
-
Уязвимости веб-приложений
- Межсайтовый скриптинг (XSS)
Атака, которая позволяют злоумышленнику внедрять вредоносный код через веб-сайт в браузеры других пользователей.
- SQL-инъекций
Атака может быть возможна если, пользовательский ввод, который передаётся в SQL-запрос, способен изменить смысл оператора или добавить туда другой запрос.
- Подделка межсайтовых запросов (CSRF)
Когда на сайте для выполнения какой-либо операции используется POST-запрос, злоумышленник может подделать форму, например в электронном письме и отправить его жертве. Затем жертва, являющаяся авторизованным пользователем, взаимодействую с этим письмом, не зная того, может отправить запрос на сайт с данными, которые задал злоумышленник.
- Кликджекинг (Clickjacking)
Принцип основан на том, что поверх видимой веб-страницы располагается невидимый слой, в который и загружается нужная злоумышленнику страница, при этом элемент управления (кнопка, ссылка), необходимый для осуществления требуемого действия, совмещается с видимой ссылкой или кнопкой, нажатие на которую ожидается от пользователя.
- DoS-атака (Denial of Service)
Хакерская атака, которая приводит к перегрузке сервера, на котором работает веб-приложение, за счет отправки огромного количества запросов.
- Man-in-the-Middle (человек посередине)
Тип атаки при которой злоумышленник попадает в цепь между двумя (или более) общающимися сторонами, чтобы перехватить разговор или передачу данных.
- Неверная конфигурация безопасности
Использование параметров конфигурации по умолчанию может быть опасным, поскольку это общеизвестная информация. К примеру, частой уязвимостью является то, что сетевые администраторы оставляют стандартные логины и пароли admin:admin.
- Межсайтовый скриптинг (XSS)
🔗 Ссылки на материалы
- 📄 Веб-безопасность – (MDN) mozilla.org
- 📄 Безопасность веб-приложений: от уязвимостей до мониторинга – habr.com
- 📺 Безопасность: уязвимости вашего приложения – YouTube
- 📄 Как защитить веб-приложение: основные советы, инструменты, полезные ссылки – tproger.ru
- 📄 Что такое XSS-уязвимость и как тестировщику не пропустить ее – habr.com
- 📄 DDoS-атаки: что это, происхождение, виды и способы защиты – selectel.ru
- 📄 DDoS-атаки: нападение и защита – habr.com
- 📄 Man-in-the-Middle: советы по обнаружению и предотвращению
- 📺 Безопасность Web-приложений (плейлист) – YouTube
- 📺 Безопасность интернет-приложений (плейлист) – YouTube
- 📄 Аналитика уязвимостей и угроз веб-приложений за 2019 год
-
Переменные окружения
Часто в ваших приложениях могут использоваться различные токены (например для доступа к стороннему платному API), логины и пароли (для подключения к базе данных), различные секретные ключи для подписей и так далее. Все эти данные не должны быть известны и доступны посторонним людям, соответственно оставлять их в коде программы ни в коем случае нельзя. Для решения этой проблемы существуют переменные окружения.
- Файл
.env
Специальный файл в котором можно хранить все переменные окружения.
- Парсинг
.env
файлаПеременные передаются в программу с помощью аргументов командной строки. Чтобы сделать подобное с
.env
файлом необходимо воспользоваться специальной библиотекой под ваш ЯП. - Хранение и передача
Изучите как загружать
.env
файлы на хостинг сервисы, а так же помните, что такие файлы нельзя коммитить в удаленные репозитории, поэтому не забывайте добавлять их в исключения через файл.gitignore
.
- Файл
🔗 Ссылки на материалы
-
Хеширование
Для обеспечения безопасности в сети широко используется криптографические алгоритмы на основе хеш-функций.
Основные понятия:
- Хеширование
Процесс преобразования массива информации (от одной буквы и хоть до целого литературного произведения) в некую уникальную короткую строку символов (называемую хэшем), которая присуща только этому массиву информации. Причем если в этом массиве информации изменить хоть один символ, то новый хэш будет отличатся кардинально.
Хеширование является необратимым процессом, то есть по полученному хэшу невозможно восстановить изначальные данные. - Контрольные суммы
Хэши могут использоваться как контрольные суммы, которые служат доказательством целостности данных.
- Коллизии
Cлучаи когда хеширование разного набора информации приводит к одинаковым хэшам.
- Соль (в криптографии)
Случайная строка данных, которая добавляется к входным данным перед хешированием, для вычисления хэша. Это необходимо для усложнения взлома методом перебора.
Основные алгоритмы хеширования:
- Семейство SHA (Secure Hash Algorithm)
SHA-256 наиболее популярный алгоритм шифрования. Используется, например, в Bitcoin.
- Семейство MD (Message Digest)
Наиболее популярный алгоритм семейства – MD5. Сейчас считается очень уязвимым к коллизиям (существуют даже генераторы коллизий для MD5).
- CRC (Cyclic redundancy check)
Алгоритм нахождения контрольной суммы, предназначенный для проверки целостности данных.
- Хеширование
🔗 Ссылки на материалы
- 📄 Хеш-функция, что это такое? – habr.com
- 📺 Что такое ХЭШ функция? | Хеширование – YouTube
- 📺 Hash/Хеш - просто о сложном – YouTube
- 📺 Как работает SHA256 – YouTube
- 📄 «Привет, мир»: разбираем каждый шаг хэш-алгоритма SHA-256 – habr.com
- 📄 Все методы взлома MD5
- 📄 CRC: как защитить программу
- 📄 Простой расчет контрольной суммы – habr.com
-
Аутентификация и авторизация
Важно понимать отличие между двумя этими понятиями.
Аутентификация – процедура проверки подлинности пользователя. Как правило выполняется путем сравнения введенного пользователем пароля с паролем, сохраненным в базе данных. Так же, в это понятие часто включают и идентификацию – процедуру выявления пользователя по его уникальному идентификатору (как правило это обычный логин или email). Это нужно, чтобы точно знать для какого пользователя выполняется проверка подлинности.
Авторизация – процедура выдачи прав доступа определенному пользователю на выполнение определенных операций. Например обычные пользователи интернет-магазина могут просматривать товары, добавлять их в корзину. А вот добавлять новые товары или удалять уже имеющиеся могут только администраторы.
- Basic Authentication
Наиболее простая схема аутентификации, при которой username и password пользователя передаются в заголовке Authorization в незашифрованном виде (base64-encoded). При использовании HTTPS является относительно безопасным.
- SSO (Single Sign-On)
Технология реализующая возможность перехода из одного сервиса в другой (не связанный с первым), без повторной аутентификации.
- OAuth / OAuth 2.0
Протокол авторизации благодаря которому можно зарегистрироваться в различных приложениях с помощью популярных сервисов (Google, Facebook, GitHub и т.д.)
- OpenID
Открытый стандарт, позволяющий создавать единую учётную запись для аутентификации на множестве не связанных друг с другом сервисов.
- JWT (Json Web Token)
Стандарт аутентификации работающий на основе токенов доступа. Токены создаются сервером, подписываются секретным ключом и передаются клиенту, который в дальнейшем использует данный токен для подтверждения своей личности.
- Basic Authentication
🔗 Ссылки на материалы
- 📄 Аутентификация и авторизация в микросервисных приложениях – habr.com
- 📄 Обзор способов и протоколов аутентификации в веб-приложениях – habr.com
- 📄 Как работает single sign-on (технология единого входа)? – habr.com
- 📄 OAuth 2: введение в протокол авторизации – selectel.ru
- 📺 Как работает OAuth 2 - введение (просто и понятно) – YouTube
- 📄 OAuth 2.0 простым и понятным языком – habr.com
- 📺 OpenID Connect. Теория – YouTube
- 📄 OpenID Connect простыми словами – habr.com
- 📄 Пять простых шагов для понимания JSON Web Tokens (JWT) – habr.com
- 📺 Виды авторизации: сессии, JWT-токены. Для чего нужны сессии? Как работает JWT? – YouTube
- 📺 JWT. Часть 1. Теория – YouTube
-
SSL/TLS
SSL (Secure Socket Layer) и TLS (Transport Layer Security) – это криптографические протоколы, которые обеспечивают защищённую передачу данных между двумя компьютерами в сети. По сути эти протоколы работают одинаково и отличий у них нет. SSL считается устаревшим, хотя все еще используется для поддержки старых устройств.
🔗 Ссылки на материалы
- 📺 Протоколы TLS/SSL | Защищенные сетевые протоколы – YouTube
- 📄 Как это работает: знакомство с SSL/TLS – habr.com
- 📺 TLS/SSL сертификаты и с чем их едят – YouTube
- 📄 Как HTTPS обеспечивает безопасность соединения – habr.com
- 📺 Шифрование в TLS/SSL | Защищенные сетевые протоколы – YouTube
- 📺 Как получить и настроить LetsEncrypt SSL сертификат для сайта? – YouTube
- 📺 Криптография с нуля – YouTube
Тестирование
Тестирование — это процесс оценки того, что все части программы ведут себя так, как от них это ожидается. Покрытие продукта должным количеством тестов, позволяет в дальнейшем проводить быстрые проверки на то, не сломалось ли что-нибудь в приложении, после добавления нового или изменения старого функционала.
-
Unit-тесты
Самый простой вид тестов. Как правило, около 70-80% от всех тестов занимают именно unit-тесты. «Unit» означает, что тестируется не вся система в целом, а небольшие и отдельные её части (функции, методы, компоненты и т.д.) в изоляции от других. Всё зависимое внешнее окружение, как правило, покрывается моками (mocks).
- Какая польза от Unit-тестов?
Для примера представим автомобиль. Его «юниты» — это двигатель, тормоза, приборная панель и т.д. Их можно проверить по отдельности перед сборкой и, в случае чего заменить или починить. А можно собрать автомобиль, не протестировав юниты, — и он не поедет. Придётся всё разбирать и проверять каждую деталь.
- Что нужно чтобы начать писать Unit-тесты?
Как правило, средств стандартной библиотеки языка достаточно, чтобы писать качественные тесты. Но для более удобного и быстрого написания тестов, лучше использовать сторонние инструменты. Например:
- Для Python используется pytest, хотя для начала хватит и стандартного unittest.
- Для JavaScript/TypeScript лучший выбор – это Jest.
- Для Go – testify.
- И так далее...
- Какая польза от Unit-тестов?
🔗 Ссылки на материалы
- 📄 Юнит-тестирование для чайников – habr.com
- 📺 Unit tests - модульное тестирование – YouTube
- 📺 Python – юнит-тестирование. Использование unittest и coverage – YouTube
- 📺 Jest. Unit Тестирование в JavaScript – YouTube
- 📺 Тестирование в Go: от плохого к хорошему – YouTube
- 📄 Когда использовать mocks в юнит-тестировании – habr.com
-
Интеграционные тесты
Интеграционное тестирование подразумевает тестирование отдельных модулей (компонентов) в связке с другими (то есть, в интеграции). То, что при Unit-тестировании закрывалось заглушкой – теперь является реальным компонентом или целым модулем.
- Зачем это нужно?
Интеграционные тесты это следующий этап после юнитов. Протестировав каждый компонент по отдельности мы еще не можем сказать, что основной функционал программы работает без ошибок. Потенциально, еще может существовать множество проблем, которые всплывут только после взаимодействия различных частей программы между собой.
- Стратегии написания интеграционных тестов
- Большой Взрыв: большинство разработанных модулей соединяются вместе, образуя либо всю необходимую систему либо её большую часть. Если всё работает, то таким спобом можно сэкономить много времени.
- Инкрементальный подход: выполняется путем соединения двух или более логически связанных модулей и затем постепенно подключаются всё новые модули, пока не будет протестирована вся система.
- Подход снизу вверх: каждый модуль на более низких уровнях тестируется с помощью модулей следующего более высокого уровня , пока не будут протестированы все модули.
- Зачем это нужно?
🔗 Ссылки на материалы
-
E2E тесты
End-to-end (E2E, сквозные) тесты подразумевают тестирование работы всей системы в целом. При этом виде тестирования, реализуется среда максимально близкая к реальным условиям. Можно провести аналогию, что за компьютером сидит робот и нажимает кнопки в указанном порядке, как это делал бы реальный пользователь.
- Когда использовать?
E2E это самый сложный вид тестов. Они требуют много времени, как для написания, так и для выполнения, поскольку задействуют всё приложение. Поэтому, если ваше приложение небольшое (например, его разрабатываете только Вы), то скорее всего будет достаточно написания Unit и некоторого кол-ва интеграционных тестов.
- Когда использовать?
🔗 Ссылки на материалы
-
Нагрузочное тестирование
Когда вы создаете большое приложение, которое должно обслуживать большое количество запросов, возникает необходимость в тестировании этой самой возможности выдерживать большие нагрузки. Для создания искусственной нагруженности существует множество утилит.
- JMeter
Удобный интерфейс, кроссплатформенность, поддержка многопоточности, расширяемость, отличные возможности по созданию отчётов, поддержка многих протоколов для запросов.
- LoadRunner
Имеет интересную функцию виртуальных пользователей, которые параллельно что-то делают с тестируемым приложением. Это позволяет понять как влияет работа одних пользователей, активно что-то делающих с сервисом, на работу других.
- Gatling
Очень мощный инструмент ориентированный уже не более опытных пользователей. Для описания сценариев используется Scala.
- Taurus
Целый фреймворк для более удобной работы над JMeter, Gatling и так далее. Для описания тестов используется JSON или YAML.
- JMeter
🔗 Ссылки на материалы
- 📄 Поговорим о нагрузочном тестировании – habr.com
- 📺 Использование непрерывного нагрузочного тестирования для оценки ёмкости и ресурсов – YouTube
- 📄 Обзор инструментария для нагрузочного и перформанс-тестирования – habr.com
- 📄 Приручаем JMeter – habr.com
- 📄 Нагрузочное тестирование на Gatling — Полное руководство – habr.com
-
Регрессионное тестирование
Регрессионное тестирование (regression - движение назад) – вид тестирования, направленный на обнаружение ошибок в уже протестированных участках исходного кода.
- Зачем нужно?
По статистике, повторное появление одних и тех же ошибок в коде - довольно частое явление. И, что самое интересное, выпускаемые для них патчи/фиксы со временем также перестают работать. Поэтому считается хорошей практикой при исправлении ошибки создать тест на неё и регулярно прогонять его при последующих изменениях.
- Зачем нужно?
🔗 Ссылки на материалы
Оптимизация
-
Профилирование
Профилирование кода это попытка найти узкие места в вашем коде. Профилирование позволяет проанализировать ваш код и найти его самые долго выполняющиеся участки. Инструмент, используемый для анализа работы, называют профилировщиком или профайлером.
🔗 Ссылки на материалы
- 📄 Профилирование кода к Python
- 📄 Профилировщики Python
- 📺 Утечки памяти в Node.js и JavaScript, сборка мусора и профилирование – YouTube
- 📺 Профилирование JS: увидеть самое важное и не утонуть в море чисел – YouTube
- 📄 Простое профилирование Node.js приложений
- 📄 Профилирование и оптимизация программ на Go
- 📄 Профилирование в Go
- 📄 Kotlin performance on Android
-
Кэширование
Кэширование является одним из самых действенных решений по оптимизации работы веб-приложений. Благодаря кэшированию можно повторно использовать ранее полученные ресурсы (статические файлы), тем самым сокращая задержку, снижая сетевой трафик и уменьшая время, необходимое для полной загрузки контента.
- CDN (Content Delivery Network)
Система серверов расположенная по всему миру. Такие сервера позволяют хранить дубликаты статического контента и доставлять его намного быстрее тем пользователям, которые находятся в непосредственной географической близости. Так же при использовании CDN снижается нагрузка на главный сервер.
- Браузерное (клиентское) кэширование
Основано на загрузке страниц и других статических данных из локального кэша. Для этого браузеру (клиенту) отдается специальные заголовки: 304 Not Modified, Expires, Strict-Transport-Security.
- Memcached
Программа-демон которая реализует высокопроизводительное кэширование в оперативной памяти на основе пар ключ-значение. В отличие от Redis не может являться надёжным и долговременным хранилищем, поэтому подходит только для кэша.
- CDN (Content Delivery Network)
🔗 Ссылки на материалы
- 📄 Что такое CDN и как это работает? – habr.com
- 📄 CDN: что такое и как это работает – selectel.ru
- 📄 Что такое CDN и как работает данная технология
- 📺 CDN своими руками – YouTube
- 📄 Учебное пособие по кэшированию – habr.com
- 📄 Кэширование и производительность веб-приложений – habr.com
- 📄 Основы кеширования веб-приложений
- 📄 HTTP-кеширование – (MDN) mozilla.org
- 📄 Четыре уровня кэширования в сети: клиентский, сетевой, серверный и уровень приложения – tproger.ru
- 📄 «HTTP Strict-Transport-Security» или как обезопасить себя от атак «man-in-the-middle» и заставить браузер всегда использовать HTTPS – habr.com
- 📄 Что такое Memcached? – Amazon
- 📺 Сравниваем Redis и Memcached, плюсы и минусы этих решений – YouTube
-
Балансировка нагрузки
Когда весь код приложения максимально оптимизирован и наращивание мощности сервера подходит к пределу, а нагрузка всё растёт и растёт – приходится прибегать к механизмам кластеризации и балансировки. Суть заключается в объединении групп серверов в кластера, где нагрузка между ними распределяется при помощи специальных методов и алгоритмов, называемых балансировкой.
- Балансировка на сетевом уровне
- DNS-балансировка. На одно доменное имя выделяется несколько IP-адресов и сервер на который будет перенаправлен запрос определяется по алгоритму Round Robin.
- Построение NLB-кластера. Используется для управления двумя или более серверами в качестве одного виртуального кластера.
- Балансировка по территориальному признаку. Примером может служить метод рассылки Anycast.
- Балансировка на транспортном уровне
Общение с клиентом замыкается на балансировщике, который работает как прокси. Он взаимодействует с серверами от своего имени, передавая информацию о клиенте в дополнительных данных и заголовках. Пример – HAProxy.
- Балансировка на прикладном уровне
Балансировщик анализирует клиентские запросы и перенаправляет их на разные серверы в зависимости от характера запрашиваемого контента. Примером может служить модуль Upstream в Nginx (который отвечает за балансировку) и pgpool из базы данных PostgreSQL (например, c его помощью можно распределять запросы на чтение на один сервер, а запросы на запись — на другой).
- Алгоритмы балансировки
- Round Robin. Каждый запрос направляется поочередно на каждый сервер (сначала на первый, потом на второй и так по кругу).
- Weighted Round Robin. Улучшенный алгоритм Round Robin, который учитывает еще и производительность сервера.
- Least Connections. Каждый последующий запрос направляется на сервер с наименьшим количеством поддерживаемых подключений.
- Destination Hash Scheduling. Сервер, обрабатывающий запрос, выбирается из статической таблицы по IP-адресу получателя.
- Source Hash Scheduling. Сервер, который будет обрабатывать запрос, выбирается из таблицы по IP-адресу отправителя.
- Sticky Sessions. Запросы распределяются в зависимости от IP-адреса пользователя. Sticky Sessions предполагает, что обращения от одного клиента будут направляться на один и тот же сервер, а не скакать в пуле.
- Балансировка на сетевом уровне
🔗 Ссылки на материалы
- 📄 Как устроен балансировщик нагрузки: алгоритмы, методы и задачи – selectel.ru
- 📄 Балансировка нагрузки: основные алгоритмы и методы – habr.com
- 📄 Введение в современную балансировку сетевой нагрузки и проксирование – medium.com
- 📄 Балансировка и распределение нагрузки
- 📺 Балансировка нагрузки при помощи NGINX – YouTube
- 📺 HAProxy - бесплатный LoadBalancer. Установка и конфигурация – YouTube
Документирование
-
Markdown
Стандарт в мире разработки. Невероятно простой, но в тоже время мощный язык разметки для описания Ваших проектов. Собственно говоря, ресурс, который Вы сейчас читаете, написан с помощью Markdown.
- Markdown cheatsheet
Шпаргалка по всем синтаксически возможностям языка.
- Awesome Markdown
Сборник различных ресурсов для работы с Markdown.
- Awesome README
Сборник красивых README.md файлов (это главный файл любого репозитория на GitHub, использующий Markdown).
- Конспекты и заметки
Markdown используются не только для написания документации. Этот невероятный инструмент отлично подходит для обучения – создания электронных конспектов и различных заметок. Лично я использую редактор Obsidian для конспектирования нового материала.
- Markdown cheatsheet
🔗 Ссылки на материалы
-
Документация внутри кода
Для каждого современного языка программирования существуют специальные инструменты которые позволяют писать документацию прямо в коде программы. Благодаря этому Вы можете читать описание методов, функций, структур и так далее прямо внутри вашей IDE. Как правило, такого рода документация выполняется в виде обычных комментариев с учётом некоторых синтаксических особенностей.
- Зачем нужно?
Чтобы сделать свою работу и работу других разработчиков проще. В долгосрочной перспективе это сэкономит больше времени, чем путешествия по коду с целью понять как все работает, какие параметры передать функции или узнать какие вообще методы есть у того или иного класса. Со временем вы неизбежно будете забывать свой же код, поэтому уже написанная документация будет полезна и Вам лично.
- Что нужно чтобы начать?
Для каждого языка все индивидуально. Во многих есть свои устоявшиеся подходы:
- Docstring для Python.
- JSDoc для JavaScript.
- Godoc для Go.
- KDoc и Dokka для Kotlin.
- Javadoc для Java.
- И другие ищите по запросу:
documentation engine for <ваш язык>
.
- Зачем нужно?
🔗 Ссылки на материалы
-
Документирование API
Удобная и понятная документация позволит другим пользователям быстрее разобраться и начать использовать ваш продукт. Писать документацию с нуля – это утомительный процесс. Для решения этой проблемы существуют общепринятые спецификации и инструменты автогенерации.
- OpenAPI
Спецификация, которая описывает, то как необходимо документировать API, чтобы он был читаем как для людей, так и для машин.
- Swagger
Набор инструментов который позволяет создавать удобную документацию API на основе той самой спецификации OpenAPI.
- Swagger UI
Инструмент позволяющий автоматически генерировать интерактивную документацию, которую можно не только читать, но и активно с ней взаимодействовать (отправлять HTTP-запросы).
- Swagger editor
Этакий playground в котором можно писать документацию и сразу видеть результат сгенерированной странички. Для этого используется файл YAML или JSON формата.
- Swagger codegen
Позволяет автоматически создавать клиентские библиотеки API, заглушки сервера и документацию.
- OpenAPI
🔗 Ссылки на материалы
- 📄 Документирование конечных точек
- 📺 Что такое Swagger и OpenAPI за 3 минуты – YouTube
- 📄 Swagger – умная документация вашего RESTful web-API – habr.com
- 📄 В чем польза формальных спецификаций вроде OpenAPI? – habr.com
- 📄 Спецификация OpenAPI и Swagger
- 📺 API + Swagger. Доклад Яндекса – YouTube
- 📄 Итак, вам нужно документировать API...
- 📄📺 Специфицируй это. Доклад Яндекса – habr.com
- 📄 Тестирование документации
-
Генераторы статики
Со временем, когда Ваш проект разрастается и у него появляется множество модулей, одной странички README на GitHub может быть не достаточно. Уместно будет создать отдельный сайт для документации вашего проекта. Для этого совсем не обязательно учиться верстать, поскольку существует множество сайтов-генераторов для создания красивой и удобной документации.
- GitBook
Наверное самый популярный генератор документации с использованием GitHub/Git и Markdown.
- Docusaurus
Open-source генератор от компании Facebook (Meta).
- MkDocs
Простой и широко кастомизируемый генератор документации в формате Markdown.
- Slate
Минималистичный генератор документации для REST API.
- Docsify
Ещё один простой, легкий и минималистичный генератор статики.
- Astro
Генератор с современным и продвинутым дизайном.
- mdBook
Статический генератор от разработчиков языка Rust.
- И другие...
- GitBook
🔗 Ссылки на материалы
Построение архитектуры
-
Архитектурные шаблоны
- Layered (многоуровневый)
Используется для структурирования программ, которые могут быть разложены на группы подзадач, каждая из которых находится на определенном уровне абстракции. Каждый уровень предоставляет услуги следующему более высокому уровню.
- Client-server
Классический шаблон, где клиенты обращаются за данными и услугами к серверу, а сервер эффективно обрабатывает эти запросы.
- Master-slave (ведущий-ведомый)
Ведущий компонент распределяет работу между идентичными ведомыми компонентами и вычисляет конечный результат из результатов, которые возвращают ведомые компоненты.
- Pipe-filter (канал-фильтр)
Каждый этап обработки заключен в компонент фильтра. Данные, подлежащие обработке, передаются по каналам. Эти каналы могут использоваться для буферизации или для синхронизации.
- Broker pattern (посредник)
Компонент посредника отвечает за координацию связи между всеми компонентами.
- Peer-to-peer (одноранговый)
Компоненты могут функционировать как в качестве клиента, запрашивая услуги у других компонентов, так и в качестве сервера, предоставляя услуги другим компонентам. Компонент может действовать как клиент, как сервер или как оба, а также может динамически менять свою роль со временем.
- Event-bus (шина событий)
Имеет 4 основных компонента: источник событий, слушатель событий, канал и шина событий. Источники публикуют сообщения в определенные каналы на шине событий.
- Blackboard (доска)
Применяется для решения задач, для которых не известны детерминированные стратегии решения.
- Interpreter (интерпретатор)
Используется для разработки компонента, который интерпретирует программы, написанные на специальном языке.
- Model-view-controller
- MVP (Modev-View-Presenter)
- MVVM (Model-View-ViewModel)
- DDD (Domain-Driven Design)
- Event-Driven Architecture
- Layered (многоуровневый)
🔗 Ссылки на материалы
- 📺 Архитектура ПО. Что это и зачем? – YouTube
- 📄 Краткий обзор 10 популярных архитектурных шаблонов приложений – medium
- 📺 Что такое MVC за 4 минуты – YouTube
- 📺 MVC, MVVM Архитектура. Наглядная теория и примеры – YouTube
- 📄 Самые важные архитектурные шаблоны, которые нужно знать – habr.com
- 📄 Архитектурные шаблоны – github.com
- 📄 Чистая архитектура – habr.com
- 📄 Что можно узнать о Domain Driven Design за 10 минут? – habr.com
- 📺 Доклад про Domain Driven Design – YouTube
-
Паттерны проектирования
- Порождающие паттерны
Отвечают за удобное и безопасное создание новых объектов или даже целых семейств объектов
- Структурные паттерны
Отвечают за построение удобных в поддержке иерархий классов
- Поведенческие паттерны
Решают задачи эффективного и безопасного взаимодействия между объектами программы
- Порождающие паттерны
🔗 Ссылки на материалы
- 📄 Паттерны ООП в метафорах – habr.com
- 📄 Шпаргалка по шаблонам проектирования – habr.com
- 📺 Паттерны проектирования на языке Python (playlist) – YouTube
- 📺 JavaScript Паттерны. Шаблоны проектирования. 17 Примеров – YouTube
- 📺 Паттерны проектирования на языке Go (playlist) – YouTube
- 📄 Паттерны проектирования – metanit.com
-
Монолитная и микросервисная архитектура
Монолит – это полноценное приложение, которое содержит единую кодовую базу (написана на одном стеке технологий и храниться в одном репозитории) и имеет единую точку входа для запуска всего приложения. Это самый распространенный подход для создания приложений в одиночку или небольшой командой.
- Достоинства
- Простота разработки (все в одном стиле и в одном месте).
- Простота развертывания.
- Легко масштабируется на начальном этапе.
- Простота разработки (все в одном стиле и в одном месте).
- Недостатки
- Нарастающая сложность (с ростом проекта увеличивается порог входа для новых разработчиков).
- Растет время на сборку и запуск.
- Усложняется добавление нового функционала, который затрагивает старый.
- Сложно (или невозможно) применение новых технологий.
- Нарастающая сложность (с ростом проекта увеличивается порог входа для новых разработчиков).
Микросервис – это полноценное приложение с единой кодовой базой. Но, в отличие от монолита, такое приложение отвечает лишь за одну функциональную единицу. То есть это маленький сервис, который решает только одну задачу, но хорошо.
- Достоинства
- Каждый отдельный микросервис может иметь свой стек технологий и разрабатываться не зависимо.
- Легко добавлять новый функционал (просто создайте новый микросервис).
- Меньше порог входа для новых разработчиков.
- Малые затраты времени на сборку и запуск.
- Каждый отдельный микросервис может иметь свой стек технологий и разрабатываться не зависимо.
- Недостатки
- Сложность реализации взаимодействия между всеми микросервисами.
- Сложнее в эксплуатации, чем несколько экземпляров монолита.
- Сложность выполнения транзакций.
- Изменения, затрагивающие несколько микросервисов, должны координироваться.
- Сложность реализации взаимодействия между всеми микросервисами.
- Достоинства
🔗 Ссылки на материалы
-
Горизонтальное и вертикальное масштабирование
Со временем, когда нагрузка на Ваше приложение начинает расти (приходит больше пользователей, появляется новый функционал и, как следствие, задействуется больше процессорного времени), становится необходимым увеличивать мощность сервера. Для этого есть 2 основных подхода:
- Вертикальное масштабирование
Подразумевает увеличение мощности уже существующего сервера. К примеру, сюда можно отнести увеличение размера оперативной памяти, установка более быстрого накопителя или увеличение его объема, а также покупка нового процессора с большой тактовой частотой и/или большим количеством ядер и потоков. Вертикальное масштабирование имеет свой предел, поскольку мы не можем долго наращивать мощности одного сервера.
- Горизонтальное масштабирование
Процесс развертывания новых серверов. Данный подход требует построения надёжной и масштабируемой архитектуры, которая позволит разнести логику работы всего приложения (или уже правильнее сказать сервиса) на несколько физических машин.
- Вертикальное масштабирование
🔗 Ссылки на материалы
Дополнительные и похожие ресурсы
- Backend Developer Roadmap: Learn to become a modern backend developer
- Профессия: бэкенд-разработчик
- Backend Roadmap (from Junior to Senior)
- A curated and opinionated list of resources (English & Russian) for Backend developers
- Timur Shemsedinov – открытые лекции, конференции, митапы по программной инженерии
- Hussein Nasser – один из лучших англоязычных каналов на YouTube по серверной разработке
- Курс по компьютерным сетям начального уровня
- Как освоить бэкенд-разработку в 2022 году: дорожная карта
- Backend Roadmap для самоучек
- Max-Starling/Notes - Заметки Full Stack разработчика
- Что должен знать Junior Backend разработчик? Подробный план
- Сети для самых маленьких – серия статей о сетях, их настройке и администрировании