Расширенный

Расширенный поиск

Автор

Статьи

Структура URL

13.01.2017
Структура URL
Все страницы, размещенные в сети Интернет, имеют свои адреса, которые представляют из себя определенную последовательность цифр. Для пользователей, в отличие от компьютера, путь к странице, записанный в виде цифровой последовательности, является неудобным и неинформативным. Именно поэтому была введена символьная интерпретация для адресов сайтов в сети Интернет, которая получила название URL (с англ. universal resource locator) – универсальный указатель ресурса.

Содержание статьи:

Располагается URL в специальном поле – адресной строке, в верхней части любого браузера и представляет собой определенную последовательность символов. Общая структура и допустимые в URL символы задокументированы в стандарте RFC 1738.

Структура URL

Согласно упомянутому стандарту, URL имеет следующую структуру:

<схема>://<логин>:<пароль>@<хост>:<порт>/?<параметры>#<якорь>

Далее приведено краткое описание элементов структуры:

  1. Схема – определяет протокол передачи данных и соответствующее обращение к ресурсу. Основные протоколы передачи данных:
    • HTTP – это протокол передачи данных. Протокол HTTP используется при пересылке веб-страниц между компьютерами, подключенными к одной сети.
    • HTTPS – более безопасный вариант протокола HTTP, использующий шифрование. Предназначен для защищенной передачи личных данных пользователей. Использование данного протокола подкрепляется сертификатом SSL (secure sockets layer), который владелец сайта может сгенерировать самостоятельно (самоподписной сертификат, Подробнее о сертификатах читайте в статье Цифровые сертификаты безопасности .
    • FTP – это протокол передачи файлов со специального файлового сервера на компьютер пользователя. FTP дает возможность абоненту обмениваться двоичными и текстовыми файлами с любым компьютером сети.
    • MAILTO – протокол для передачи электронных писем. Используется как форма обратной связи. При переходе по ссылке, содержащей данный протокол, откроется почтовый клиент.
  2. Логин и пароль – эти данные в протоколе http, как правило, не указываются. Они определяют права пользователя на доступ к определенной странице сайта.
  3. «Собака» (@) – специальный разделитель. Без логина и пароля его не указывают.
  4. Хост – это доменное имя, иногда IP-адрес ресурса, к которому обращается пользователь. Домены бывают нескольких уровней.

    Домены первого (верхнего) уровня также называют доменной зоной. Например, в доменном имени "safe-surf.ru", .ru – это домен первого уровня. Все домены верхнего уровня можно разделить на две группы:

    • Национальные или географические домены. Они определяют принадлежность сайта к той или иной стране или географической территории. Например, домен .ru принадлежит России, .kz - Казахстану, .ua – Украине и пр.
    • Домены общего пользования. Они могут устанавливать принадлежность сайта к определенной категории или виду деятельности. Например .com – коммерческие, .info – информационные, .biz – для бизнеса, .org – некоммерческие, .travel – туризм и пр.

    Домен safe-surf.ru является доменным именем второго уровня. Здесь .ru - это домен верхнего (первого) уровня. Собственное имя web-сайта – safe-surf находится на втором месте от окончания полного имени. Именно поэтому такие домены называются доменами второго уровня.

    Второй и все последующие уровни домена должны быть уникальны в группе своего родительского домена. Иначе говоря, в сети Интернет может быть только один домен второго уровня safe-surf в домене верхнего уровня .ru.

    Домены третьего уровня регистрируются у организаций или пользователей, владеющих доменами второго уровня. Например, для страницы safe-surf.ru может быть создан домен для форума – forum.safe-surf.ru. Получилось доменное имя третьего уровня, где forum является доменом третьего уровня в зоне safe-surf.ru.

  5. Порт – указывается довольно редко. Например, при обращении по протоколу http к сайту или любому файлу, размещенному на странице, автоматически присваивается одно из значений – 80 или 8080.
  6. URL-путь – путь к файлу или конкретному разделу сайта.
  7. Параметры – запрос с определёнными параметрами, которые передаются на сервер методом GET. Чтобы разделять параметры применяют знак &, например: ?параметр1=значение1&параметр2=значение2
  8. Якорь – это уникальная строка, состоящая из букв и/или цифр. Она ссылается на определённую область открываемого веб-документа. С его помощью можно сделать так, чтобы пользователь попал к определенному месту на странице.

Обманные приемы, использующие URL

1. URL, похожий на существующий

Под этим понимается создание сайта с URL, похожим на уже существующий. Пользователь, не заметив различия в URL, перейдёт на поддельный сайт, где мошенники попытаются выманить у него денежные средства, личные данные или заразить компьютер вредоносным программным обеспечением. Можно выделить несколько механизмов осуществления такого обмана:

  • замена одного или нескольких символов в уже существующем URL. Например, safe-surf.ru и safesurf.ru – два совершенных разных сайта.
  • создание поддельного сайта в другой доменной зоне. ( safe-surf.ru и safe-surf.ua, safe-surf.com)
  • использование домена третьего уровня (safe-surf.ru и safe-surf.ucoz.ru, safe-surf.narod.ru)

2. Сайты с сокращенным URL

Cамо сокращение адреса выполняется на специализированных сервисах и служит для удобства пользователей. Владелец сайта, загружая длинную, громоздкую ссылку на выходе получит ее упрощенную версию, которую в дальнейшем будет предоставлять пользователям. Пример сокращения URL :

  • исходный адрес http://www.safe-surf.ru/users-of/article/321/
  • полученный адрес goo.gl/5MBDwj

Как видно, по полученному новому URL трудно понять, на какой сайт он ведет. Таким образом, переходя по сокращенной ссылке, пользователь подвергает опасности свой компьютер и безопасность своих данных и фактически «идёт вслепую».

3. Использование цифрового представления адреса сайта

Как уже говорилось в начале статьи, изначально адреса страниц в сети Интернет состоят из цифр. Например, https://178.248.237.38/articles/ и https://www.safe-surf.ru/article/ адреса одной и той же страницы, но в разном представлении. Такое цифровое представление адреса, как и сокращенный URL, неинформативно и может запутать пользователя, чем могут воспользоваться мошенники.

4. Подделка гиперссылок

Гиперссылка – это часть электронного документа (текст, изображение), которая ссылается на другой элемент или другую страницу. Под подделкой понимается привязка к тексту или изображению сторонней ссылки. Например, изображение, содержащее знак известной социальной сети или банковского ресурса, может вести на фишинговые сайты или страницы, содержащие вредоносное ПО.

Не заметив это, пользователь может перейти на поддельную страницу, где злоумышленники попытаются обманным путем похитить денежные средства, личные данные или загрузить вредоносное ПО.

Рекомендации

  • Всегда смотрите на URL, если Вас что-либо смущает в его написании, лучше по этой ссылке не переходить.
  • При переходе на незнакомый сайт проверяйте URL страницы при помощи поисковой системы, загрузив URL в поисковую строку.
  • Обращайте внимание на URL часто используемых сайтов. Любые изменения в адресе могут свидетельствовать о подделке данной страницы злоумышленниками.
  • Проверяйте реальные адреса гиперссылок, заключенных в текст или изображение, т.к. они могут вести на совершенно иные страницы. Сделать это можно, наведя курсор на гиперссылку, при этом в левом нижнем углу браузера должен появиться URL-адрес страницы, на которую эта гиперссылка ведет.

    Например, осуществляя переход в раздел "Статьи", наведя курсор на соответствующий блок, в правом нижнем углу появится ссылка указывающая расположение данной страницы "safe-surf.ru/article/"

  • В смартфоне или планшете проверить адрес гиперссылки можно нажав и удерживая элемент содержащий гиперссылку до появления контекстного меню, в котором появится ссылка по которой будет осуществляться переход.
  • Используйте и регулярно обновляйте на компьютере антивирус с поддержкой проверки интернет-страниц.