Carder
Professional
- Messages
- 2,619
- Reaction score
- 1,879
- Points
- 113
Интернет-файлы cookie вызывают проблемы с конфиденциальностью, хотя они также могут облегчить навигацию в Интернете.
Большинство файлов cookie в Интернете невероятно просты, но они - одна из тех вещей, которые начали жить собственной жизнью. Куки-файлы начали привлекать огромное внимание средств массовой информации еще в 2000 году из-за проблем с конфиденциальностью в Интернете, и споры до сих пор бушуют.
С другой стороны, файлы cookie предоставляют возможности, которые значительно упрощают навигацию в Интернете. Дизайнеры почти каждого крупного сайта используют их, потому что они обеспечивают лучший пользовательский интерфейс и значительно упрощают сбор точной информации о посетителях сайта.
В этой статье мы рассмотрим базовую технологию, лежащую в основе файлов cookie, а также некоторые функции, которые они обеспечивают.
Файлы cookie - это программы, которые веб-сайты помещают на ваш жесткий диск. Они сидят на вашем компьютере и собирают информацию о вас и обо всем, что вы делаете в Интернете, и всякий раз, когда веб-сайт этого требует, он может загрузить всю информацию, собранную файлом cookie.
Подобные определения довольно часто встречаются в прессе. Проблема в том, что эта информация неверна. Файлы cookie - это не программы, и они не могут работать, как программы. Следовательно, они не могут самостоятельно собрать какую-либо информацию. Они также не могут собирать личную информацию о вас с вашего компьютера.
Вот правильное определение cookie: cookie - это фрагмент текста, который веб-сервер может хранить на жестком диске пользователя. Файлы cookie позволяют веб-сайту сохранять информацию на компьютере пользователя, а затем извлекать ее. Части информации хранятся в виде пар имя-значение.
Например, веб-сайт может генерировать уникальный идентификационный номер для каждого посетителя и сохранять этот идентификационный номер на каждом компьютере пользователя с помощью файла cookie.
Если вы используете Microsoft Internet Explorer для просмотра веб-страниц, вы можете увидеть все файлы cookie, которые хранятся на вашем компьютере. Чаще всего они живут в каталоге c: windowscookies. Когда я заглядываю в этот каталог на своей машине, я нахожу 165 файлов. Каждый файл представляет собой текстовый файл , содержащий пары имя-значение, и есть один файл для каждого веб-сайта, который разместил файлы cookie на моем компьютере.
В каталоге вы можете видеть, что каждый из этих файлов представляет собой простой обычный текстовый файл. Вы можете увидеть, какой веб-сайт разместил файл на вашем компьютере, посмотрев на имя файла (информация также хранится внутри файла). Вы можете открыть каждый файл, щелкнув по нему.
Например, я посетил goto.com, и этот сайт разместил файл cookie на моем компьютере. Файл cookie для goto.com содержит следующую информацию:
ID пользователя A9A3BECE0563982D www.goto.com/
Goto.com сохранил на моей машине одну пару имя-значение. Имя пары - UserID, значение - A9A3BECE0563982D. Когда я впервые посетил goto.com, сайт присвоил мне уникальное значение идентификатора и сохранил его на моем компьютере.
(Обратите внимание, что, вероятно, в файле после трех, показанных выше, хранятся еще несколько значений. Это служебная информация для браузера.)
Amazon.com хранит на моей машине немного больше информации. Когда я смотрю на файл cookie, созданный Amazon на моем компьютере, он содержит следующее:
идентификатор сеанса 954242000 amazon.com/ идентификатор сеанса 002-4135256-7625846 amazon.com/ x-main eKQIfwnxuF7qtmX52x6VWAXh @ Ih6Uo5H amazon.com/ ubid-main 077-9263437-9645324 amazon.com/
Похоже, что Amazon хранит основной идентификатор пользователя, идентификатор для каждого сеанса и время начала сеанса на моей машине (а также значение x-main, которое может быть любым).
Подавляющее большинство сайтов хранят на вашем компьютере только одну часть информации - идентификатор пользователя. Но сайт может хранить много пар имя-значение, если захочет.
Пара имя-значение - это просто именованный фрагмент данных. Это не программа, и она ничего "делать" не может. Веб-сайт может получать только ту информацию, которую он разместил на вашем компьютере. Он не может получать информацию из других файлов cookie или любую другую информацию с вашего компьютера.
Когда вы вводите URL-адрес в веб-браузере, веб-сервер может просматривать ваш файл cookie.
Как вы видели в предыдущем разделе, данные cookie - это просто пары имя-значение, хранящиеся на вашем жестком диске веб-сайтом. Это все данные cookie. Веб-сайт хранит данные, а затем получает их обратно. Веб-сайт может получать только те данные, которые он хранит на вашем компьютере. Он не может просматривать никакие другие файлы cookie или что-либо еще на вашем компьютере.
Данные перемещаются следующим образом:
Вы контролируете этот процесс. Вы можете установить опцию в своем браузере, чтобы браузер сообщал вам каждый раз, когда сайт отправляет вам пары имя-значение. Затем вы можете принять или отклонить значения.
Веб-сайты используют файлы cookie по-разному. Вот некоторые из наиболее распространенных примеров:
Сайты могут точно определить, сколько людей на самом деле посещают сайт. Оказывается, из-за прокси-серверов, кеширования, концентраторов и т.д. Единственный способ для сайта точно подсчитывать посетителей - это установить файл cookie с уникальным идентификатором для каждого посетителя. Используя файлы cookie, сайты могут определять, сколько посетителей пришло, сколько новых посетителей по сравнению с постоянными и как часто посетитель заходил. Сайты могут сохранять пользовательские настройки, чтобы сайт мог выглядеть по-разному для каждого посетителя (часто это называется настройкой). Например, если вы посетите msn.com, он предлагает вам возможность «изменять содержимое / макет / цвет». Он также позволяет вам ввести свой почтовый индекс и получить индивидуальную информацию о погоде. Когда вы вводите свой почтовый индекс, в файл cookie MSN добавляется следующая пара «имя-значение»:
ПОГОДА CC = NC% 5FRaleigh% 2DDurham®ION = www.msn.com/
Во всех этих примерах обратите внимание, что база данных может хранить то, что вы выбрали с сайта, страницы, которые вы просматривали с сайта, информацию, которую вы предоставили сайту в онлайн-формах и т.д. Вся информация хранится в базе данных сайта, и в большинстве случаев файл cookie, содержащий ваш уникальный идентификатор, - это все, что хранится на вашем компьютере.
Когда вы регистрируетесь в системе регистрации Carder.uk, проблема решается следующим образом: сайт запоминает значение вашего файла cookie и сохраняет его вместе с вашей регистрационной информацией. Если вы потратите время для входа в систему с любого другого компьютера (или с машины, которая потеряла свои файлы cookie), сервер изменит файл cookie на этой машине, чтобы он содержал идентификатор, связанный с вашей регистрационной информацией. Таким образом, у вас может быть несколько компьютеров с одинаковым значением идентификатора.
Есть две вещи, которые вызвали сильную реакцию в отношении файлов cookie:
Большинство файлов cookie в Интернете невероятно просты, но они - одна из тех вещей, которые начали жить собственной жизнью. Куки-файлы начали привлекать огромное внимание средств массовой информации еще в 2000 году из-за проблем с конфиденциальностью в Интернете, и споры до сих пор бушуют.
С другой стороны, файлы cookie предоставляют возможности, которые значительно упрощают навигацию в Интернете. Дизайнеры почти каждого крупного сайта используют их, потому что они обеспечивают лучший пользовательский интерфейс и значительно упрощают сбор точной информации о посетителях сайта.
В этой статье мы рассмотрим базовую технологию, лежащую в основе файлов cookie, а также некоторые функции, которые они обеспечивают.
Основы cookie
В апреле 2000 года я прочитал подробную статью о конфиденциальности в Интернете в большой уважаемой газете, и эта статья содержала определение файлов cookie. Перефразируя, определение было таким:Файлы cookie - это программы, которые веб-сайты помещают на ваш жесткий диск. Они сидят на вашем компьютере и собирают информацию о вас и обо всем, что вы делаете в Интернете, и всякий раз, когда веб-сайт этого требует, он может загрузить всю информацию, собранную файлом cookie.
Подобные определения довольно часто встречаются в прессе. Проблема в том, что эта информация неверна. Файлы cookie - это не программы, и они не могут работать, как программы. Следовательно, они не могут самостоятельно собрать какую-либо информацию. Они также не могут собирать личную информацию о вас с вашего компьютера.
Вот правильное определение cookie: cookie - это фрагмент текста, который веб-сервер может хранить на жестком диске пользователя. Файлы cookie позволяют веб-сайту сохранять информацию на компьютере пользователя, а затем извлекать ее. Части информации хранятся в виде пар имя-значение.
Например, веб-сайт может генерировать уникальный идентификационный номер для каждого посетителя и сохранять этот идентификационный номер на каждом компьютере пользователя с помощью файла cookie.
Если вы используете Microsoft Internet Explorer для просмотра веб-страниц, вы можете увидеть все файлы cookie, которые хранятся на вашем компьютере. Чаще всего они живут в каталоге c: windowscookies. Когда я заглядываю в этот каталог на своей машине, я нахожу 165 файлов. Каждый файл представляет собой текстовый файл , содержащий пары имя-значение, и есть один файл для каждого веб-сайта, который разместил файлы cookie на моем компьютере.
В каталоге вы можете видеть, что каждый из этих файлов представляет собой простой обычный текстовый файл. Вы можете увидеть, какой веб-сайт разместил файл на вашем компьютере, посмотрев на имя файла (информация также хранится внутри файла). Вы можете открыть каждый файл, щелкнув по нему.
Например, я посетил goto.com, и этот сайт разместил файл cookie на моем компьютере. Файл cookie для goto.com содержит следующую информацию:
ID пользователя A9A3BECE0563982D www.goto.com/
Goto.com сохранил на моей машине одну пару имя-значение. Имя пары - UserID, значение - A9A3BECE0563982D. Когда я впервые посетил goto.com, сайт присвоил мне уникальное значение идентификатора и сохранил его на моем компьютере.
(Обратите внимание, что, вероятно, в файле после трех, показанных выше, хранятся еще несколько значений. Это служебная информация для браузера.)
Amazon.com хранит на моей машине немного больше информации. Когда я смотрю на файл cookie, созданный Amazon на моем компьютере, он содержит следующее:
идентификатор сеанса 954242000 amazon.com/ идентификатор сеанса 002-4135256-7625846 amazon.com/ x-main eKQIfwnxuF7qtmX52x6VWAXh @ Ih6Uo5H amazon.com/ ubid-main 077-9263437-9645324 amazon.com/
Похоже, что Amazon хранит основной идентификатор пользователя, идентификатор для каждого сеанса и время начала сеанса на моей машине (а также значение x-main, которое может быть любым).
Подавляющее большинство сайтов хранят на вашем компьютере только одну часть информации - идентификатор пользователя. Но сайт может хранить много пар имя-значение, если захочет.
Пара имя-значение - это просто именованный фрагмент данных. Это не программа, и она ничего "делать" не может. Веб-сайт может получать только ту информацию, которую он разместил на вашем компьютере. Он не может получать информацию из других файлов cookie или любую другую информацию с вашего компьютера.
Как перемещаются данные cookie?

Когда вы вводите URL-адрес в веб-браузере, веб-сервер может просматривать ваш файл cookie.
Как вы видели в предыдущем разделе, данные cookie - это просто пары имя-значение, хранящиеся на вашем жестком диске веб-сайтом. Это все данные cookie. Веб-сайт хранит данные, а затем получает их обратно. Веб-сайт может получать только те данные, которые он хранит на вашем компьютере. Он не может просматривать никакие другие файлы cookie или что-либо еще на вашем компьютере.
Данные перемещаются следующим образом:
- Если вы вводите URL-адрес веб-сайта в своем браузере, ваш браузер отправляет запрос на веб-сайт для страницы (см. Как работают веб-серверы для обсуждения). Например, если вы введете URL-адрес в свой браузер, ваш браузер свяжется с сервером Amazon и запросит его домашнюю страницу.
- Когда браузер делает это, он будет искать на вашем компьютере файл cookie, установленный Amazon. Если он найдет файл cookie Amazon, ваш браузер отправит все пары имя-значение в файле на сервер Amazon вместе с URL-адресом. Если он не находит файла cookie, он не отправляет данные cookie.
- Веб-сервер Amazon получает данные cookie и запрос страницы. Если получены пары имя-значение, Amazon может их использовать.
- Если пары имя-значение не получены, Amazon знает, что вы не посещали раньше. Сервер создает для вас новый идентификатор в базе данных Amazon, а затем отправляет пары «имя-значение» на ваш компьютер в заголовке отправляемой веб-страницы. Ваша машина хранит пары имя-значение на жестком диске.
- Веб-сервер может изменять пары имя-значение или добавлять новые пары всякий раз, когда вы посещаете сайт и запрашиваете страницу.
Вы контролируете этот процесс. Вы можете установить опцию в своем браузере, чтобы браузер сообщал вам каждый раз, когда сайт отправляет вам пары имя-значение. Затем вы можете принять или отклонить значения.
Как веб-сайты используют файлы cookie?
Файлы cookie эволюционировали, потому что они решают большую проблему для людей, создающих веб-сайты. В самом широком смысле файл cookie позволяет сайту сохранять информацию о состоянии на вашем компьютере. Эта информация позволяет веб-сайту запомнить, в каком состоянии находится ваш браузер. Идентификатор - это одна простая часть информации о состоянии - если идентификатор существует на вашем компьютере, сайт знает, что вы посещали раньше. Состояние: «Ваш браузер посещал сайт хотя бы один раз», и сайт знает ваш идентификатор по этому посещению.Веб-сайты используют файлы cookie по-разному. Вот некоторые из наиболее распространенных примеров:
Сайты могут точно определить, сколько людей на самом деле посещают сайт. Оказывается, из-за прокси-серверов, кеширования, концентраторов и т.д. Единственный способ для сайта точно подсчитывать посетителей - это установить файл cookie с уникальным идентификатором для каждого посетителя. Используя файлы cookie, сайты могут определять, сколько посетителей пришло, сколько новых посетителей по сравнению с постоянными и как часто посетитель заходил. Сайты могут сохранять пользовательские настройки, чтобы сайт мог выглядеть по-разному для каждого посетителя (часто это называется настройкой). Например, если вы посетите msn.com, он предлагает вам возможность «изменять содержимое / макет / цвет». Он также позволяет вам ввести свой почтовый индекс и получить индивидуальную информацию о погоде. Когда вы вводите свой почтовый индекс, в файл cookie MSN добавляется следующая пара «имя-значение»:
ПОГОДА CC = NC% 5FRaleigh% 2DDurham®ION = www.msn.com/
- Поскольку я живу в Роли, Северная Каролина, это имеет смысл.
- Большинство сайтов, похоже, хранят такие настройки в базе данных сайта и не хранят ничего, кроме идентификатора в качестве файла cookie, но сохранение фактических значений в парах имя-значение - еще один способ сделать это (мы обсудим позже, почему этот подход потерял популярность).
Во всех этих примерах обратите внимание, что база данных может хранить то, что вы выбрали с сайта, страницы, которые вы просматривали с сайта, информацию, которую вы предоставили сайту в онлайн-формах и т.д. Вся информация хранится в базе данных сайта, и в большинстве случаев файл cookie, содержащий ваш уникальный идентификатор, - это все, что хранится на вашем компьютере.
Проблемы с файлами cookie
Файлы cookie не являются идеальным государственным механизмом, но они, безусловно, делают возможным многое, что в противном случае было бы невозможно. Вот несколько вещей, которые делают файлы cookie несовершенными.- Люди часто используют общие машины - любая машина, которая используется в общественных местах, и многие машины, используемые в офисе или дома, используются совместно несколькими людьми. Допустим, вы используете общедоступный компьютер (например, в библиотеке) для покупки чего-либо в интернет-магазине. Магазин оставит файл cookie на машине, и кто-то может позже попытаться купить что-нибудь в магазине, используя вашу учетную запись. Магазины обычно публикуют большие предупреждения об этой проблеме, и именно поэтому. Но даже в этом случае ошибки могут случиться. Например, однажды я использовал машину своей жены, чтобы что-то купить на Amazon. Позже она посетила Amazon и нажала кнопку «в один клик», не понимая, что она действительно позволяет купить книгу ровно в один клик учетные записи правильно, это не проблема. Учетные записи разделяют все файлы cookie пользователей. В других операционных системах учетные записи гораздо более расслаблены, и это проблема. Если вы попробуете приведенный выше пример на общедоступной машине, и если другие люди, использующие машину, посетили Carder.uk, то URL-адрес истории может показать очень длинный список файлов.
- Файлы cookie удаляются. Если у вас возникли проблемы с браузером и вы позвоните в службу технической поддержки, вероятно, первое, что вам потребуется сделать, - это удалить все временные файлы Интернета на вашем компьютере. Когда вы это сделаете, вы потеряете все свои файлы cookie. Теперь, когда вы снова посещаете сайт, этот сайт будет думать, что вы новый пользователь, и назначит вам новый файл cookie. Это имеет тенденцию искажать данные о новых и вернувшихся посетителях на сайте, а также может затруднить восстановление ранее сохраненных настроек. Вот почему сайты просят вас зарегистрироваться в некоторых случаях - если вы регистрируетесь с именем пользователя и паролем, вы можете войти в систему, даже если вы потеряете файл cookie, и восстановить свои настройки. Если значения предпочтений хранятся непосредственно на машине (как в примере погоды MSN выше), восстановление невозможно. Вот почему многие сайты теперь хранят всю информацию о пользователях в центральной базе данных и хранят только значение идентификатора на компьютере пользователя. Если вы удалите файл cookie для Carder.uk, а затем повторно посетите URL-адрес истории в предыдущем разделе, вы обнаружите, что Carder.uk не имеет для вас истории. Сайт должен создать для вас новый идентификатор и файл cookie, и этот новый идентификатор не имеет данных, хранящихся против него в базе данных. (Также обратите внимание, что система регистрации HowStuffWorks позволяет вам сбросить список истории, когда захотите.)
- Несколько машин - люди часто используют более одной машины в течение дня. Например, у меня есть машина в офисе, машина дома и ноутбук для дороги. Если сайт не разработан специально для решения этой проблемы, у меня будет три уникальных файла cookie на всех трех машинах. Любой сайт, который я посещаю со всех трех машин, будет отслеживать меня как трех отдельных пользователей. Установка настроек трижды может раздражать. Опять же, сайт, который позволяет регистрацию и централизованно хранить настройки, может облегчить мне создание одной и той же учетной записи на трех машинах, но разработчики сайта должны спланировать это при проектировании сайта. Если вы посетите URL-адрес истории, показанный в предыдущем разделе, с одного компьютера, а затем попробуете его снова с другого, вы обнаружите, что ваши списки истории отличаются. Это потому, что сервер создал для вас два идентификатора, по одному на каждой машине.
Когда вы регистрируетесь в системе регистрации Carder.uk, проблема решается следующим образом: сайт запоминает значение вашего файла cookie и сохраняет его вместе с вашей регистрационной информацией. Если вы потратите время для входа в систему с любого другого компьютера (или с машины, которая потеряла свои файлы cookie), сервер изменит файл cookie на этой машине, чтобы он содержал идентификатор, связанный с вашей регистрационной информацией. Таким образом, у вас может быть несколько компьютеров с одинаковым значением идентификатора.
Файлы cookie в Интернете: вопросы конфиденциальности
Если вы прочитали статью до этого момента, вам может быть интересно, почему в средствах массовой информации возник такой шум по поводу файлов cookie и конфиденциальности в Интернете. В этой статье вы видели, что файлы cookie представляют собой безобидные текстовые файлы, а также видели, что они предоставляют множество полезных возможностей в Интернете.Есть две вещи, которые вызвали сильную реакцию в отношении файлов cookie:
- Первое - это то, что мучило потребителей на протяжении десятилетий. Допустим, вы покупаете что-то из традиционного каталога почтового перевода. В каталоге компании указано ваше имя, адрес и номер телефона из вашего заказа, а также известно, какие товары вы приобрели. Он может продавать вашу информацию другим лицам, которые могут захотеть продать вам аналогичные товары. Это топливо, которое делает возможным телемаркетинг и нежелательную почту. На веб-сайте сайт может отслеживать не только ваши покупки, но и страницы, которые вы читаете, объявления, на которые вы нажимаете, и т.д. Если вы затем что-то покупаете и вводите свое имя и адрес, сайт потенциально знает гораздо больше о вы, чем традиционная компания по доставке по почте. Это делает таргетинг гораздо точнее, и это заставляет многих людей чувствовать себя неуютно. У разных сайтов разные политики. Carder.uk придерживается строгой политики конфиденциальности и не продает и не передает какую-либо личную информацию о наших читателях третьим лицам. Например, если репортер спрашивает меня, сколько посетителей посещает Carder.uk или какая страница на сайте является наиболее популярной, мы создаем эту совокупную статистику из данных в базе данных.
- Второй - уникален для Интернета. Есть определенные поставщики инфраструктуры, которые могут создавать файлы cookie, которые видны на нескольких сайтах. DoubleClick - самый известный пример этого. Многие компании используют DoubleClick для показа баннерной рекламы на своих сайтах. DoubleClick может размещать на сайте небольшие (1x1 пиксель) файлы GIF, которые позволяют DoubleClick загружать файлы cookie на ваш компьютер. Затем DoubleClick может отслеживать ваши перемещения по нескольким сайтам. Он потенциально может видеть поисковые строки, которые вы вводите в поисковые системы (больше из-за того, как некоторые поисковые системы реализуют свои системы, а не потому, что умышленно что-то зловещее). Поскольку DoubleClick может собирать так много информации о вас с разных сайтов, он может создавать очень обширные профили.. Они все еще анонимны, но богаты. Затем DoubleClick пошел еще дальше. Приобретая компанию, DoubleClick пригрозил связать эти обширные анонимные профили обратно с информацией об имени и адресе - он пригрозил персонализировать их, а затем продать данные. Для большинства людей это стало очень похоже на шпионаж, и именно это вызвало бурю негодования. DoubleClick и подобные компании находятся в уникальном положении для такого рода вещей, потому что они размещают рекламу на очень многих сайтах. Межсайтовое профилирование недоступно для отдельных сайтов, поскольку файлы cookie зависят от сайта.