Спам (массовые неадресные рекламные рассылки по электронной почте) в наше время стал настоящей бедой электронной почты. В этой статье рассматриваются причины возникновения, способы распространения и методы борьбы с нежелательной электронной корреспонденцией.
Вы читаете сохранённую копию статьи 2003 года с моего старого сайта blackman2003.narod.ru. Часть информации, указанной в статье, за прошедшее время могла значительно устареть.
Сейчас уже, наверное, не осталось пользователей систем электронной почты, которые ни разу не сталкивались с проблемой спама. Большинство знакомы с ней не понаслышке. Откуда же взялся спам как явление и почему он настолько жизнеспособен?
Сам термин "спам" возник задолго до появления компьютеров. В 1930 г. так назывались консервы из второсортного мяса (Пряная ветчина, SPiced hAM, сокращенно SPAM), которые использовали очень агрессивную рекламную кампанию. Через некоторое время слово "спам" стало нарицательным, им стали называть все, что навязывалось вопреки желанию, в частности различные письма, открытки, проспекты и прочую макулатуру рекламного характера, которая приходила по почте. Потом этим термином стали характеризовать ненужную рекламную корреспонденцию, рассылаемую по электронной почте.
Невероятная живучесть спама обусловлена практически нулевой стоимостью его рассылки. Ведь для ведения спам-рассылок только и требуется, что компьютер и доступ в Интернет. Одному человеку вполне по силам ежедневно рассылать до нескольких миллионов писем. Все затраты на рассылку рекламы в итоге ложатся на ее получателей. Именно в этом главное отличие спама от обычной почтовой рекламы. Кроме того, отсутствие законодательной базы в области электронной почты делает деятельность спамеров ничем не ограниченной.
Итак, давайте же разберемся, откуда берется спам и как с ним бороться.
На дальних подступах
Для того чтобы начать рассылку рекламы, спамеру, прежде всего, требуется добыть список адресов, которые можно использовать для рассылки. Откуда он может его взять? Есть несколько источников.
Первый и основной путь — это сканирование HTML-страниц. Если Вы имеете свой сайт, там наверняка указан Ваш e-mail. Нет ничего проще, чем при помощи специальной программы извлечь e-mail адрес из сайта. Таким образом можно обрабатывать до нескольких тысяч сайтов в час. Кроме того, Ваш e-mail наверняка оставлен в нескольких форумах, гостевых книгах и т.д., откуда он также без проблем извлекается.
Второй путь — это создание e-mail адресов по словарю. В самом деле, в английском языке всего-то около 50 тысяч слов. На таком крупном почтовом сервере как mail.ru все осмысленные адреса давно уже заняты. Комбинируя адреса почтовых серверов с английскими или русскими словами, можно за кратчайшие сроки получить огромное количество адресов, большая часть которых будет реально существовать.
Третий путь основан на том, что Вы сами даете спамеру e-mail адрес. Вы могли зарегистрироваться на каком-нибудь портале, делать покупки в online магазине и т.д. Базу с информацией не только об e-mail адресах, но и другими Вашими данными могли украсть / продать / купить. Что уж говорить об онлайн-информации, если в Москве свободно продаются базы данных паспортного стола. Однажды попав, Ваш адрес так и будет кочевать из одной базы другую, а поток спама на Ваш почтовой ящик будет только возрастать.
Как же противостоять этому?
Первый рубеж обороны
Чтобы Ваш адрес не попал в базы спамеров, достаточно выполнять несколько простых правил:
- использовать абсолютно бессмысленный адрес, что-то вроде o811yatl@ec7z7v.ru.
- нигде и никогда не публиковать свой e-mail адрес.
- не давать этот адрес никому кроме 2-3 надежных друзей.
Соблюдение этих правил на 99% защитит Вас от спама. Но разве Вам нужна такая электронная почта? Посмотрим, что можно сделать, не используя крайних мер. Можно использовать несколько почтовых ящиков: один для личной переписки с надежными людьми, один для рассылок, один для остального, и множество временных "одноразовых" ящиков для форумов, досок объявлений и т.д. Можно использовать сервисы вроде Spamlock.ru, указывая вместо своего почтового адреса URL сервиса. Но, на мой взгляд, это не очень удобно. Для защиты адресов на HTML-страницах я рекомендую использовать кодирование адреса. В самом деле, в современных браузерах существует множество возможностей для такого способа. Это и использование HTML-кодирования, когда буква "A", например, заменяется ее кодом (т.е. A). Это и всевозможные Java Script, и т.д. Для осуществления кодирования существует много программ. Мною, как автором одной из программ подобного рода (Blackman’s E-mail encoder), была написана статья "Шифруем e-mail адрес", в которой приводится обзор программ для кодирования e-mail адреса (статья была опубликована в Internet Zone #488, и на моем сайте http://www.blackman2003.narod.ru).
Существует также весьма оригинальный метод, основанный на забивании фильтров спам-роботов потоком несуществующих e-mail адресов. На основной странице делается невидимая ссылка (прозрачный gif размером 1×1 пиксель) на страницу с огромным списком несуществующих e-mail’ов. Фильтры спам-робота просто забиваются таким потоком мусора.
Некоторые порталы используют метод ловли на живца. На главной странице указывается специальный e-mail адрес, на который "клюют" спам-роботы. Если одно и то же письмо приходит на этот, а также любой другой из почтовых ящиков данного портала, то можно со 100% уверенностью классифицировать такое письмо как спам.
Но что делать в том случае, если Ваш адрес уже занесен в одну или несколько спамерских баз, и Вам ежедневно приходит десяток рекламных писем?
Второй рубеж обороны
Так же, как несколько лет назад многие почтовые сервера установили антивирусные фильтры, в последнее время крупные порталы (yandex.ru, mail.ru) начинают использовать антиспамовые фильтры.
Это могут быть как простейшие способы (блокировка IP- или e-mail адресов), так и более сложные (блокировка по содержанию или специальной базе активных спамеров).
Но спамеры тоже не зря свой хлеб едят. Борьба спамеров и антиспамовых фильтров все больше и больше напоминает противостояние вирусов и антивирусов, которое, вероятно, никогда не прекратится. Спамеры придумывают все новые и новые трюки. К примеру, никогда не следует отвечать на пришедший спам. Даже если в качестве обратного указан реальный адрес спамера, то отписаться от получения рекламы у Вас вряд ли получится. В некоторых случаях спамеры используют в качестве обратных реальные адреса, но не имеющие никакого отношения к ним самим. И весь поток гневных писем сыплется на человека, который ни в чем не виноват.
Даже в, казалось бы, надежной системе фильтрации по содержимому письма, спамеры нашли много лазеек. В Рунете все началось с использования похожих по начертанию букв. Если Вы не видите разницы между латинской буквой T и русской Т, то для спам-фильтров это два совершенно разных символа. Множество лазеек оставляют HTML-письма. Можно, например, между буквами текста вставить буквы одинакового с фоном цвета. Вы увидите на этом месте только небольшой пропуск, а программа-фильтр это слово не распознает. А что, спрашивается делать, если все письмо состоит из одной-единственной картинки в формате GIF? Никакого текста для фильтрации в таком письме не имеется.
Сражение внутри
Конечно, можно понадеяться на антиспамовые фильтры на почтовом сервере, но не каждый сервер их имеет, да и эффективность их составляет отнюдь не 100%. Как же добиться удаления нежелательной корреспонденции еще на сервере, не скачивая ее целиком? Существует два метода: метод черного списка, и метод белого списка.
Метод черного списка подразумевает ведение какой-либо организацией или сообществом пользователей списка IP-адресов, e-mail адресов или полей "Тема" рекламных писем. Вы скачиваете с сервера только те письма, которые отсутствуют в этом списке, а остальные удаляете даже не просматривая. Конечно, этот способ при всей своей привлекательности имеет несколько минусов: список надо как минимум ежедневно обновлять, и существует вероятность, что трафик самого списка будет превышать поток спама. Кроме того, спамеры действуют очень оперативно, и для качественной фильтрации будет требоваться такая же точно оперативность в обновлении этого списка.
Метод белого списка полностью противоположен: Вы скачиваете с сервера только те письма, отправители которых Вам известны. Конечно, в чистом виде этот метод для многих совершенно неприменим. Если Вам может написать посторонний человек (пользователь программы, посетитель сайта), то используется такой способ: Вы скачиваете с сервера письма только от известных адресатов или содержащие определенную строчку в поле "Тема". Всем остальным автоматически отсылается ответ, в котором указано, что Вы принимаете письма только с такой-то строчкой в поле "тема". Если письмо действительно важно для отправителя, то он еще раз перешлет его. А Ваша почтовая программа, встретив эту строку, занесет адрес отправителя в "белый список". Спамер вряд ли будет отвечать на такое письмо. При существующих размерах рассылок (сотни тысяч и миллионы адресов) это совершенно нереально.
И черный и белый список легко реализуются штатными средствами наиболее распространенных почтовых программ. Например, в The Bat! имеется очень мощная система фильтрации, которую можно настроить на любые нужды. В последней версии Outlook, по слухам, также имеется очень интересная система фильтрации. Кроме того, для целей ведения черного и белого списка имеется много отдельных программ, которые могут быть выполнены как в виде plug-in’ов для почтовых клиентов, так и в качестве самостоятельной программы, которая будет работать как прослойка между сервером и Вашей почтовой программой.
Партизанская война
Для многих важным является не сам факт получения спама (т.е. время и деньги, затраченные на оплату соединения с Интернетом), а время, которое приходится тратить на сортировку писем на нужные и ненужные. Действительно, даже при довольно крупных потоках спама, если Вы забираете почту каждый день, на скачивание ее тратится меньше 1 минуты. А если Вы в это же время предпочитаете посетить пару-тройку сайтов, то этой минутой можно вообще пренебречь.
Во многих почтовых программах в последнее время кроме стандартных папок "Входящие", "Исходящие", "Отправленные" и "Корзина" у каждого ящика, появилась такая папка, как "Спам" ("Junk mail"), в которую должна отсортировываться вся нежелательная корреспонденция. Эта сортировка возможна как вручную, так и при помощи самодельной системы фильтров. Действительно, все рекламные письма имеют в своем тексте что-то общее: в одних предлагают что-нибудь купить, в других — что-то посетить; в одних оставляют свой адрес, в других — телефон. Совсем не сложно выбрать около десятка признаков, по которым можно отнести письма к категории "спам". Эффективность такой системы может составлять 50-75%.
Эти же самые действия можно осуществлять и автоматически. Например, для почтовой программы The Bat! существует много подобных фильтров. Довольно любопытным мне кажется фильтр BayesIt. От других он отличается возможностью обучения. При установке Вы "натравливаете" его на имеющиеся у Вас рекламные письма, а он находит в них наиболее характерные для спама признаки, по которым в дальнейшем и производит сортировку. Таким образом, у Вас получается уникальная система фильтрации, настроенная конкретно на Ваш почтовый ящик.
После боя (вместо заключения)
Что же получается в итоге: война со спамом проиграна? Ведь существующие методы либо не дают 100% защиты от спама, либо создают множество неудобств. Даже при комплексном применении. Вряд ли спасут ситуацию законы о спаме, которые уже принимаются в Европе, и, вероятно, скоро будут приняты у нас. При практически нулевых затратах рассылка спама может давать огромную прибыль. А где есть прибыль, там есть и желающие ее получить.
100% гарантию может дать только отмена анонимности электронной почты и Интернета в целом. Некоторые софтверные гиганты уже пытаются предпринимать шаги в этом направлении, аргументируя их борьбой с пиратством, спамом и терроризмом. Но это уже будет совершенно другой Интернет. Не тот, в котором возможна одурманивающая и всепоглощающая свобода, в котором можно почти все, о котором возникают легенды. Который дал толчок к написанию "Лабиринта отражений" Сергея Лукьяненко.
Я не хочу избавиться от спама такой ценой. А Вы?
Статья была опубликована в номере 4 за 2004 год еженедельника Мегабайт