Спам-фильтры · 1 min read · Dec 28, 2025
Борьба с изображениями спама с помощью FuzzyOCR и SpamAssassin на Debian/Ubuntu
Борьба с изображениями спама с помощью FuzzyOCR и SpamAssassin на Debian/Ubuntu
Версия 1.0
Автор: Фалко Тимме
Этот учебник описывает, как сканировать электронные письма на наличие изображений спама с помощью FuzzyOCR. FuzzyOCR — это плагин для SpamAssassin, который предназначен для нежелательной массовой почты, содержащей изображения в качестве основного носителя контента. Используя различные методы, он анализирует содержимое и свойства изображений, чтобы различать нормальные письма (ham) и спам-письма. FuzzyOCR пытается поддерживать низкую нагрузку на систему, сканируя только те письма, которые еще не были классифицированы как спам SpamAssassin, тем самым избегая ненужной работы.
Я не даю никаких гарантий, что это сработает для вас!
1 Предварительная заметка
В этой статье я буду использовать Debian Etch в качестве базовой системы. Шаги по установке FuzzyOCR должны быть одинаковыми для систем Ubuntu.
Я предполагаю, что SpamAssassin уже установлен и работает, с /etc/mail/spamassassin/ в качестве его основного каталога конфигурации. Если ваш каталог отличается (например, если у вас установлен ISPConfig, каталог будет /home/admispconfig/ispconfig/tools/spamassassin/etc/mail/spamassassin/), это не проблема. Я укажу, где что изменить.
Пожалуйста, убедитесь, что ваша версия SpamAssassin работает с FuzzyOCR. Например, версия FuzzyOCR, которую я собираюсь установить здесь ( fuzzyocr-3.5.1-devel.tar.gz), требует SpamAssassin 3.1.4 или новее.
2 Установка предварительных требований для FuzzyOCR
FuzzyOCR имеет некоторые предварительные требования, такие как ocrad и gocr, которые мы можем установить следующим образом:
apt-get install netpbm gifsicle libungif-bin gocr ocrad libstring-approx-perl libmldbm-sync-perl imagemagick tesseract-ocr3 Установка FuzzyOCR
Далее мы загружаем и устанавливаем последнюю версию FuzzyOCR devel с http://fuzzyocr.own-hero.net/wiki/Downloads. Мы загружаем версию devel вместо стабильной версии, потому что разработчики FuzzyOCR говорят:
“Текущая рекомендация — это версия разработки, потому что стабильная версия не имеет функций и очень старая.”
cd /usr/src/
wget http://users.own-hero.net/~decoder/fuzzyocr/fuzzyocr-3.5.1-devel.tar.gzЗатем мы распаковываем FuzzyOCR и перемещаем все файлы FuzzyOcr* и каталог FuzzyOcr (они все находятся в каталоге FuzzyOcr-3.5.1/) в /etc/mail/spamassassin:
tar xvfz fuzzyocr-3.5.1-devel.tar.gz
cd FuzzyOcr-3.5.1/
mv FuzzyOcr* /etc/mail/spamassassin/Если ваш каталог SpamAssassin отличается, например, /home/admispconfig/ispconfig/tools/spamassassin/etc/mail/spamassassin/, то последнюю команду следует заменить на
mv FuzzyOcr* /home/admispconfig/ispconfig/tools/spamassassin/etc/mail/spamassassin/Не удаляйте каталог /usr/src/FuzzyOcr-3.5.1/ пока, там есть каталог с образцами изображений спама ( samples/), который нам понадобится позже, чтобы проверить, работает ли FuzzyOCR как ожидалось.
Итак, FuzzyOCR теперь установлен, теперь нам нужно его настроить.
Get new posts in your inbox
No spam. Unsubscribe anytime.