Спам-фильтры · 1 min read · Dec 28, 2025

Борьба с изображениями спама с помощью FuzzyOCR и SpamAssassin на Debian/Ubuntu

Борьба с изображениями спама с помощью FuzzyOCR и SpamAssassin на Debian/Ubuntu

Версия 1.0
Автор: Фалко Тимме

Этот учебник описывает, как сканировать электронные письма на наличие изображений спама с помощью FuzzyOCR. FuzzyOCR — это плагин для SpamAssassin, который предназначен для нежелательной массовой почты, содержащей изображения в качестве основного носителя контента. Используя различные методы, он анализирует содержимое и свойства изображений, чтобы различать нормальные письма (ham) и спам-письма. FuzzyOCR пытается поддерживать низкую нагрузку на систему, сканируя только те письма, которые еще не были классифицированы как спам SpamAssassin, тем самым избегая ненужной работы.

Я не даю никаких гарантий, что это сработает для вас!

1 Предварительная заметка

В этой статье я буду использовать Debian Etch в качестве базовой системы. Шаги по установке FuzzyOCR должны быть одинаковыми для систем Ubuntu.

Я предполагаю, что SpamAssassin уже установлен и работает, с /etc/mail/spamassassin/ в качестве его основного каталога конфигурации. Если ваш каталог отличается (например, если у вас установлен ISPConfig, каталог будет /home/admispconfig/ispconfig/tools/spamassassin/etc/mail/spamassassin/), это не проблема. Я укажу, где что изменить.

Пожалуйста, убедитесь, что ваша версия SpamAssassin работает с FuzzyOCR. Например, версия FuzzyOCR, которую я собираюсь установить здесь ( fuzzyocr-3.5.1-devel.tar.gz), требует SpamAssassin 3.1.4 или новее.

2 Установка предварительных требований для FuzzyOCR

FuzzyOCR имеет некоторые предварительные требования, такие как ocrad и gocr, которые мы можем установить следующим образом:

apt-get install netpbm gifsicle libungif-bin gocr ocrad libstring-approx-perl libmldbm-sync-perl imagemagick tesseract-ocr

3 Установка FuzzyOCR

Далее мы загружаем и устанавливаем последнюю версию FuzzyOCR devel с http://fuzzyocr.own-hero.net/wiki/Downloads. Мы загружаем версию devel вместо стабильной версии, потому что разработчики FuzzyOCR говорят:

“Текущая рекомендация — это версия разработки, потому что стабильная версия не имеет функций и очень старая.”

cd /usr/src/  
wget http://users.own-hero.net/~decoder/fuzzyocr/fuzzyocr-3.5.1-devel.tar.gz

Затем мы распаковываем FuzzyOCR и перемещаем все файлы FuzzyOcr* и каталог FuzzyOcr (они все находятся в каталоге FuzzyOcr-3.5.1/) в /etc/mail/spamassassin:

tar xvfz fuzzyocr-3.5.1-devel.tar.gz  
cd FuzzyOcr-3.5.1/  
mv FuzzyOcr* /etc/mail/spamassassin/

Если ваш каталог SpamAssassin отличается, например, /home/admispconfig/ispconfig/tools/spamassassin/etc/mail/spamassassin/, то последнюю команду следует заменить на

mv FuzzyOcr* /home/admispconfig/ispconfig/tools/spamassassin/etc/mail/spamassassin/

Не удаляйте каталог /usr/src/FuzzyOcr-3.5.1/ пока, там есть каталог с образцами изображений спама ( samples/), который нам понадобится позже, чтобы проверить, работает ли FuzzyOCR как ожидалось.

Итак, FuzzyOCR теперь установлен, теперь нам нужно его настроить.

Share: X/Twitter LinkedIn

Get new posts in your inbox

No spam. Unsubscribe anytime.