- Dettagli
- Categoria: Area Scientifica
- Scritto da Riccardo Satta
- Visite: 1231
PubbliTesi - La Tesi
Metodi e Algoritmi per il Filtraggio dell’Image Spam
Scheda Sintetica
Autore: Riccardo Satta
Relatore: Fabio Roli
Università: Università degli Studi di Cagliari
Facoltà: Facoltà di Ingegneria
Corso: Laurea Spec. in Ingegneria Elettronica
Data di Discussione: 19/10/2007
Voto: 110 cum laude
Disciplina: Pattern Recognition, filtraggio dello spam
Lingua: Italiano
Grande Area: Area Scientifica
Settori Interessati: Software House ed enti di ricerca impegnati nello sviluppo di tecniche Antispam
Descrizione:
La tesi si occupa dell’image spam, tecnica di spam nella quale il testo è inserito in una immagine e, spesso, reso illeggibile per un OCR tramite tecniche di oscuramento come caratteri distorti etc..
Attualmente, mancano dataset di riferimento per valutare le tecniche di filtraggio contro l’image spam. Si è quindi sviluppato un generatore di immagini di spam, basato sui metodi di oscuramento usati dagli spammer, che può fornire immagini contenenti testo “oscurato” al livello desiderato. La misura del “livello di oscuramento” è stata definita studiando l’effetto dei parametri di ogni tecnica di oscuramento sull’errore degli OCR.
Il generatore è stato applicato a un’analisi dell’efficacia dell’image spam nell’evadere i filtri attuali, ed in particolare SpamAssassin. Tale analisi è una novità nella letteratura del settore, e ha fornito utili indicazioni per lo sviluppo dei filtri antispam.