Home-›Foren-›Pegasus Mail-›Pegasus filtert keine erweiterten Zeichensätze
- This topic has 2 Antworten, 2 Stimmen, and was last updated 19:47 um 9. Oktober 2005 by Pegasus.
- AutorBeitrag
- 30. September 2005 um 10:14 #32011UnbekanntParticipant
Moin Community,
habe derzeit ein Verständnis-Problem mit den Zeichensätzen der ISO 8859 Familie. Bei der gibt es ja einen Grundseichensatz der identisch mit dem ASCII Satz ist und bis Nummerierung 127 geht. Ab Nummerierung 160 fangen dann die erweiterten Sätze an, die schrift-spezifische Zeichen enthalten. Für westeuropäische und amerikanische Sprachen wird wird der Satz 8859-1 zusätzlich geladen, für kyrillische Zeichen z.B. die 8859-5. Soweit die Theorie.
Nun hat ein Kollege ein verstärktes Spam Problem und zwar in der Art, dass er massenhaft e-mails erhält, die mit \“fremden\“ Zeichensätzen erstellt worden sind. Das äußert sich dann in wildem Zeichensalat in den Header- und Textbereichen. Zeichen, welche also z.B. in Russland mit dem kyrillischen Zeichensatz eingegeben worden sind, werden hier mit dem westeuropäischen wieder ausgegeben. Nur unter der entsprechenden Nummerierung in der Zeichentabelle steht natürlich nun ein anderes Zeichen, welches ausgegeben wird – es entsteht Kauderwelsch.
Nun enthalten leider nicht alle e-mails eine zusätzliche Zeichensatzangabe, nach der man den Spam-Filter suchen lassen könnte. Also habe ich versucht, bestimmte außergewöhnliche Zeichen zu suchen (z.B. \“ À \“), welche in den Headerbereichen auch zu sehen sind. Da wir derzeit keine skandinavischen Firmen als Partner haben, dürfte solch ein Zeichen eigentlich nicht auftauchen und sollte deshalb ursprünglich durch die \“Übersetzung\“ der Zeichen aus einem anderen Zeichensatz hervorgerufen worden sein.
Doch leider erkennt der Zeichen-Such-Filter diese nicht, obwohl das richtige Zeichen in der Filterdefinition erscheint und auch in der email enthalten ist.
Desweiteren verstehe ich auch Folgendes nicht: Mitunter erhält man kyrillische emails, welche als Text und zusätzlich auch in html generiert worden sind. Darin kann man nun gut die Zeichen vergleichen, weil der html Text in Russisch ausgegeben wird und der Plain Text in Kauderwelsch. Nun müssten die Nummerierungen der einzelnen Zeichen der verschiedenen Zeichensätze doch übereinstimmen, d.h. ein russisches \“Schaa\“ (200) müsste in unserem Zeichensatz ein \“ È \“ ergeben. Tut es aber nicht.Kann mir einer auf die Sprünge helfen?
Ach so: Unser e-mail Client ist Pegasus v4.12a, welches von Haus aus eigentlich recht ordentliche Filterwerkzeuge mitbringt. Habe es mit dem normalen Filter, aber auch mit dem für Reguläre Ausdrücke versucht. Die Zeichen aus dem erweiterten Zeichensatz werden aber ignoriert und die emails deshalb nicht gefiltert.
Gruß
Mülli4. Oktober 2005 um 10:36 #115384UnbekanntParticipantHi,
hat wirklich keiner ein Spam Problem mit kyrillischen oder sonstigen Zeichen, welche dann immer als Zeichensalat im Header erscheinen?
Wie filtert ihr das raus?
Gruß
Mülli9. Oktober 2005 um 19:47 #115838PegasusParticipantHallo Mülli,
schau Dir mal POPFile an: http://popfile.sourceforge.net/manual/de/manual.html.
In Pegasus Mail: http://www.rauhut.name/web/pmaufgebohrt.htm#popfile
Gruß, Pegasus
In eigener Sache: Gesucht wird ein neuer Moderator für das Pegasus Mail Forum. Hast Du Zeit, Lust und das nötige Fachwissen? Dann melde Dich bitte beim Forumsbetreiber.
- AutorBeitrag
Das Thema ‘Pegasus filtert keine erweiterten Zeichensätze’ ist für neue Antworten geschlossen.