Pelican-bot/Stressmeter

Aus Piratenwiki Mirror
Zur Navigation springen Zur Suche springen

Das Stressmeter ist ein Versuch, die "soziale Temperatur" in den zahlreichen von der Piratenpartei genutzten Kanälen zu messen und gegebenenfalls Alarm bei den verantwortlichen Moderatoren zu schlagen.

Das Konzept ist dabei von bayesischen Spamfiltern und Internetsuchmaschinen inspiriert und sieht folgendermaßen aus:

  1. Jeglicher geloggte Chat wird in Elemente aufgeteilt ( http://en.wikipedia.org/wiki/Text_segmentation )
  2. Die Teile werden normalisiert
    1. Nicks werden durch Accountnamen ersetzt, bekannte Nicks ohne Accounts werden auf einen gemeinsamen Bezeichner (möglicherweise manuell) gesetzt.
    2. von Wörtern werden nur die Stämme verwendet. ( http://en.wikipedia.org/wiki/Stemming )
    3. Bekannte Abkürzungen werden durch ganze Wörter ersetzt.
    4. Besondere Satzzeichenfolgen wie "!!!" werden durch Bezeichnungen ersetzt.
  3. Die so erhaltenen normierten Wortfolgen werden in einer Datenbank gespeichert.
  4. Eine "Badword-Liste" (manuell erstellte Liste von Schimpfwörtern etc.) wird verwendet um das System zu initalisieren.
  5. Anhand dieser Liste wird ähnlich dem PageRank-Algorithmus jede Zeile Chat rekursiv indiziert, indem jedes neue Element nach der Nähe zu bereits bewerteten Elementen und der Stellung im Satz bewertet wird, wobei Wörter am Zeilenanfang und am Zeilenende höher gewichtet werden als die in der Mitte. Auch wird der Index von vorangegangener und nachfolgender Zeile in Betracht genommen, falls möglich.
  6. In mehreren Durchläufen dieses Algorithmus werden die Indizes und Gewichte so angepasst, dass es keine wesentlichen Schwankungen der Werte mehr gibt.
  7. Falls der so ermittelte Wert über einem festgelegten Schwellenwert liegt, werden Moderatoren benachrichtigt.
  8. Moderatoren können bewerten ob der Alarm zutrifft oder nicht, und gegebenenfalls selbst Zeilen und Worte als Alarmzeichen deklarieren.
  9. Diese Bewertung wird verwendet um die Gewichte der betroffenen Elemente zu korrigieren, ( http://en.wikipedia.org/wiki/Supervised_learning )