version 0.62
[irssistats] / irssistats.c
1 /*
2  * irssistats version 0.62
3  *
4  * This tool generates IRC stats based on irssi logs.
5  * Usage: irssistats [/path/to/file.conf]
6  *
7  * Copyright (C) 2002-2004  Antoine Jacquet <royale@zerezo.com>
8  * http://royale.zerezo.com/irssistats/
9  *
10  * This program is free software; you can redistribute it and/or modify
11  * it under the terms of the GNU General Public License as published by
12  * the Free Software Foundation; either version 2 of the License, or
13  * (at your option) any later version.
14  *
15  * This program is distributed in the hope that it will be useful,
16  * but WITHOUT ANY WARRANTY; without even the implied warranty of
17  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
18  * GNU General Public License for more details.
19  *
20  * You should have received a copy of the GNU General Public License
21  * along with this program; if not, write to the Free Software
22  * Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
23 */
24
25
26 #include <sys/types.h>
27 #include <stdio.h>
28 #include <stdlib.h>
29 #include <time.h>
30 #include <string.h>
31 #include <regex.h>
32
33 /* Config */
34 #define BASEUSERS 1000
35 #define MAXNICKLENGTH 50
36 #define MAXLINELENGTH 2000
37 #define MAXQUOTELENGTH 100
38 #define NBUSERS 50
39 #define NBUSERSTIME 10
40 #define NBURLS 5
41 #define NBTOPICS 5
42 #define NBWORDS 20
43 #define MINWORDLENGTH 5
44
45 /* irssistats */
46 #define VERSION "0.62"
47 #define URL "http://royale.zerezo.com/irssistats/"
48
49 /* Counters */
50 #define D_SMILE     0
51 #define D_FROWN     1
52 #define D_EXCLAM    2
53 #define D_QUESTION  3
54 #define D_ME        4
55 #define D_TOPIC     5
56 #define D_MODE      6
57 #define D_KICK      7
58 #define D_KICKED    8
59 #define D_URL       9
60 #define D_JOIN      10
61 #define D_NICK      11
62 #define D_MONOLOGUE 12
63 #define NBCOUNTERS  13
64 char *counters[NBCOUNTERS]={"C_SMILE","C_FROWN","C_EXCLAM","C_QUESTION","C_ME","C_TOPIC","C_MODE","C_KICK","C_KICKED","C_URL","C_JOIN","C_NICK","C_MONOLOGUE"};
65
66 /* Languages */
67 #define NBLANGUAGES 11
68 #define NBKEYS 39
69 char *keys[NBLANGUAGES][NBKEYS+1][2]= /* first key used for language name and abbreviation */
70 {
71   { /* English language */
72     { "English",      "en" },
73     { "CHARSET",      "ISO-8859-1" },
74     { "HEADER",       "Statistics for %s by %s" },
75     { "LEGEND",       "Legend" },
76     { "LASTDAYS",     "Lastdays statistics" },
77     { "TOPHOURS",     "Hourly statistics" },
78     { "TOPUSERS",     "Most active people" },
79     { "OTHERS",       "There are %d left not ranked..." },
80     { "NBLINES",      "lines" },
81     { "NICK",         "nick" },
82     { "AVGLETTERS",   "letters/lines" },
83     { "HOURS",        "hours" },
84     { "QUOTE",        "random message" },
85     { "TOPUSERSTIME", "Most active people by time of day" },
86     { "RANDTOPICS",   "Some topics" },
87     { "CHANGEDBY",    "changed by" },
88     { "NEWTOPIC",     "new topic" },
89     { "RANDURLS",     "Some URLs" },
90     { "POSTEDBY",     "posted by" },
91     { "POSTEDURL",    "URL" },
92     { "TOPWORDS",     "Most used words" },
93     { "WORD",         "word" },
94     { "OCCURRENCES",  "occurrences" },
95     { "BIGNUMBERS",   "Some big numbers..." },
96     { "NUMBERS",      "numbers" },
97     { "TIME",         "%d lines (%d days) parsed in %d seconds" },
98     { "FOOTER",       "Statistics generated by" },
99     { "C_SMILE",      "is often happy :)" },
100     { "C_FROWN",      "is often sad :(" },
101     { "C_EXCLAM",     "yells a lot !" },
102     { "C_QUESTION",   "asks a lot of questions ?" },
103     { "C_ME",         "likes /me command" },
104     { "C_TOPIC",      "often changes the topic" },
105     { "C_MODE",       "often changes the modes" },
106     { "C_KICK",       "likes to /kick" },
107     { "C_KICKED",     "is often kicked" },
108     { "C_URL",        "posts many URLs" },
109     { "C_JOIN",       "doesn't know wether to stay or quit" },
110     { "C_NICK",       "often changes his nick" },
111     { "C_MONOLOGUE",  "speaks a lot of monologues" }
112   },
113   { /* French language */
114     { "French",       "fr" },
115     { "CHARSET",      "ISO-8859-1" },
116     { "HEADER",       "Statistiques de %s par %s" },
117     { "LEGEND",       "L&eacute;gende" },
118     { "LASTDAYS",     "Statistiques des derniers jours" },
119     { "TOPHOURS",     "Statistiques horaires" },
120     { "TOPUSERS",     "Personnes les plus actives" },
121     { "OTHERS",       "Il reste %d personnes non class&eacute;es..." },
122     { "NBLINES",      "lignes" },
123     { "NICK",         "nick" },
124     { "AVGLETTERS",   "lettres/lignes" },
125     { "HOURS",        "heures" },
126     { "QUOTE",        "message al&eacute;atoire" },
127     { "TOPUSERSTIME", "Personnes les plus actives par p&eacute;riode de la journ&eacute;e" },
128     { "RANDTOPICS",   "Quelques topics" },
129     { "CHANGEDBY",    "chang&eacute; par" },
130     { "NEWTOPIC",     "nouveau topic" },
131     { "RANDURLS",     "Quelques URLs" },
132     { "POSTEDBY",     "post&eacute;e par" },
133     { "POSTEDURL",    "URL" },
134     { "TOPWORDS",     "Mots les plus utilis&eacute;s" },
135     { "WORD",         "mot" },
136     { "OCCURRENCES",  "occurrences" },
137     { "BIGNUMBERS",   "Quelques grands nombres..." },
138     { "NUMBERS",      "nombres" },
139     { "TIME",         "%d lignes (%d jours) trait&eacute;es en %d secondes" },
140     { "FOOTER",       "Statistiques g&eacute;n&eacute;r&eacute;es par" },
141     { "C_SMILE",      "est souvent heureux :)" },
142     { "C_FROWN",      "est souvent triste :(" },
143     { "C_EXCLAM",     "hurle beaucoup !" },
144     { "C_QUESTION",   "pose beaucoup de questions ?" },
145     { "C_ME",         "aime la commande /me" },
146     { "C_TOPIC",      "change souvent le topic" },
147     { "C_MODE",       "change souvent les modes" },
148     { "C_KICK",       "aime la commande /kick" },
149     { "C_KICKED",     "est souvent kick&eacute;" },
150     { "C_URL",        "poste beaucoup d'URLs" },
151     { "C_JOIN",       "ne sait pas s'il doit rester ou partir" },
152     { "C_NICK",       "change souvent de nick" },
153     { "C_MONOLOGUE",  "parle beaucoup de monologues" }
154   },
155   { /* German language */
156     /* contributed by Valentin Gelhorn <valentin.gelhorn@web.de> */
157     { "German",       "de" },
158     { "CHARSET",      "ISO-8859-1" },
159     { "HEADER",       "Statistiken f&uuml;r %s von %s" },
160     { "LEGEND",       "Legende" },
161     { "LASTDAYS",     "Statistik der letzten Tage" },
162     { "TOPHOURS",     "St&uuml;ndliche Statistik" },
163     { "TOPUSERS",     "Die aktivsten Personen" },
164     { "OTHERS",       "Es bleiben noch %d uneingetragene" },
165     { "NBLINES",      "Zeilen" },
166     { "NICK",         "Nick" },
167     { "AVGLETTERS",   "Buchstaben/Zeile" },
168     { "HOURS",        "Stunden" },
169     { "QUOTE",        "Zuf&auml;llig ausgewaehlte Zitate" },
170     { "TOPUSERSTIME", "Die aktivsten Personen zur bestimmten Tageszeit" },
171     { "RANDTOPICS",   "Ein paar Topics" },
172     { "CHANGEDBY",    "Gesetzt von" },
173     { "NEWTOPIC",     "Neues topic" },
174     { "RANDURLS",     "Ein paar URLs" },
175     { "POSTEDBY",     "Geschrieben von" },
176     { "POSTEDURL",    "URL" },
177     { "TOPWORDS",     "Am h&auml;ufigsten benutze W&ouml;rter" },
178     { "WORD",         "Wort" },
179     { "OCCURRENCES",  "Vorkommen" },
180     { "BIGNUMBERS",   "Ein paar grosse Zahlen" },
181     { "NUMBERS",      "Zahlen" },
182     { "TIME",         "%d Zeilen (%d Tage) analysiert in %d Sekunden" },
183     { "FOOTER",       "Statistiken wurden erstellt von" },
184     { "C_SMILE",      "ist oft gl&uuml;klich :)" },
185     { "C_FROWN",      "ist oft traurig :(" },
186     { "C_EXCLAM",     "schreit oft !" },
187     { "C_QUESTION",   "stellt viele Fragen ?" },
188     { "C_ME",         "mag /me'en" },
189     { "C_TOPIC",      "aendert oft das Topico" },
190     { "C_MODE",       "aendert oft die Modes" },
191     { "C_KICK",       "mag /kick'en" },
192     { "C_KICKED",     "wird oft gekickt"},
193     { "C_URL",        "schreibt viele URLs"},
194     { "C_JOIN",       "kann sich nicht entscheiden ob er bleiben oder gehen soll" },
195     { "C_NICK",       "&auml;ndert oft seinen Nick" },
196     { "C_MONOLOGUE",  "spricht oft Monologe" }
197   },
198   { /* Spanish language */
199     /* contributed by Alex <ainaker@gmx.net> */
200     { "Spanish",      "es" },
201     { "CHARSET",      "ISO-8859-1" },
202     { "HEADER",       "Estad&iacute;sticas de %s por %s" },
203     { "LEGEND",       "Leyenda" },
204     { "LASTDAYS",     "Estad&iacute;sticas de los &uacute;ltimos d&iacute;as" },
205     { "TOPHOURS",     "Estad&iacute;sticas por horas" },
206     { "TOPUSERS",     "Los que m&aacute;s escriben" },
207     { "OTHERS",       "Hay %d m&aacute;s que no llegaron..." },
208     { "NBLINES",      "l&iacute;neas" },
209     { "NICK",         "nick" },
210     { "AVGLETTERS",   "letras por l&iacute;nea" },
211     { "HOURS",        "horas" },
212     { "QUOTE",        "Frase aleatoria" },
213     { "TOPUSERSTIME", "Los que m&aacute;s escriben seg&uacute;n la hora" },
214     { "RANDTOPICS",   "Algunos topics" },
215     { "CHANGEDBY",    "Puestos por" },
216     { "NEWTOPIC",     "topic" },
217     { "RANDURLS",     "Algunas URLs" },
218     { "POSTEDBY",     "puestas por" },
219     { "POSTEDURL",    "URL" },
220     { "TOPWORDS",     "Palabras m&aacute;s usadas" },
221     { "WORD",         "Palabra" },
222     { "OCCURRENCES",  "Frecuencia" },
223     { "BIGNUMBERS",   "Algunos datos..." },
224     { "NUMBERS",      "N&uacute;mero de veces" },
225     { "TIME",         "%d lineas (%d d&iacute;as) procesadas en %d segundos" },
226     { "FOOTER",       "Estad&iacute;sticas generadas por" },
227     { "C_SMILE",      "Suele estar fel&iacute;z :)" },
228     { "C_FROWN",      "Suele estar triste :(" },
229     { "C_EXCLAM",     "Grita mucho !" },
230     { "C_QUESTION",   "Hace muchas preguntas ?" },
231     { "C_ME",         "Abusa del comando /me" },
232     { "C_TOPIC",      "Suele cambiar el topic" },
233     { "C_MODE",       "Cambia a veces los modos del canal" },
234     { "C_KICK",       "Le gusta patear" },
235     { "C_KICKED",     "Es pateado con frecuencia" },
236     { "C_URL",        "Pone muchas URLs" },
237     { "C_JOIN",       "No sabe si irse o quedarse" },
238     { "C_NICK",       "Cambia mucho de nick" },
239     { "C_MONOLOGUE",  "Habla solo" }
240   },
241   { /* Polish language */
242     /* contributed by Jakub Jankowski <shasta@atn.pl> */
243     { "Polish",       "pl" },
244     { "CHARSET",      "ISO-8859-2" },
245     { "HEADER",       "Statystyki dla %s zebrane przez %s" },
246     { "LEGEND",       "Legenda" },
247     { "LASTDAYS",     "Statystyki z ostatnich dni" },
248     { "TOPHOURS",     "Statystyki godzinowe" },
249     { "TOPUSERS",     "Najaktywniejsi" },
250     { "OTHERS",       "Jest jeszcze %d nie sklasyfikowanych..." },
251     { "NBLINES",      "linii" },
252     { "NICK",         "nick" },
253     { "AVGLETTERS",   "liter/liniê" },
254     { "HOURS",        "godziny" },
255     { "QUOTE",        "losowa wypowied¼" },
256     { "TOPUSERSTIME", "Najaktywniejsi wed³ug pory dnia" },
257     { "RANDTOPICS",   "Kilka topików" },
258     { "CHANGEDBY",    "ustawiony przez" },
259     { "NEWTOPIC",     "topik" },
260     { "RANDURLS",     "Kilka URL-i" },
261     { "POSTEDBY",     "poda³(a)" },
262     { "POSTEDURL",    "URL" },
263     { "TOPWORDS",     "Najczê¶ciej wystêpuj±ce s³owa" },
264     { "WORD",         "s³owo" },
265     { "OCCURRENCES",  "wyst±pieñ" },
266     { "BIGNUMBERS",   "Kilka wielkopomnych liczb..." },
267     { "NUMBERS",      "kategorie" },
268     { "TIME",         "Dokonano analizy %d linii (obejmuj±cych %d dni) w czasie %d sekund" },
269     { "FOOTER",       "Statystyki wygenerowane przez" },
270     { "C_SMILE",      "jest czêsto szczesliwy(a) :)" },
271     { "C_FROWN",      "jest czêsto smutny(a) :(" },
272     { "C_EXCLAM",     "czêsto KRZYCZY!" },
273     { "C_QUESTION",   "zadaje du¿o pytañ?" },
274     { "C_ME",         "lubi u¿ywaæ /me" },
275     { "C_TOPIC",      "czêsto zmienia topik" },
276     { "C_MODE",       "czêsto zmienia tryby kana³u" },
277     { "C_KICK",       "lubi kopaæ" },
278     { "C_KICKED",     "czêsto wykopywany(a)" },
279     { "C_URL",        "podaje du¿o URL-i" },
280     { "C_JOIN",       "nie wie czy zostaæ, czy wyj¶æ" },
281     { "C_NICK",       "czêsto zmienia nick" },
282     { "C_MONOLOGUE",  "uwielbia monologi" }
283   },
284   { /* Polish language */
285     /* contributed by Piotr Jarmuz <coreupper@yahoo.com> */
286     { "Polish",       "pl-old" },
287     { "CHARSET",      "ISO-8859-1" },
288     { "HEADER",       "Statystyki dla %s przez %s" },
289     { "LEGEND",       "Legenda" },
290     { "LASTDAYS",     "Statystyki z ostatnich dni" },
291     { "TOPHOURS",     "Statystyki godzinne" },
292     { "TOPUSERS",     "Najaktywniejsi ludzie" },
293     { "OTHERS",       "Zostalo jeszcze %d nie sklasyfikowanych..." },
294     { "NBLINES",      "linie" },
295     { "NICK",         "nick" },
296     { "AVGLETTERS",   "litery/linie" },
297     { "HOURS",        "godziny" },
298     { "QUOTE",        "przypadkowa wiadomosc" },
299     { "TOPUSERSTIME", "Najaktywniejsi ludzie wedlug czasu dnia" },
300     { "RANDTOPICS",   "Pare tematow" },
301     { "CHANGEDBY",    "zmienione przez" },
302     { "NEWTOPIC",     "nowy temat" },
303     { "RANDURLS",     "Pare URL-i" },
304     { "POSTEDBY",     "wyslane przez" },
305     { "POSTEDURL",    "URL" },
306     { "TOPWORDS",     "Najczestsze slowa" },
307     { "WORD",         "slowo" },
308     { "OCCURRENCES",  "wystapienia" },
309     { "BIGNUMBERS",   "Pare wielkich liczb..." },
310     { "NUMBERS",      "liczby" },
311     { "TIME",         "%d linii (%d dni) sparsowanych w %d sekund" },
312     { "FOOTER",       "Statystyki wygenerowane przez" },
313     { "C_SMILE",      "jest czesto szczesliwy :)" },
314     { "C_FROWN",      "jest czesto smutny :(" },
315     { "C_EXCLAM",     "duzo krzyczy !" },
316     { "C_QUESTION",   "zadaje duzo pytan ?" },
317     { "C_ME",         "lubi /mnie polecenie" },
318     { "C_TOPIC",      "czesto zmienia temat" },
319     { "C_MODE",       "czesto zmienia tryb" },
320     { "C_KICK",       "lubi /kopac" },
321     { "C_KICKED",     "czesto go wykopuja" },
322     { "C_URL",        "wysyla duzo URL-i" },
323     { "C_JOIN",       "nie wie czy zostac czy wyjsc" },
324     { "C_NICK",       "czesto zmienia swojego nicka" },
325     { "C_MONOLOGUE",  "czesto mowi monologiem" }
326   },
327   { /* Finnish language */
328     /* contributed by Antti Huopana <ahuopana@ratol.fi> */
329     { "Finnish",      "fi" },
330     { "CHARSET",      "ISO-8859-1" },
331     { "HEADER",       "Kanavan %s tilastot - %s" },
332     { "LEGEND",       "Merkkien selitykset" },
333     { "LASTDAYS",     "Viime päivien tilastot" },
334     { "TOPHOURS",     "Tilastot tunneittain" },
335     { "TOPUSERS",     "Aktiivisimmat ihmiset" },
336     { "OTHERS",       "Jäljelle jäi %d joita ei listattu..." },
337     { "NBLINES",      "rivit" },
338     { "NICK",         "nikki" },
339     { "AVGLETTERS",   "kirjainta/rivi" },
340     { "HOURS",        "tunnit" },
341     { "QUOTE",        "satunnainen viesti" },
342     { "TOPUSERSTIME", "Vuorokauden ajan mukaan aktiivisimmat" },
343     { "RANDTOPICS",   "Joitakin aiheita" },
344     { "CHANGEDBY",    "vaihtaja" },
345     { "NEWTOPIC",     "aihe" },
346     { "RANDURLS",     "Joitakin URLeja" },
347     { "POSTEDBY",     "lähettäjä" },
348     { "POSTEDURL",    "URL" },
349     { "TOPWORDS",     "Eniten käytettyjä sanoja" },
350     { "WORD",         "sana" },
351     { "OCCURRENCES",  "käytetty" },
352     { "BIGNUMBERS",   "Joitakin isoja lukuja..." },
353     { "NUMBERS",      "luvut" },
354     { "TIME",         "%d riviä (%d päivää) parsittu %d sekunnissa" },
355     { "FOOTER",       "Tilastot on generoinut" },
356     { "C_SMILE",      "on usein iloinen :)" },
357     { "C_FROWN",      "on usein surullinen :(" },
358     { "C_EXCLAM",     "möykkää paljon !" },
359     { "C_QUESTION",   "kyselee liikaa ?" },
360     { "C_ME",         "pitää itsestään" },
361     { "C_TOPIC",      "vaihtaa usein aihetta" },
362     { "C_MODE",       "haluaa elää muuttuvassa maailmassa" },
363     { "C_KICK",       "pitää potkimisesta" },
364     { "C_KICKED",     "tykkää tulla potkituksi" },
365     { "C_URL",        "surffailee liikaa" },
366     { "C_JOIN",       "ei tiedä ollakko vai eikö olla" },
367     { "C_NICK",       "kärsii identiteettiongelmista" },
368     { "C_MONOLOGUE",  "höpöttää paljon itsekseen" }
369   },
370   { /* Italian language */
371     /* contributed by Coviello Giuseppe <giuseppecoviello@tin.it> <http://coviello.altervista.org> */
372     { "Italian",      "it" },
373     { "CHARSET",      "ISO-8859-1" },
374     { "HEADER",       "Statistiche per il canale %s di %s" },
375     { "LEGEND",       "Legenda" },
376     { "LASTDAYS",     "Statistiche degli ultimi giorni" },
377     { "TOPHOURS",     "Statistiche in ore" },
378     { "TOPUSERS",     "Utenti pi&ugrave; attivi" },
379     { "OTHERS",       "Ci sono %d utenti non classificati..." },
380     { "NBLINES",      "righe" },
381     { "NICK",         "nick" },
382     { "AVGLETTERS",   "lettere/righe" },
383     { "HOURS",        "ore" },
384     { "QUOTE",        "messaggio casuale" },
385     { "TOPUSERSTIME", "Utenti più attivi del giorno (divisi per fasce orarie)" },
386     { "RANDTOPICS",   "Alcuni topic" },
387     { "CHANGEDBY",    "cambiato da" },
388     { "NEWTOPIC",     "nuovo topic" },
389     { "RANDURLS",     "ALcuni URL" },
390     { "POSTEDBY",     "postato da" },
391     { "POSTEDURL",    "URL" },
392     { "TOPWORDS",     "Le parole più usate" },
393     { "WORD",         "parola" },
394     { "OCCURRENCES",  "usata" },
395     { "BIGNUMBERS",   "Alcuni numeri ..." },
396     { "NUMBERS",      "numeri" },
397     { "TIME",         "%d righe (%d giorni) esaminate in %d secondi" },
398     { "FOOTER",       "Statistiche generate da" },
399     { "C_SMILE",      "è spesso felice :)" },
400     { "C_FROWN",      "è spesso triste :(" },
401     { "C_EXCLAM",     "esclama molto !" },
402     { "C_QUESTION",   "fa molte domande ?" },
403     { "C_ME",         "ama il comando /me" },
404     { "C_TOPIC",      "cambia spesso il topic" },
405     { "C_MODE",       "cambia spesso i mode" },
406     { "C_KICK",       "ama /kick(are)" },
407     { "C_KICKED",     "è kickato spesso" },
408     { "C_URL",        "posta molti URL" },
409     { "C_JOIN",       "non sa se è ora di andare o restare" },
410     { "C_NICK",       "cambia spesso il nick" },
411     { "C_MONOLOGUE",  "fa molti monologhi" }
412   },
413   { /* Dutch language */
414     /* contributed by Jeroen Ubbink <crasp@blackbyte.nl> */
415     { "Dutch",        "nl" },
416     { "CHARSET",      "ISO-8859-1" },
417     { "HEADER",       "Statistieken voor %s door %s" },
418     { "LEGEND",       "Legenda" },
419     { "LASTDAYS",     "Statistieken van de laatste dagen" },
420     { "TOPHOURS",     "Statistieken per uur" },
421     { "TOPUSERS",     "Meest actieve mensen" },
422     { "OTHERS",       "Er zijn nog %d niet in de top..." },
423     { "NBLINES",      "regels" },
424     { "NICK",         "nick" },
425     { "AVGLETTERS",   "letters/lijn" },
426     { "HOURS",        "uren" },
427     { "QUOTE",        "Willekeurige regel" },
428     { "TOPUSERSTIME", "Meest actieve mensen per tijdstip per dag" },
429     { "RANDTOPICS",   "Enkele topics" },
430     { "CHANGEDBY",    "gewijzigd door" },
431     { "NEWTOPIC",     "nieuwe topic" },
432     { "RANDURLS",     "Enkele URLs" },
433     { "POSTEDBY",     "Geplaatst door" },
434     { "POSTEDURL",    "URL" },
435     { "TOPWORDS",     "Meest gebruikte woorden" },
436     { "WORD",         "woord" },
437     { "OCCURRENCES",  "aantal" },
438     { "BIGNUMBERS",   "Enkele grote aantallen..." },
439     { "NUMBERS",      "numbers" },
440     { "TIME",         "%d regels (%d dagen) verwerkt in %d seconden" },
441     { "FOOTER",       "Statistieken gegenereert door" },
442     { "C_SMILE",      "is vaak vrolijk :)" },
443     { "C_FROWN",      "is vaak droevig :(" },
444     { "C_EXCLAM",     "schreeuwt veel !" },
445     { "C_QUESTION",   "stelt veel vragen ?" },
446     { "C_ME",         "vindt /me een leuk commando" },
447     { "C_TOPIC",      "verandert vaak de topic" },
448     { "C_MODE",       "verandert vaak de modes" },
449     { "C_KICK",       "vindt /kick erg leuk" },
450     { "C_KICKED",     "wordt vaak gekickt" },
451     { "C_URL",        "plaatst veel URLs" },
452     { "C_JOIN",       "twijfelt tussen blijven of gaan" },
453     { "C_NICK",       "verandert vaak van nick" },
454     { "C_MONOLOGUE",  "spreekt veel monologen" }
455   },
456   { /* Russian language */
457     /* contributed by kamikaze <kamikaze@rss.lv> */
458     { "Russian",      "ru" },
459     { "CHARSET",      "KOI8-R" },
460     { "HEADER",       "óÔÁÔÉÓÔÉËÁ ÄÌÑ %s ÏÔ %s" },
461     { "LEGEND",       "ïÂÏÚÎÁÞÅÎÉÑ" },
462     { "LASTDAYS",     "óÔÁÔÉÓÔÉËÁ ÐÏÓÌÅÄÎÉÈ ÄÎÅÊ" },
463     { "TOPHOURS",     "ðÏÞÁÓÏ×ÁÑ ÓÔÁÔÉÓÔÉËÁ" },
464     { "TOPUSERS",     "áËÔÉ×ÎÅÊÛÉÅ ÌÀÄÉ" },
465     { "OTHERS",       "ïÓÔÁÌÏÓØ %d ÎÅÐÏÄÓÞÉÔÁÎÙÈ..." },
466     { "NBLINES",      "ÓÔÒÏËÉ" },
467     { "NICK",         "ÎÉË" },
468     { "AVGLETTERS",   "ÂÕË×Ù/ÓÔÒÏËÉ" },
469     { "HOURS",        "ÞÁÓÙ" },
470     { "QUOTE",        "ÓÌÕÞÁÊÎÏÅ ÓÏÏÂÝÅÎÉÅ" },
471     { "TOPUSERSTIME", "áËÔÉ×ÎÅÊÛÉÅ ÌÀÄÉ ÐÏ ×ÒÅÍÅÎÉ ÄÎÑ" },
472     { "RANDTOPICS",   "îÅÓËÏÌØËÏ ÔÏÐÉËÏ×" },
473     { "CHANGEDBY",    "ÉÚÍÅΣÎ" },
474     { "NEWTOPIC",     "ÎÏ×ÙÊ ÔÏÐÉË" },
475     { "RANDURLS",     "îÅÓËÏÌØËÏ URLÏ×" },
476     { "POSTEDBY",     "ÏÐÕÂÌÉËÏ×ÁÌ" },
477     { "POSTEDURL",    "URL" },
478     { "TOPWORDS",     "þÁÓÔÏ ÉÓÐÏÌØÚÕÅÍÙÅ ÓÌÏ×Á" },
479     { "WORD",         "ÓÌÏ×Ï" },
480     { "OCCURRENCES",  "ÐÒÏÉÛÅÓÔ×ÉÑ" },
481     { "BIGNUMBERS",   "îÅÓËÏÌØËÏ ÂÏÌØÛÉÈ ÞÉÓÅÌ..." },
482     { "NUMBERS",      "ÞÉÓÌÁ" },
483     { "TIME",         "%d ÓÔÒÏË (%d ÄÎÅÊ) ÏÂÒÁÂÏÔÁÎÏ ÚÁ %d ÓÅËÕÎÄ" },
484     { "FOOTER",       "óÔÁÔÉÓÔÉËÁ ÓÇÅÎÅÒÉÒÏ×ÁÎÁ" },
485     { "C_SMILE",      "ÞÁÓÔÏ ÓÞÁÓÌÉ× :)" },
486     { "C_FROWN",      "ÞÁÓÔÏ ÎÅÓÞÁÓÔÅΠ:(" },
487     { "C_EXCLAM",     "ÍÎÏÇÏ ×ÏÓËÌÉÃÁÅÔ !" },
488     { "C_QUESTION",   "ÚÁÄÁ£Ô ÍÎÏÇÏ ×ÏÐÒÏÓÏ× ?" },
489     { "C_ME",         "ÌÀÂÉÔ /me command" },
490     { "C_TOPIC",      "ÞÁÓÔÏ ÍÅÎÑÅÔ ÔÏÐÉË" },
491     { "C_MODE",       "ÞÁÓÔÏ ÍÅÎÑÅÔ ÒÅÖÉÍÙ" },
492     { "C_KICK",       "ÌÀÂÉÔ /kick" },
493     { "C_KICKED",     "ÞÁÓÔÏ ×ÙËÉÄÙ×ÁÀÔ" },
494     { "C_URL",        "ÐÕÂÌÉËÕÅÔ ÍÎÏÇÏ URLÏ×" },
495     { "C_JOIN",       "ÎÅ ÚÎÁÅÔ - ÏÓÔÁÔØÓÑ ÉÌÉ ÕÊÔÉ" },
496     { "C_NICK",       "ÞÁÓÔÏ ÍÅÎÑÅÔ Ó×ÏÊ ÎÉË" },
497     { "C_MONOLOGUE",  "éÓÐÏÌØÚÕÅÔ ÍÎÏÇÏ ÍÏÎÏÌÏÇÏ×" }
498   },
499   { /* Estonian language */
500     /* contributed by Martin Vool <mardicas@hot.ee> */
501     { "Estonian",     "et" },
502     { "CHARSET",      "ISO-8859-4" },
503     { "HEADER",       "Statistika kanalile %s on koostanud %s" },
504     { "LEGEND",       "Legend" },
505     { "LASTDAYS",     "Viimaste päevade statistika" },
506     { "TOPHOURS",     "Tunni statistika" },
507     { "TOPUSERS",     "Kõige aktiivsemad inimesed" },
508     { "OTHERS",       "%d inimest on rääkinud" },
509     { "NBLINES",      "rida" },
510     { "NICK",         "nimi" },
511     { "AVGLETTERS",   "tähte/rida" },
512     { "HOURS",        "kell" },
513     { "QUOTE",        "suvaline teade" },
514     { "TOPUSERSTIME", "Kõige aktiivsemad inimesed päeva aja järgi" },
515     { "RANDTOPICS",   "Mõned topicud" },
516     { "CHANGEDBY",    "muutis" },
517     { "NEWTOPIC",     "topicud" },
518     { "RANDURLS",     "Mõned aadressid" },
519     { "POSTEDBY",     "postitas" },
520     { "POSTEDURL",    "URL" },
521     { "TOPWORDS",     "Enim kasutatud sõnad" },
522     { "WORD",         "sõna" },
523     { "OCCURRENCES",  "sagedus" },
524     { "BIGNUMBERS",   "Mõned suured numbrid" },
525     { "NUMBERS",      "iseloom" },
526     { "TIME",         "%d rida (%d päeva) on möödunud %d sekundit" },
527     { "FOOTER",       "Statistika on koostanud" },
528     { "C_SMILE",      "on tihti õnnelik :)" },
529     { "C_FROWN",      "on tihti kurb :(" },
530     { "C_EXCLAM",     "põrnitseb palju" },
531     { "C_QUESTION",   "küsib palju küsimusi" },
532     { "C_ME",         "/me manjakk" },
533     { "C_TOPIC",      "vahetab tihti topicut" },
534     { "C_MODE",       "vahetab tihti modesid" },
535     { "C_KICK",       "kickib palju" },
536     { "C_KICKED",     "saab tihti kicke" },
537     { "C_URL",        "reklaamib palju" },
538     { "C_JOIN",       "sõelub sisse ja välja" },
539     { "C_NICK",       "vahetab pidevalt nime" },
540     { "C_MONOLOGUE",  "räägib palju monolooge" }
541   }
542 };
543
544 int language=0; /* default to english */
545
546 char *L(char *key)
547 {
548   int i;
549   for (i=1;i<=NBKEYS;i++) if (strcmp(key,keys[language][i][0])==0) return(keys[language][i][1]);
550   fprintf(stderr,"unknown language key: %s\n",key);
551   return("");
552 }
553
554 /* Variables */
555
556 int debug=1; /* 0 = none ; 1 = normal ; 2 = verbose */
557 char channel[MAXLINELENGTH]="set_channel_in_config_file";
558 char maintainer[MAXLINELENGTH]="set_maintainer_in_config_file";
559 char theme[MAXLINELENGTH]="default,blue,dark,grayscale,namour,pisg,zeduel,zerezo";
560 int refresh_time=0; /* 0 = disabled */
561 int w3c_link=1; /* 0 = disabled */
562 char header[MAXLINELENGTH]="none";
563 char footer[MAXLINELENGTH]="none";
564 int totallines=0;
565 time_t debut;
566 int top_words=1; /* 0 = disabled */
567 int ranking=0; /* 0 = lines ; 1 = words ; 2 = letters */
568 int quarter=0; /* 1 = enabled */
569
570 struct user
571 {
572   char nick[MAXNICKLENGTH];
573   int lines;
574   int words;
575   int letters;
576   int hours[4];
577   char quote[MAXQUOTELENGTH+1];
578   int counters[NBCOUNTERS];
579   int temp;
580 } *users;
581 int nbusers=0;
582 int maxusers=BASEUSERS;
583
584 struct
585 {
586   char nick[MAXNICKLENGTH];
587   char url[MAXLINELENGTH];
588   char shorturl[MAXQUOTELENGTH+1];
589 } urls[NBURLS];
590 int nburls=0;
591
592 struct
593
594   char nick[MAXNICKLENGTH];
595   char topic[MAXQUOTELENGTH+1];
596 } topics[NBTOPICS];
597 int nbtopics=0;
598
599 struct
600 {
601   int lines;
602   int hours[4];
603 } lastdays[31];
604 int days=0;
605
606 int hours[24*4];
607 int lines=0;
608
609 struct letter
610 {
611   int nb;
612   struct letter *next[26];
613 } words;
614
615 struct
616 {
617   int nb;
618   char word[MAXLINELENGTH];
619 } topwords[NBWORDS];
620
621 #define isletter(c) (((c>='a')&&(c<='z'))||((c>='A')&&(c<='Z')))
622 #define lowercase(c) (((c>='A')&&(c<='Z'))?c-'A'+'a':c)
623 int findwords(char *message)
624 {
625   int i,c,n=0;
626   struct letter *pos,*tmp;
627   for (;;)
628   {
629     while (!isletter(*message)) if (*message=='\0') return n; else message++;
630     pos=&words;
631     while (isletter(*message))
632     {
633       c=lowercase(*message)-'a';
634       if (pos->next[(int)c]==NULL)
635       {
636         tmp=malloc(sizeof(struct letter));
637         if (tmp==NULL)
638         {
639           fprintf(stderr, "findwords(): malloc failure\n");
640           exit(1);
641         }
642         tmp->nb=0;
643         for (i=0;i<26;i++) tmp->next[i]=NULL;
644         pos->next[(int)c]=tmp;
645       }
646       pos=pos->next[(int)c];
647       message++; 
648     }
649     pos->nb++;
650     n++;
651   }
652   return n;
653 }
654
655 char tempword[MAXLINELENGTH];
656 void bestwords(struct letter pos,int cur)
657 {
658   int i,j;
659   if ((cur>=MINWORDLENGTH)&&(pos.nb>topwords[NBWORDS-1].nb))
660   {
661     for (i=0;pos.nb<topwords[i].nb;i++);
662     for (j=NBWORDS-1;j>i;j--)
663     {
664       topwords[j].nb=topwords[j-1].nb;
665       strcpy(topwords[j].word,topwords[j-1].word);
666     }
667     topwords[i].nb=pos.nb;
668     strcpy(topwords[i].word,tempword);
669   }
670   for (i=0;i<26;i++) if (pos.next[i]!=NULL)
671   {
672     tempword[cur]='a'+i;
673     bestwords(*(pos.next[i]),cur+1);
674   }
675   tempword[cur]='\0';
676 }
677
678 void freewords(struct letter *pos)
679 {
680   int i;
681   for (i=0;i<26;i++) if (pos->next[i]!=NULL)
682   {
683     freewords(pos->next[i]);
684     free(pos->next[i]);
685     (*pos).next[i]=NULL;
686   }
687 }
688
689 void printhtml(FILE *fic,char *string) /* replace < and > by &lt; and &gt; */
690 {
691   while (*string!='\0')
692   {
693     switch (*string)
694     {
695       case '<':fprintf(fic,"&lt;"); break;
696       case '>':fprintf(fic,"&gt;"); break;
697       case '&':fprintf(fic,"&amp;"); break;
698       default:fprintf(fic,"%c",*string); break;
699     }
700     string++;
701   }
702   return;
703 }
704
705 int dichotomic(char *nick)
706 {
707   int i,j,start=0,end=nbusers-1,middle;
708   while (start<=end)
709   {
710     middle=(start+end)/2;
711     if (strcmp(nick,users[middle].nick)>0) start=middle+1; else end=middle-1;
712   }
713   if (strcmp(nick,users[start].nick)!=0)
714   {
715     nbusers++;
716     if (nbusers>=maxusers)
717     {
718       maxusers+=BASEUSERS;
719       if (debug==2) fprintf(stderr,"allocating more users : %d\n",maxusers);
720       if ((users=realloc(users,maxusers*sizeof(struct user)))==NULL) { fprintf(stderr,"too many users : unable to realloc memory\n"); exit(1); }
721     }
722     for (i=nbusers-1;i>start;i--)
723     {
724       strcpy(users[i].nick,users[i-1].nick);
725       users[i].lines=users[i-1].lines;
726       users[i].words=users[i-1].words;
727       users[i].letters=users[i-1].letters;
728       for (j=0;j<4;j++) users[i].hours[j]=users[i-1].hours[j];
729       strcpy(users[i].quote,users[i-1].quote);
730       for (j=0;j<NBCOUNTERS;j++) users[i].counters[j]=users[i-1].counters[j];
731       users[i].temp=users[i-1].temp;
732     }
733     strcpy(users[start].nick,nick);
734     users[start].lines=0;
735     users[start].words=0;
736     users[start].letters=0;
737     for (j=0;j<4;j++) users[start].hours[j]=0;
738     users[start].quote[0]='\0';
739     for (j=0;j<NBCOUNTERS;j++) users[start].counters[j]=0;
740     users[start].temp=0;
741   }
742   return(start);
743 }
744
745 void parse_log(char *logfile)
746 {
747   FILE *fic;
748   char line[MAXLINELENGTH];
749   int pos;
750   int i,j;
751   char *nick,*message;
752   int nickstart;
753   int mononick,monolines;
754   int temp,hour;
755
756   if ((fic=fopen(logfile,"rt"))==NULL) { fprintf(stderr,"can't open log file \"%s\"\n",logfile); exit(1); }
757   if (debug) printf("working on %s : ",channel);
758   while (fgets(line,MAXLINELENGTH,fic)!=NULL)
759   {
760     /* remove \n */
761     for (i=0;line[i]!=0;i++);
762     if (i>=MAXLINELENGTH-1) { fprintf(stderr,"line %d is too long\n",totallines); exit(1); }
763     line[i-1]='\0';
764     pos=0;
765     totallines++;
766     if (totallines%10000==0 && debug) { printf("."); fflush(stdout); }
767     if (strncmp("--- Day changed",line,15)==0) /* --- Day changed Wed May 01 2002 */
768     {
769       for (i=30;i>0;i--)
770       {
771         lastdays[i].lines=lastdays[i-1].lines;
772         for (j=0;j<4;j++) lastdays[i].hours[j]=lastdays[i-1].hours[j];
773       }
774       lastdays[0].lines=0;
775       for (j=0;j<4;j++) lastdays[0].hours[j]=0;
776       days++;
777     }
778     else if (strncmp("-!- mode/",&line[6],9)==0) /* 00:00 -!- mode/#channel [...] by (Nick, Nick2, )Nick3 */
779     {
780       for (i=strlen(line);line[i]!=' ';i--);
781       nick=&line[i+1];
782       users[dichotomic(nick)].counters[D_MODE]++;
783     }
784     else if (strncmp("-!-",&line[6],3)==0) /* 00:00 -!- Nick something... */
785     {
786       for (i=10;line[i]!=' ';i++);
787       line[i]='\0';
788       nick=&line[10];
789       message=&line[i+1];
790       if (strncmp("changed the topic of",message,20)==0) /* 00:00 -!- Nick changed the topic of #channel to: new topic */
791       {
792         users[dichotomic(nick)].counters[D_TOPIC]++;
793         for (i=21;message[i]!=':';i++);
794         message=&message[i+2];
795         nbtopics++;
796         if ((nbtopics<=NBTOPICS) || (rand()%(nbtopics/NBTOPICS)==0))
797         {
798           temp=nbtopics<=NBTOPICS?nbtopics-1:rand()%NBTOPICS;
799           strcpy(topics[temp].nick,nick);
800           strncpy(topics[temp].topic,message,MAXQUOTELENGTH);
801         }
802       }
803       else if (strncmp("was kicked from",message,15)==0) /* 00:00 -!- Nick was kicked from #channel by Nick [Reason] */
804       {
805         users[dichotomic(nick)].counters[D_KICKED]++;
806         for (i=16;message[i]!=' ';i++);
807         message=&message[i+4];
808         for (i=0;message[i]!=' ';i++);
809         message[i]='\0';
810         users[dichotomic(message)].counters[D_KICK]++;
811       }
812       else if (strncmp("is now known as",message,15)==0) /* 00:00 -!- Nick is now known as Nick */
813         users[dichotomic(nick)].counters[D_NICK]++;
814       else if (message[0]=='[') /* 00:00 -!- Nick [user@host] something... */
815       {
816         for (i=0;message[i]!=']';i++);
817         message=&message[i+2];
818         if (strncmp("has joined",message,10)==0) /* 00:00 -!- Nick [user@host] has joined #channel */
819           users[dichotomic(nick)].counters[D_JOIN]++;
820         else if (strncmp("has quit",message,8)==0); /* 00:00 -!- Nick [user@host] has quit [Reason] */
821         else if (strncmp("has left",message,8)==0); /* 00:00 -!- Nick [user@host] has left #channel [Reason] */
822         else;
823       }
824     }
825     else if ((line[6]=='<') || (line[7]=='*'))
826     {
827       line[2]='\0';
828       hour=atoi(line);
829       if (line[7]=='*') /* 00:00  * Nick the message */
830       {
831         for (i=9;line[i]!=' ';i++);
832         nick=&line[9];
833         message=&line[i+1];
834       }
835       else if (line[7]=='>') /* 00:00 <>>>?Nick<<<> the personal message */
836                              /* 00:00 <>>?Nick<<> the personal message */
837       {
838         for (i=10;line[i]!='<';i++);
839         nick=&line[10];
840         if (line[9]=='>') nick++;
841         message=&line[i+5];
842       }
843       else /* 00:00 <?Nick> the message */
844       {
845
846         /* 
847          * Irssi doesn't log channel mode with show_nickmode = OFF    
848          * the following covers op, half-op, voice and show_nickmode_empty                 
849          */
850         if (line[7]=='@' || line[7]=='%' || line[7]=='+' || line[7]==' ') {
851             nickstart = 8;
852         } else {
853             nickstart = 7;
854         }
855           
856         for (i=nickstart;line[i]!='>';i++);
857         nick=&line[nickstart];
858         message=&line[i+2];
859       }
860       line[i]='\0';
861       i=dichotomic(nick);
862       if (line[7]=='*') users[i].counters[D_ME]++;
863       if (i==mononick)
864       {
865         monolines++;
866         if (monolines==5) users[i].counters[D_MONOLOGUE]++;
867       }
868       else
869       {
870         mononick=i;
871         monolines=1;
872       }
873       j=strlen(message);
874       users[i].lines++;
875       if (top_words || ranking==1) users[i].words+=findwords(message);
876       users[i].letters+=j;
877       users[i].hours[hour/6]++;
878       lastdays[0].lines++;
879       lastdays[0].hours[hour/6]++;
880       lines++;
881       if (quarter)
882       {
883         line[5]='\0';
884         hour=hour*4+atoi(&line[3])/15;
885       }
886       hours[hour]++;
887       if (message[j-1]=='?') users[i].counters[D_QUESTION]++;
888       else if (message[j-1]=='!') users[i].counters[D_EXCLAM]++;
889       else if ((message[j-3]==' ')&&(message[j-2]==':'))
890       {
891         if (message[j-1]==')') users[i].counters[D_SMILE]++;
892         else if (message[j-1]=='(') users[i].counters[D_FROWN]++;
893       }
894       if (rand()%users[i].lines==0) strncpy(users[i].quote,message,MAXQUOTELENGTH);
895       if (strncmp("http://",message,7)==0)
896       {
897         users[i].counters[D_URL]++;
898         for (i=0;(message[i]!=' ') && (i<strlen(message));i++);
899         message[i]='\0';
900         nburls++;
901         if ((nburls<=NBURLS) || (rand()%(nburls/NBURLS)==0))
902         {
903           temp=nburls<=NBURLS?nburls-1:rand()%NBURLS;
904           strcpy(urls[temp].nick,nick);
905           strcpy(urls[temp].url,message);
906           strncpy(urls[temp].shorturl,message,MAXQUOTELENGTH);
907         }
908       }
909     }
910     pos=0;
911   }
912   fclose(fic);
913   if (debug) printf(" done\n");
914 }
915
916 void parse_nick(char *nickfile)
917 {
918   FILE *fic;
919   int i,j;
920   regex_t preg;
921   char line[MAXLINELENGTH];
922   int user;
923   
924   for (i=0;i<nbusers;i++) users[i].temp=users[i].lines;
925   if ((fic=fopen(nickfile,"rt"))==NULL) { fprintf(stderr,"can't open nick file \"%s\"\n",nickfile); exit(1); }
926   while (fscanf(fic,"%s",line)==1)
927   {
928     user=dichotomic(line);
929     fscanf(fic,"%s",line);
930     if (regcomp(&preg,line,0)!=0) { fprintf(stderr,"error in nick file"); exit(1); }
931     for (i=0;i<nbusers;i++) if ((i!=user) && (regexec(&preg,users[i].nick,0,0,0)==0) && (users[i].lines>=0))
932     {
933       if (users[i].temp>users[user].temp) /* for nick alias, keep the random quote of the most used nick */
934       {
935         strcpy(users[user].quote,users[i].quote);
936         users[user].temp=users[i].temp;
937       }
938       users[user].lines+=users[i].lines;
939       users[user].words+=users[i].words;
940       users[user].letters+=users[i].letters;
941       for (j=0;j<4;j++) users[user].hours[j]+=users[i].hours[j];
942       for (j=0;j<NBCOUNTERS;j++) users[user].counters[j]+=users[i].counters[j];
943       /* "remove" old user */
944       users[i].lines=-1;
945       users[i].words=-1;
946       users[i].letters=-1;
947       for (j=0;j<4;j++) users[i].hours[j]=-1;
948       for (j=0;j<NBCOUNTERS;j++) users[i].counters[j]=-1;
949     }
950     regfree(&preg);
951   }
952   fclose(fic);
953   /* "remove" the ignored nicks */
954   i=dichotomic("<NULL>");
955   users[i].lines=-1;
956   users[i].words=-1;
957   users[i].letters=-1;
958   for (j=0;j<4;j++) users[i].hours[j]=-1;
959   for (j=0;j<NBCOUNTERS;j++) users[i].counters[j]=-1;
960 }
961
962 void gen_xhtml(char *xhtmlfile)
963 {
964   FILE *fic;
965   FILE *sfic;
966   int i,j,k;
967   int user,max,temp;
968   char line[MAXLINELENGTH];
969   char *subtheme;
970   
971   if ((fic=fopen(xhtmlfile,"wt"))==NULL) { fprintf(stderr,"can't open xhtml file \"%s\"\n",xhtmlfile); exit(1); }
972   
973   /* header */
974   if (strcmp("none",header)==0)
975   {
976     fprintf(fic,"<!DOCTYPE html PUBLIC \"-//W3C//DTD XHTML 1.0 Strict//EN\" \"http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd\">\n\n");
977     fprintf(fic,"<!-- Generated by irssistats %s : %s -->\n\n",VERSION,URL);
978     fprintf(fic,"<html>\n\n<head>\n<title>");
979     fprintf(fic,L("HEADER"),channel,maintainer);
980     fprintf(fic,"</title>\n<meta http-equiv=\"Content-Type\" content=\"text/html; charset=%s\" />\n",L("CHARSET"));
981     if (refresh_time)
982       fprintf(fic,"<meta http-equiv=\"Refresh\" content=\"%d\" />\n",refresh_time);
983     subtheme=strtok(theme,",");
984     fprintf(fic,"<link rel=\"stylesheet\" type=\"text/css\" href=\"%s.css\" title=\"%s\" />\n",subtheme,subtheme);
985     while ((subtheme=strtok(NULL,","))!=NULL)
986       fprintf(fic,"<link rel=\"alternate stylesheet\" type=\"text/css\" href=\"%s.css\" title=\"%s\" />\n",subtheme,subtheme);
987     fprintf(fic,"</head>\n\n");
988     fprintf(fic,"<body>\n\n");
989   }
990   else
991   {
992     if ((sfic=fopen(header,"rt"))==NULL) { fprintf(stderr,"can't open header file \"%s\"\n",header); exit(1); }
993     while ((temp=fread(line,1,MAXLINELENGTH,sfic))) fwrite(line,temp,1,fic);
994     fclose(sfic);
995   }
996   fprintf(fic,"<div id=\"irssistats\">\n\n<div id=\"irssistats_header\">\n<h1>");
997   fprintf(fic,L("HEADER"),channel,maintainer);
998   fprintf(fic,"</h1>\n<p>\n%s</p>\n</div>\n\n",ctime(&debut));
999
1000   /* legend */
1001   fprintf(fic,"<div id=\"irssistats_legend\">\n<h2>%s</h2>\n<table>\n<tr>\n",L("LEGEND"));
1002   for (i=0;i<4;i++) fprintf(fic,"<td><div class=\"h%d\" style=\"width: 40px\"></div></td><td>%s %d-%d</td>\n",i+1,L("HOURS"),i*6,i*6+5);
1003   fprintf(fic,"</tr>\n</table>\n</div>\n\n");
1004   
1005   /* last days */
1006   fprintf(fic,"<div id=\"irssistats_lastdays\">\n<h2>%s</h2>\n<table>\n<tr>\n",L("LASTDAYS"));
1007   max=-1;
1008   for (i=30;i>=0;i--) if (lastdays[i].lines>max) max=lastdays[i].lines;
1009   for (i=30;i>=0;i--)
1010   {
1011     fprintf(fic,"<td align=\"center\" valign=\"bottom\"><small>%d</small>",lastdays[i].lines);
1012     for (j=0;j<4;j++) if (lastdays[i].hours[j]!=0) fprintf(fic,"<div class=\"v%d\" style=\"height:%dpx\"></div>",j+1,150*lastdays[i].hours[j]/max);
1013     fprintf(fic,"</td>\n");
1014   }
1015   fprintf(fic,"</tr>\n<tr>\n");
1016   for (i=30;i>=0;i--)
1017     fprintf(fic,"<th>%d</th>\n",i);
1018   fprintf(fic,"</tr>\n</table>\n</div>\n\n");
1019   
1020   /* top hours */
1021   fprintf(fic,"<div id=\"irssistats_tophours\">\n<h2>%s</h2>\n<table>\n<tr>\n",L("TOPHOURS"));
1022   max=-1;
1023   for (i=0;i<24*4;i++) if (hours[i]>max) max=hours[i];
1024   if (quarter) for (i=0;i<24*4;i++)
1025   {
1026     fprintf(fic,"<td align=\"center\" valign=\"bottom\">");
1027     if (hours[i]!=0) fprintf(fic,"<div class=\"v%d\" style=\"width:4px;height:%dpx\"></div>",i/4/6+1,150*hours[i]/max);
1028     fprintf(fic,"</td>\n");
1029   }
1030   else for (i=0;i<24;i++)
1031   {
1032     fprintf(fic,"<td align=\"center\" valign=\"bottom\"><small>%.1f%%</small>",lines!=0?(float)100*hours[i]/lines:0);
1033     if (hours[i]!=0) fprintf(fic,"<div class=\"v%d\" style=\"height:%dpx\"></div>",i/6+1,150*hours[i]/max);
1034     fprintf(fic,"</td>\n");
1035   }
1036   fprintf(fic,"</tr>\n<tr>\n");
1037   for (i=0;i<24;i++)
1038     if (quarter) fprintf(fic,"<th colspan=\"4\">%d</th>\n",i);
1039     else fprintf(fic,"<th>%d</th>\n",i);
1040   fprintf(fic,"</tr>\n</table>\n</div>\n\n");
1041   
1042   /* top users */
1043   fprintf(fic,"<div id=\"irssistats_topusers\">\n<h2>%s</h2>\n",L("TOPUSERS"));
1044   switch (ranking)
1045   {
1046     case 0:
1047       fprintf(fic,"<table>\n<tr><th></th><th>%s</th><th>%s</th><th>%s</th><th colspan=\"2\">%s</th><th>%s</th></tr>\n",L("NICK"),L("NBLINES"),L("HOURS"),L("AVGLETTERS"),L("QUOTE"));
1048       break;
1049     default:
1050       /* "letters" and "words" ranking are not yet translated so we use the generic word "rank" ... */
1051       fprintf(fic,"<table>\n<tr><th></th><th>%s</th><th>%s</th><th>%s</th><th colspan=\"2\">%s</th><th>%s</th></tr>\n",L("NICK"),"rank",L("HOURS"),L("AVGLETTERS"),L("QUOTE"));
1052       break;
1053   }
1054   for (i=1;i<=NBUSERS;i++)
1055   {
1056     user=-1;
1057     max=0;
1058     switch (ranking)
1059     {
1060       case 0:
1061         for (j=0;j<nbusers;j++) if (users[j].lines>max) max=users[user=j].lines;
1062         break;
1063       case 1:
1064         for (j=0;j<nbusers;j++) if (users[j].words>max) max=users[user=j].words;
1065         break;
1066       case 2:
1067         for (j=0;j<nbusers;j++) if (users[j].letters>max) max=users[user=j].letters;
1068         break;
1069     }
1070     if (user!=-1)
1071     {
1072       switch (ranking)
1073       {
1074         case 0:
1075           fprintf(fic,"<tr><td>%d</td><td>%s</td><td>%d</td><td class=\"oneline\">",i,users[user].nick,users[user].lines);
1076           break;
1077         case 1:
1078           fprintf(fic,"<tr><td>%d</td><td>%s</td><td>%d</td><td class=\"oneline\">",i,users[user].nick,users[user].words);
1079           break;
1080         case 2:
1081           fprintf(fic,"<tr><td>%d</td><td>%s</td><td>%d</td><td class=\"oneline\">",i,users[user].nick,users[user].letters);
1082           break;
1083       }
1084       for (j=0;j<4;j++) if (users[user].hours[j]!=0) fprintf(fic,"<div class=\"h%d\" style=\"width:%dpx\"></div>",j+1,100*users[user].hours[j]/users[user].lines);
1085       fprintf(fic,"</td><td>%d</td><td><div class=\"hm\" style=\"width:%dpx\"></div></td><td>\"",users[user].lines!=0?users[user].letters/users[user].lines:0,users[user].lines!=0?users[user].letters/users[user].lines:0);
1086       printhtml(fic,users[user].quote);
1087       fprintf(fic,"\"</td></tr>\n");
1088       users[user].lines=-1;
1089       users[user].words=-1;
1090       users[user].letters=-1;
1091     }    
1092   }
1093   fprintf(fic,"</table>\n");
1094   temp=0;
1095   for (i=0;i<=nbusers;i++) if (users[i].lines>=0) temp++;
1096   if (temp>0)
1097   {
1098     fprintf(fic,"<p>");
1099     fprintf(fic,L("OTHERS"),temp);
1100     fprintf(fic,"</p>\n");
1101   }
1102   fprintf(fic,"</div>\n\n");
1103   
1104   /* top users by time */
1105   fprintf(fic,"<div id=\"irssistats_topuserstime\">\n<h2>%s</h2>\n",L("TOPUSERSTIME"));
1106   fprintf(fic,"<table>\n<tr><th></th>");
1107   for (i=0;i<4;i++) fprintf(fic,"<th colspan=\"2\">%s %d-%d</th>",L("HOURS"),i*6,i*6+5);
1108   fprintf(fic,"</tr>\n");
1109   for (i=1;i<=NBUSERSTIME;i++)
1110   {
1111     fprintf(fic,"<tr><td>%d</td>",i);
1112     for (j=0;j<4;j++)
1113     {
1114       user=-1;
1115       max=0;
1116       for (k=0;k<nbusers;k++) if (users[k].hours[j]>max) max=users[user=k].hours[j];
1117       if (user!=-1)
1118       {
1119         fprintf(fic,"<td>%s</td><td>%d</td>",users[user].nick,users[user].hours[j]);
1120         users[user].hours[j]=-1;
1121       }
1122       else fprintf(fic,"<td></td><td></td>");
1123     }
1124     fprintf(fic,"</tr>\n");
1125   }
1126   fprintf(fic,"</table>\n</div>\n\n");
1127
1128   /* random topics */
1129   fprintf(fic,"<div id=\"irssistats_randtopics\">\n<h2>%s</h2>\n",L("RANDTOPICS"));
1130   fprintf(fic,"<table>\n<tr><th>%s</th><th>%s</th></tr>\n",L("CHANGEDBY"),L("NEWTOPIC"));
1131   for (i=nbtopics<NBTOPICS?nbtopics-1:NBTOPICS-1;i>=0;i--)
1132   {
1133     fprintf(fic,"<tr><td>%s</td><td>\"",topics[i].nick);
1134     printhtml(fic,topics[i].topic);
1135     fprintf(fic,"\"</td></tr>\n");
1136   }
1137   fprintf(fic,"</table>\n</div>\n\n");
1138   
1139   /* random urls */
1140   fprintf(fic,"<div id=\"irssistats_randurls\">\n<h2>%s</h2>\n",L("RANDURLS"));
1141   fprintf(fic,"<table>\n<tr><th>%s</th><th>%s</th></tr>\n",L("POSTEDBY"),L("POSTEDURL"));
1142   for (i=nburls<NBURLS?nburls-1:NBURLS-1;i>=0;i--)
1143   {
1144     fprintf(fic,"<tr><td>%s</td><td>\"<a href=\"",urls[i].nick);
1145     printhtml(fic,urls[i].url);
1146     fprintf(fic,"\">");
1147     printhtml(fic,urls[i].shorturl);
1148     fprintf(fic,"</a>\"</td></tr>\n");
1149   }
1150   fprintf(fic,"</table>\n</div>\n\n");
1151   
1152   /* top words */
1153   if (top_words)
1154   {
1155     fprintf(fic,"<div id=\"irssistats_topwords\">\n<h2>%s</h2>\n",L("TOPWORDS"));
1156     fprintf(fic,"<table>\n<tr><th></th><th>%s</th><th>%s</th></tr>\n",L("WORD"),L("OCCURRENCES"));
1157     for (i=0;i<NBWORDS;i++)
1158       if (topwords[i].nb!=0) fprintf(fic,"<tr><td>%d</td><td>\"%s\"</td><td>%d</td></tr>\n",i+1,topwords[i].word,topwords[i].nb);
1159     fprintf(fic,"</table>\n</div>\n\n");
1160   }
1161   
1162   /* big numbers */
1163   fprintf(fic,"<div id=\"irssistats_bignumbers\">\n<h2>%s</h2>\n",L("BIGNUMBERS"));
1164   fprintf(fic,"<table>\n<tr><th>%s</th><th>%s</th><th>%s</th></tr>\n",L("NICK"),L("NUMBERS"),L("NBLINES"));
1165   for (i=0;i<NBCOUNTERS;i++)
1166   {
1167     user=-1;
1168     max=0;
1169     for (j=0;j<nbusers;j++) if (users[j].counters[i]>max) max=users[user=j].counters[i];
1170     if (user!=-1) fprintf(fic,"<tr><td>%s</td><td>%s</td><td>%d</td></tr>",users[user].nick,L(counters[i]),users[user].counters[i]);
1171   }
1172   fprintf(fic,"</table>\n</div>\n\n");
1173   
1174   /* footer */
1175   fprintf(fic,"<div id=\"irssistats_footer\">\n<p>");
1176   fprintf(fic,L("TIME"),totallines,days,(int)(time(NULL)-debut));
1177   fprintf(fic,"</p>\n<p>%s <a href=\"%s\">irssistats %s</a></p>\n",L("FOOTER"),URL,VERSION);
1178   if (w3c_link)
1179   {
1180     fprintf(fic,"<p>\n<a href=\"http://validator.w3.org/check/referer\"><img src=\"valid-xhtml10.png\" height=\"31\" width=\"88\" alt=\"Valid XHTML 1.0!\" /></a>\n");
1181     fprintf(fic,"<a href=\"http://jigsaw.w3.org/css-validator/check/referer\"><img src=\"valid-css.png\" height=\"31\" width=\"88\" alt=\"Valid CSS!\" /></a>\n</p>\n");
1182   }
1183   fprintf(fic,"</div>\n\n</div>");
1184   if (strcmp("none",header)==0)
1185   {
1186     fprintf(fic,"\n\n</body>\n\n</html>\n");
1187   }
1188   else
1189   {
1190     if ((sfic=fopen(footer,"rt"))==NULL) { fprintf(stderr,"can't open footer file \"%s\"\n",footer); exit(1); }
1191     while ((temp=fread(line,1,MAXLINELENGTH,sfic))) fwrite(line,temp,1,fic);
1192     fclose(sfic);
1193   }
1194   
1195   fclose(fic);
1196 }
1197
1198 void parse_config(char *configfile)
1199 {
1200   FILE *fic;
1201   char line[MAXLINELENGTH];
1202   char keyword[MAXLINELENGTH];
1203   char value[MAXLINELENGTH];
1204   int configlines=0;
1205   int i;
1206   
1207   if (configfile!=NULL)
1208   {
1209     if ((fic=fopen(configfile,"rt"))==NULL)
1210     {
1211       fprintf(stderr,"can't open config file : \"%s\"\n",configfile);
1212       exit(1);
1213     }
1214   }
1215   else
1216   {
1217     sprintf(line,"%s/.irssistats",getenv("HOME"));
1218     if ((fic=fopen(line,"rt"))==NULL)
1219       if ((fic=fopen("/etc/irssistats.conf","rt"))==NULL)
1220       {
1221         fprintf(stderr,"can't find config file : \"%s\" nor \"/etc/irssistats.conf\"\n",line);
1222         fprintf(stderr,"please give the path to the config file in argument\n");
1223         exit(1);
1224       }
1225   }
1226
1227   while (fgets(line,MAXLINELENGTH,fic))
1228   {
1229     configlines++;
1230     if (*line!=';' && *line!='#' && *line!='/' && *line!='-' && *line!='\n')
1231     {
1232       if ((sscanf(line,"%s : %s\n",(char *)&keyword,(char *)&value))!=2) { fprintf(stderr,"error in config file : each line must have the format \"keyword : value\" (line %d)\n",configlines); exit(1); }
1233       
1234       if (strcmp("debug",keyword)==0)
1235       {
1236         if (strcmp("none",value)==0) debug=0;
1237         else
1238         if (strcmp("normal",value)==0) debug=1;
1239         else
1240         if (strcmp("verbose",value)==0) { debug=2; fprintf(stderr,"switching to verbose output\n"); }
1241         else { fprintf(stderr,"unknown value for \"debug\" option, must be \"normal\", \"verbose\" or \"none\"\n"); exit(1); }
1242       }
1243       else
1244       
1245       if (strcmp("channel",keyword)==0)
1246       {
1247         if (debug==2) fprintf(stderr,"setting channel name to \"%s\"\n",value);
1248         strcpy(channel,value);
1249       }
1250       else
1251       
1252       if (strcmp("maintainer",keyword)==0)
1253       {
1254         if (debug==2) fprintf(stderr,"setting maintainer to \"%s\"\n",value);
1255         strcpy(maintainer,value);
1256       }
1257       else
1258       
1259       if (strcmp("language",keyword)==0)
1260       {
1261         if (debug==2) fprintf(stderr,"setting language to \"%s\"\n",value);
1262         for (i=0;i<NBLANGUAGES;i++) if (strcmp(value,keys[i][0][1])==0) { language=i; break; }
1263         if (i==NBLANGUAGES)
1264         {
1265           fprintf(stderr,"Invalid language : %s\n",value);
1266           fprintf(stderr,"Supported languages :\n");
1267           for (i=0;i<NBLANGUAGES;i++) fprintf(stderr,"%s = %s\n",keys[i][0][1],keys[i][0][0]);
1268           exit(1);
1269         }
1270       }
1271       else
1272       
1273       if (strcmp("theme",keyword)==0)
1274       {
1275         if (debug==2) fprintf(stderr,"setting theme to \"%s\"\n",value);
1276         strcpy(theme,value);
1277       }
1278       else
1279       
1280       if (strcmp("refresh_time",keyword)==0)
1281       {
1282         refresh_time=atoi(value);
1283         if (debug==2) fprintf(stderr,"setting refresh_time to \"%d\"\n",refresh_time);
1284       }
1285       else
1286       
1287       if (strcmp("w3c_link",keyword)==0)
1288       {
1289         if (debug==2) fprintf(stderr,"setting w3c_link to \"%s\"\n",value);
1290         if (strcmp("no",value)==0) w3c_link=0;
1291         else if (strcmp("yes",value)==0) w3c_link=1;
1292         else { fprintf(stderr,"unknown value for \"w3c_link\" option, must be \"yes\" or \"no\"\n"); exit(1); }
1293       }
1294       else
1295       
1296       if (strcmp("header",keyword)==0)
1297       {
1298         if (debug==2) fprintf(stderr,"setting header to \"%s\"\n",value);
1299         strcpy(header,value);
1300       }
1301       else
1302       
1303       if (strcmp("footer",keyword)==0)
1304       {
1305         if (debug==2) fprintf(stderr,"setting footer to \"%s\"\n",value);
1306         strcpy(footer,value);
1307       }
1308       else
1309       
1310       if (strcmp("input",keyword)==0)
1311       {
1312         if (debug==2) fprintf(stderr,"parsing log file \"%s\"\n",value);
1313         parse_log(value);
1314       }
1315       else
1316       
1317       if (strcmp("nickfile",keyword)==0)
1318       {
1319         if (debug==2) fprintf(stderr,"nick alias using file \"%s\"\n",value);
1320         parse_nick(value);
1321       }
1322       else
1323       
1324       if (strcmp("output",keyword)==0)
1325       {
1326         if (debug==2) fprintf(stderr,"generating xhtml file \"%s\"\n",value);
1327         bestwords(words,0);
1328         gen_xhtml(value);
1329         
1330         /* reset variables */
1331         nbusers=0;
1332         nburls=0;
1333         nbtopics=0;
1334         days=0;
1335         for (i=0;i<24*4;i++) hours[i]=0;
1336         lines=0;
1337         freewords(&words);
1338         for (i=0;i<NBWORDS;i++) topwords[i].nb=0;
1339         totallines=0;
1340         debut=time(NULL);
1341       }
1342       else
1343       
1344       if (strcmp("top_words",keyword)==0)
1345       {
1346         if (debug==2) fprintf(stderr,"setting top_words to \"%s\"\n",value);
1347         if (strcmp("no",value)==0) top_words=0;
1348         else if (strcmp("yes",value)==0) top_words=1;
1349         else { fprintf(stderr,"unknown value for \"top_words\" option, must be \"yes\" or \"no\"\n"); exit(1); }
1350       }
1351       else
1352       
1353       if (strcmp("ranking",keyword)==0)
1354       {
1355         if (strcmp("lines",value)==0) ranking=0;
1356         else
1357         if (strcmp("words",value)==0) ranking=1;
1358         else
1359         if (strcmp("letters",value)==0) ranking=2;
1360         else { fprintf(stderr,"unknown value for \"ranking\" option, must be \"lines\", \"words\" or \"letters\"\n"); exit(1); }
1361       }
1362       else
1363       
1364       if (strcmp("quarter",keyword)==0)
1365       {
1366         if (debug==2) fprintf(stderr,"setting quarter to \"%s\"\n",value);
1367         if (strcmp("no",value)==0) quarter=0;
1368         else if (strcmp("yes",value)==0) quarter=1;
1369         else { fprintf(stderr,"unknown value for \"quarter\" option, must be \"yes\" or \"no\"\n"); exit(1); }
1370       }
1371
1372       else { fprintf(stderr,"error in config file : \"%s\" is an unknown keyword (line %d)\n",keyword,configlines); exit(1); }        
1373     }
1374   }
1375   fclose(fic);
1376 }
1377
1378 int main(int argc,char *argv[])
1379 {
1380   if ((users=malloc(maxusers*sizeof(struct user)))==NULL) { fprintf(stderr,"unable to malloc memory\n"); exit(1); }
1381   srand(debut=time(NULL));
1382   if (argc==1) parse_config(NULL);
1383   else if (argc==2) parse_config(argv[1]);
1384   else
1385   {
1386     fprintf(stderr,"Usage : %s [/path/to/file.conf]\n",argv[0]);
1387     fprintf(stderr,"Version : irssistats %s\n",VERSION);
1388     exit(1);
1389   }
1390   return(0);
1391 }