O webalizer é provavelmente a ferramenta de estatísticas opensource mais utilizado.
Em primeiro lugar é de utilização bem simples, fácil de configurar e executar automaticamente.
Em segundo lugar é pouco exigente a nível de recursos, ainda que a sua capacidade de escalar seja algo limitada.
Em terceiro lugar suporta três dos formatos de logs mais utilizados, nomeadamente CLF (combined/cummon log format, utilizador pelo Apache, por exemplo), FTP ou xferlog (o formato de logs do wu-ftp e outros servidores de FTP) e logs nativos do Squid.
Estes três servidores representam uma percentagem razoavelmente elevada dos servidores HTTP, FTP e proxies utilizados hoje em dia em ambientes de hosting e servidores de administração privada, pelo que os formatos de logs suportados são os mais usuais.
Ao nível de possibilidades de reporting, por seu lado, o webalizer disponibiliza quase toda a informação que se pode encontrar nos seus concorrentes mais fortes.
O webalizer permite proceder a reportes incrementais e mantém um histórico de até 12 meses.
Também cria tops de vários dados, bem como permite criar listagens completas com todos os dados de determinada categoria.
Os tops que o webalizer consegue gerar são:
- top de sites por pageviews, que é a lista de IPs/hostnames dos utilizadores que mais pageviews geraram no site;
- top de sites por tráfego, que é a lista dos IPs/hostnames que mais tráfego geraram;
- top de URLs por pageviews, que é a lista dos URLs mais visto;
- top de URLs por tráfego, a lista dos URLs que originaram mais tráfego no site;
- top de referrers, a lista de URL de onde vinham a maioria dos utilizadores;
- top de User Agents, a lista dos browsers mais utilizados para aceder ao site;
- top de países, a lista dos países de onde foram originados a maioria dos pageviews do site;
- top de páginas de entrada, a lista das páginas por onde os utilizadores mais entram no site;
- top de páginas de saída, a lista das páginas onde os utilizadores mais vezes terminam as suas visitas ao site;
- top de pesquisas, a lista das pesquisas com que o site foi encontrado mais vezes.
Além dos tops, o webalizer permite ainda criar listagem de todos os dados de uma determinada categoria. Os dados para que o webalizer gera estas listagens são:
- Sites
- URLs
- Referrers
- User Agents
- Expressões de Pesquisa
- Utilizadores
O webalizer pode ainda criar ficheiros de dumps dos dados referidos, que podem depois ser utilizados com outros programas.
Apesar de ser uma ferramenta já antiga continua a ser uma das melhores para quem pretende correr a sua própria aplicação de processamento estatístico e disponibiliza toda a informação que hoje se pretende, incluindo a tão falada Long Tail, que é na prática a listagem de todos as Expressões de pesquisa com que o site é encontrado.
A grande desvantagem do webalizer é que apenas corre em plataformas *nix (Unix, Linux, Solaris, etc).
O webalizer pode ser encontrado em http://www.mrunix.net/webalizer/.