O webalizer é provavelmente a ferramenta de estatísticas opensource mais utilizado.
Em primeiro lugar é de utilização bem simples, fácil de configurar e executar automaticamente.
Em segundo lugar é pouco exigente a nível de recursos, ainda que a sua capacidade de escalar seja algo limitada.
Em terceiro lugar suporta três dos formatos de logs mais utilizados, nomeadamente CLF (combined/cummon log format, utilizador pelo Apache, por exemplo), FTP ou xferlog (o formato de logs do wu-ftp e outros servidores de FTP) e logs nativos do Squid.
Estes três servidores representam uma percentagem razoavelmente elevada dos servidores HTTP, FTP e proxies utilizados hoje em dia em ambientes de hosting e servidores de administração privada, pelo que os formatos de logs suportados são os mais usuais.
Ao nível de possibilidades de reporting, por seu lado, o webalizer disponibiliza quase toda a informação que se pode encontrar nos seus concorrentes mais fortes.
O webalizer permite proceder a reportes incrementais e mantém um histórico de até 12 meses.
Também cria tops de vários dados, bem como permite criar listagens completas com todos os dados de determinada categoria.
Os tops que o webalizer consegue gerar são:
- top de sites por pageviews, que é a lista de IPs/hostnames dos utilizadores que mais pageviews geraram no site;
- top de sites por tráfego, que é a lista dos IPs/hostnames que mais tráfego geraram;
- top de URLs por pageviews, que é a lista dos URLs mais visto;
- top de URLs por tráfego, a lista dos URLs que originaram mais tráfego no site;
- top de referrers, a lista de URL de onde vinham a maioria dos utilizadores;
- top de User Agents, a lista dos browsers mais utilizados para aceder ao site;
- top de países, a lista dos países de onde foram originados a maioria dos pageviews do site;
- top de páginas de entrada, a lista das páginas por onde os utilizadores mais entram no site;
- top de páginas de saída, a lista das páginas onde os utilizadores mais vezes terminam as suas visitas ao site;
- top de pesquisas, a lista das pesquisas com que o site foi encontrado mais vezes.
Além dos tops, o webalizer permite ainda criar listagem de todos os dados de uma determinada categoria. Os dados para que o webalizer gera estas listagens são:
- Sites
- URLs
- Referrers
- User Agents
- Expressões de Pesquisa
- Utilizadores
O webalizer pode ainda criar ficheiros de dumps dos dados referidos, que podem depois ser utilizados com outros programas.
Apesar de ser uma ferramenta já antiga continua a ser uma das melhores para quem pretende correr a sua própria aplicação de processamento estatístico e disponibiliza toda a informação que hoje se pretende, incluindo a tão falada Long Tail, que é na prática a listagem de todos as Expressões de pesquisa com que o site é encontrado.
A grande desvantagem do webalizer é que apenas corre em plataformas *nix (Unix, Linux, Solaris, etc).
O webalizer pode ser encontrado em http://www.mrunix.net/webalizer/.
Boa tarde, estou escrevendo um artigo para conclusão de curso e gostaria de saber quem é o autor desta postagem para que eu possa referenciá-lo pois tem muita coisa boa que posso aproveitar, meu projeto é em relação a arquivos de log também.
Obrigado!
Olá Higor,
O meu nome é Marco Neves – a falta do meu nome é falha grave na nova versão da página “Acerca”, que acabei de corrigir.
No entanto, acho importante a nota de que o projecto webalizer está inactivo há já alguns anos, e que o post em que comenta foi escrito em 2006.
O software em questão continua a ser util e a fazer o que se espera dele, mas uma grande maioria da internet mudou para projectos mais recentes, entre eles o Google Analitics (http://www.google.com/analytics/) – topico que daria um bom conjunto de novos posts nesta série – talvez em breve.