Monthly Archives: September 2006

Estatísticas Web – webalizer

Published by:

webalizer é provavelmente a ferramenta de estatísticas opensource mais utilizado.

Em primeiro lugar é de utilização bem simples, fácil de configurar e executar automaticamente.

Em segundo lugar é pouco exigente a nível de recursos, ainda que a sua capacidade de escalar seja algo limitada.

Em terceiro lugar suporta três dos formatos de logs mais utilizados, nomeadamente CLF (combined/cummon log format, utilizador pelo Apache, por exemplo), FTP ou xferlog (o formato de logs do wu-ftp e outros servidores de FTP) e logs nativos do Squid.

Estes três servidores representam uma percentagem razoavelmente elevada dos servidores HTTP, FTP e proxies utilizados hoje em dia em ambientes de hosting e servidores de administração privada, pelo que os formatos de logs suportados são os mais usuais.

Ao nível de possibilidades de reporting, por seu lado, o webalizer disponibiliza quase toda a informação que se pode encontrar nos seus concorrentes mais fortes.

webalizer permite proceder a reportes incrementais e mantém um histórico de até 12 meses.

Também cria tops de vários dados, bem como permite criar listagens completas com todos os dados de determinada categoria.

Os tops que o webalizer consegue gerar são:

  • top de sites por pageviews, que é a lista de IPs/hostnames dos utilizadores que mais pageviews geraram no site;
  • top de sites por tráfego, que é a lista dos IPs/hostnames que mais tráfego geraram;
  • top de URLs por pageviews, que é a lista dos URLs mais visto;
  • top de URLs por tráfego, a lista dos URLs que originaram mais tráfego no site;
  • top de referrers, a lista de URL de onde vinham a maioria dos utilizadores;
  • top de User Agents, a lista dos browsers mais utilizados para aceder ao site;
  • top de países, a lista dos países de onde foram originados a maioria dos pageviews do site;
  • top de páginas de entrada, a lista das páginas por onde os utilizadores mais entram no site;
  • top de páginas de saída, a lista das páginas onde os utilizadores mais vezes terminam as suas visitas ao site;
  • top de pesquisas, a lista das pesquisas com que o site foi encontrado mais vezes.

Além dos tops, o webalizer permite ainda criar listagem de todos os dados de uma determinada categoria. Os dados para que o webalizer gera estas listagens são:

  • Sites
  • URLs
  • Referrers
  • User Agents
  • Expressões de Pesquisa
  • Utilizadores

webalizer pode ainda criar ficheiros de dumps dos dados referidos, que podem depois ser utilizados com outros programas.

Apesar de ser uma ferramenta já antiga continua a ser uma das melhores para quem pretende correr a sua própria aplicação de processamento estatístico e disponibiliza toda a informação que hoje se pretende, incluindo a tão falada Long Tail, que é na prática a listagem de todos as Expressões de pesquisa com que o site é encontrado.

A grande desvantagem do webalizer é que apenas corre em plataformas *nix (Unix, Linux, Solaris, etc).

webalizer pode ser encontrado em http://www.mrunix.net/webalizer/.


Modelos de Negócio Online

Published by:

Tenho estado a trabalhar num CMS para uma empresa de media tradicional, que publica várias revistas. Eles questionam-se como rentabilizar os respectivos sites, e isso levou-me a mim a colocar a mesma questão.

No caso dos meus sites, a questão nunca foi como ganhar dinheiro com eles, mas a verdade é que ao longo de vários anos dediquei muitas horas à construção de ferramentas, a pesquisa e criação de conteúdos, a criar e alterar o design dos sites.

E, claro, coloquei muito do meu dinheiro nestes sites, especialmente no registo dos domínios, acesso à internet e aluguer de servidores.

Hoje olho para os meus sites, cuja quantidade se escreve com dois dígitos, e para a lista de domínios que tenho registados, todos com óptimos projectos editoriais, mas pouco tempo para os implementar e colocar online, e percebo que tenho o mesmo problema que este cliente.

Claro que eu tenho um problema acrescido. Eles têm dezenas de pessoas a criar novos conteúdos todos os dias. Eu estou a solo e apenas o faço nos tempos livres.

Esqueçamos portanto os meus pequenos sites e concentremo-nos nas situações em que existe conteúdo e investimento para a sua criação, como este cliente, e como muitas empresas idênticas, como as centenas de revistas que existem não apenas no nosso país, como também no resto do mundo.

A maioria destas equipas editoriais está permanentemente vigilante a tudo o que de relevante se passa na sua área. Isto dá-lhes a oportunidade de criar conteúdos novos à medida que as coisas vão acontecendo.

Por outro lado, a maioria do tempo estas equipas estão concentradas em criar ou adaptar conteúdos mais profundos, que serão publicados nas revistas, em papel.

Por razões de espaço estes conteúdos são muitas vezes cortados, e publicados apenas parcialmente nas revistas, não sendo completamente incomum um artigo com 3000 palavras acabar por ser reduzido a 2000 por razões de espaço disponível na revista.

Estes conteúdos reduzidos são muitas vezes os que vão parar ao site. Esta é, no entanto, a versão errada para colocar online. A versão a colocar online deveria ser a versão original. Por alguma razão o autor escreveu originalmente mais texto.

Mas, dizem-me, assim ninguém vai comprar a revista, uma vez que os conteúdos estão todos online, e ainda mais completos.

Sim, é verdade. A menos que estes conteúdos estejam disponíveis apenas para quem adquirir a revista.

Mas, deverão todos os conteúdos estar disponíveis apenas para as pessoas que comprem ou assinem a revista?

Na minha opinião não. Os sites têm tudo a ganhar se alguns dos conteúdos estiverem disponíveis a qualquer pessoa.

Por um lado se alguns dos conteúdos estiverem disponíveis para toda a gente, é provável que com o tempo mais pessoas descubram o site, e consequentemente a revista.

Por outro lado esse conteúdos vão ser indexados pelos motores de pesquisa, o que vai trazer novos utilizadores ao site, tornando com isso a revista conhecida para esses utilizadores e potenciando com isso a aquisição de novos clientes.

Mas, então, que conteúdos disponibilizar e que conteúdos guardar apenas para os clientes da revista em papel?

Bem, penso que a segmentação dos conteúdos se poderia fazer em três grupos.

O primeiro é que conteúdos disponibilizar a todos os visitantes do site no momento da criação. Bem, este tipo de redacções todos os dias cria algumas noticias, por vezes dezenas de pequenas noticias, que são pouco mais que citações de outras fontes. Estes conteúdos ocupam por norma menos de 10 a 15 minutos por artigo.

Estes conteúdos, devido ao seu reduzido custo, penso que poderiam ser disponibilizados imediatamente, até porque a maioria deles nunca irá ser publicada de qualquer das formas.

Restam com isto os artigos que implicam mais pesquisa, mais longos, mais elaborados, independentemente de virem a ser publicados na revista ou não. Na minha perspectiva estes conteúdos devem estar disponíveis apenas aos clientes da revista. Esta é a forma de incentivar a compra da revista, ou a sua assinatura.

Se os artigos são publicados na revista aparecem online apenas algum tempo depois de a revista estar nas bancas (ou ser enviada aos assinantes), se não forem publicados em papel ficariam disponíveis online imediatamente para todos os assinantes.

Mas, tanto num caso como noutro, deverão os artigos estar acessíveis apenas aos assinantes eternamente?

Penso que não. Penso que se poderão criar ainda dois intervalos de tempo distintos. Afinal de contas, depois de ser publicado um número de uma revista já ninguém mais vai comprar o número anterior, pelo que os conteúdos do mês anterior poderiam ser rentabilizados de outra forma, sem com isso afectar a venda da revista.

Como? Criando um sistema de assinatura online, em que os assinantes desta forma possam pagar para ter acesso a um artigo em particular, ou por um período de tempo (um dia, um mês, um ano?), a todos os conteúdos premium que tenham mais do que a idade de uma (ou duas) edição em papel (no caso da revista mensal, um mês – ou dois).

Assim, supondo que tenho interesse pela área da revista, mas não sou um profissional da área, pelo que não preciso de ler as reportagens no mês em que são escritas, apenas quero poder ir ler alguma informação da área de vez em quando, posso subscrever a assinatura online. Ou se sou estudante e quero aceder a uma reportagem especial que fizeram há alguns meses, posso aceder a ela desta forma, por um valor muito mais reduzido que o custo da assinatura da revista.

Mas, e ao fim de um ano, ou dois, esta informação ainda é relevante? Bem, historicamente tudo é importante. Mas será que ainda alguém vai pagar para aceder a conteúdos tão antigos? Provavelmente não.

Por isso, em determinada altura esses conteúdos podem ser libertados para serem acedidos de forma anónima, para que qualquer utilizador os possa ver. Desta forma promove-se a qualidade dos conteúdos da revista, permite-se aos motores de pesquisa indexar mais conteúdos do site, o que ajuda a dar mais relevância ao mesmo, e a fazer com que ele apareça em mais pesquisas relacionadas com a sua área de actividade.

E claro, colocar publicidade no site também ajuda, pois permite rentabilizar o tráfego de todos os artigos, mesmo daqueles que estão disponíveis para toda a gente.

Se o site tem pouco tráfego pode oferecer-se esse espaço aos anunciantes da edição em papel, mas sempre fazendo ver que é uma oferta, uma promoção, e não algo a que eles terão direito sempre que anunciarem na edição em papel, porque quando o site tiver mais tráfego poderemos querer vender esse espaço, e os nossos anunciantes habituais são os primeiros potências clientes da lista.

Mas, dizem vocês, isso é possível com os assinantes, mas e as revistas que são vendidas nas bancas, como permitimos que as pessoas tenham ainda assim acesso à versão estendida desses conteúdos?

Bem… eu tenho algumas ideias, e você? E têm alguma ideia melhor para rentabilizar este tipo de sites?


Estatísticas Web – Novos dados

Published by:

Hoje, especialmente entre os bloggers, procuram-se novas informações ou utilizam-se de forma mais intensa informações que anteriormente eram quase ignoradas.

Nem sempre essas informações são obtidas exclusivamente através de dados de tráfego do site. Algumas dessas informações apenas se conseguem quando se cruza dados de tráfego com dados provenientes de outras fontes.

Entre os novos dados estatísticos que se encontram hoje na moda estão:

Long Tail

A Long Tail é levar um pouco mais longe uma informação que anteriormente já se considerava.

Trata-se das palavras utilizadas nos motores de pesquisa e que resultam em visitas ao site.

Anteriormente desta informação era apresentada apenas um top, entre 10 e 50 palavras (e/ou expressões) mais utilizadas. Hoje os webmasters e bloggers querem saber não apenas quais as mais utilizadas, mas todas as palavras que resultaram em visitas ao site.

EPM (Earnings per Thousand) ou CPM (Comission per Thousand)

O M em EPM ou CPM vem no numero mil em numeração romana (M). CPM pode também ser utilizada para significar Cost Per Thousand, o que faz sentido especialmente do ponto de vista do anúnciante, que é quem tem o dinheiro para anúnciar, e consequentemente a quem normalmente os termos se adequam.

Na prática este indicador permite ter uma ideia da rentabilidade do tráfego de um site.

Das muitas informações que se podem calcular acerca do tráfego se um site este é uma das poucas que apenas está disponível quando o site faz venda directa de espaço publicitário.

No mundo dos blogs, se esta informação fosse disponibilizada permitiria encontrar os nichos de mercado em que mais facilmente se rentabilizaria um blog. Claro que isso poderia acabar por criar um excesso de sites nesse nicho, e consequentemente criar mais espaço para anúncios que os anúncios existentes, baixando com isso o valor do nicho.

Algumas das redes de anúncios, como é o caso do Google Adsense, proíbem mesmo os seus associados de revelar este valor.

Earnings Per User ou Lucro por utilizador

Este indicador, tal como o E/CPM é indicativo da rentabilidade do tráfego, mas considera os utilizadores únicos do site ao invés dos pageviews.


Tem uma ideia

Published by:

Christine Kane era até há alguns momentos um nome desconhecido para mim. Trata-se de uma cantora/escritora de canções que tem também um blog, onde escreve sobre a sua musica, sobre o que a inspira e a forma como compõe.

Cheguei até ela de um dos vários blogs sobre marketing que leio (não perguntem qual, pois abri o link e só mais tarde o fui ler, como faço sempre, pelo que não sei bem qual é o referer).

Cheguei ao blog dela através de um post intitulado Are You hook-able?, que recomendo bastante a qualquer blogger, tal como vários outros artigos relacionados com esse.

Mas aquele que realmente me inspirou foi o post Getting Discovered, Getting Discouraged, and Getting a Clue..

O texto dela é inspirado e direcionado para músicos em prespectiva, pessoas que gostariam de ser cantores profissionais, escritores de canções, mas na realidade aplica-se a qualquer pessoa, em qualquer àrea de actividade.

Tem vários outros posts interessantes, é uma das novas adicções ao meu feed reader.