Tag Archives: seo

PpW – Usar Flash e Javascript

Published by:

Hoje, mais do que no passado, o AJAX (Asynchronous JavaScript and XML) parece estar em todo o lado, e os sites dinâmicos criados utilizando essa tecnologia são mais que muitos.

Há alguns dias, o Google disponibilizou o seu Google Web Toolkit, que permite criar aplicações Java, que são depois convertidas para aplicações HTML+Javascript.

O próprio Google utiliza AJAX em várias das suas ferramentas, como seja o Gmail, ou oGoogle Maps. Mas será que o AJAX é o resultado de todas as nossas preces?

E o Flash, que a macromédia tem desenvolvido ao longo de anos, e que hoje é uma ferramenta de desenvolvimento aplicacional completa, utilizada para fazer desde menus animados até jogos ou video players. É esta a solução para as nossas preces?

Bem, mesmo normalmente não utilizando Flash, e raramente recorrendo ao Javascript mais do que o estritamente necessário, concordo que são ferramentas uteis, e que permitem muitas coisas que seria bastante dificeis (ou mesmo impossiveis de conseguir) de outra forma.

Mas, peço desculpa, ainda não aderi à febre. Nem à do Flash, que com a novidade AJAX está a passar, nem à do AJAX. Por duas razões, e que se aplicam a ambas as situações:

  • Não são correctamente indexados;
  • Não são completamente compatíveis.

Não são completamente indexados

Hoje, ao contrário do que acontecia há algum tempo atrás, um flash cuidadosamente criado com esse objectivo em mente já é razoávelmente indexado. Mas apenas se for criado com esse objectivo em mente.

Mas não é isso que acontece normalmente. A maioria dos flahs que vi até hoje não contém directamente os conteúdos, ou quando os contém não estão em texto, mas em imagens, aparentemente para ficarem sempre com a aparência correcta.

Mas mesmo quando os texto estão dentro do flash e são indexáveis, não é possivel os motores de pesquisa enviarem os utilizadores directamente para a página onde se encontram os conteúdos que o utilizador procura.

Problemas idênticos se colocam quando se utiliza JavaScript para criar conteúdos, para os colocar nas páginas, independentemente de esses conteúdos fazerem inicialmente parte do JavaScript de alguma forma ou serem pedidos ao servidor pelo javascript (Sendo que neste caso nenhum motor de pesquisa irá aceder a esses conteúdos, uma vez que não executam o javascript).

Estas situações tornam-se mais graves quando o Javascript ou o Flash é utilizado para menus. Neste caso além de os conteúdos do Flash, ou criados pelo Javascript não serem indexados, também não o são as páginas que são pedidas quando os utilizadores clicam no menu.

Compatibilidade

Vários browsers não têm pluggin de flash, e alguns não executam javascript, pelo que sites que dependam muito dessas ferramentas não serão correctamente vistos nesses browsers.

Dos meus três browsers (Galeon, Mozilla Firefox e Internet Explorer), durante muito tempo apenas um tinha o pluggin de Flash instalado, e utilizadores invisuais, por exemplo, não têm forma de saber onde clicar num menu em flash para acederem a uma página que procuram.

Imagens, mesmo com MAP, isto é, com vários links na mesma imagem, podem ter titles por link, o que permite a qualquer utilizador saber antecipandamente alguma informação acerca do local para onde será enviado quando clicar no local onde tem o cursor. Mas o flash não.

Browsers apenas de texto (muitas vezes os browsers especiais são baseados nessas ferramentas) descrevem as imagens de forma alternativa (utilizando os campos alttitle), mas não têm forma de descrever um flash, e muitos deles também não executam javascript, pois uma grande parte da DOM não se lhes aplicaria de qualquer das formas.

Soluções

Claro que existem soluções de compromisso, como seja, ter um segundo menu, que será mostrado quando o utilizador não tiver flash, ou que esteja noutra parte da página, e que constituia uma alternativa ao menu em Flash ou Javascript, e que os motores de pesquisa também consigam utilizar.

Outra solução será ter uma versão alternativa do site para utilizadores que não têm flash ou javascript, mas isso significa também que os motores de pesquisa irão indexar essa versão e não a primeira, o que pode fazer com que a maioria dos utilizadores passe a utilizar a versão HTML, mesmo tendo flash e javascript.

Mas na verdade, eu utilizaria Flash e Javascript apenas no estritamente necessário. AJAX e outras formas de JavaScript que façam pedidos remotos de conteúdos, no entanto, utilizaria apenas em backoffices e partes de sites que não pretenda que sejam indexados.


PpW – A diferença nos URLs

Published by:

Quando se programa para WEB a solução mais fácil é utilizar os parâmetros para tudo o que seja informação dinâmica, como os identificadores das categorias, dos artigos, ou de qualquer outra coisa que se pretenda apresentar, criando URLs do tipo lista.php?id=123ou lista/index.html?id=123.

Nada de grava haveria a dizer desta prática não fosse realidade:

  • O Google não indexa links com o parâmetro id com valores com mais do que uma determinada dimensão (4 ou 5 digitos)
  • Os motores de pesquisa em geral não indexam, ou indexam de forma menos satisfatória URLs com mais do que 2 parâmetros.

Mas como podemos deixar de utilizar este tipo de URLs? Há várias formas e várias ferramentas que permitem resolver este problema.

A mais abrangente delas é talvez o mod_rewrite do Apache, servidor instalado na grande maioria dos hostings, e que permite tranformar URLs. Por exemplo, se pretendermos que o nosso URL lista.php?id=123 passe a ser lista/123.html, isso pode ser conseguido com o mod_rewrite, adicionando às configurações do apache, ou em alguns casos a um ficheiro .htaccess na raiz do seu site a seguinte linha:


RewriteRule ^/lista/(.*).html /lista.php?id=$1 [PT]

Esta simples regra faz com que sempre que um URL do tipo /lista/123.html for pedido ao nosso servidor, o mod_rewrite irá alterar o URL para /lista.php?id=123 que o apache depois tenta servir, processando assim o nosso script PHP original.

O mesmo pode ser feito para qualquer outro URL, e tendo em conta que o primeiro parâmetro é uma regular expression, quase qualquer transformação pode ser feita nos URLs. É preciso apenas um pouco de jeito, alguma persistência, e imaginação.

E a diferença que isso pode fazer na quantidade de páginas de um site nos indices principais do Google e dos outros motores de pesquisa faz TODA a diferença.

O maior trabalho num site já feito acaba por ser mesmo alterar todos os links, e todos os locais onde os links são criados para utilizar os novos URLs.

Claro que esta solução não passa de um remendo. Muitas linguagens e frameworks de programação para WEB já permitem por si só utilizar URLs dinâmicos, e permitem implementar directamente este tipo de URLs.


Programar para Web

Published by:

Quando se programa para Internet há todo um conjunto de considerações que é preciso ter, e que em ambientes fechados pouco ou nada se pensa nelas.

Quando falo em programar para web, falo de desenvolvimento de sites que estarão disponíveis para o grande publico, sites abertos. Há, claro, considerações especiais a ter quando se programam aplicações fechadas sobre ambiente WEB, mas isso são águas para outras moagens.

Há considerações de diversas ordens a fazer:

  1. Segurança – As considerações de segurança são as que vão no sentido de impedir que alterem o site de forma não pretendida, de impossibilitar que o site seja utilizado para propósitos que não aqueles para que foi concebido, e de não permitir a apropriação de informação que não se pretende que seja acessivel.
  2. Usabilidade – A usabilidade tem a ver com a facilidade de utilização do site, com a capacidade dos visitantes facilmente encontrarem a informação que pretendem, e de o fazerem da forma mais confortável possivel.
  3. Indexação – A indexação é uma das coisas que apenas quando se programa para Web se passa a considerar. E mesmo assim muitas vezes não se tem verdadeiramente noção da sua importância. Algumas pequenas alterações podem fazer toda a diferênça no tráfego de um site.

Segurança

Quando se fala de segurança fala-se de tudo o que tenha a ver com validar toda a informação que se recebe dos utilizadores de um site.

Muitas vezes essas verificações são feitas apenas nos formulários, e muitas vezes apenas do lado do utilizador, utilizando JavaScript.

Mas isto não é o suficiente. Ultrapassar validações efectuadas do lado do cliente é facil. Muito fácil.

Assim como também é simples alterar os parâmetros passados no URL, utilizados muitas vezes em links sem grande pudor ou cuidado.

Usabilidade

O local onde as coisas são colocadas num site pode fazer toda a diferença na performance desse site. Colocar um ménu à direita ou esquerda faz diferença. Toda a diferença.

Mas a usabilidade é mais do que isso. Como é que o site será visto por invísuais, que têm que recorrer à ajuda preciosa de programas que se baseiam na estrutura do código de um site para o apresentar?

Estão as coisas que pretende destacar nos locais que os utilizadores as procuram?

Indexação

Você todos os dias coloca novos conteúdos no seu site, tem já algumas centenas de artigos publicados, o seu site tem meses de existência, mas o tráfego que o seu site recebe dos motores de pesquisa é baixo, quase insignificante.

Será que o seu site está a ser correctamente indexado?

Estes temas serão tratados aqui ao longo dos próximos dias. Permaneça comigo, e fique a saber um pouco mais sobre como melhorar o seu site.

Artigos nesta série

Segurança

Usabilidade

Indexação

Performance

SEO: ALT e TITLE de Imagens

Published by:

Quando olhamos para a maioria dos sites hoje, verificamos facilmente que muitos deles sofrem de problemas graves. Muitos apenas têm uma imagem ou um flash, outros têm muito pouca informação, mas depois existem sites que á primeira vista teriam tudo para ser “best sellers”, mas depois não aparecem nos resultados de pesquisa para aquelas que seriam as palavras-chaves do site.

Na maioria das vezes isso não é sequer dificil de explicar ou de resolver quando se percebe. Por questões de design não é incomum coisas importantes, que normalmente seriam Headings (H1, H2, H3, etc), não passarem de imagens. Não que isto por si só sejam o fim do mundo, mas o facto de essas imagens não terem qualquer texto associado faz com que os motores de pesquisa não consigam perceber (correctamente pelo menos) quais são as palavras chave de uma página.

O problema é ainda mais grave quando essas imagens são a única referência real a essas palavras-chave. Por exemplo, suponhamos que o titulo deste post era apenas uma imagem, na qual se podia ler o texto ALTs e TITLEs, e que esse texto não aparecia em mais nenhum lugar do texto.

Seria possivel os motores de pesquisa associarem o post a essas palavras? A resposta é “Com a tecnologia actual, não!”.

Alt

Mas isso pode ser contornado. A Tag (X)HTML tem um campo, que em HTML é opcional, mas em XHTML é obrigatório, que é o ALT. O campo ALT das imagens serve para fornecer um texto alternativo, utilizado pelos browsers que têm as imagens desactivadas ou que não mostram de todo imagens… e pelos Robots dos motores de pesquisa, claro.

Estes texto devem ser ilucidativos acerca do conteúdo da imagem, mas curtos, pois serão utilizados em substituição da imagem.

Description

Se pretendermos, de alguma forma, descrever a imagem (site feito utilizando tecnologias XHTML e CSS 2.0, limitado a 800 pixeis de largura, com uma laterar laranja com texto verde e o fundo do corpo principal a cinza claro, com texto quase preto), poderemos utilizar o campo DESCRIPTION.

O description deve ainda ser utilizado por uma questão de usabilidade. A maioria de nós vê. Alguns de nós bem. Mas existem muitas pessoas que não têm essa capacidade, mas que conseguem navegar na internet, utilizando programas especialmente desenvolvidos para esse fim. E se em relação a todo o texto de uma página o programa com mais ou menos precisão consegue ler o texto, quando chega às imagens, não tem forma de explicar à pessoa que está junto ao computador o que representa a imagem. Apenas sabe que é uma imagem. Mas se a imagem tiver uma descrição, utilizando o campo description, a maioria dos programas utilizará essa descrição para descrever a imagem ao seu utilizador.

Title

O HTML permite ainda definir o texto que aparece (normalmente) quando passamos com o rato por cima da imagem, utilizando o parametro TITLE. Este valor pode ser tão grande quanto pretendermos, e é também associado pelos motores de pesquisa à imagem e à página em que a imagem se encontra.

o código de uma imagem, com ALT, TITLE e DESCRIPTION ficaria com esta aparência:

<img src='/caminho/para/imagem.gif'
   title='A minha melhor imagem'
  description='Uma descrição tão longa quando o pretenda para a imagem'>

Ah… não vale a pena abusar destes campos, os motores de pesquisa já começam a perceber quando estamos a tentar aproveitar-nos deles, e os seus algoritmos serão cada vez mais apurados. A melhor forma de vender os nossos conteúdos aos motores de pesquisa é sermos informativos, mas consistentes.

Lembro ainda que apesar de estes campos, muitas vezes não utilizados, darem aos motores de pesquisa informação acerca do que está na imagem, e ajudá-los a melhor indexar a página onde as nossas imagens estão, não lhes diz qual a relevância das imagens na página, pelo que este texto será, por norma, tratado com pouco mais relevância do que se de texto simples se tratasse.

Para que as nossas imagens sejam tratadas com mais relevância do que o restante texto da página é necessário que mais relevância lhe seja dada.

Se a imagem substitui o Titulo de uma artigo ou de uma listagem, porque razão é que não está dentro de um H1? Se é um sub-titulo, porque não um H2?

Porque depois quebra o design, ouço muito webmasters dizer… Não amiguinhos, o Design vem antes e depois. Quando se estrutura HTML, é apenas isso que se faz, cria-se a estrutura dos conteúdos. Ainda que se tenha que ter em consideração o Design, esse só é realmente importante depois de o conteúdo estar bem estruturado. Poucas (muito poucas) coisas não se conseguem fazer se o conteúdo estiver bem estruturado.

Não esquecer

Utilizar ALT em todas as imagens.

DESCRIPTION em todas as imagem que possam ser descritas.

TITLE em todas as imagens que possam ter mais a dizer.


TrustRank to Yahoo!

Published by:

William Slawski do blog Seo by the Sea escrevia ontem (15 de Maio de 2006) sobre o Trust Rank do Yahoo!, num post denominado Trust and the Internet: Web Search Spam.

O TrustRank serve para quantificar a probabilidade de um site ser ou não spammer, e conseguir assim que os sites de spammers não sejam indexados.

O post do Slawski baseia-se em alguns dos papers que serão apresentados na 15th Annual World Wide Web Conference, numa workshop sobre “Modelos de Confiança para a Web”, especialmente no paper Propagating Trust and Distrust to Demote Web Spamda autoria de Baoning WuVinay GoelBrian Davison, da Universidade de Lehigh.

O Trust Rank baseia-se numa lista de sites, que são sementes de “confiança”, porque o Yahoo! considera que não contém links para sites de spammers. Assim, o nível de confiança desses sites é depois dividido pelos sites para os quais o site contém links.

Os problemas apontados ao sistema de Trust é o facto de não haver uma propagação inversa de desconfiança (se o site apontar um site de spammers, então é-lhe atribuida uma parte de nível de desconfiança do site apontado, reduzindo assim o nível de confiança do site que contém o link), e o facto de um site com mais actividade atribuir um nível menor de confiança aos sites indicados que um site com um nível menor de confiança.

Vale a pena ler o post do Slawski, bem como todo o blog, que tem outros posts relacionados, e muita outra informação relacionada com optimização web (SEO).