Depois de um vídeo do Matt Cutts explicando porque a página do Google não possui um código válido, no qual, no final ele diz que ter código válido não gera nenhum bônus para o site no rankeamento, começou um burburinho, dizendo que era uma grande besteira validar código e que isso é desnecessário. Infelizmente, as palavras do Matt Cutts foram interpretadas ao pé da letra e isso causou uma péssima interpretação dos fatos.
Não estou dizendo que ele está mentindo, o que ele falou no vídeo, acredito que seja 100% verdadeiro, mas em momento nenhum ele falou que não há vantagem em ter um código válido. O que ele disse é que não existe nenhuma função no algoritmo parecido com isso:
Ou seja, não tem nenhuma função que veja se o site tem html válido e se tiver dá algum bônus para a página, fazendo com que ele apareça com uma posição melhor. Porém é fácil demonstrar que um código válido e, principalmente, semântico acabará melhor indexado do que outro documento que tenha um péssimo código e mantenha todas as demais variáveis similares.
Trechos de código HTML como o abaixo ainda são muito encontrados em páginas, hoje em dia, para quem começou a desenvolver para web agora, isso é um exemplo de como as páginas eram escritas antigamente. Esse código exibe 3 parágrafos e um menu com 5 itens, com a formatação toda misturada aos dados, sem qualquer indicação do que é o que e, com tags fechadas fora de ordem ou nem fechadas:
O mesmo resultado pode ser conseguido com o código abaixo e a adição de um CSS que orientaria a diagramação da respostas. Para os puritanos do HTML válido e semântico, o código está errado, porém, ele atende a todas as necessidades, pois há uma clara indicação do que é o que, o código é mais limpo e segue um padrão correto de abertura e fechamento de tags. O markup extra, que faria os advogados do XHTML strict torcerem o nariz é benéfico.
Quem já trabalhou com programação, principalmente, interpretando textos, nota que é muito mais fácil entender o que cada parte do segundo código quer dizer do que o primeiro e é ai que está a grande vantagem do código válido e semântico. Na hora de interpretar o código para tentar dizer sobre o que é a página, o algoritmo (que nada mais é do que um interpretador de texto, com mais um monte de funções) vai saber, claramente, o que é conteúdo, o que é um parágrafo, o que está destacado e o que é um menu.
Já no primeiro código o algoritmo tem quase que adivinhar o que é cada coisa e se não adivinhar corretamente, algo que poderia ser uma grande vantagem para sua página pode acabar passando como mais um texto qualquer no meio do resto do texto na página.
Com a disputa cada vez mais acirrada pelos primeiros lugares no Google, Yahoo ou Bing, qualquer pequena vantagem pode valer muito a pena. Tirando casos que a mudança implica em mais custos que a melhoria no posicionamento da página traria de retorno, eu diria que essa alteração é fundamental.
Reposta simples, não. Como viram, no código acima, eu optei por colocar marcação extra para ajudar a definir o que cada parte do código representa, mesmo que desse para ter o mesmo resultado sem essa marcação extra. Além disso, várias coisas que são necessárias para que a página funcione a contento não deixarão que a mesma valide, como javascripts de afiliados e métricas, porém isso não é suficiente para prejudicar o entendimento da página, até porque, na maioria das vezes, esses itens são ignorados pelos mecanismos de busca.
A preocupação maior deve ser com a semântica, principalmente, a indicação do que cada elemento da página é, por exemplo:
E a utilização da sintaxe do XHTML, pelo simples fato que é muito mais fácil interpretar um código bem padronizado do que outro que é uma bagunça.
Por mais estranho que possa parecer a mudança do foco para HTML5 ao invés do XHTML, para um programador, que acha o XHTML mais interessante e prático, faz todo sentido a mudança. Porém, ao mesmo tempo que o HTML5 não obriga que escrevamos mais código com uma sintaxe parecida com o XML, ele não proíbe isso, ou seja, para continuar usufruindo dessa facilidade de interpretação que pode gerar uma melhoria na posição das páginas, basta continuar obedecendo os princípios básicos do XML, como:
Seguindo a especificação do HTML5, mas mantendo a sintaxe "puxada" para o XML, teremos o melhor dos dois mundos, pois o HTML5 é, naturalmente, mais semântico que o XHTML, além de introduzir elementos que nos permite definir as várias partes do documento de uma forma muito boa.
[...] This post was mentioned on Twitter by Pinceladas da Web, Neto Basilio and Vitor Ruiz Leonel, Allegro Propaganda. Allegro Propaganda said: Código válido é benéfico para SEO: http://migre.me/9DPR – via @pinceladasdaweb [...]
Twitter Comment
RT: @pinceladasdaweb: Código válido é benéfico para SEO: [link to post] #seo #html5
– Posted using Chat Catcher
Twitter Comment
Muito bom essa matéria! Leiam! // RT: @pinceladasdaweb: Código válido é benéfico para SEO: [link to post] #seo #html5
– Posted using Chat Catcher
Twitter Comment
RT @allegrototal: Código válido é benéfico para SEO: [link to post] – via @pinceladasdaweb
– Posted using Chat Catcher
Twitter Comment
Código válido é benéfico para SEO: [link to post] – via @pinceladasdaweb
– Posted using Chat Catcher
Twitter Comment
Código válido é benéfico para SEO: [link to post] #seo #html5
– Posted using Chat Catcher
Twitter Comment
RT @tweetmeme Código válido é benéfico para SEO | BrPoint [link to post]
– Posted using Chat Catcher
Hoje, código válido não interfere nas posições dos resultados dos mecanismos de busca. No futuro, talvez.
Twitter Comment
RT @brunoalves: RT @tweetmeme Código válido é benéfico para SEO | BrPoint [link to post] – leitura recomendável!
– Posted using Chat Catcher
[...] Bruno Alves do brpoint.net fala sobre como o código válido é benéfico ou não para uma boa optimização para os motores de [...]
Twitter Comment
mais um artigo “na mosca” do @brunoalves: Código válido é benéfico para SEO [link to post]
– Posted using Chat Catcher
Twitter Comment
Concordo! E os tabeleiros sempre falando que tanto faz… RT @brunoalves Código válido é benéfico para SEO | BrPoint [link to post]
– Posted using Chat Catcher
[...] 2. BrPoint [...]