Removendo o código HTML em um parse
Bom dia pessoal, este é meu primeiro artigo para o PHPBrasil, vou fazer um bem simples, porém, dependendo da aceitação e a disponibilidade de tempo irei publicando mais artigos. Espero que gostem!
Muitas vezes precisamos fazer o parse em um HTML muito sujo e sem padrão algum, sendo assim acaba sendo mais fácil fazer o Parse quando eliminamos do conteúdo o HTML.
Para eliminar o código HTML utilizaremos uma função muito simples chamada strip_tags(), esta função recebe como parâmetro o conteúdo HTML e retorna um conteúdo de texto, respeitando as quebras e identação já existente, veja o exemplo:
Com isso, em uma página com o HTML complexo e bagunçado conseguimos eliminar todo o lixo para fazer o parse de forma bem mais simples.
Bom, é isso, espero que agrade, em breve devo escrever mais, espero sugestões de temas, talvez continuar nesta linha de parse.
Muitas vezes precisamos fazer o parse em um HTML muito sujo e sem padrão algum, sendo assim acaba sendo mais fácil fazer o Parse quando eliminamos do conteúdo o HTML.
Para eliminar o código HTML utilizaremos uma função muito simples chamada strip_tags(), esta função recebe como parâmetro o conteúdo HTML e retorna um conteúdo de texto, respeitando as quebras e identação já existente, veja o exemplo:
<?php $codigo = file_get_contents("http://www.phpbrasil.com/"); echo strip_tags($codigo); ?>
Com isso, em uma página com o HTML complexo e bagunçado conseguimos eliminar todo o lixo para fazer o parse de forma bem mais simples.
Bom, é isso, espero que agrade, em breve devo escrever mais, espero sugestões de temas, talvez continuar nesta linha de parse.
Exemplo: