Descricao: Esta função tem o propósito de garimpar palavras chaves de um texto qualquer passado como parametro.
Date: 07/11/2005
Obs. estou publicando este arquivo somente porque acho q mais pessoas irão precisar, se vc precisou, legal :) pode me mandar um email com criticas, sugestoes, elogios e tal..valeu
*/
#AQUI ESTÁ MINHA FUNÇÃO
#esta irá retorar um array com várias palavras.
function select_keywords($texto){
global $keywords;
$er .= '/(';//comeco
$er .= '[A-ZÀ-Ú]+[a-zà-ú\']*';//ultima alteracao foi colocado a opcao para aspas simples
$er .= '\s?';//espaço opcional
$er .= '([\/\|]|(-[A-ZÀ-Úa-zà-ú]+|(de\s|(do\s|(da\s|(dos\s|das\s))))))?';//opcional complementos
$er .= '\s?';//espaço opcional
$er .= '([A-ZÀ-Ú]+[a-zà-ú]*)';//este é a segunda parte do nome, onde vai buscar somente nomes compostos de 2 pal.
$er .= '\s?';//espaço opcional
$er .= '([\/\|]|(-[A-ZÀ-Úa-zà-ú]+|(de\s|(do[!s]\s|da[!s]\s))))?';
$er .= '\s?';//espaço opcional
$er .= '([A-ZÀ-Ú]+[a-zà-ú]*)?';//palavra q comece com maiscula
$er .= '\s?';//espaço opcional
$er .= '([\/\|]|(-[A-ZÀ-Úa-zà-ú]+|(de\s|(do\s|(da\s|(dos\s|das\s))))))?';
$er .= '\s?';//espaço opcional
$er .= '([A-ZÀ-Ú]+[a-zà-ú]*)?';//palavra q comece com maiscula
$er .= '\s?';//espaço opcional
$er .= '([A-ZÀ-Ú]+[a-zà-ú]*)?';//palavra q comece com maiscula
$er .= ')\1?/s';//fim
$texto = html_entity_decode($texto);
$keywords = array();
preg_match_all($er, $texto, $matches, PREG_SET_ORDER);
for ($i=0; $i< count($matches); $i++)
array_push($keywords, $matches[$i][0]);
}
##########################
### vamos para um exemplo:
# 1- nosso texto para busca:
$texto = "Mais uma (importante) contribuição à bibliografia de jornalismo: A Aventura da Reportagem de Gilberto Dimenstein e Ricardo Kotscho (Novas Buscas em Comunicação, volume 38; 104 páginas, Cr$ 918,00, Summus Editorial).
Dois dos mais respeitados repórteres da imprensa nacional, narram, cada um no seu estilo, como se dá a produção de uma reportagem, desde o seu nascimento, através das idéias transformadas em pautas, passando pelas dificuldades na obtenção de informações e a publicação (ou não) no jornais. Com apresentação de outro jornalista peso-pesado, Clóvis Rossi, o livro traz os bastidores das redações, as pressões da cúpula dos jornais, as articulações que permitem ou não a publicação de determinadas matérias e ainda, como enfrentar as armadilhas das informações, checar e costurar dados.
Kotscho, repórter da sucursal paulista do Jornal do Brasil, três prêmios Esso e dois Vladimir Herzog, é autor de 13 livros (entre os quais O Massacre dos Posseiros e Explode um novo Brasil). Dimenstein, diretor da sucursal da Folha de São Paulo em Brasília é conhecido por suas reportagens investigativas na área da Política, denunciando diversos escândalos. Premiado duas vezes com o Esso e o Líbero Badaró, é autor de A República dos Padrinhos,Conexão Cabo Frio e A Guerra dos Meninos.";
# 2- realiza a busca das palavras na funcao
select_keywords($texto);//chama a funcao passando um texto
# 3- gera o keywords da página
echo " 0 ){
for ($i=0; $i< count($keywords); $i++)
{
echo $keywords[$i].", ";
}
}else{
echo "aqui vai o default caso o texto nao tenha palavras";
}
echo '\">';
#neste exemplo o resultado obtido por eu foi:
/*
*/
?>