Fuentes de Google News

La edición en inglés de Google News rastrea historias de más de 4,500 sitios, que incluye tanto sitios web de noticias como blogs, pero eso es todo lo que sabemos. Google nunca ha publicado una lista completa de sus fuentes de noticias y la única manera para determinar si un sitio está indexado en Google News o no es a través del Source Operator (operador de fuente).

Si enmbargo, los nombres de las fuentes de Google News ya no son más un secreto. Descubre por qué tras el salto.

Krishna Bharat, que es el cerebro detrás de Google News, lanzó recientemente una enorme lista con más de 150,000 artículos de noticias en torno a Osama Bin Laden que fueron publicados en los sitios web de noticias de todo el mundo después de que la operación de Abbottabad había terminado.

Dado que casi todas las editoriales había cubierto la historia de Bin Laden en ese timpo, es muy probable que la lista de Bharat contenga las direcciones URL de más o menos todas las fuentes de noticias que son rastreadas por Google News.

Por lo tanto, he aquí una lista completa con todas las fuentes de Google News tal cual están dispuestas en la lista de Bharat.

Puedes descargar estos datos como un archivo de texto para el análisis en línea, mientras que una copia está disponible en Google Docs, para compartirla en línea. Si eres un poco curioso, esta lista de fuentes fue preparada con el siguiente comando de Linux.

cat osama_google_news.txt | grep ENGLISH | awk '{print $11}' | cut -d "/" -f 3 | sort | uniq -c | sort 

Vaya cosas que descubrimos cada día!

2 Comentarios

    • Los sitios en español también los he puesto en el archivo de Google Docs. Sólo tienes que hacer clic sobre el enlace y verás los sitios indexados en cada idioma.

Dejar respuesta

Please enter your comment!
Please enter your name here