miércoles, 13 de enero de 2010

Descargando (casi) todos esos vídeos

En los últimos años ha proliferado la inclusión de contenidos multimedia en un montón de sitios web, siempre con YouTube como referencia. Para digitalizar y publicar vídeo se suele utilizar como contenedor el formato Flash Video (archivos .FLV) y han surgido todo tipo de herramientas (o incluso servicios web) destinados a permitir la descarga de estos vídeos que originalmente se han pensado para ser vistos on-line. Lo malo de estos programas o servicios es que están especializados en extraer y descargar los archivos de vídeo de ciertas web concretas y en su versión actual. Esto hace que dichas herramientas dejen de funcionar cada vez que los responsables de la web cambian la forma de los enlaces (o cualquier detalle técnico relacionado con estos) y deban ser revisadas y actualizadas convenientemente para volver a ser útiles. Además tenemos la probable situación en que nos interese descargar vídeos de una web que ninguna de estas utilidades especializadas soporta.

Una solución de más bajo nivel y por lo tanto más genérica y efectiva en la mayoría de casos es el uso de un complemento de Firefox (como puede ser HTTPFox) que permita monitorizar el tráfico HTTP entre el navegador y el servidor web para obtener la dirección de descarga del archivo FLV. La idea es activar el complemento, cargar la web donde se visualiza el vídeo en pantalla y darle al Play para que queden registrados las conexiones web que se producen después de ese momento para pescar entre estas la que nos interesa.

Un ejemplo podría ser la descarga de los vídeos que RTVE asociados a su espacio de radio y televisión Conciertos de Radio-3. No se por qué desde la web solo puede accederse a los más recientes o a los que consideran más importantes cuando la realidad es que en su mediateca disponen de bastantes más conciertos. Para solucionar eso y poder acceder a todo lo que haya publicado podemos realizar una búsqueda desde Google usando ciertos operadores avanzados de la siguiente manera:

site:rtve.es inurl:mediateca inurl:videos inurl:"conciertos-radio-3"


A esta secuencia podemos añadir el nombre del grupo u otro dato relevante para refinar la búsqueda, aunque no siempre incluyen dicha información en la página. Una vez descubierto algún vídeo de nuestro interés solo queda entrar en la página correspondiente, activar la herramienta de monitorización, darle al Play y localizar en la lista de conexiones la correspondiente al preciado archivo de vídeo. Como ejemplo pego el enlace al del concierto de Los Coronas, responsables de un rock instrumental de lo más auténtico:

http://www.rtve.es/resources/TE_SLCOR3/flv/2/7/1257816729572.flv

Lo bueno de esta técnica es que nos permite acceder a los archivos reales, independientemente de cómo se presente el contenido al internauta para su visionado on-line. Otra técnica alternativa para guardar en nuestro disco duro este tipo de contenidos suele ser hurgar en la caché del navegador, bien a mano o con la ayuda de herramientas especializadas, pero esa es otra historia que tendrá que esperar hasta un futuro post.