viernes, 29 de enero de 2010

Búsquedas en Internet

Hace poco escribía una entrada sobre la forma de descargar archivos de vídeo poniendo como ejemplo la web de RTVE y mencionaba ciertos trucos de búsqueda relacionados con Google. Como la búsqueda de información en la web y en general en Internet me parece interesante y útil a partes iguales y recientemente he recuperado un material que elaboré sobre el tema, aprovecho para enlazarlo aquí. Se trata de una presentación en formato PDF que utilicé en una charla-taller titulada "Búsqueda en Internet: hasta Google y más allá...". La tabla de contenidos tratados es la siguiente:
  • WWW: la telaraña mundial
  • Directorios
  • Buscadores, arañas e índices
  • ¿Google es Dios?
  • Los otros (grandes)
  • Buscadores especiales
  • La cara oscura de la web
  • Fuera de la telaraña
Aunque básicamente se trata de un material de apoyo, bien podría serle de utilidad a alguien para descubrir nuevos aspectos relacionados con la búsqueda de información en la red de redes. O al menos eso espero.

jueves, 28 de enero de 2010

Troceando y reensamblando archivos

Con el auge de la banda ancha, compartir archivos de gran tamaño se ha convertido en algo cotidiano (video digitalizado, imágenes de CD o DVD en formato .ISO, etc.) Algunas de las tecnologías más usadas para hacerlo (los servicios de descarga directa, de los que traté en el post anterior) imponen a veces restricciones en cuanto al tamaño máximo de cada archivo a compartir, por lo que es frecuente encontrar descargas troceadas en varios archivos que luego hay que volver a unir.

Para estos menesteres se vienen utilizando ciertas herramientas software como Hacha (sobre todo en la internet hispana) y HJ-Split. No es que tenga nada en contra de estas aplicaciones; a pesar de sus feas interfaces de usuario, cumplen su misión: permiten trocear un archivo grande en trozos más pequeños y reensamblarlos posteriormente de una forma sencilla, para torpes, como la mayoría de programas en Windows. Lo que sí me sorprende es que sean los más populares, existiendo alternativas menos dañinas a la vista como File Splitter.

Pero no es de estos programas de los que quería tratar en este post, sino de ciertas herramientas que ya tenemos en nuestro sistema para lidiar con archivos troceados, muchas veces sin ni siquiera saberlo. En el caso de usar Linux, tenemos en la consola la solución completa en la forma de dos utilidades básicas que vienen de fábrica:

split nos permite trocear un archivo indicándole el tamaño de los trozos, el prefijo y el sufijo a utilizar en los nombres de los archivos resultantes. Por ejemplo, para trocear un archivo AVI de 300 MB en trozos de 100 MB que se llamen como el archivo original más un sufijo numérico de dos dígitos (empezando por 00) lo invocaríamos desde la consola de la siguiente forma:

$ split -d -b 100M video.avi video.avi.

cat nos permite concatenar archivos, tanto de texto como binarios, volcando el resultado a la salida estándar (la pantalla). Si lo combinamos con el redireccionamiento de la salida estándar a un archivo, conseguiremos reensamblar el archivo original a partir de sus trozos (es vital enumerarlos en el orden correcto). Siguiendo con el ejemplo anterior:

$ cat video.avi.00 video.avi.01 video.avi.02 > video.avi

Si esto nos parece demasiado complicado, siempre podemos instalar un programa con interfaz gŕafica, similar a Hacha tecleando desde la consola (luego lo ejecutaremos como ghoz):

$ sudo apt-get install hoz-gui

En sistemas Windows no tenemos preinstalada ninguna herramienta (que yo sepa ;) similar a split, pero podemos usar el viejo comando copy para reensamblar archivos troceados de la siguiente forma:

c:> copy /b video.avi.00 + video.avi.01 + video.avi.02 video.avi

En fin, que tenemos distintas opciones a la hora de trocear y unir archivos, algunas incluso esperando en la consola de comandos a ser invocadas ;-)

sábado, 23 de enero de 2010

Automatizando descargas de RapidShare

Desde hace un par de años se han hecho muy populares los servicios de hospedaje de archivos del tipo RapidShare o Megaupload; lo que en inglés se conoce como "1-Click hosting" y en español como servidores de "descarga directa". Estos han desplazado a las típicas redes y aplicaciones P2P como eMule y BitTorrent para compartir todo tipo de archivos. La ventaja es que no necesitan del uso de ninguna aplicación específica; todo queda a un par de clics desde nuestro navegador.

La lista de los servicios de este tipo disponibles actualmente es demasiado larga, pero los dos citados siguen siendo los más populares, sobre todo RapidShare. En su modalidad gratuita solo se puede descargar un archivo cada 15 minutos, por lo que han ido apareciendo una serie de programas especializados en automatizar las descargas desde este y otros servicios similares. La ventaja es que esperan el tiempo correspondiente en cada uno e incluso engañan a los captchas, muy usados para obligar a que el cibernauta visite las webs en persona y lea los anuncios.

Por fortuna, RapidShare solo presenta el fastidio de tener que pulsar varios botones y esperar un tiempo antes y después de cada descarga. Para ello programé hará ahora un año este shell script que permite realizar descargas de RapidShare de forma desatendida. Fue una solución quick & dirty al problema que aun puede ser útil en sistemas Linux que no tengan entorno gráfico o donde no se puedan instalar aplicaciones más potentes como las que paso a recomendar.

En general, la mejor opción para automatizar la descarga de archivos desde este tipo de servidores tanto en Linux como en Windows es JDownloader, una aplicación hecha con Java que soporta la mayoría de estos servicios, tanto en modalidad gratuita como de pago, y va cargado con todas las opciones imaginables en un gestor de descargas.

Tucan Manager es una alternativa más ligera que para sistemas Linux presenta la ventaja adicional de poderse instalar desde los repositorios de las principales distribuciones. Si usas Ubuntu sería tan fácil como teclear desde una consola:

$ sudo apt-get install tucan


En definitiva, que hay que perder un poco de tiempo automatizando las tareas habituales para, a la larga, ahorrarnos un montón ;-)

Actualización Abril 2011: tras la reciente remodelación del sitio web de Rapidshare, el script (cuya última versión, que incluye soporte para proxy, puede descargarse aquí) ha dejado de funcionar de forma irremediable. La nueva web hace un uso intensivo de JavaScript para generar contenido en el lado del cliente (incluyendo los enlaces de descarga) por lo que deja de ser factible la automatización con tan solo bash y curl :(

martes, 19 de enero de 2010

Mark Knopfler

Este músico británico es sobre todo conocido por su trayectoria al frente del grupo de rock Dire Straits, aunque ya desde esa época dio rienda suelta a su remanente de creatividad musical componiendo algunas bandas sonoras y colaborando con otros músicos de primera fila. Después de disolver Dire Straits se centró en su carrera en solitario sumando a las ocasionales partituras para películas discos y giras en las que mezcla su particular estilo de rock con otros estilos musicales de los que ha bebido: folk, blues, jazz o country. Original guitarrista, sobresaliente compositor y narrador de historias, y artesanal productor en sus propias grabaciones o en las de otros, Mark Knopfler es una figura de referencia en el panorama de la música popular anglosajona de los últimos treinta años.

Aprovechando mi reciente puesta al día sobre sus últimos discos he elaborado una selección y mezcla de los temas que más me han gustado. Ahí va la lista:
  1. What it is
  2. Done with Bonaparte
  3. So far from the Clyde
  4. Border reiver
  5. Sailing to Philadelphia
  6. The ragpicker's dream
  7. Boom, like that
  8. Silvertown blues
  9. All the roadrunning
  10. Speedway at Nazareth
  11. Get lucky
  12. Je suis désolé
  13. Heart full of holes
  14. Piper to the end
  15. Going home: theme of the local hero
Y aquí puede descargarse un archivo ZIP con la mezcla codificada en MP3 a una calidad intermedia para no retrasar demasiado la transferencia. Que aproveche.

Esta es la descarga alternativa en formato OGG Vorbis, de calidad superior a igual tamaño de archivo y que además soporta gapless playback. Para leer más sobre este asunto puedes consultar este post.

NOTA: la distribución de este material sujeto a copyright se realiza únicamente con el objeto de difundir la música de calidad y promocionar la obra de sus autores. Si te gusta la muestra compra sus discos y/o asiste a sus conciertos.

viernes, 15 de enero de 2010

TuxGuitar: tablaturas para guitarra en Linux

Cualquier aficionado a la guitarra, sepa solfeo o no, encontrará en TuxGuitar una útil herramienta. Se trata de una aplicación multiplataforma disponible para Windows, Linux (en Ubuntu desde los repositorios) y Mac OS X distribuida como software libre. Además de permitir la creación y edición de partituras permite abrir los típicos archivos de tablaturas en formato Powertab y GuitarPro junto con archivos MIDI estándares. Aparte de escucharlos nos permite ver la partitura, la tabulación e incluso un gráfico del mástil donde observar la digitación de cada una de las pistas de la canción interpretadas a la guitarra. Al trabajar como un secuenciador MIDI multipistas podemos silenciar o cambiar las propiedades de cada una para aprender a tocarlo más fácilmente.

Recientemente le saqué bastante partido para aprender ciertas partes de guitarra de una potente y épica canción de Amon Amarth: Embrace of the endless ocean (aquí puede verse un videoclip). Al localizar un archivo .gp4 de la misma y abrirlo con TuxGuitar pude discernir algunas de las técnicas utilizadas e incluso cambiar la afinación de B (el tono original jodidamente grave ;) a E para poder tocar encima con mi guitarra.

Otro día publicaré una entrada recomendando una solución para hacer sonar el programa en Linux en el caso de no tener un sintetizador MIDI incorporado en la tarjeta de sonido...

miércoles, 13 de enero de 2010

Descargando (casi) todos esos vídeos

En los últimos años ha proliferado la inclusión de contenidos multimedia en un montón de sitios web, siempre con YouTube como referencia. Para digitalizar y publicar vídeo se suele utilizar como contenedor el formato Flash Video (archivos .FLV) y han surgido todo tipo de herramientas (o incluso servicios web) destinados a permitir la descarga de estos vídeos que originalmente se han pensado para ser vistos on-line. Lo malo de estos programas o servicios es que están especializados en extraer y descargar los archivos de vídeo de ciertas web concretas y en su versión actual. Esto hace que dichas herramientas dejen de funcionar cada vez que los responsables de la web cambian la forma de los enlaces (o cualquier detalle técnico relacionado con estos) y deban ser revisadas y actualizadas convenientemente para volver a ser útiles. Además tenemos la probable situación en que nos interese descargar vídeos de una web que ninguna de estas utilidades especializadas soporta.

Una solución de más bajo nivel y por lo tanto más genérica y efectiva en la mayoría de casos es el uso de un complemento de Firefox (como puede ser HTTPFox) que permita monitorizar el tráfico HTTP entre el navegador y el servidor web para obtener la dirección de descarga del archivo FLV. La idea es activar el complemento, cargar la web donde se visualiza el vídeo en pantalla y darle al Play para que queden registrados las conexiones web que se producen después de ese momento para pescar entre estas la que nos interesa.

Un ejemplo podría ser la descarga de los vídeos que RTVE asociados a su espacio de radio y televisión Conciertos de Radio-3. No se por qué desde la web solo puede accederse a los más recientes o a los que consideran más importantes cuando la realidad es que en su mediateca disponen de bastantes más conciertos. Para solucionar eso y poder acceder a todo lo que haya publicado podemos realizar una búsqueda desde Google usando ciertos operadores avanzados de la siguiente manera:

site:rtve.es inurl:mediateca inurl:videos inurl:"conciertos-radio-3"


A esta secuencia podemos añadir el nombre del grupo u otro dato relevante para refinar la búsqueda, aunque no siempre incluyen dicha información en la página. Una vez descubierto algún vídeo de nuestro interés solo queda entrar en la página correspondiente, activar la herramienta de monitorización, darle al Play y localizar en la lista de conexiones la correspondiente al preciado archivo de vídeo. Como ejemplo pego el enlace al del concierto de Los Coronas, responsables de un rock instrumental de lo más auténtico:

http://www.rtve.es/resources/TE_SLCOR3/flv/2/7/1257816729572.flv

Lo bueno de esta técnica es que nos permite acceder a los archivos reales, independientemente de cómo se presente el contenido al internauta para su visionado on-line. Otra técnica alternativa para guardar en nuestro disco duro este tipo de contenidos suele ser hurgar en la caché del navegador, bien a mano o con la ayuda de herramientas especializadas, pero esa es otra historia que tendrá que esperar hasta un futuro post.

domingo, 10 de enero de 2010

Patético primer post

Bueno, después de seis años desde mi último intento de blogging (no, no he estado en la cárcel ni recluido en un templo budista aunque quizá debería...) voy a tener la desfachatez de empezar el año futurista 2010 estrenando otro "cuaderno de bitácora" ahora que ya casi ha pasado de moda y hasta las mascotas tienen uno propio. Si soy capaz de publicar un par de anotaciones medianamente interesantes a la semana durante un par de meses puede que hasta informe a algunas personas de confianza de su existencia y si obtengo cierto feedback positivo más adelante echaré la casa por la ventana invitando al robot de Google. Las anotaciones versarán sobre mis aficiones, como suele ser habitual en estos casos: música, cine, literatura, software, Internet, instrumentos medievales de tortura, etc. Además aprovecharé para colgar algunos materiales de cosecha propia que tengo olvidados en el disco duro y quizá alguno de nueva factura si encuentro el tiempo necesario. Como veo que estas líneas se empiezan a parecer al cuento de la lechera las voy a terminar aquí mismo. Hasta el inminente próximo post. Espero.