rmbit - La bitácora personal de Ricardo Martín
La bitácora personal de Ricardo Martín
Comentando cosas desde 2004
23 de mayo de 2024

Probando Stable Diffusion 3

Hace ya unos pocos años que la inteligencia artificial entró en nuestras vidas. Recuerdo cuando durante la carrera, hace ya casi veinticinco años, teníamos una asignatura llamada Sistemas Expertos donde tocábamos muy de pasada el asunto de las redes neuronales, uno de los fundamentos teóricos del aprendizaje artificial. Desde entonces hemos visto un desarrollo que ha ido parejo al crecimiento de la potencia de computación hasta el punto de que hoy día cualquier interacción con esta inteligencia nos parezca magia. Primero se popularizaron los chats de texto y después los llamados text to image. Tres son los sistemas que pugnan entre sí para conseguir que nuestro texto se convierta en una imagen: Dall-E que puede utilizarse gratuitamente en Microsoft Copilot Designer, Midjourney, usable a través de Discord, y Stable Diffusion, un sistema de código abierto basado en modelos especializados en diferentes tipos de tratamiento de imágenes.

Aunque Dall-E a través de Copilot da unos resultados muy buenos, no termina de convencerme. Midjourney me resulta demasiado complejo y apenas lo he utilizado. Me he centrado en Stable Diffusion 3 para hacer mis pruebas de generación de imágenes, tanto por la calidad de resultados (permite realizar imágenes bastante grandes y fotorrealistas) como por su versatilidad a la hora de redactar un texto indicativo de como ha de ser la imagen (o prompt en el argot). Existen multitud de sitios en internet donde probar Stable Diffusion con sus diferentes modelos, aunque quizás Civitai sea la principal, donde además podemos descargar los modelos gratuitamente. Para aprender lo básico yo he seguido los estupendos tutoriales para principiantes de Stable Diffusion Art.

He instalado Stable Diffusion junto con el interfaz web AUTOMATIC1111 en uno de mis Macs en cuestión de unos pocos minutos. En realidad, lo complejo de su uso se basa en su versatilidad. Recomiendo leer mucho sobre como escribir prompts correctamente, entender los conceptos de como funciona SD para poder sacarle todo el partido, ya que en un principio la tentación de poder escribir cualquier cosa de cualquier manera nos lleva a textos desordenados, confusos también para la inteligencia artificial y por tanto con resultados decepcionantes.

Lo más interesante es que con un ordenador de potencia media (o incluso baja sin tarjeta gráfica dedicada) se puede empezar a trabajar. Eso sí, el método de prueba-error hace que haya que armarse de paciencia hasta depurar el prompt y conseguir lo que queremos. Es muy recomendable echar un ojo a las webs de prompts (como PromptHero) para orientarse de como organizar nuestras instrucciones.

No hay duda de que estamos aún en la prehistoria de este tipo de aplicaciones, y ahora nos parecen sorprendentes, pero se incorporarán a nuestras vidas en poco tiempo para ayudarnos en los procesos creativos, tanto a los que nos gusta la fotografía o el diseño gráfico como a los que simplemente son curiosos y quieren generar imágenes a medida por el simple hecho de generarlas…

28 de enero de 2014

UrtheCast, una ventana al planeta Tierra

Ayer por la tarde, hora española, dos cosmonautas rusos realizaron un paseo espacial para instalar una cámara en el módulo de servicio Zvezda de la ISS. Esta operación, que para la mayoría pasó desapercibida y no salió en ningún informativo, puede suponer una revolución en la forma en la que vemos a nuestro planeta. El motivo: La cámara –en realidad dos cámaras– que se colocó permitirá dentro de no mucho tiempo contemplar en tiempo casi real la superficie terrestre con un nivel de detalle nunca antes imaginado. Salvando las distancias, será una especie de Google Earth en movimiento y actualizado en el momento.

La idea ha sido de la empresa canadiense UrtheCast, con la colaboración del fabricante de componentes aerospaciales ruso RSC Energia, Naciones Unidas y el canal de documentales Discovery Channel. La cámara en cuestión no es una cámara cualquiera, más bien es un telescopio conectado a una cámara. IRIS, que así se llama, está adaptada para soportar las duras condiciones del espacio exterior y tomará vídeo con calidad Ultra HD (cuatro veces la alta definición 1080p), así como datos telemétricos.

Aún no sabemos cuando podremos verlo, pero es de suponer que no tengamos que esperar mucho. Lo que sí se sabe es que el servicio será gratuito y existirán suscripciones de pago para empresas u organizaciones interesadas en contar con información extra, así como para poder utilizar comercialmente las imágenes. También se pondrá a disposición de los desarrolladores una API para que aplicaciones o dispositivos puedan utilizar el servicio. La verdad es que la cosa pinta muy bien. Sólo nos queda comprobar como se desarrolla.

19 de septiembre de 2013

Probando iOS 7: Un sistema avanzado bajo apariencia sencilla

Vivimos en unos años en los que la actualización de un sistema operativo para móviles es noticia en los medios. Hace diez años hubiéramos pensado que estábamos locos. Esta reflexión me surgió al ver la avalancha de informaciones acerca de iOS 7, el nuevo sistema operativo para iPhone. Yo conseguí bajarlo ayer por la tarde después de varios intentos.

A pesar de que ya habíamos visto muchas pantallas y conocíamos el diseño con bastante detalle, impresiona verlo instalado y funcionado en mi móvil. Las primeras imágenes que vi cuando fue presentado antes del verano no me acabaron de convencer y pensé que el diseño cambiaría a algo más «refinado» en la versión definitiva. Pero no. Lo que se mostró en su día es lo que hoy tenemos. Y tengo que decir que todas aquellas dudas se han disipado completamente. iOS 7 me parece valiente, atrevido, innovador, rápido y muy práctico. Como siempre, Apple ha cuidado todos los detalles, tanto lo que se ve como lo que no, o aquello que quizás descubramos dentro de unos meses.

Lo primero que llama la atención y «choca» es el colorido y el aspecto radicamente plano y algo infantil de los iconos. Tal vez algunos de ellos podían haberse diseñado de otro modo (el de Safari y el de Ajustes me parecen horribles), pero todo es acostumbrarse. El nuevo sistema permite que estos iconos puedan ser dinámicos, ya que están diseñados mediante vectores (para entendernos, no son imágenes «fijas»). Por ejemplo el icono de la aplicación Reloj muestra la hora, minutos y segundos reales y se actualiza en tiempo real. Otra novedad interesante son los paneles semitranslúcidos, igual que los fondos dinámicos. También lo es que ¡por fin! podamos acceder rápidamente a las opciones más habituales. En el centro de control podremos activar o desactivar las redes inalámbricas, el bluetooth, encender y apagar la linterna, ajustar el brillo de la pantalla y otras opciones útiles.

Todo en iOS 7 es muy ágil e intuitivo y acostumbrarse es cuestión de minutos. El nuevo teclado, aunque tiene características muy parecidas al antiguo, da la sensación de ser más fácil de usar, más cómodo. Por otra parte el asistente por voz Siri también funciona mejor y sabe dar respuestas más naturales a nuestras preguntas y comandos.

En definitiva, un paso adelante en cuanto a estética y tecnología que no es precisamente conservador. Apple ha buscado la originalidad, la diferencia y, por supuesto, la excelencia en el funcionamiento y en los detalles bajo una apariencia sencilla. Y eso no es nada fácil de conseguir.

8 de abril de 2013

Sony FMP-X1, el primer reproductor UHD 4K: ¿El fin de los soportes físicos?

Era fácil adivinar que la presentación el año pasado de los primeros televisores 4K (comercialmente llamado Ultra High Definition, Ultra HD o simplemente UHD), el siguiente paso eran los reproductores de contenidos, proveedores de contenidos o como lo queramos llamar ahora. Sony, que ya presentó sus pantallas, ha anunciado que en verano lanzará su primer proveedor de contenidos en 4K. Su nombre es FMP-X1 y es además histórico por ser el primer reproductor de una gran marca sin basarse en un soporte físico. ¿El fin de una época?

Es esta caraterística la que más me ha dado que pensar. Es verdad que en la nota de prensa no se dice nada sobre las características concretas de este modelo, pero lo que es seguro es que cuenta con un disco duro, conector USB y lector de tarjetas SD. De salida parece ser que incluirá diez películas en 4K. Haciendo un pequeño cálculo y teniendo en cuenta que el formato UHD es cuatro veces más grande que el Full HD que todos conocemos, cada una de esas películas pesará al menos 100 Mb usando un algoritmo de compresión más eficiente que el de los Blu-Ray. Las diez películas supondrían 1 Tb de información. ¿De cuánto es el disco duro que incluirá el FMP-X1?.

Parece que muchos de los contenidos se ofrecerán en formato descarga o bien en streaming, con lo que probablemente no tendremos la calidad de imagen que nos puede ofrecer un disco. Digo esto porque el soporte físico no depende del ancho de banda de la línea de comunicaciones o del espacio que ha de ocupar en el disco duro. ¿Y si queremos conservar esas películas? Los reproductores de Blu-Ray anunciados como 4K de momento solo ofrecen un simple reescalado del material 1080p y los trabajos para diseñar un disco de al menos 128 Gb de capacidad están todavía en una etapa muy temprana (se habla de algoritmos de compresión como HEVC o discos BDXL).

3 de marzo de 2013

‘Real Racing 3’

No hace tanto tiempo, los videojuegos que incorporaban nuestros teléfonos móviles no pasaban de una humilde serpiente cuadrada o de un «rompeladrillos» de lo más básico. Hacia 2002 o 2003, cuando llegaron las primeras pantallas en color con una definición razonable, el mercado de los juegos para móvil comenzó a despegar. Pocos imaginaríamos que hoy, en 2013, los teléfonos inteligentes desbancarían a las videoconsolas portátiles. Juegos como ‘Real Racing 3’, que se ha presentado hace poco, tienen mucha culpa de ellos.

Aún parece increíble que en el reducido tamaño de un iPhone 5 quepa esa capacidad de procesamiento, sobre todo gráfico. ‘Real Racing 3’ posiblemente sea uno de los cinco mejores videojuegos para móvil que existen actualmente. Se trata de un simulador de conducción, un clásico «juego de coches» donde podemos elegir de entre más de un centenar de automóviles y numerosos campeonatos con variadas pruebas (aceleración, eliminatoria, cronometrados, carrera tradicional, etc). Casi siempre competiremos con otros jugadores, lo que aporta el componente «social» que hoy día toda aplicación requiere. Permite compartir los logros tanto con Facebook como con Twitter.

Pero si he traído este videojuego al blog es por su realismo, su jugabilidad y por sus gráficos increíbles. Poco a poco se va logrando alcanzar la calidad de cualquier ordenador de sobremesa. Todavía no llega, pero tiempo al tiempo. El artífice de la saga ‘Real Racing’ es la compañía Firemonkeys Studio, antigua Firemint, una empresa independiente australiana que ha sido comprada recientemente por Electronic Arts. Tan sólo vamos a ponerle una pega: Aunque el juego es completamente gratuito, la compra «in-app» de monedas está muy presente y es casi imposible mantenerse sólo con las monedas ganadas con el propio juego.

17 de febrero de 2013

El grotesco regreso de ‘Black Mirror’

La que según mi parecer es la mejor serie de los últimos años, ‘Black Mirror’, regresó a las pantallas británicas del Channel 4 el pasado lunes con un nuevo episodio. Con el título de ‘Be Right Back’ (algo así como ‘Ya Vuelvo’) se nos ofrece una visión de un futuro muy cercano perfectamente realista, lleno de teléfonos móviles y portátiles ultraplanos y coches inteligentes. También el software ha avanzado mucho, hasta tal punto de resultar siniestro y macabro. No quiero contar más para no destripar el argumento a los posibles espectadores. Lo que a priori puede resultar una ayuda para determinadas personas, pronto se convierte en una especie de pesadilla tecnológica factible dentro de unos pocos años.

Como ocurre siempre en ‘Black Mirror’, hasta el último detalle está perfectamente estudiado y cuidado. Pero sin duda lo mejor de todo es que es realista. Eso es lo más inquietante. El trabajo de los actores es muy sólido y el guión de Charlie Brooker, como siempre, perfecto. La serie sigue manteniendo en esta segunda temporada toda la calidad de la primera. Veremos los otros dos episodios qué es lo que nos ofrece… Por cierto, aquí en España, será la TNT quien la emita.

24 de noviembre de 2012

Haciendo vídeo con el iPhone 5

Hace unas dos semanas que tengo el iPhone 5. Desde entonces he ido probando prácticamente todas sus características. Como nunca he tenido uno antes, el cambio de mi viejo Nokia ha sido espectacular. En este artículo voy a centrarme especialmente en la parte dedicada al vídeo. Buceando por la red me he dado cuenta de que hay pocos análisis en castellano sobre las capacidades técnicas de la cámara del teléfono de Apple. En este poco tiempo he trasteado lo justo con esta característica, pero quiero aportar algunos datos interesantes sobre la grabación de secuencias de vídeo y compararlas con la de una cámara réflex de gama media-alta, que es lo que más conozco.

Lo primero que llama la atención –y que en mi caso echo de menos– es que carece de un botón físico dedicado a la cámara. Hay que tocar la pantalla, algo que hace que tomar vídeo o fotos sea un poquito incómodo. Si no tenemos mucha práctica, sujetar el teléfono de forma horizontal con seguridad y pulsar el botón de grabación resulta complicado. Al menos a mí me lo ha parecido. Esta poca ergonomía se compensa ampliamente cuando vemos los resultados en el ordenador. Me han parecido sorprendentes y mucho mejores de lo que hubiera imaginado.

Entrando en los aspectos más técnicos, el iPhone 5 usa la archiconocida codificación H.264 para el vídeo a 29,97 fotogramas por segundo y AAC monoaural para el sonido. El contenedor es, como no podía ser de otro modo, .MOV, que se manejan de maravilla con cualquier ordenador Mac. La tasa de transferencia –un dato que me parece muy importante puesto que buena parte de la calidad del vídeo la establece este parámetro– es de unos 17,50 Mbits por segundo. Por comparar, la tasa de grabación de mi Canon EOS 60D está en torno a 44 Mbits por segundo. Seguramente se haya optado por una solución de compromiso entre la calidad y el tamaño de los archivos resultantes. Así, un clip de un minuto ocupará unos 130 Mb. Los parámetros de vídeo no pueden cambiarse en la aplicación que viene por defecto, pero existen varias apps, tanto gratuitas como de pago, que sí lo permiten. El sonido, como he indicado, es monoaural, pero puede conectarse un micrófono estéreo para mejorar su calidad. De todos modos, el que capta el iPhone es bastante bueno.

El estabilizador dicen que ha mejorado respecto a su predecesor. Eso no he podido comprobarlo, pero el del iPhone 5 se comporta solo correctamente. Si queremos obtener un buen resultado, o tenemos un pulso de acero o hemos de pasarlo por un software de estabilización. Otro de los aspectos que no ayuda es que la cámara del iPhone tiene un campo de visión bastante estrecho si lo comparamos con otros móviles. Carece del gran angular que podemos ver, por ejemplo, en el Samsung Galaxy SIII. Ignoro cual es la razón de este detalle tan negativo.

Está claro que el iPhone 5 no está diseñado para realizar vídeo intensivamente, pero es un buen aliado para captar rápidamente secuencias con gran calidad de imagen y que, en la mayoría de los casos, puede sustituir en esta función a casi cualquier cámara compacta que existe hoy día en el mercado.

Para terminar, un ejemplo de vídeo tomado hoy mismo con el teléfono. Os recomiendo visualizarlo a máxima calidad. En cualquier caso tened en cuenta que YouTube y todos los demás servidores de vídeo comprimen bastante los clips para ahorrar espacio, pero sirve para hacerse una ligera idea de la calidad:



rmbit está bajo una licencia de Creative Commons.
Plantilla de diseño propio en constante evolución.
Página servida en 0,117 segundos.
Gestionado con WordPress