martes, 29 de noviembre de 2011

Resumen 30 de noviembre


Procesamiento de imágenes

En el proceso digital de imágenes se distinguen dos niveles principales de manera general.
Bajo nivel:
1.      Muy poco uso de conocimiento respecto al contenido de las imágenes.
2.      Comunmente se reconoce una secuencia de cuatro para le procesamiento a bajo nivel
·         Adquisicion de imagen
·         Pre-procesamiento
·         Segmentacion de la imagen
·         Descripcion y clasificación de objetos.
Alto nivel:
1.      Existe la capacidad de realizar toma de decisiones respecto al contenido de las imágenes.
El procesamiento de imágenes esta dado por un conjunto de operaciones llevadas a cabo sobre las imágenes a fin de realizar mediciones cuantitativas para poder describirlas es decir características que permitan mejorar o detallar la imagen.
Una característica es un atributo algunos atributos son naturales y se definen mediante la apariencia visual de la imagen en tanto otros, los artificiales, son el resultado e operaciones realizadas a la imagen.
Para poder realizar mediciones a una imagen se requiere que sus características estén bien definidas, los bordes bien delimitados asi como color y brillo uniformes.
Una imagen esta dada por sus coordenadas espaciales y su brillo , y es represantada matemáticamente en una matriz, donde los índices de las filas y columnas indican un punto especifico en la imagen.
En el procesamiento digital de imágenes, existen diversas aplicaciones y problemas:
-Representación
-Transformación
-Modelado
-Restauración
-Análisis
-Comprensión de datos

·         Filtros para la eliminación de ruido en las imágenes
Se define como ruido cualquier entidad en las imágenes, datos o resultados intermedios que no son interesantes para la computación que se pretende llevar a cabo.
Las técnicas de filtraje son transformaciones de la imagen píxel a píxel, que dependen de los niveles de gris de los píxeles vecinos en la imagen original. El proceso de filtraje se realiza utilizando matrices denominadas máscaras, que son aplicadas sobre la imagen. Los filtros sirven para suavizar o realzar detalles de la imagen, o minimizar efectos de ruido.

·         Filtro gaussiano. Este filtro implementa máscaras que intentan imitar la forma de una gaussiana: G(x,y) = e - (x + y)² / 2σ², donde x, y son las coordenadas de la imagen y sigma una desviación estándar de la probabilidad de distribución asociada.
·         Filtro mediana (rango de vecindades). El objetivo del filtro mediana es reducir el empañamiento de los bordes. Este filtro reemplaza el píxel actualmente analizado en la imagen por la mediana del brillo con respecto a los vecinos más cercanos.
·         Filtro de suavizado direccional (preservación de bordes). La eliminación de ruido mediante suavizado distorsiona la información con respecto a los bordes. Que se calcula en varias direcciones según la ecuación: I’ (x,y) = 1/Nθ(k,l)EθΣΣ I(x-k, y-l).
·         Filtro de suavizado conservador. Esta técnica de reducción del nivel de ruido emplea un algoritmo de filtración simple y rápido que sacrifica su poder de eliminación de ruido a cambio de preservar el detalle espacial de la frecuencia en una imagen, removiendo píxeles aislados con un valor muy alto o muy bajo.
·         Realce de contraste. Tiene como objetivo mejorar la calidad de las imágenes bajo ciertos criterios subjetivos del ojo humano. El contraste entre dos objetos se puede definir como la razón entre sus niveles de gris medios. La manipulación de contraste consiste en una transferencia radiométrica en cada píxel.
·         Filtro paso bajo es empleado para remover ruido de alta frecuencia espacial en una imagen digital. La reducción del ruido mediante el filtro de paso bajo se lleva a cabo mediante una cancelación de las variaciones más rápidas entre píxel y píxel.
·         Filtro paso alto opera mediante el análisis de los valores de cada píxel y cambiando estos de acuerdo a los valores de los píxeles vecinos. El filtro paso alto realza detalles de la imagen.
·         Filtro SUSAN (Smallest Univalue Segment Assimilating Nucleus). Preserva la estructura de la imagen alisando únicamente sobre los píxeles que se encuentran dentro de la región del píxel analizado (píxel central). Este filtro integra los mejores aspectos de los métodos de reducción de ruidos existentes incluyendo la preservación de bordes. En el análisis de objetos dentro de las imágenes resulta esencial distinguir entre el objeto de interés y el resto de la imagen. Una de las técnicas más conocidas es la segmentación mediante la detección de bordes. La detección de bordes es la aplicación de un algoritmo con esté proposito que dará como resultado un contorno. Su objetivo es obtener imágenes cuya salida muestre píxeles de mayor intensidad en los valores que detecten transiciones cercanas.Alguno de los algoritmos de detección de bordes más comunes son:Técnicas basadas en el gradiente: Operador de Roberts, Operador de Sobel, Operador de Prewitt, Operador Isotrópico.Operadores basados en cruces por cero: Operador de Marr-Hildreth, Detector de Canny.
·         Los operadores basados en el gradiente son píxeles con un alto gradiente. Un rápido índice de cambio de intensidad dada por el ángulo del vector gradiente puede observarse en los píxeles de los bordes.
·         Un píxel de borde se describe por: Intensidad del borde (magnitud del gradiente) y dirección del borde (ánglo del gradiente).
·         Operador de Roberts. Utiliza las direcciones diagonales para calcular el vector gradiente mediante máscaras.
·         Operador de Sobel. Calcula la magnitud del gradiente mediante: Msx² + sy²
·       Operador de Prewitt. Expande la definición del gradiente en una máscara de 3x3 para se más inmune al ruido, utiliza la misma ecuación que Sobel, pero con constante c = 1.
·   Operador Isotrópico. Intenta llegar a un equilibrio entre operador Prewitt y Sobel. Prewitt proporciona detección para bordes verticales y horizontales, y Sobel detección de bordes diagonales.

Vision por computadora

Hay varias razones por las que debemos estar interesados en la visión computacional o visión artificial. 

a) Todas las formas de vida inteligente poseen la capacidad entre la percepción y el control del movimiento (es decir acción); la percepción visual es de fundamental importancia para la vida inteligente.
b) Los clientes comparan absolutamente a menudo la calidad del aspecto con calidad funcional. Es altamente deseable comparar su aspecto visual antes de ser empaquetado y enviado. Asimismo, es deseable que el proceso de la inspección esté automatizado y efectuado sin la intervención humana.

Estas dos motivaciones para el estudio de la percepción caracterizan dos posibles razones del interés para el procesamiento, análisis, e interpretación de imágenes visuales.
Así pues, si la visión es un medio para un fin – conocer el mundo observándolo – la visión artificial es exactamente lo mismo salvo que el medio por el cual se adquiere el conocimiento ahora es un instrumento de cómputo.El tema de la visión artificial es extenso: los asuntos tales como la restauración de imágenes, mejoramiento de imagen, inspección visual automatizada, visión robótica, escenas tridimensionales, y percepción y cognición visual todas forman parte del término “Visión Artificial”.
Los primeros experimentos de cómputo para desarrollar sistemas artificiales para la visión en máquinas empezaron tarde en los años, de amplia variedad en grados de complejidad.
 Los usos han sido muchos y variados, abarcando el reconocimiento de caracteres, análisis las células de sangre, investigación automática de las radiografías, medicina nuclear , tomografías asistidas por computadora (CAT, Computer Aided Tomography), clasificación de cromosomas, identificación land-use, supervisión del tráfico, generación automática de proyecciones cartográficas, inspección de piezas para la garantía de calidad industrial, identificación de piezas y regeneración visual para ensamblaje y reparación automática. Los usos militares han incluido el seguimiento de objetos móviles, navegación automática basada en detección pasiva, y target acquisition y range-finding.
A la visión artificial le compete estudiar la estructura física tridimensional del mundo para el análisis automático de imágenes. Sin embargo, es necesaria la calidad en el uso de imágenes. Ejemplo  al  pasar de un mundo tridimensional a una imagen de dos dimensiones se pierde inevitable la información en el proceso de la proyección.
La recuperación de esta información perdida forma el problema central en la visión artificial.Las imágenes son imágenes digitales: son representaciones discretas (es decir ellas tienen valores distintos en los puntos regularmente muestreados) y son representaciones cuantificadas (es decir cada valor es un valor del número entero).
La visión artificial incluye muchas técnicas que son útiles para si misma, Ej., el procesamiento de imágenes (que se refiere a la transformación, codificación, y transmisión de las imágenes) y los patrones, de las cuales los patrones visuales son pero solo una instancia).La visión artificial incluye también técnicas para la descripción útil de la forma y del volumen, para modelos geométricos, y para el llamado proceso cognoscitivo. Así, aunque la visión artificial se refiere ciertamente al procesamiento de imágenes, estas imágenes son solamente la materia prima de una ciencia mucho más amplia, la misma que se esfuerza en última instancia para emular las capacidades perceptivas del hombre y, quizás, para verter una luz sobre la manera por la cual él logra su interacción adaptativa y robusta con su ambiente.

Animación por computadora.

Una animación es la simulación de movimiento, creada atraves de la corrida de una serie de imágenes o cuadros a cierta velocidad. La animación por computadora se puede definir como la presentación de información digital a través de una secuencia de imágenes o cuadros creadas o generadas por la computadora. Se utiliza ampliamente en los videojuegos y películas.
Hay una diferencia entre un video y una animación:
En el video el movimiento se toma de manera continua y es descompuesto en cuadros, la animación parta varias imágenes estáticas y las une para crear la ilusión de movimiento continuo.

Animación 3D

Las computadoras nos permiten crear escenas tridimensionales, esto quiere decir que, a diferencia de  la animación dibujada a mano, en una escena animada por computadora es posible cambiar el angulo de cámara y con esto, ver otra parte de la escena. John Lasseter de Pixar fue una de las primeras personas en crear animación por computadora.
Otra ventaja de la animación por computadora, es que se pueden reutilizar partes de la animación por separado.

Animación en el cine

La industria del cine es una de las que mas estudios sobre animación por computadora ha hecho, tanto en efectos visuales como en películas totalmente animadas por computadora. Los estudios de animación Pixar crearon en conjunto con estudios Disney la primera película animada completamente por computadora llamada: Toy Story.

Técnicas de animación

Algunas técnicas que se utilizan en la animación tradicional son la de animación con acetatos, la animación basada en cuadros y la animación en sprite.

·         Animación basada en cuadros:
Es una de las mas utilizadas. Una película contiene 24 cuadros por segundo, para hacer una secuencia, se van filmando las imágenes cuadro por cuadro y luego se unen para conformar una animación.

·         Animación basada en sprites:
Esta animación se refiere a animaciones de objetos sobre fondos estáticos, es decir; lo que cambia son los personajes. Esta técnica es aplicada en los videojuegos. Con el paso del tiempo se han creado nuevas técnicas como Key framing, rotoscopiado, motion control y wavelets.

·         Key framing:
El key framing se refiere a establecer posiciones en puntos específicos de    tiempo en una animación y la parte intermediaria la obtiene la          computadora por medio de la interpolación matemática.

·         Rotoscopiado:
Consiste en una forma más elaborada de key framing. En este caso se         obtienen la posición y el ángulo  de los puntos clave de imágenes reales y        se trata de converger los modelos en computadora con ellos.

·         Motion Control:
Esta técnica consiste en obtener posiciones clave de manera automática a partir de un actor real por medio de dispositivos que se conectan a su cuerpo.

·         Wavelets:
Esta técnica permite que en una sola imagen se compriman una gran cantidad de datos para acercarse a ella, se vayan viendo los detalles.

La teoría Wavelets es una teoría puramente matemática que ha sido aplicada en distintas áreas, por ejemplo fue utilizada para buscar una mejor manera de transmitir mensajes claros a través de hilos telefónicos, encontrar una mejor forma de interpretar las señales sísmicas e incluso es utilizada por el FBI para codificar su base de datos de 30 millones de huellas dactilares.