Sistema de visión artificial humanoide para reconocimiento de formas y patrones de objetos, aplicando redes neuronales y algoritmos de aprendizaje automático
Resumen
Esta tesis, desarrolla un sistema de Visión Artificial el cual detecta objetos bajo un ambiente a campo abierto de terreno arenoso, con un fondo incierto bajo ciertas condiciones de luminosidad, brillo saturación, contraste. Para ello se desarrolló un sistema el cual permite ver la profundidad y la distancia la cual se encuentra determinado punto de la imagen de la cámara respecto al mundo real, todo por medio de algoritmos computacionales y teoría de Visión estereoscópica, aproximándose así a un sistema de Visión artificial Humanoide al percibir la profundidad y el reconocimiento de objetos bajo el concepto que se presenta en el libro “A Humanoid Vision System for Versatile Interaction” escrita por Yasuo K., Sebastien R., Oliver S., Gorgon C. & Akihiko N. También se desarrolló un sistema el cual permite identificar el objeto objetivo, ya sea para su posterior manipulación, o posterior acción del sistema, lo cual se implementó una red neuronal Multicapa el cual permite diferenciar de entre 3 objetos, el final deseado. El uso de la Red Neuronal Artificial guarda un papel muy importante. Las conexiones entre neuronas tienen pesos asociados que representan la influencia de una sobre la otra. Si dos neuronas no están conectadas, el correspondiente peso de enlace es cero. Esencialmente, cada una envía su información de estado multiplicado por el correspondiente peso a todas las neuronas conectadas con ella. Luego cada una, a su vez, suma los valores recibidos desde sus dendritas para actualizar sus estados respectivos. Se emplea normalmente un conjunto de ejemplos representativos de la transformación deseada para "entrenar" el sistema, que, a su vez, se adapta para producir las salidas deseadas cuando se lo evalúa con las entradas "aprendidas". Para la percepción de profundidad, se realizó con un tablero de ajedrez, al identificar las esquinas de cada cuadrado ubicados cada 2.54 cm a una distancia de la cámara de 79cm medidos en real, obteniendo resultados muy aproximados entre [71 – 75] cm con un error de hasta 4 cm. Esto sin embargo se puede corregir aplicando mayor uso de imágenes para lectura y calibración de cámara y luego aplicar los algoritmos de estereoscopía. Éste error, es aceptable por ejemplo en sistemas de prevención de choques en los autos, los cuales tienen un retrovisor pantalla en su panel principal, mostrándose en el screen la distancia del obstáculo detectado respecto al auto a fin de evitar malas maniobras o choques. De esta manera en este proyecto de tesis se demuestra la identificación de objetos, y la percepción de la profundidad con el tablero de ajedrez.
Colecciones
- Ingeniería Mecatrónica [101]