Diferencia entre revisiones de «Grupo 3»

Revisión del 16:10 6 ago 2014

Contenido

1 Integrantes
2 Tutor
3 Introducción
4 Motivación
5 Objetivos
6 Desarrollo del problema
7 Paleta
8 Demo
9 Conclusiones
10 Trabajo a futuro
11 Referencias
12 Plugin

Integrantes

Álvaro Pardo
Fernando Penadés

Tutor

Mercedes Marzoa

Introducción

El proyecto consiste en agregar nuevas funcionalidades y mejorar, mediante entrenamiento, las existentes en el proyecto anterior.

Motivación

Nos pareció buena idea continuar con este proyecto, con el fin de mejorarlo y acercarlo más a el objetivo final de insertarlo en el mundo educativo, dando así nuevas posibilidades a los chicos con capacidades diferentes de trabajar con el robot Butiá. Las principales dificultades que notamos a la hora de programar mediante voz con la paleta anterior, pasaban por la imposibilidad de desplazarse por la pantalla (moviendo el scroll) y de deshacer. Creímos conveniente orientar nuestro trabajo hacía la implementación de dichas funcionalidades.

Objetivos

Agregar varias funcionalidades básicas a las ya existentes.
Permitir al usuario una más cómoda edición del código, mediante comandos para mover del scroll y la operación "Deshacer".
Agregar más entrenamiento a las operaciones pre existentes, con el fin de mejorar la capacidad de reconocimiento de las mismas.

Desarrollo del problema

Articulo principal: Paleta para primitivas de reconocimiento de voz en tortuga: Desarrollo del problema

Gramática: La gramática actual es la siguiente:

Paleta

La paleta como se ve en la imagen consta de un solo bloque llamado escuchar. Lo que hace este bloque es iniciar el programa que escucha. Luego simplemente se comienza a decir las instrucciones.

Comandos soportados desde antes:

Empezar
Adelante Butiá
Atrás Butiá
Derecha Butiá
Izquierda Butiá
Esperar [número] donde número es la cantidad de tiempo a esperar de 1 a 10
Limpiar: Borra todos los comandos
Ejecutar: Deja de escuchar y ejecuta el programa

Comandos nuevos:

Bajar: Baja el scroll
Subir: Sube el scroll
Deshacer
Por siempre
Repetir [número] donde número es la cantidad de veces a repetir de 1 a 10
Fin: Comando utilizado para terminar de poner bloques dentro de una estructura de repetición (Repetir o Por siempre) y comenzar a ponerlos abajo de la misma

Demo

Ejemplo de ejecutar:

Aclaración: El problema del ultimo bloque que agrega luego de recibir el comando ejecutar ya fue arreglado.

Ejemplo de limpiar bloques:

Ejemplo de instrucciones con error al final:

Conclusiones

Logramos implementar las funcionalidades que nos propusimos y concluímos que aún quedan varias funcionalidades importantes que desarrollar, como las estructuras "if-then-else" y la utilización de cajas. Centramos nuestro trabajo en agregar algunas estructuras básicas, como repetir (de 1 a 10) y por siempre, y funcionalidades de edición, como movimiento del scroll y el deshacer. Esta última es fundamental, dado que el reconocimiento de voz es aún inexacto y es necesario poder volver atrás sin necesidad de borrar todo. El otro objetivo que nos propusimos fue el de mejorar el entrenamiento de las funcionalidades preexistentes. Logramos duplicar la base de datos de voz y mejorar el reconocimiento adecuado de los comandos anteriores. Sin embargo, notamos que todavía hace falta trabajo de entrenamiento para que la paleta pueda ser usada convenientemente.

Trabajo a futuro

Agregar más funcionalidades básicas y más complejas, como por ejemplo guardado de proyecto, uso de cajas, estructuras "if" y sensores.
Entrenar aún más el modelo acústico.
Ampliar a otros idiomas.

Referencias

[1] Modelo acustico VoxForge: http://www.voxforge.org/es [2] Tutorial Pocketsphinx http://cmusphinx.sourceforge.net/wiki/tutorialpocketsphinx [3] Using PocketSphinx with GStreamer: http://cmusphinx.sourceforge.net/wiki/gstreamer [4] Adapting the default acoustic model: http://cmusphinx.sourceforge.net/wiki/tutorialadapt

Plugin

Archivo:Butia listens.zip

@@ Línea 73: / Línea 73: @@
 ==Trabajo a futuro==
-* Ampliar la gramática para abarcar mas funcionalidades del TurtleBot.
+* Agregar más funcionalidades básicas y más complejas, como por ejemplo guardado de proyecto, uso de cajas, estructuras "if" y sensores.
-* Entrenar el modelo acústico con más personas y en ambientes con ruido.
+* Entrenar aún más el modelo acústico.
-* Ampliar a otros idiomas
+* Ampliar a otros idiomas.
 ==Referencias==