Tecnología

UX para una escritura a mano digital natural

La inteligencia artificial avanzada permite llevar la escritura manual al mundo digital, y una experiencia de usuario adelantada a su época la convierte en una de las herramientas más versátiles

La importancia de la experiencia de usuario

La experiencia de usuario o UX (del inglés “User eXperience”) hace referencia a la experiencia que se tiene al interactuar con una aplicación, producto o sistema. En el desarrollo de software, suele ser el foco de dos disciplinas estrechamente relacionadas: la investigación y el diseño de la experiencia de usuario.

Investigación de la experiencia de usuario

En MyScript, investigamos la experiencia de usuario para comprender por qué y en qué contextos las personas prefieren escribir a mano. Estudiamos también las expectativas, necesidades y comportamientos de las personas cuando escriben a mano en papel o en un dispositivo digital.

Utilizando diversas técnicas estadísticas y cualitativas (desde entrevistas y encuestas hasta estudios de actividades diarias, análisis comparativos y pruebas de usabilidad), nuestros investigadores de UX recopilan, clasifican y analizan enormes cantidades de datos. Posteriormente, desarrollan roles detallados (modelos de distintos tipos de usuarios) y mapas de viaje (recorridos que siguen los usuarios al realizar tareas en una aplicación) que cubren las necesidades más importantes en diversas empresas o sectores.

Diseño de la experiencia de usuario

Nuestros diseñadores de UX utilizan los roles y los recorridos identificados por la investigación de UX para dar respuestas innovadoras a las necesidades de los usuarios. Son los responsables de realizar talleres y proponer y crear prototipos de posibles diseños, al tiempo que ayudan a garantizar que las actualizaciones del diseño cumplan también con los requisitos legales, comerciales y de otro tipo (como la localización).

Aunque pueda parecer sencillo, a menudo las necesidades o los problemas de los usuarios no tienen soluciones simples, especialmente cuando se trabaja con inteligencia artificial. Es aquí donde los desafíos se vuelven mayores (¡y más interesantes!) para los equipos de UX.

Para ilustrar estos desafíos, veamos más en profundidad cómo nos ha ayudado la UX a dar forma y a definir nuestros principales productos en MyScript.

Sacar más rendimiento a la tinta digital

Cuando comenzamos a desarrollar nuestra tinta digital basada en la inteligencia artificial, allá por 1998, nuestras prioridades eran la precisión y la velocidad del reconocimiento de escritura. Pero ya entonces éramos conscientes de que la historia no acabaría ahí.

Existen muchas tintas digitales en el mercado, pero la mayoría ofrecen unas capacidades más bien limitadas: capturan los trazos de los usuarios como imágenes estáticas. Se les puede cambiar el tamaño o pueden moverse por la página, pero poca cosa más. Como resultado, los datos manuscritos se sitúan en la página en un plano distinto del resto, en particular del texto escrito con el teclado.

Por eso, mientras desarrollábamos un motor de IA que pudiera reconocer y convertir la escritura con una precisión extraordinaria, también nos preguntábamos ya qué más podría llegar a ser y a hacer la tinta digital. ¿En qué otros aspectos podría beneficiar a los usuarios y mejorar al papel y a la tinta tradicionales?

La literatura existente nos ayudó a comprender por qué las personas eligen escribir o dibujar a mano y no con el teclado, dictando o usando otros métodos de entrada digitales. Así que comenzamos a experimentar para ampliar los horizontes de la tinta digital más allá del reconocimiento de escritura. Ampliamos el punto de mira e incluimos prestaciones como la adaptabilidad y la edición mediante gestos con el lápiz. Y aunque los avances fueron positivos, pronto quedó claro que no eran desafíos que la inteligencia artificial pudiera solucionar por sí sola. Debíamos trabajar en paralelo en un diseño de la experiencia de usuario innovador e inteligente.

Una entrada de datos efectiva de manera natural

Trabajábamos en un momento de crecimiento exponencial en la adopción y diversificación de los dispositivos digitales, y la situación y el futuro de la escritura a mano eran inciertos. Así que intensificamos nuestra investigación, entrevistando a personas de diversos entornos sociales y profesionales durante períodos prolongados, para comprender qué uso hacían de la escritura a mano en su día a día.

Estudiamos miles de notas reales (en papel y digitales) y organizamos encuestas detalladas con miles de participantes. Y a pesar a la explosiva proliferación de dispositivos digitales, nuestra hipótesis de partida se confirmaba una y otra vez: crear contenido a mano ofrece ventajas sustanciales e insustituibles, desde una mayor libertad de expresión hasta una mejora en la memorización.

Es mucho más fácil registrar ideas no lineales o relacionar conceptos utilizando lápiz y papel que con el teclado. Lo mismo ocurre al escribir ecuaciones matemáticas o notación musical. Y a menudo es más fácil crear diagramas a mano que con el mouse. Con frecuencia, al escribir, no se trata solo de crear un contenido acabado: es también una manera de pensar. Cuando escribimos o dibujamos a mano, nuestras ideas pueden evolucionar de una forma más libre y orgánica.

Las ventajas del contenido digital

Pero crear contenido a mano también comporta limitaciones y frustraciones.

En nuestras investigaciones, constatamos que las notas en papel a menudo no se integraban bien con las herramientas y los recursos digitales. Las personas muchas veces perdían el rastro de los datos trazados en trozos de papel. Perdían un tiempo precioso en la transcripción al pasar actas manuscritas o esquemas retocados a PowerPoint o Keynote. A menudo, las notas funcionaban bien al principio, pero se volvían cada vez más caóticas y difíciles de entender cuando faltaba espacio o cuando se cometían errores que no se podían borrar. Las alternativas digitales a la escritura a mano eran por lo general más efectivas para recuperar, organizar, trasladar, modificar o conectar la información.

¿Por qué elegir entre dos métodos de entrada de datos si cada uno ofrece ventajas en cuanto a productividad y usabilidad? Vimos ahí una oportunidad para crear una solución que combinara lo mejor de ambos mundos.

Comprender los escenarios de uso

Durante nuestra investigación, habíamos examinado también contextos en los que los métodos de entrada digital tradicionales parecían difíciles de manejar y en los que escribir a mano (incluso con un dedo) podría tener sus ventajas.

Las pantallas y los sistemas de infoentretenimiento de los vehículos son un buen ejemplo: los botones, los controles giratorios y los teclados de pantalla táctil pueden distraer a los conductores y suponer una amenaza seria para la seguridad. Incluso el reconocimiento de voz tiene inconvenientes importantes: en los automóviles suele haber ruido de fondo y la tecnología no es tan precisa como para evitar errores frecuentes. Si los conductores tienen que dividir la atención para solucionar errores en el reconocimiento, las consecuencias pueden ser catastróficas.

¿Y si los conductores pudieran simplemente escribir instrucciones con un dedo sin apartar la mirada de la carretera? Plantearía algunos retos, sin duda: para empezar, el software debería ser capaz de separar y comprender los caracteres superpuestos. Pero las ventajas y las posibles aplicaciones de una solución de este tipo serían considerables, por ejemplo en los relojes inteligentes, cuyas pantallas son muy pequeñas.

Otro ejemplo es la creación de diagramas. Para dibujar diagramas para informes o presentaciones, normalmente los usuarios tienen que dominar otra aplicación o adquirir destrezas especializadas en un programa con el que ya estén familiarizados (como Microsoft Word). ¿Y si nuestra tecnología les permitiera crear un diagrama con el lápiz y convertirlo en formas perfectas, líneas rectas y texto de imprenta con apenas un par de toques?

¿Y si además el diagrama convertido tuviera un diseño adaptable y cambiara automáticamente el tamaño de los conectores al mover los elementos? Mejor aún, ¿y si el diagrama dibujado a mano pudiera convertirse automáticamente al pegarlo en aplicaciones conocidas de presentaciones, como PowerPoint o Keynote?

Estábamos dando forma a un nuevo tipo de tinta digital que ofrecería al usuario algo más que el reconocimiento de la escritura y la conversión del texto.

De la comprensión a la visión

Una vez identificadas las necesidades de los usuarios a través de una investigación rigurosa de UX, el objetivo estaba claro: garantizar que nuestra tinta digital funcionara como el eslabón perdido entre las ventajas naturales de la escritura a mano y la potencia del contenido digital. La combinación de ambos podía dar un gran impulso a la productividad de las personas. Pero solo con la inteligencia artificial, no sería suficiente. Necesitábamos un diseño de la experiencia de usuario inteligente, cuidadoso e innovador.

Interactividad y productividad

El primer paso fue definir en qué aspectos nuestra tinta digital iría más allá que las demás del mercado. En estrecha colaboración con nuestros equipos de desarrollo y directores de producto, nuestro equipo de UX concibió una “tinta interactiva” que ofrecería tres innovaciones principales: multimodalidad, capacidad de edición y adaptabilidad.

Multimodalidad

Queríamos que nuestra tinta digital funcionara en igualdad de condiciones que el texto escrito con el teclado, y no como una forma de contenido separada. Así que diseñamos nuestro software para que tratara los distintos tipos de entradas de texto de la misma manera, permitiendo a los usuarios combinar la escritura a mano y con el teclado en un mismo documento, párrafo, frase o palabra. Puede comprobarlo en Nebo , nuestra aplicación para tomar notas digitales.

La página estándar de Nebo fue diseñada para la creación de notas y documentos estructurados y lineales, en los que el contenido escrito a mano y con el teclado se pudiera combinar, fusionar y convertir según fuera necesario. Los usuarios pueden añadir diversos “objetos” (diagramas, cálculos matemáticos, esbozos, etc.) para enriquecer las notas sin que afecte a la precisión del reconocimiento.

De hecho, el uso de los objetos plantea uno de los mayores retos a los que nos enfrentamos ahora mismo: cómo hacer posible que los usuarios combinen contenidos de texto y de otro tipo en una página digital con total libertad y sin perder funcionalidad en ninguno de ellos. Nuestra determinación por lograr este objetivo se aprecia especialmente en la introducción y evolución de la página de formato libre de Nebo, lanzada a finales de 2020.

La página de formato libre es un lienzo infinito que permite a los usuarios escribir y dibujar con libertad, sin restricciones en la colocación del contenido y sin la potencial distracción que puede provocar el procesamiento digital automático. Esto lo convierte en una solución excelente en sesiones de lluvias de ideas o para tomar apuntes en clase, situaciones en las que los usuarios se centran menos en la estructura lineal y en el contenido meramente de texto.

Actualmente, trabajamos en crear la próxima versión de la página de formato libre, que permitirá a los usuarios escribir, dictar e incluso convertir la escritura a mano en texto de imprenta, cerrando cada vez más la brecha entre las entradas de datos analógicas y digitales.

Capacidad de edición

También queríamos que nuestra “tinta interactiva” brindara una flexibilidad digital total al contenido manuscrito. La escritura a mano tenía que seguir siendo totalmente editable al nivel de los trazos individuales, y tenía que poderse editar con el lápiz digital.

Llevamos a cabo una extensa investigación y, con ayuda de nuestro equipo de IA, implementamos una serie de gestos del lápiz tan intuitivos que se pueden aprender y emplear en segundos: tachar para borrar, un trazo hacia arriba para unir, hacia abajo para separar, etc. Y como nuestra tinta es multimodal, estos gestos funcionan tanto en texto de imprenta como manuscrito: una forma más de aumentar la productividad de nuestros usuarios.

Adaptabilidad

En algunos contextos (como al crear apuntes de un curso combinando texto con esbozos, diagramas o ecuaciones matemáticas) es fundamental conservar el diseño original del contenido.

En otros (como al escribir el acta de una reunión que se convertirá en texto de imprenta y se compartirá en el trabajo) es más productivo que el contenido fluya automáticamente al hacer cambios o al verlo sincronizado en otro dispositivo.

La adaptabilidad es un requisito que depende del contexto, por lo que nuestras soluciones tenían que ofrecer esta posibilidad cuando fuera necesaria, adaptando los cambios en el diseño automáticamente para todas las formas de contenido (incluso la combinación de escritura a mano y texto de imprenta).

Nebo: escaparate, campo de pruebas y solución

Nebo es nuestra aplicación de bloc de notas digital. Está impulsada por el motor de inteligencia artificial del SDK de MyScript y moldeada siguiendo nuestro empeño por ofrecer una experiencia superior al escribir a mano. Es también un campo de pruebas ideal para nuestras soluciones de UX: un lugar donde implementar y testar funciones que complementan y mejoran el núcleo de nuestra tecnología de reconocimiento.

Usamos Nebo para recopilar una amplia gama de datos analíticos que revelan cómo experimentan los usuarios en el mundo real con nuestras nuevas funciones y mejoras. Toda la información que obtenemos a través de los análisis, las peticiones de asistencia, las solicitudes de funciones nuevas, las reseñas en las tiendas de aplicaciones, la participación en redes sociales y nuestro programa Insider tiene un valor inestimable y nos ayuda a dar forma al desarrollo futuro de nuestros productos. Y, por supuesto, llevamos a cabo una amplia investigación sobre los patrones de uso de Nebo, lo que nos permite determinar qué cosas funcionan y qué cosas deben mejorarse, además de identificar posibles nuevos usos y expectativas.

Ver lo que es Nebo hoy da una idea más precisa de lo que todo esto significa en la práctica. La aplicación ofrece un reconocimiento de escritura de alta precisión y conversión en texto de imprenta en tiempo real en más de 60 idiomas. Pero el diseño de su UX es lo que transforma esta herramienta ya de por sí excepcional en una experiencia mucho más global y que incentiva la productividad.

Con Nebo, por ejemplo, los usuarios pueden editar la escritura a mano sin esfuerzo usando gestos naturales con el lápiz. El contenido escrito a mano también es adaptable, de forma que, por ejemplo, las notas manuscritas de una reunión se redistribuyen automáticamente para facilitar la visualización en distintos dispositivos. Ideal para compartirlas por correo electrónico o con un enlace web con compañeros de trabajo que probablemente las verán en el teléfono. Nebo permite también dar formato al texto, por ejemplo subrayándolo o dibujando un recuadro alrededor para resaltarlo. Y los usuarios pueden exportar sus notas en diversos formatos habituales.

Esta lista no es exhaustiva y las prestaciones que incluye Nebo no paran de crecer. Pero da una idea de las múltiples formas en las que nuestro equipo de UX ha buscado extender y amplificar la potencia del SDK de MyScript . Además, cada función está respaldada por una investigación rigurosa y evoluciona mediante pruebas y revisiones constantes: para el equipo de UX de MyScript, la innovación y la mejora continuada son tan importantes como la implementación inicial.

Tecnología
Inteligencia artificial, redes neuronales y reconocimiento de escritura
Tecnología