Google Research ha presentado un nuevo sistema llamado InkSight, que utiliza inteligencia artificial (IA) para leer la escritura a mano y podría cambiar la forma en que las máquinas convierten lo que escribimos en papel a texto digital. Este sistema transforma fotos de palabras escritas a mano en texto digital sin necesidad de dispositivos intermedios.
La idea detrás de InkSight es reemplazar el reconocimiento óptico de caracteres (OCR), que a veces puede fallar, por una IA que imita cómo los humanos aprenden a leer. Esto se logra enseñando a la IA a reconocer y replicar la escritura humana. Según los investigadores, “la toma de notas digitales está ganando popularidad, ya que ofrece una forma duradera, editable y fácilmente indexable de almacenar notas en un formato digital conocido como tinta digital. Sin embargo, aún hay una gran brecha entre esta forma de tomar notas y la tradicional con papel y lápiz, que sigue siendo preferida por la mayoría”.
InkSight combina la lectura y la escritura, permitiendo entrenar un modelo sin necesidad de grandes cantidades de muestras emparejadas, que son difíciles de conseguir. Este sistema no solo es una técnica alternativa, sino que también ofrece resultados más precisos en situaciones no ideales, como fotos tomadas con poca luz o con texto parcialmente oculto. Los investigadores encontraron que las personas podían leer el 87% de los trazos de texto generados por InkSight, y dos tercios eran tan buenos que no se podían distinguir de la escritura real.
Para quienes disfrutan escribir a mano, InkSight ofrece beneficios interesantes. Imagina escribir en un cuaderno y luego mostrar tus notas a la cámara para hacerlas instantáneamente buscables y organizarlas en contexto con notas anteriores. Si tu escritura es desordenada, InkSight puede convertir tus garabatos en texto mecanografiado, manteniendo la precisión de lo que escribiste.
A gran escala, este sistema podría ser una herramienta crucial para descifrar y convertir textos manuscritos de siglos pasados a formato digital. Incluso en idiomas con poca presencia digital, InkSight podría ayudar a preservar la escritura a mano y contribuir a la creación de recursos de entrenamiento para esos idiomas.
Google no es el único que trabaja en herramientas de IA para descifrar la escritura a mano. Amazon, por ejemplo, ha mejorado su Kindle Scribe para transformar notas manuscritas en texto legible. También existe Goodnotes, una aplicación de toma de notas digitales que puede leer escritura a mano y recientemente lanzó herramientas de edición de escritura utilizando su tecnología Goodnotes Smart Ink, que permite editar notas manuscritas como si fueran texto mecanografiado.