Google ha lanzado SynthID Text, una herramienta que permite a los desarrolladores marcar y detectar texto generado por modelos de inteligencia artificial. Esta tecnología ya está disponible para su descarga en la plataforma de IA Hugging Face y en el actualizado Responsible GenAI Toolkit de Google. La compañía anunció en una publicación que “hoy estamos haciendo de código abierto nuestra herramienta de marca de agua SynthID Text”. Esta herramienta será gratuita para desarrolladores y empresas, ayudándoles a identificar contenido generado por IA.
¿Cómo funciona? Cuando se le da una pregunta como “¿Cuál es tu fruta favorita?”, los modelos que generan texto predicen cuál “token” (unidad de información) es más probable que siga a otro, uno a la vez. Los tokens pueden ser un carácter, una palabra o parte de una frase. El modelo asigna a cada token un puntaje, que indica la probabilidad de que aparezca en el texto generado. SynthID Text agrega datos adicionales a esta distribución de tokens al “modular la probabilidad de que se generen ciertos tokens”, según Google.
El patrón final de puntajes, que combina las elecciones de palabras del modelo con los puntajes de probabilidad ajustados, se considera la marca de agua. Este patrón se compara con los patrones esperados para textos con y sin marca de agua, lo que ayuda a SynthID a detectar si un texto fue generado por una herramienta de IA o si proviene de otras fuentes.
Google asegura que SynthID Text, que se ha integrado con sus modelos Gemini desde la primavera, no afecta la calidad, precisión ni velocidad de generación de texto, y funciona incluso con textos que han sido recortados, parafraseados o modificados. Sin embargo, la empresa reconoce que su tecnología de marca de agua tiene limitaciones. Por ejemplo, SynthID Text no es tan efectivo con textos cortos o aquellos que han sido reescritos o traducidos, así como en respuestas a preguntas de hechos. “En respuestas a preguntas fácticas, hay menos oportunidades para ajustar la distribución de tokens sin afectar la precisión fáctica”, explica la compañía. Esto incluye preguntas como “¿Cuál es la capital de Francia?” o solicitudes donde se espera poca o ninguna variación, como “recitar un poema de William Wordsworth”.