La inteligencia artificial generativa puede parecer mágica, pero detrás de su desarrollo hay un gran equipo de empleados en empresas como Google y OpenAI, conocidos como “ingenieros de prompts” y analistas. Su trabajo consiste en evaluar la precisión de las respuestas de los chatbots para mejorar la inteligencia artificial. Sin embargo, una nueva directriz interna de Google para los contratistas que trabajan en Gemini ha generado preocupaciones sobre la posibilidad de que este sistema proporcione información inexacta en temas sensibles, como la salud.
Para mejorar Gemini, los contratistas de GlobalLogic, una empresa de subcontratación propiedad de Hitachi, deben evaluar las respuestas generadas por la IA en función de factores como la “veracidad”. Hasta hace poco, estos contratistas podían “saltar” ciertos prompts si no tenían experiencia en el tema. Por ejemplo, si se les preguntaba sobre cardiología y no tenían formación científica, podían optar por no evaluar esa respuesta.
Sin embargo, la semana pasada, GlobalLogic anunció un cambio en las instrucciones de Google: ahora los contratistas no pueden saltar estos prompts, sin importar su nivel de experiencia. Antes, las directrices indicaban que si no tenían la experiencia crítica necesaria, podían omitir la tarea. Ahora, se les dice que deben “evaluar las partes del prompt que entienden” y añadir una nota indicando que no poseen conocimiento especializado.
Esto ha generado preocupaciones sobre la precisión de Gemini en ciertos temas, ya que los contratistas a veces deben evaluar respuestas técnicas sobre enfermedades raras sin tener el conocimiento adecuado. Un contratista comentó en una comunicación interna que pensaba que el objetivo de permitir saltar prompts era aumentar la precisión al asignar la tarea a alguien más calificado. Ahora, solo pueden omitir prompts en dos casos: si faltan completamente información o si contienen contenido dañino que requiere formularios de consentimiento especiales para su evaluación. Google no respondió a las solicitudes de comentarios de TechCrunch antes de la publicación de esta noticia.