¡Hola, amigos! Bienvenidos al boletín regular de IA de TechCrunch. Esta semana en IA, la inteligencia artificial generativa está comenzando a inundar la publicación académica con contenido spam, un nuevo y desalentador desarrollo en el frente de la desinformación. En una publicación en Retraction Watch, un blog que rastrea las retractaciones recientes de estudios académicos, los profesores asistentes de filosofía Tomasz Żuradzk y Leszek Wroński escribieron sobre tres revistas publicadas por Addleton Academic Publishers que parecen estar compuestas enteramente por artículos generados por IA. Las revistas contienen artículos que siguen el mismo formato, llenos de palabras de moda como “blockchain,” “metaverso,” “internet de las cosas” y “aprendizaje profundo.” Listan el mismo comité editorial, con 10 miembros fallecidos, y una dirección genérica en Queens, Nueva York, que parece ser una casa.
¿Por qué es un gran problema? Podrías preguntar. ¿No es simplemente el costo de hacer negocios en internet hoy en día? Bueno, sí. Pero las revistas falsas muestran lo fácil que es manipular los sistemas utilizados para evaluar a los investigadores para promociones y contrataciones, y esto podría ser una señal de alerta para los trabajadores del conocimiento en otras industrias. En al menos un sistema de evaluación ampliamente utilizado, CiteScore, las revistas se ubican en el top 10 para la investigación en filosofía. ¿Cómo es esto posible? Se citan extensamente entre sí. (CiteScore considera las citas en sus cálculos). Żuradzk y Wroński encuentran que, de 541 citas en una de las revistas de Addleton, 208 provienen de otras publicaciones falsas del editor.
“[Estos rankings] frecuentemente sirven a universidades y organismos de financiamiento como indicadores de la calidad de la investigación,” escribieron Żuradzk y Wroński. “Juegan un papel crucial en decisiones sobre premios académicos, contrataciones y promociones, y por lo tanto pueden influir en las estrategias de publicación de los investigadores.” Uno podría argumentar que CiteScore es el problema, claramente es una métrica defectuosa. Y no es un argumento equivocado. Pero tampoco es incorrecto decir que la IA generativa y su abuso están perturbando sistemas de los que dependen los medios de vida de las personas de maneras inesperadas y potencialmente muy dañinas.
Hay un futuro en el que la IA generativa nos hace replantear y rediseñar sistemas como CiteScore para que sean más equitativos, holísticos e inclusivos. La alternativa más sombría, y la que se está desarrollando ahora, es un futuro en el que la IA generativa sigue descontrolada, causando estragos y arruinando vidas profesionales. Espero que corrijamos el rumbo pronto.
Generador de bandas sonoras de DeepMind: DeepMind, el laboratorio de investigación de IA de Google, dice que está desarrollando tecnología de IA para generar bandas sonoras para videos. La IA de DeepMind toma la descripción de una banda sonora (por ejemplo, “medusas pulsando bajo el agua, vida marina, océano”) emparejada con un video para crear música, efectos de sonido e incluso diálogos que coincidan con los personajes y el tono del video.
Un robot chofer: Investigadores de la Universidad de Tokio desarrollaron y entrenaron un “humanoide musculoesquelético” llamado Musashi para conducir un pequeño coche eléctrico a través de una pista de prueba. Equipado con dos cámaras que actúan como ojos humanos, Musashi puede “ver” la carretera frente a él, así como las vistas reflejadas en los espejos laterales del coche.
Un nuevo motor de búsqueda de IA: Genspark, una nueva plataforma de búsqueda impulsada por IA, utiliza IA generativa para escribir resúmenes personalizados en respuesta a consultas de búsqueda. Ha recaudado $60 millones hasta ahora de inversores, incluyendo Lanchi Ventures; la última ronda de financiamiento de la compañía la valoró en $260 millones post-dinero, una cifra respetable mientras Genspark compite con rivales como Perplexity.
¿Cuánto cuesta ChatGPT?: ¿Cuánto cuesta ChatGPT, la plataforma de chatbot impulsada por IA de OpenAI? Es una pregunta más difícil de responder de lo que podrías pensar. Para hacer un seguimiento de las diversas opciones de suscripción de ChatGPT disponibles, hemos elaborado una guía actualizada sobre los precios de ChatGPT.
Los vehículos autónomos enfrentan una variedad interminable de casos límite, dependiendo de la ubicación y la situación. Si estás en una carretera de dos carriles y alguien pone su intermitente izquierdo, ¿significa que va a cambiar de carril? ¿O que deberías adelantarlo? La respuesta puede depender de si estás en la I-5 o en la Autobahn. Un grupo de investigadores de Nvidia, USC, UW y Stanford muestra en un artículo recién publicado en CVPR que muchas circunstancias ambiguas o inusuales pueden resolverse, si puedes creerlo, haciendo que una IA lea el manual de conductores local. Su Asistente de Conducción de Gran Lenguaje, o LLaDa, da acceso a LLM al manual de conducción de un estado, país o región. Las reglas locales, costumbres o señales se encuentran en la literatura y, cuando ocurre una circunstancia inesperada como un claxon, luces altas o un rebaño de ovejas, se genera una acción apropiada (detenerse, girar, tocar el claxon de vuelta).
El lunes, Runway, una empresa que construye herramientas de IA generativa orientadas a creadores de contenido de cine e imagen, presentó Gen-3 Alpha. Entrenado con una gran cantidad de imágenes y videos de fuentes públicas y propias, Gen-3 puede generar clips de video a partir de descripciones de texto e imágenes fijas. Runway dice que Gen-3 Alpha ofrece una mejora “importante” en la velocidad y fidelidad de generación sobre el modelo de video anterior de Runway, Gen-2, así como controles detallados sobre la estructura, estilo y movimiento de los videos que crea. Gen-3 también puede adaptarse para permitir personajes más “controlados estilísticamente” y consistentes, dice Runway, apuntando a “requisitos artísticos y narrativos específicos.” Gen-3 Alpha tiene sus limitaciones, incluyendo el hecho de que su metraje se limita a 10 segundos. Sin embargo, el cofundador de Runway, Anastasis Germanidis, promete que es solo el primero de varios modelos generadores de video que vendrán en una familia de modelos de próxima generación entrenados en la infraestructura mejorada de Runway.
Gen-3 Alpha es solo el último sistema de video generativo de varios que han surgido en los últimos meses. Otros incluyen Sora de OpenAI, Dream Machine de Luma y Veo de Google. Juntos, amenazan con revolucionar la industria del cine y la televisión tal como la conocemos, asumiendo que pueden superar los desafíos de derechos de autor.
La IA no tomará tu próximo pedido en McDonald’s. McDonald’s anunció esta semana que eliminaría la tecnología de toma de pedidos automatizada, que la cadena de comida rápida había estado probando durante casi tres años, de más de 100 de sus ubicaciones. La tecnología, co-desarrollada con IBM e instalada en los drive-thrus de los restaurantes, se volvió viral el año pasado por su propensión a malinterpretar a los clientes y cometer errores. Un artículo reciente en The Takeout sugiere que la IA está perdiendo terreno entre los operadores de comida rápida en general, quienes no hace mucho expresaron entusiasmo por la tecnología y su potencial para aumentar la eficiencia (y reducir costos laborales). Presto, un jugador importante en el espacio de carriles de drive-thru asistidos por IA, recientemente perdió un cliente importante, Del Taco, y enfrenta pérdidas crecientes. El problema es la inexactitud. El CEO de McDonald’s, Chris Kempczinski, dijo a CNBC en junio de 2021 que su tecnología de reconocimiento de voz era precisa en aproximadamente un 85% de las veces, pero que el personal humano tenía que ayudar con aproximadamente uno de cada cinco pedidos. La mejor versión del sistema de Presto, mientras tanto, solo completa aproximadamente el 30% de los pedidos sin la ayuda de un ser humano, según The Takeout. Así que, mientras la IA está diezmando ciertos segmentos de la economía gig, parece que algunos trabajos, particularmente aquellos que requieren entender una amplia gama de acentos y dialectos, no pueden ser automatizados. Por ahora, al menos.