Los usuarios de Flickr se quejan de que el sistema asigna automáticamente etiquetas incorrectas y ofensivas a las fotos

Un sitio bien conocido para almacenar y publicar fotos encontró un problema característico de cualquier herramienta automática que intente reemplazar a una persona en el análisis de información no estándar. Los usuarios notaron que la función de etiquetado automático a menudo reconoce objetos en fotografías no solo incorrectamente, sino que muchas etiquetas son simplemente ofensivas. Por ejemplo, las fotos de un hombre negro, según Flickr, deben asignarse, entre otras, a las etiquetas "animal" (animal) y "mono" (mono antropoide).

No culparon a los algoritmos del sistema de reconocimiento de patrones de Flickr por la discriminación racial, ya que se encuentran con fotografías de personas del tipo europeo, que, sin embargo, también recibieron etiquetas desagradables que dicen que representa un "animal" y, muy probablemente, un "mono". Por otro lado, según Flickr de esta fotografía de las famosas puertas del campo de concentración nazi Dachau, las etiquetas "gimnasio de la jungla" y "deporte" son adecuadas además de las correctas.

Flickr reconoció el problema debido a la gran cantidad de comentarios negativos de los usuarios. De las etiquetas que el sistema puede asignar automáticamente a las fotografías, intentaron eliminar el "mono" y prometieron regular el uso de la etiqueta "deportiva", en particular, para eliminarlo de la descripción de las fotos del campo de concentración. El orador de la compañía dice que generalmente está orgulloso de la nueva característica, pero aceptó que aún necesita trabajar en los errores de reconocimiento. El sistema tiene en cuenta la forma en que los usuarios editan etiquetas, y probablemente aún no han "aprendido" a tener en cuenta su opinión al reconocer el contenido de una foto.

El año pasado, los empleados de Google Research revelaronalgoritmo de reconocimiento de imagen propio basado en redes neuronales. Él está tratando no solo de nombrar los objetos presentes en la fotografía, sino también de describirlo en "lenguaje humano". Casi el mismo resultado se obtuvo independientemente de Google en la Universidad de Stanford. Por ejemplo, su algoritmo cree inequívocamente que en esta foto "una niña está comiendo un pedazo de pastel":

imagen

All Articles