Wolfram Alpha aprendeu a descrever o conteúdo de todas as imagens e fotos



Os desenvolvedores do site Wolfram Alpha adicionaram outro recurso incrível aos recursos exclusivos do sistema - reconhecimento de qualquer foto. Todos podem experimentar o ImageIdentify no trabalho. Basta enviar a foto para o site de demonstração e, após alguns segundos, você receberá uma resposta. De acordo com os próprios desenvolvedores - quase sempre o caminho certo.

Stephen Wolfram, o fundador e principal ideólogo da empresa, descreve em detalhes a operação do sistema nas entradas de seu blog . Stephen disse que, há 40 anos, estava esperando o momento em que os computadores aprenderiam a reconhecer imagens, e tinha certeza de que esse momento chegaria. A tarefa de reconhecimento é uma das mais básicas para uma pessoa e uma das mais difíceis para sistemas e algoritmos de computador.

Stephen escreve que, embora o algoritmo nem sempre reconheça imagens corretamente, mesmo seus erros se assemelham fortemente a erros humanos.

O reconhecimento de imagem agora funciona não apenas no site de demonstração, mas também no próprio Wolfram Language. Você pode definir uma imagem, obter sua descrição e usar a própria descrição - obtenha, por exemplo, a definição de um objeto de um artigo de dicionário ou crie uma nuvem de palavras a partir de um artigo da Wikipedia.

imagem
imagem
imagem

Você pode escrever um programa que analise automaticamente fotografias e compile estatísticas, faça outros cálculos relacionados ao conteúdo das imagens ou divida-as em categorias. A função de reconhecimento também está disponível através da API.

Para treinar o sistema, os desenvolvedores usaram dezenas de milhões de imagens. Do ponto de vista de Stephen, isso é comparável à quantidade de informações que uma pessoa recebe nos primeiros dois anos de vida. Stephen também conta em detalhes no blog como eles desenvolveram um sistema de aprendizado de máquina em redes neurais e quais problemas surgiram. Por exemplo, quando o sistema ainda não foi ensinado a reconhecer rostos, processou o retrato de Indiana Jones e produziu o resultado "Chapéu".

imagem

Para testar o sistema, Wolfram tentou alimentar várias fotos conflitantes e, às vezes, obtinha resultados estranhos, às vezes engraçados ou até engraçados.

imagem

Alguns erros de reconhecimento acabaram sendo não apenas completamente explicáveis, mas também muito "humanizados". Também foi interessante a experiência de reconhecer a pintura abstrata - essas pinturas funcionavam como uma espécie de "testes de Rorschach".

imagem

O ImageIdentify atualmente é capaz de reconhecer até 10.000 objetos diferentes. Enquanto ela não lida bem com o reconhecimento de pessoas específicas, obras de arte e objetos raros.

É muito engraçado brincar com o sistema, não sendo a opção mais fácil para fotos e obter respostas bastante peculiares.

imagem

O projeto Wolfram Alpha foi lançado em 2009. O sistema é capaz de responder às perguntas feitas em um idioma regular e, usando dados de fontes abertas, conta as respostas. Por exemplo, para uma pergunta feita em um smartphone: "Que tipo de aeronave tenho na minha cabeça agora?" o sistema responderá determinando a localização usando GPS e indicará a lista de aeronaves com base nos dados de voos de transportadoras aéreas.

All Articles