Wolfram Alpha hat gelernt, den Inhalt von Bildern und Fotos zu beschreiben



Die Entwickler der Wolfram Alpha-Website haben die einzigartigen Funktionen des Systems um eine weitere erstaunliche Funktion erweitert - die Erkennung von Fotos. Jeder kann ImageIdentify bei der Arbeit ausprobieren . Laden Sie einfach das Bild auf die Demo-Site hoch und nach einigen Sekunden erhalten Sie eine Antwort. Laut den Entwicklern selbst - fast immer der richtige.

Stephen Wolfram, der Gründer und Chefideologe des Unternehmens, beschreibt die Funktionsweise des Systems in den Einträgen in seinem Blog ausführlich . Stephen sagte, dass er 40 Jahre auf den Moment gewartet hatte, in dem Computer lernen würden, Bilder zu erkennen, und war sich sicher, dass dieser Moment kommen würde. Die Erkennungsaufgabe ist eine der grundlegendsten für eine Person und eine der schwierigsten für Computersysteme und Algorithmen.

Stephen schreibt, dass, obwohl der Algorithmus Bilder nicht immer richtig erkennt, selbst seine Fehler stark menschlichen Fehlern ähneln.

Die Bilderkennung funktioniert jetzt nicht nur auf der Demo-Site, sondern auch in Wolfram Language. Sie können ein Bild festlegen, seine Beschreibung abrufen und dann die Beschreibung selbst verwenden. Sie können beispielsweise die Definition eines Objekts aus einem Wörterbuchartikel abrufen oder eine Wortwolke aus einem Artikel auf Wikipedia erstellen.

Bild
Bild
Bild

Sie können ein Programm schreiben, das Fotos automatisch analysiert und Statistiken erstellt, andere Berechnungen in Bezug auf den Inhalt der Bilder durchführt oder diese in Kategorien unterteilt. Die Erkennungsfunktion ist auch über die API verfügbar.

Um das System zu trainieren, verwendeten die Entwickler zig Millionen Bilder. Aus Stephens Sicht ist dies vergleichbar mit der Menge an Informationen, die eine Person in den ersten Lebensjahren erhält. Stephen erzählt im Blog auch ausführlich, wie sie ein maschinelles Lernsystem in neuronalen Netzen entwickelt haben und welche Probleme aufgetreten sind. Wenn dem System beispielsweise noch nicht beigebracht wurde, Gesichter zu erkennen, hat es nach der Verarbeitung des Porträts von Indiana Jones das Ergebnis „Hat“ erhalten.

Bild

Um das System zu testen, versuchte Wolfram, ihre verschiedenen widersprüchlichen Bilder zu füttern und bekam manchmal seltsame, manchmal lustige oder sogar niedliche Ergebnisse.

Bild

Einige Erkennungsfehler erwiesen sich nicht nur als vollständig erklärbar, sondern sogar als sehr „humanisiert“. Interessant war auch die Erfahrung, abstrakte Malerei zu erkennen - diese Gemälde arbeiteten als eine Art "Rorschach-Test".

Bild

ImageIdentify kann derzeit bis zu 10.000 verschiedene Objekte erkennen. Während sie mit der Erkennung bestimmter Personen, Kunstwerke und seltener Gegenstände nicht gut zurechtkommt.

Es ist ziemlich lustig, mit dem System zu spielen, es nicht als einfachste Option für Bilder zu betrachten und ziemlich eigenartige Antworten zu erhalten.

Bild

Das Wolfram Alpha-Projekt wurde 2009 gestartet. Das System kann die gestellten Fragen in einer regulären Sprache beantworten und anhand von Daten aus offenen Quellen die Antworten zählen. Zum Beispiel auf eine Frage von einem Smartphone: "Was für ein Flugzeug habe ich jetzt über meinem Kopf?" Das System ermittelt daraufhin den Standort mithilfe von GPS und zeigt die Liste der Flugzeuge auf der Grundlage von Daten zu Flügen von Luftfahrtunternehmen an.

All Articles