Dünyanın önde gelen teknoloji ve iş süreç yönetimi şirketi Xerox’un uzun yıllardır üzerinde çalıştığı görsel tanımlama yazılımı, bilgisayarda veya internet üzerinde görsel ararken çok daha hızlı ve kolay bir şekilde doğru görselleri bulmamızı sağlayacak.
Xerox’un Fransa Grenoble AR-GE merkezindeki bilim insanlarının üzerinde çalıştığı yazılım programı, dijital ortamda yer alan görselleri, isimlerine göre değil, görüntüsüne göre tanıyıp buluyor ve sınıflandırıyor. Geliştirilen bu yazılım, “generic” olarak betimlenen, bina, uçak, araba, hayvan, insan, kitap, masa, sandalye gibi binlerce objeyi görüntüsünden tanıyor.
Geliştirilen görsel arama teknolojisi, görseli parçalara ayırarak tanımlama temeline dayanıyor. Görseli oluşturan her bir parçaya “patch” (yama) adı veriliyor. Yazılım, her bir obje için belli sayıda “patch”in yan yana olma koşulunu arıyor. Örneğin, görselin bir araba görüntüsü olduğunu tanımlayabilmek için görsel üzerinde lastik “patch”ini, cam “patch’”ini, kapı “patch”ini ve far “patch”ini bir arada arıyor, sadece lastik “patch”ini gördüğü zaman buna araba demiyor, bunu lastik olarak tanımlıyor. Bilgisayar her bir obje için en az kaç “patch”i bulduktan sonra tanımlama yapabileceğini biliyor. Örneğin, Eyfel Kulesi resimlerini internette aradığınızda karşınıza sadece eyfel.jpeg, eyfelkulesi.jpeg ve benzeri dosya isimli görseller gelmiyor. Görüntüsünde Eyfel olan tüm resim dosyalarını taramaya çalışıyor.
Hali hazırda Bing, Google, Yahoo ve Yandex gibi birçok arama motoru sadece yazı (sözcük, cümle) bazlı bir arama yapabiliyor. Bu arama yöntemi ile özellikle sosyal medyada yer alan ama dosya ismi ve etiketi görseli tanımlamayan milyonlarca resim ve video, arama motorlarının kapsamının dışında kalıyor. Bu teknoloji kullanıma sunulduğunda, Facebook, Instagram, Twitter ve YouTube ileti ve dosyalarında aranan görsel ve videoların kolayca bulunması sağlanmış olacak.
Fransa’nın Grenoble şehrinde faaliyet gösteren Xerox Avrupa AR-GE merkezinde, bilgisayarlara görerek anlama yeteneği sağlayacak bu tür projelerin dışında, büyük veri (big data) analizi, metin çözümleme, dil yapısını anlamaya yönelik başka bilimsel çalışmalar da yürütülüyor.