Visual computing, görsel verilerin (görüntüler, videolar, 3B sahneler gibi) elde edilmesi, işlenmesi, analiz edilmesi, sentezlenmesi ve anlaşılması için kullanılan hesaplamalı ve algoritmik yöntemlerin tümünü kapsar. Bu alan, bilgisayarla görü, bilgisayar grafikleri, sanal ve artırılmış gerçeklik ile görsel veri analizini bir araya getirir. Diğer teknolojilerden farkı, görsel içeriğin anlaşılması ve üretilmesine odaklanmasıdır; yapay zeka, algoritmik geometri ve insan algısı gibi alanlardan beslenir. Görsel verileri kullanılabilir temsillere dönüştürmek için matematiksel modeller, makine öğrenimi algoritmaları ve grafik işleme teknikleri kullanılır.
Kullanım alanları ve örnekler
Visual computing; video gözetimde nesne tespiti ve yüz tanıma, mimarlık veya tıpta 3B yeniden yapılandırma, sinema için görüntü sentezi, bilimsel veri görselleştirmesi ve sanal/artırılmış gerçeklikte etkileşimli arayüzler gibi çok çeşitli alanlarda kullanılır. Otonom sürüş sistemleri de çevreyi gerçek zamanlı olarak anlamak için visual computing'e dayanır.
Başlıca yazılım araçları, kütüphaneler ve framework'ler
Başlıca araçlar arasında OpenCV (açık kaynak bilgisayarla görü kütüphanesi), TensorFlow ve PyTorch (görüntüler için derin öğrenme modelleri eğitimi), Blender ve Unity (görüntü sentezi ve sanal gerçeklik), ayrıca bilimsel görselleştirme için VTK (Visualization Toolkit) bulunur. Open3D, PCL (Point Cloud Library) ve Unreal Engine gibi özel framework'ler de yaygın olarak kullanılır.
Son gelişmeler ve eğilimler
Son dönemde, görüntü ve video sentezi için üretici derin öğrenme modelleri (diffusion, GAN'ler) entegrasyonu, mekansal anlamada gelişmiş 3B konvolüsyonel mimariler ve görüntü sıkıştırma ile süper çözünürlükte yapay zeka kullanımı öne çıkmaktadır. Multimodal birleşim (metin, görüntü, sesin birleştirilmesi), görsel alanda açıklanabilir yapay zeka ve gömülü sistemler (edge computing) için gerçek zamanlı optimizasyon başlıca eğilimler arasındadır.