Avrupa'nın önde gelen yapay zeka şirketlerinden biri olan LightOn, yakın zamanda "Visual RAG"'ı Paradigm platformuna entegre etti. Bu yenilik, müşterilere metinler, resimler, grafikler ve diyagramlar içeren belgelerle etkileşimde bulunmalarına olanak tanıyan anahtar teslim bir çözüm sunuyor. Bu gelişme, işletmeler ve kamu kurumları için yeni ufuklar açıyor.
Geri çağırma ile zenginleştirilmiş üretim (RAG), büyük dil modellerinin (LLM'ler) dış bilgi kaynaklarını kullanarak içerik oluşturmasına olanak tanıyan etkili bir tekniktir. Görsel-işitsel bilgileri içeren modellerin (VLM) metin, grafik ve diyagram gibi multimedya verilerini yakalayabilme yetenekleri sayesinde yeni bir yaklaşım geliştirildi: Visual RAG. Bu, bir VLM'nin yeteneklerini geri çağırma mekanizmasıyla birleştirerek, metin ve görsel kaynaklardan bilgi çıkarmayı ve ilişkilendirmeyi mümkün kılar.
Son akademik araştırmalar, arXiv:2501.10834 numaralı Visual RAG: Multi-modal Retrieval-Augmented Generation çalışmasında sunulanlar gibi, bu teknolojinin temel prensiplerini şimdiden keşfetmiştir. Bu çalışmalar, görsel-işitsel modelleri geri çağırma mekanizmalarıyla birleştirmenin multimodal belgelerin anlaşılması ve kullanılması üzerinde önemli bir iyileştirme sağladığını göstermektedir.
Bir Teknolojik Atılım
Geçtiğimiz Kasım ayında LightOn, MonoQwen2-VL-v0.1 adlı görsel belge yeniden sıralayıcısını tanıttı. Start-up, bu gelişmeye dayanarak endüstrinin ihtiyaçlarına uygun bir çözüm sunuyor.

Geleneksel sistemlerin görüntü veya metinleri ayrı ayrı analiz etmeye odaklanmasının aksine, "Visual RAG" geniş ve karmaşık belge veritabanlarında dinamik bir şekilde gezinmeyi mümkün kılar. LightOn'un kurucu ortağı ve CEO'su Igor Carron şunları söyledi:
"Multimodal RAG için kapsamlı bir çözüm sunarak, bir organizasyonun verilerinin kullanılmasında yeni bir adım atıyoruz. Paradigm, bu ölçekte görüntülerin işlenmesi ve analiz edilmesine olanak tanıyan ilk yapay zeka çözümüdür. Yapay zekamızın sadece bir resmi anlaması değil, aynı zamanda bir belge veritabanının ortasında milyonlarcasını bulup işlemesi söz konusudur. Bugün, yapay zekanın başlangıcından beri metinlerle yaptığınız gibi fotoğraflar veya infografiklerle de iletişim kurabilirsiniz."
İşletmeler ve Kamu Sektörü için Stratejik Bir Kaldıraç
"Visual RAG"'ın entegrasyonu, zengin görsel içeriği olan belgeleri etkin bir şekilde işleyebilen araçlar için artan bir talebe yanıt veriyor. Bu yenilik, birkaç önemli fayda sunar:
Gelişmiş belge araştırması: Teknik belgeler, finansal raporlar, patentler ve multimedya arşivlerine optimize edilmiş erişim;
Karar verme sürecinin iyileştirilmesi: Kritik bilgilerin hızlı ve doğru bir şekilde bağlamlandırılması;
Veri güvenliği ve egemenliği: Entegre dağıtım, bilgi sistemlerinin gizliliğini ve bağımsızlığını garanti eder.
Bu özellikler, LightOn'u bilgi akışlarının kontrolünün belirleyici bir rekabet avantajı haline geldiği bir ortamda stratejik bir oyuncu konumuna getiriyor.