Dünya Günü vesilesiyle IBM ve Avrupa Uzay Ajansı (ESA), çok modlu jeo-uzamsal verilerden gezegenin dinamiklerini analiz etmek, yorumlamak ve öngörmek için tasarlanmış TerraMind adlı jeneratif bir yapay zeka temel modelinin lansmanını duyurdu.
Bu lansman, ESA'nın, DLR (Alman Havacılık ve Uzay Merkezi), Forschungszentrum Jülich, IBM Research Europe ve KP Labs gibi önde gelen bir konsorsiyum tarafından desteklenen ve ESA'nın Dünya bilimlerine adanmış yenilik laboratuvarı Φ-lab'ın bilimsel ve mali desteğiyle gerçekleştirilen FAST-EO (Foundation Models for Advanced Space-based Earth Observation) adlı Avrupa girişimi çerçevesinde gerçekleşmiştir.
FAST-EO'nun hedefi, Dünya gözlem (EO) topluluğu içinde temel modellere erişimi demokratikleştirmek ve doğal kaynakların sürdürülebilir yönetimi, biyoçeşitliliğin korunması, iklim felaketlerinin önlenmesi veya tarımsal-çevresel sistemlerin analizi gibi önemli alanlarda benimsenmelerini teşvik etmektir.
TerraMind bu çerçevede yer almaktadır. Model, Forschungszentrum Jülich'de "TerraMesh" üzerinde önceden eğitilmiştir, bu şimdiye kadar oluşturulmuş en geniş jeo-uzamsal veri setidir. Bu veri kümesi, Copernicus Sentinel-1 ve -2 uydularından gelen optik ve radar görüntülerinden çevresel metin temsillerine, jeomorfoloji ve tarihi iklim verilerine kadar dokuz farklı modaliteyi kapsayan 9 milyondan fazla örnek içermektedir.
Simetrik transformatör tabanlı kodlayıcı-çözümleyici mimariye dayanan TerraMind, piksel, jeton ve dizi tipi girdileri eşzamanlı olarak işleyebilir. Örneğin, bitki örtüsü dinamiklerini geçmiş meteorolojik eğilimler ve arazi kullanımı tanımları ile birleştirerek ortaya çıkan riskleri tanımlayabilir veya bir ekosistemin evrimini modelleyebilir.

Çığır Açan Bir Yenilik: Thinking-in-Modalities (TiM)

TerraMind, heterojen veri hacmini işleme kapasitesinin ötesinde, metodolojik bir yenilik sunar: Thinking-in-Modalities (TiM). Tasarımcılarına göre, bu, Dünya gözlemine uygulanan gerçekten jeneratif ve çok modlu ilk temel modeldir. Bu yaklaşım, eksik girişler durumunda yapay verileri otonom olarak üretmesini sağlar — bulut örtüsü, sensörlerin değişken çözünürlükleri veya gözlem dizilerindeki zaman boşlukları nedeniyle tele-detekleme alanında sıkça karşılaşılan bir durumdur.
Yöntemin orijinalliği, modaliteler arasında bağlamsal bir akıl yürütmeye dayanır. LLM'lerde kullanılan düşünce zincirlerinden ilham alan TiM mekanizması, modelin görüntüler, metinler, fiziksel veya coğrafi değişkenler arasında öğrenilen korelasyonlardan verileri birleştirmesini, ekstrapole etmesini ve yeniden yapılandırmasını sağlar. İnce ayar veya çıkarım sırasında, bu kısmi bağlamı zenginleştirme yeteneği, modelin dayanıklılığını artırmakla kalmaz, aynı zamanda belirli durumlarda yanıtlarını hassaslaştırır.
Bu tekniğin, iklim, arazi kullanımı, bitki örtüsü, hidroloji veya tarım uygulamaları gibi çeşitli değişkenleri bir araya getiren su kıtlıklarının tahmini gibi konulara uygulanması, geleneksel yaklaşımların veri silo'ları veya zaman boşluklarıyla karşılaştığı yerlerde, operasyonel potansiyelini gösterir.

Optimizasyonlu Etkinlik

Kapsamına rağmen — eğitim aşamasında kullanılan 500 milyardan fazla token — TerraMind, özellikle verimlidir. Mimarisine ve temsillerin etkili sıkıştırılmasına bağlı olarak, benzer görevlerdeki karşılaştırılabilir modellere göre on kat daha az kaynak tüketir. Bu fark, hesaplama veya bağlantı kapasitesinin sınırlı olduğu ortamlarda bile geniş çapta dağıtım için somut perspektifler açar.
Ayrıca en performanslı olanıdır. TerraMind, ESA tarafından PANGAEA, topluluk tarafından standart olarak kabul edilen bir benchmark üzerinde değerlendirildi: Gerçek görevlerde, arazi örtüsü sınıflandırması, değişiklik tespiti, çevre izleme ve çok sensörlü ve çok zamanlı analiz gibi alanlarda popüler 12 Dünya gözlem temel modelini %8 veya daha fazla aşmıştır.
Model, IBM'in iklim ve çevresel AI stratejisi kapsamında, IBM-NASA Prithvi ve Granite modellerinin tamamlayıcısı olarak yer almaktadır. IBM Geospatial Studio ve Hugging Face üzerindeki erişilebilirliği ve birlikte çalışabilirliği güçlendirmektedir.
ESA'dan Earth Observation Data Scientist Nicolas Longepe için:
"Bu proje, bilimsel topluluk, büyük teknoloji şirketleri ve uzmanlar arasında, Dünya bilimlerine hizmet eden teknolojinin potansiyelini kullanmak için başarılı bir birliğinin mükemmel bir örneğidir. Dünya gözlem verileri uzmanları, Makine öğrenimi uzmanları, veri bilimcileri ve yüksek performanslı hesaplama (HPC) mühendisleri arasındaki sinerji büyüleyici."
 
 
 
 

Daha iyi anlamak

Thinking-in-Modalities (TiM) nedir ve TerraMind modelinde nasıl çalışır?

Thinking-in-Modalities (TiM), TerraMind'in eksik veri olduğunda farklı modlardan, örneğin görüntüler ve metinlerden gelen bilgileri birleştirerek yapay veri oluşturmasını sağlayan yenilikçi bir yaklaşımdır. Öğrenilen korelasyonlara dayalı verileri bağlamsallaştırmak ve ekstrapole etmek için LLM'lerde kullanılan düşünce zincirlerinden esinlenmiştir.