Açlık krizleri, özellikle düşük gelirli ve gelişmekte olan ülkelerde milyonlarca insanı etkileyen kritik küresel sorunlardan biridir. Geleneksel tahmin yöntemlerinin yetersiz kaldığı noktada, makine öğrenmesi teknolojileri umut vadeden çözümler sunmaktadır. Bu makalede, ülkeye özel makine öğrenmesi modellerinin kıtlık tahmininde nasıl kullanılabileceğini ve bu yaklaşımın gıda güvenliği alanında ne gibi yenilikler getirebileceğini inceleyeceğiz.
Kıtlık Tahmininde Makine Öğrenmesinin Rolü
Makine öğrenmesi, büyük veri kümelerini analiz ederek karmaşık örüntüleri tespit etme yeteneğiyle, kıtlık tahmininde devrim yaratma potansiyeline sahiptir. Doğal, ekonomik ve çatışmayla ilgili değişkenleri bir araya getiren modeller, geleneksel yöntemlerin ötesinde bir öngörü gücü sunmaktadır.
Araştırmacılar, gıda tüketim skorlarını tahmin etmek için üç farklı makine öğrenmesi modeli kullandılar:
- Doğrusal Regresyon
- XGBoost
- RandomForestRegressor
Bu modellerden RandomForestRegressor, ortalama %10.6’lık bir tahmin hata oranıyla en başarılı sonuçları verdi. Ancak, ülkeler arasında doğruluk oranları %2 ile %30 arasında değişkenlik gösterdi. Bu durum, her ülkenin kendine özgü dinamiklerinin olduğunu ve ülkeye özel modellerin gerekliliğini vurgulamaktadır.
Veri Setinin Önemi ve Çeşitliliği
Kıtlık tahmininde kullanılan veri seti, çeşitli güvenilir kaynaklardan toplanan kapsamlı sayısal verilerden oluşmaktadır. Bu veri seti şunları içermektedir:
- Çevresel faktörler (örn. yağış miktarı, bitki örtüsü indeksi)
- Ekonomik göstergeler (örn. enflasyon oranları, gıda enflasyonu)
- Çatışma istatistikleri (örn. savaş kaynaklı ölümler)
Veri kaynakları arasında şunlar bulunmaktadır:
- Armed Conflict Location and Event Data Project (ACLED)
- FAO’nun istatistik birimi FAOSTAT
- Trading Economics
- Dünya Gıda Programı’nın (WFP) Mevsimsel İzleme sistemi
Bu çeşitli veri kaynaklarının entegrasyonu, kıtlık tahmininin çok yönlü doğasını yansıtmakta ve daha kapsamlı bir analiz sunmaktadır.
Metodoloji: Ülkeye Özel Modeller
Araştırmanın en önemli bulgularından biri, ülkeye özel modellerin gerekliliğidir. Her ülkenin kendine has veri setleri ve değişkenleri olduğundan, genel bir model yerine ülkeye özel modeller daha doğru tahminler sağlamaktadır.
Araştırmacılar, veri setini her ülke için özelleştirerek, o ülkenin verilerinin çoğunluğunda bulunan özellikleri modele dahil ettiler. Bu yaklaşım, tek bir özelliğin veri setini “ele geçirmesini” önleyerek daha dengeli ve temsili bir model oluşturulmasını sağladı.
Modeller, %80 eğitim ve %20 test verisi kullanılarak oluşturuldu ve değerlendirildi. Ortalama mutlak hata, modellerin performansını ölçmek için kullanıldı.
Bulgular: RandomForest’in Üstünlüğü
Araştırma sonuçları, RandomForest modelinin kıtlık tahmininde en etkili yöntem olduğunu gösterdi. RandomForest, XGBoost gibi diğer gelişmiş algoritmalara kıyasla daha iyi performans sergiledi ve aynı zamanda daha kolay yorumlanabilir sonuçlar üretti.
RandomForest modelinin ortalama mutlak hatası %10.6 olarak gerçekleşti. Bu, modelin bir bölgedeki kötü veya sınırda gıda tüketimine sahip insanların yüzdesini ortalama 10.6 puanlık bir sapmayla tahmin edebildiği anlamına gelmektedir.
Ülkeler arasında performans farklılıkları gözlemlendi:
- Endonezya: %2 gibi düşük bir hata oranı
- Güney Sudan: %30 civarında yüksek bir hata oranı
Bu farklılıklar, her ülkenin kendine özgü dinamiklerini ve veri kalitesinin önemini vurgulamaktadır.
Özellik Öneminin Analizi
RandomForest modelinin bir diğer avantajı, hangi özelliklerin tahminlerde en etkili olduğunu belirleyebilmesidir. Araştırma, ülkeler arasında özellik öneminin büyük ölçüde değiştiğini ortaya koydu:
- Ekonomik göstergeler (örn. enflasyon oranları) genellikle en önemli tahmin faktörleri arasındaydı.
- Çatışma verileri, bazı ülkelerde (örn. Güney Sudan) öne çıkarken, diğerlerinde daha az önemliydi.
- Nepal gibi istisnai durumlarda, çatışma verileri yüksek doğrulukta tahminler sağladı (%3.44 hata oranı).
Bu bulgular, kıtlık tahmininde tek bir evrensel formülün olmadığını ve her ülkenin kendine özgü bir yaklaşım gerektirdiğini göstermektedir.
Veri Toplama ve Erişimin Önemi
Araştırma, kapsamlı ve erişilebilir veri toplamanın kritik önemini vurgulamaktadır. Tüm özellikler, en az bir ülkede en önemli beş faktör arasında yer alırken, aynı zamanda en az bir ülkede en az önemli dört faktör arasında da bulunmaktadır.
Bu durum, veri toplama çabalarının genişletilmesi ve çeşitlendirilmesi gerektiğini göstermektedir. Özellikle kıtlık riski altındaki ülkelerde, daha detaylı ve geniş kapsamlı veri toplanması, daha doğru tahminler yapılmasını sağlayacaktır.
Politika Yapıcılar İçin Çıkarımlar
Bu araştırmanın sonuçları, politika yapıcılar ve insani yardım kuruluşları için önemli çıkarımlar sunmaktadır:
- Ülkeye özel yaklaşımlar: Her ülkenin kıtlık dinamikleri farklı olduğundan, tek tip çözümler yerine ülkeye özel stratejiler geliştirilmelidir.
- Veri odaklı karar verme: Makine öğrenmesi modelleri, kaynakların daha etkili dağıtılması için kullanılabilir.
- Erken uyarı sistemleri: Bu modeller, potansiyel kıtlık risklerini önceden tespit etmek için kullanılabilir.
- Veri toplama yatırımları: Daha kapsamlı ve kaliteli veri toplama çabalarına yatırım yapılmalıdır.
Gelecekteki Araştırma Yönelimleri
Bu çalışma, kıtlık tahmininde makine öğrenmesinin potansiyelini göstermekle birlikte, gelecekteki araştırmalar için de yol göstericidir:
- Daha fazla veri entegrasyonu: Sosyal medya verileri, uydu görüntüleri gibi yeni veri kaynaklarının modellere dahil edilmesi.
- Gerçek zamanlı tahmin sistemleri: Sürekli güncellenen verilerle çalışan dinamik modellerin geliştirilmesi.
- Açıklanabilir AI: Modellerin karar verme süreçlerini daha şeffaf hale getiren tekniklerin araştırılması.
- Çapraz ülke öğrenimi: Bir ülkedeki modelin diğer ülkelere nasıl uyarlanabileceğinin incelenmesi.