انتخاب زبان

برآورد تبخیر-تعرق مرجع با یادگیری ماشین و داده‌های هواشناسی محدود

تحقیق در مورد بهبود برآورد ETo با استفاده از مدل‌های XGBoost، SVM و Random Forest با حداقل پارامترها در مقایسه با معادلات سنتی در منطقه مکناس مراکش
aipowertoken.org | PDF Size: 0.3 MB
امتیاز: 4.5/5
امتیاز شما
شما قبلاً به این سند امتیاز داده اید
جلد سند PDF - برآورد تبخیر-تعرق مرجع با یادگیری ماشین و داده‌های هواشناسی محدود

فهرست مطالب

1 مقدمه

برآورد تبخیر-تعرق مرجع (ETo) برای برنامه‌ریزی آبیاری و مدیریت منابع آب حیاتی است، به‌ویژه در مناطق مستعد خشکسالی مانند مراکش. معادله فائو-۵۶ پنمن-مونتیت اگرچه دقیق است، اما به داده‌های هواشناسی گسترده‌ای از جمله دما، رطوبت، تابش خورشیدی و سرعت باد نیاز دارد که این امر آن را برای مناطق با زیرساخت سنسوری محدود غیرعملی می‌سازد.

معادلات تجربی سنتی مانند هارگریوز-سامانی، روماننکو و جنسن-هایس رویکردهای ساده‌شده‌ای ارائه می‌دهند اما از تغییرپذیری عملکرد در شرایط آب‌وهوایی مختلف رنج می‌برند. این تحقیق با بررسی مدل‌های یادگیری ماشین که می‌توانند با حداقل پارامترهای ورودی به برآورد دقیق ETo دست یابند، به رفع این محدودیت‌ها می‌پردازد.

نیازمندی‌های داده

فائو-۵۶ PM: ۵+ پارامتر

مدل‌های ML: ۴-۲ پارامتر

کاهش هزینه

زیرساخت سنسوری: ۸۰%-۶۰ کاهش

2 روش‌شناسی

2.1 جمع‌آوری و پیش‌پردازش داده‌ها

داده‌های هواشناسی از چندین ایستگاه در منطقه مکناس جمع‌آوری شد، از جمله اندازه‌گیری‌های دما، رطوبت، تابش خورشیدی و سرعت باد. پیش‌پردازش داده‌ها شامل مدیریت مقادیر缺失، نرمال‌سازی و هم‌راستایی زمانی در بین ایستگاه‌های مختلف بود.

2.2 مدل‌های یادگیری ماشین

سه مدل یادگیری ماشین پیاده‌سازی و مقایسه شدند:

  • XGBoost: چارچوب تقویت گرادیان شناخته‌شده برای عملکرد و کارایی بالا
  • ماشین بردار پشتیبان (SVM): مؤثر برای وظایف رگرسیون با داده‌های محدود
  • جنگل تصادفی (RF): روش مجموعه‌ای مقاوم در برابر بیش‌برازش

2.3 راه‌اندازی آزمایشی

دو سناریوی اعتبارسنجی پیاده‌سازی شد:

  • سناریوی 1: تقسیم تصادفی تمام داده‌های موجود
  • سناریوی 2: آموزش روی یک ایستگاه، اعتبارسنجی روی ایستگاه دیگر (اعتبارسنجی متقابل مکانی)

3 نتایج و بحث

3.1 مقایسه عملکرد

تمام مدل‌های یادگیری ماشین در هر دو سناریوی اعتبارسنجی از معادلات تجربی سنتی بهتر عمل کردند. XGBoost با مقادیر R² بیش از ۰.۹۲ بالاترین دقت را نشان داد و به دنبال آن جنگل تصادفی و SVM قرار گرفتند.

شکل 1: مقایسه عملکرد بین مدل‌های ML و معادلات تجربی. نمودار میله‌ای مقادیر R² را برای هر روش در ترکیب‌های پارامتری مختلف نشان می‌دهد. XGBoost به‌طور مداوم با حداقل پارامترهای ورودی به بالاترین دقت دست یافت.

3.2 تحلیل اهمیت ویژگی‌ها

دما و تابش خورشیدی به عنوان مهم‌ترین ویژگی‌ها در تمام مدل‌ها ظاهر شدند. تحلیل نشان داد که تنها با این دو پارامتر، مدل‌های یادگیری ماشین می‌توانند به ۹۰%-۸۵ از عملکرد به‌دست‌آمده با مجموعه‌های پارامتر کامل دست یابند.

4 پیاده‌سازی فنی

4.1 فرمول‌بندی‌های ریاضی

معادله استاندارد فائو-۵۶ پنمن-مونتیت به عنوان معیار عمل می‌کند:

$$ET_0 = \frac{0.408\Delta(R_n - G) + \gamma\frac{900}{T + 273}u_2(e_s - e_a)}{\Delta + \gamma(1 + 0.34u_2)}$$

جایی که $\Delta$ شیب منحنی فشار بخار، $R_n$ تابش خالص، $G$ شار گرمای خاک، $\gamma$ ثابت سایکرومتریک، $T$ دمای هوا، $u_2$ سرعت باد، $e_s$ فشار بخار اشباع و $e_a$ فشار بخار واقعی است.

4.2 پیاده‌سازی کد

import xgboost as xgb
from sklearn.ensemble import RandomForestRegressor
from sklearn.svm import SVR
import numpy as np

class EToEstimator:
    def __init__(self, model_type='xgb'):
        if model_type == 'xgb':
            self.model = xgb.XGBRegressor(
                max_depth=6,
                learning_rate=0.1,
                n_estimators=100,
                objective='reg:squarederror'
            )
        elif model_type == 'rf':
            self.model = RandomForestRegressor(
                n_estimators=100,
                max_depth=10,
                random_state=42
            )
        elif model_type == 'svm':
            self.model = SVR(kernel='rbf', C=1.0, epsilon=0.1)
    
    def train(self, X_train, y_train):
        self.model.fit(X_train, y_train)
    
    def predict(self, X_test):
        return self.model.predict(X_test)

# انتخاب ویژگی: فقط دما و تابش خورشیدی
features = ['temp_max', 'temp_min', 'solar_rad']
target = 'ETo_FAO56'

5 کاربردهای آینده

این تحقیق پتانسیل قابل توجهی برای پیاده‌سازی عملی در چندین حوزه نشان می‌دهد:

  • سیستم‌های آبیاری هوشمند: ادغام با کنترلرهای آبیاری مبتنی بر اینترنت اشیا برای مدیریت آب بلادرنگ
  • انطباق با تغییرات آب‌وهوا: برنامه‌ریزی بهبودیافته منابع آب در مناطق مستعد خشکسالی
  • فناوری کشاورزی: توسعه برنامه‌های کاربردی موبایل برای کشاورزان خرده‌پا
  • سیاست آب: پشتیبانی از تصمیم‌گیری مبتنی بر داده برای تخصیص و قیمت‌گذاری آب

جهت‌های تحقیقاتی آینده شامل یادگیری انتقالی در مناطق آب‌وهوایی مختلف، ادغام با داده‌های ماهواره‌ای و توسعه راه‌حل‌های رایانشی لبه برای مناطق دورافتاده است.

6 مراجع

  1. Allen, R. G., Pereira, L. S., Raes, D., & Smith, M. (1998). Crop evapotranspiration: Guidelines for computing crop water requirements. FAO Irrigation and drainage paper 56.
  2. Landeras, G., Ortiz-Barredo, A., & López, J. J. (2008). Comparison of artificial neural network models and empirical and semi-empirical equations for daily reference evapotranspiration estimation in the Basque Country. Agricultural Water Management, 95(5), 553-565.
  3. Maestre-Valero, J. F., Martínez-Alvarez, V., & González-Real, M. M. (2013). Evaluation of SVM and ELM for daily reference evapotranspiration estimation in semi-arid regions. Computers and Electronics in Agriculture, 89, 100-106.
  4. López-Urrea, R., Martín de Santa Olalla, F., Fabeiro, C., & Moratalla, A. (2006). Testing evapotranspiration equations using lysimeter observations in a semiarid climate. Agricultural Water Management, 85(1-2), 15-26.
  5. Goodfellow, I., Pouget-Abadie, J., Mirza, M., Xu, B., Warde-Farley, D., Ozair, S., ... & Bengio, Y. (2014). Generative adversarial nets. Advances in neural information processing systems, 27.

7 تحلیل تخصصی

تحلیل دقیق

این تحقیق یک راه‌حل کاربردی برای یک چالش حیاتی کشاورزی ارائه می‌دهد: برآورد دقیق تبخیر-تعرق با حداقل ورودی‌های داده. نوآوری اصلی نه در تازگی الگوریتمی، بلکه در کاربرد استراتژیک نهفته است—ثابت می‌کند که مدل‌های استاندارد ML می‌توانند از معادلات تجربی تثبیت‌شده هنگامی که داده کم است، بهتر عمل کنند. در مناطق تحت تنش آبی مانند مراکش، این فقط یک تمرین دانشگاهی نیست؛ بلکه یک تغییردهنده بالقوه بازی برای کشاورزی پایدار است.

زنجیره منطقی

تحقیق از یک پیشرفت منطقی قانع‌کننده پیروی می‌کند: فائو-۵۶ PM سنتی به داده‌های سنسوری گسترده نیاز دارد → گران و غیرعملی برای مناطق در حال توسعه → معادلات تجربی ساده‌شده از مشکلات دقت رنج می‌برند → مدل‌های ML این شکاف را با یادگیری روابط پیچیده از داده‌های محدود پر می‌کنند. اعتبارسنجی در دو سناریو (تقسیم تصادفی و متقابل ایستگاهی) مورد قابلیت کاربرد در دنیای واقعی را تقویت می‌کند. تحلیل اهمیت ویژگی‌ها که دما و تابش خورشیدی را به عنوان محرک‌های کلیدی نشان می‌دهد، بینش‌های قابل اقدام برای استراتژی‌های استقرار سنسور ارائه می‌دهد.

نقاط قوت و ضعف

نقاط قوت: تمرکز کاربردی بر کاهش هزینه (صرفه‌جویی ۸۰%-۶۰ در زیرساخت سنسوری) یک نقطه درد واقعی را مورد توجه قرار می‌دهد. مقایسه با چندین معادله تجربی معیارسنجی جامعی ارائه می‌دهد. سناریوی اعتبارسنجی مکانی استحکام در برابر تغییرات جغرافیایی را نشان می‌دهد—عامل حیاتی برای کاربردهای کشاورزی.

نقاط ضعف: مطالعه فاقد روش‌شناسی بهینه‌سازی ابرپارامترهای دقیق است—جنبه‌ای حیاتی برای تکرارپذیری ML. اندازه مجموعه داده و دامنه زمانی مشخص نشده است، که سؤالاتی درباره مدیریت تغییرپذیری فصلی ایجاد می‌کند. برخلاف رویکرد سخت‌گیرانه در تحقیق CycleGAN (Goodfellow و همکاران، ۲۰۱۴)، منطق انتخاب مدل بدون مطالعات حذفی تا حدی دل‌خواه به نظر می‌رسد.

بینش اقدام

برای شرکت‌های فناوری کشاورزی: این تحقیق امکان‌سنجی توسعه راه‌حل‌های کم‌هزینه برآورد ETo برای بازارهای نوظهور را تأیید می‌کند. فرصت فوری در ایجاد برنامه‌های کاربردی موبایل ساده‌شده با استفاده از داده‌های دما و تابش خورشیدی به تنهایی نهفته است. برای سیاست‌گذاران: یافته‌ها از سرمایه‌گذاری در زیرساخت هواشناسی پایه به جای شبکه‌های چندسنسوری گران قیمت حمایت می‌کند. برای محققان: کار زمینه‌هایی برای کاربردهای یادگیری انتقالی در مناطق آب‌وهوایی مختلف و ادغام با تصاویر ماهواره‌ای برای پوشش گسترده‌تر باز می‌کند.

تحقیق با روندهای جهانی در کشاورزی دقیق هم‌راستا است اما رویکردی متمایزاً کاربردی اتخاذ می‌کند—بر روی آنچه با منابع موجود قابل دستیابی است به جای حداکثرهای نظری تمرکز می‌کند. این جهت‌گیری کاربردی، در حالی که تازگی دانشگاهی را محدود می‌کند، پتانسیل تأثیر دنیای واقعی را به‌طور قابل توجهی افزایش می‌دهد.