Introduction
배추(Brassica rapa subsp. pekinensis)는 한국 식문화의 핵심 채소로, 특히 김장 문화와 밀접하게 연관되어 있다. 김장철을 중심으로 한 가을배추의 수요는 계절성 작물 중에서도 단연 독보적인 위치를 차지하고 있으며, 국민 1인당 소비량 또한 채소중 가장 높은 비중을 차지하고 있다(Rural Development Administration, 2025). 이러한 수요에 대응하기 위해 매년 전국적으로 대규모 재배가 이루어지며, 배추는 단순한 채소를 넘어 식량 안보 및 농가 경제에 직결되는 전략 작물로 간주되고 있다. 그러나 배추 재배는 노동력과 관리 투입이 많은 반면, 기상 조건에 민감하게 반응하는 특성으로 인해 생산량의 변동성이 크고, 이에 따른 가격 불안정도 자주 발생한다(Park et al., 2015). 따라서 배추 생산의 안정성과 예측 가능성을 높이기 위한 과학적이고 체계적인 생육 모니터링 및 관리 기술의 연구가 필수적이다.
최근 지구온난화를 비롯한 기후변화는 농업 전반에 심각한 영향을 미치고 있다. 여름철 이상고온, 국지성 폭우, 가뭄, 예측이 어려운 계절 간 강수 변화는 농작물의 생육에 불안정성을 초래하고 있으며, 이로 인한 수량 감소와 품질 저하 사례가 매년 증가하고 있다(Climate Change 2023: AR6 Synthesis Report). 더불어 기후 변화에 적응하기 위한 작부체계의 변화로 인해 작물 주산지가 점차 북상하거나, 고랭지에서 중산간 지역으로 이동하는 경향도 나타나고 있다(Lee and Kim, 2008). 이러한 재배지 변화는 단순히 위치 이동에 그치지 않고, 재배 시기, 생육 기간(Ullah et al., 2021), 병해충 발생 양상(Ghini et al., 2011), 수확량(Jayathilaka et al., 2012) 등 다양한 농업 환경 조건의 변화를 수반하게 되어 기존의 생육 예측 모델이나 관리 방안이 현실에 부합하지 않는 경우가 많아지고 있다(Bisbis et al., 2018; Lobell, 2014). 따라서 변화하는 기후 조건에 유연하게 대응할 수 있는 새로운 작물 생육 예측 기법 개발이 필요하며(Moriondo et al., 2011), 이에 대한 관심과 연구가 지속적으로 확대되고 있는 상황이다(Hasegawa et al., 2022; Jägermeyr et al., 2021).
이러한 농업의 불확실성과 환경 변화에 대응하기 위한 대안으로 정밀농업이 주목받고 있다(Pathak et al., 2019). 정밀농업은 작물 생육의 공간적, 시간적 작황을 과학적으로 측정하고 분석하여, 보다 정밀한 의사결정과 효율적인 자원 투입을 가능하게 하는 농업 기술이다(Karunathilake et al., 2023). 특히 무인기 기반의 원격탐사 기술은 최근 비약적으로 발전하면서, 작물 생육 정보를 비파괴적이고 신속하게 획득할 수 있는 강력한 수단으로 자리잡고 있다(Peksen, 2007). 초분광, 다중분광영상 및 기계학습(Aguilar-Ariza et al., 2023)을 이용한 엽록소 함량(Jang et al., 2024), 광합성(Hussain et al., 2021), 스트레스 상태(Zhou et al., 2021) 등을 확인하는 다양한 연구들이 수행되고 있다. 이러한 연구는 기존의 경험 중심의 농업 관리 방식을 대체하거나 보완하여, 노동력 절감은 물론 생산성과 품질의 향상까지도 기대할 수 있는 가능성을 가지고 있다.
따라서 본 연구는 무인기를 이용한 다중분광영상의 식생지수를 이용하여 배추의 생체중을 추정하는 모델을 개발하고, 적산온도를 적용하여 환경에 따른 추정오차를 보정하는 것을 목표로 수행되었다.
Materials and Methods
실험대상 및 장소
본 실험은 전라북도 완주군 국립원예특작과학원 배추(Brassica rapa subsp. Pekinensis) 시험 포장(35°50’24.4N 127°02’1.23E, Fig. 1)에서 진행되었다. 2022년 9월 7일과 2023년 9월 6일에 각각 포피형인 청명가을과 반포피형인 불암 3호를 1열씩 10열로 파종하였다(Fig. 1). 2022년 11월 9일 및 2023년 11월 8일에 수확량과 상관성이 높다(Lee and Park, 2024)고 알려진 생체중을 각각 청명가을 27개 샘플(2022년 12개, 2023년 15개)과 불암 3호 27개 샘플(2022년 12개, 2023년 15개)을 대상으로 파괴조사하였다.
실험방법
Matrice 300 RTK(DJI Technology Inc, China)에 다중분광 센서 Altum-PT(MicaSense Inc, USA)(Table 1)를 탑재하여 센서 보정 후 고도 25 m, 비행 속도 4 m/s, 종횡비 75%로 생육조사 당일 정오에 공간분해능 1 cm로 실험포장을 촬영하였다. 영상 접합 기준점 설정을 위해 HI-Target V60(KOSECO Inc, Korea)을 사용하여 Ground Control Point(GCP)를 측정하였다. 촬영된 다중분광 영상 데이터를 Pix4D mapper(Pix4D S.A., Switerland)에서 정합한 후, QGIS(Quantum GIS, USA)의 Pansharpening을 처리를 하였다. ENVI 5.6(Exelis Visual Information Solution Inc., USA)의 Region Of Interest기능을 통해 식물을 식별하는 데 탁월한 식생지수 ExG(Excess Green vegetation index) (Štroner et al., 2023)로 각 배추개체 잎 부분만의 반사값을 추출하였고(Fig. 2), 사분위수(InterQuartile Range, IQR) (Yang et al., 2019)를 이용한 이상치를 제거 후, 10가지 식생지수(Vegetation Indices, VIs) (Table 2)를 계산하였다.
Table 1.
Multispectral sensor.
Table 2.
Vegetation Indices (VIs).
Name | Calculation | Reference |
NDVI | (Xue & Su, 2017) | |
GNDVI | (Marcial-Pablo et al., 2019) | |
GRVI | (Sripada et al., 2006) | |
RVI | (Yaghobi et al., 2019) | |
DVI | (Naji, 2018) | |
NDRE | (Barnes et al., 2000) | |
EVI | (Huete et al., 1999) | |
PRI | (Ryu et al., 2021) | |
OSAVI | (Xue & Su, 2017) | |
TCARI | (Haboudane et al., 2002) |
회귀모델
독립변수 중 피어슨 상관관계 분석(Cohen et al., 2009)으로 상관성이 적은 변수를 후진 소거법으로 하나씩 제거하며 회귀분석을 진행하였다. 회귀모델은 선형회귀모델인 Multiple Linear Regression(MLR), Ridge Regression(RR), Lasso Regression(LR), 비선형회귀모델인 Support Vector Regression(SVR), K-Nearest Neighbors Regression(KNR)을 사용하였다.
MLR은 둘 이상의 독립변수가 종속변수에 선형적인 관계가 있을 때 종속변수를 예측하거나 변수 간의 관계를 분석하는 데 사용되는 기본적인 방법이다. MLR은 독립변수의 조합을 최적화함으로써 종속변수에 대한 보다 정확한 예측을 보여준다(Lee et al., 2020). RR은 다중공선성 문제를 해결하기 위해 설계된 선형회귀 분석 방법 중 하나이다. RR은 정규화 항을 이용하여 회귀계수에 제한을 두어 모델복잡성 및 과적합을 방지하며, 모델의 안정성과 예측 정확도를 유지한다(Yasin et al., 2022). LR은 RR과 유사하게 다중공선성 문제를 해결하기위해 설계된 선형회귀 분석 방법 중 하나이다. LR은 RR과 달리 회귀계수를 0으로 축소시켜 모델복잡성 및 과적합을 방지하고 이에 따라 변수를 선택할 필요가 없다(Ranstam and Cook, 2018).
SVR은 가우시안 및 다항식 커널을 기본 커널함수로 사용하는 회귀방식으로 경사 하강 알고리즘을 사용하여 가중치 계수를 최적화하며 과적합문제 없이 뛰어난 일반화 성능을 나타낸다(Marjanović et al., 2011). 본 실험에서 SVR은 가우시안 rbf 커널을 사용한 비선형 SVR을 사용하였다. KNR은 선형 회귀 학습이 아닌 비모수적 학습방법으로 학습데이터에서 가장 비슷한 k개의 샘플을 유클리드 거리로 분석하여 예측을 하는방식이다(Kuhn and Johnson, 2013).
회귀모델 분석 시 일반화 성능 및 신뢰성을 고려하여 K-Fold Validation(KFV) 알고리즘을 사용하였다. KFV는 데이터세트를 동일한 크기를 가지는 k개의 분리된 데이터 세트로 무작위로 분할되고 각 데이터세트는 차례로 다른 데이터세트를 학습하는데 사용되며(Wong and Yang, 2017) (Fig. 3), 본 실험에서 5회 시행되었다.
평가지표
모델 평가 방법으로는 Eq. (1), (2), (3)과 같이 결정계수(R2)와 Root Mean Square Error(RMSE), Mean Absolute Error(MAPE)를 사용하였다(Yang et al., 2022; Yohanani et al., 2022). 일반화 성능을 고려하여 MAPE of Validation(MAPEV)이 가장 낮은 모델을 좋은 모델로 판단하였다.
적산온도
적산온도(Accumulated Temperature, AT)는 작물이 성장할 수 있는 기준 생육적온 이상인 날의 평균 기온을 누적한 값이다. 실험포장의 평균 기온은 기상청 기상자료개방포털의 완주군 기온을 이용하였다. 가을 배추의 생육적온은 15°C로 파종일부터 생육조사일의 기온에서 생육적온을 뺀 값의 합을 이용하였다.
Results and Discussions
배추의 생체중 및 다중분광데이터의 이상치를 제거한 결과, 청명가을과 불암 3호 동일하게 Blue에서 2개, Green, Red, RedEdge, NIR에서 각각 1개로, 총 54개의 데이터 중 총 이상치 4개를 제외한 50개의 데이터로 분석이 진행되었다. Table 3에 청명가을(Cheongmyeonggael Cabbage), 불암 3호(Bulam No.3 Cabbage), 통합품종 배추(Intergrated Cabbage) 생체중의 평균과 표준편차 그리고 연도별 적산온도를 나타내었다. T - test 결과 2022년의 생체중과 2023년의 생체중은 청명가을, 불암 3호, 통합품종 배추 모두 유의미한 차이가 있었다. 적산온도와 생체중을 연도별로 비교하였을 때 적산온도와 생체중이 비례하는 경향을 확인하였다.
Table 3.
Cabbage’s fresh weight’s Mean & Standard Deviation (SD) & AT.
Year |
Integrated cabbage Mean ± SD |
Cheongmyeonggaeul Mean ± SD |
Bulam No.3 Mean ± SD | AT |
2022 | 3103.7 ± 447.7gb | 3006.4 ± 419.9gb | 3243.9 ± 521.5gb | 178.8°C |
2023 | 4557.1 ± 882.5ga | 4326.6 ± 426.4ga | 4702.4 ± 377.9ga | 223.0°C |
Table 4는 청명가을, 불암 3호, 통합품종 배추의 생체중과 VIs간의 상관관계 분석의 결과이다. 청명가을은 NDRE, GRVI, GNDVI, TCARI, DVI, OSAVI, EVI, PRI, RVI, NDVI순, 불암 3호는 TCARI, PRI, NDRE, DVI, EVI, NDVI, RVI, GRVI, GNDVI, OSAVI순으로, 통합품종 배추에서 NDRE, TCARI, GRVI, GNDVI, PRI, DVI, OSAVI, EVI, NDVI, RVI순으로 생체중과 상관성이 높았다.
Table 4.
Correlation analysis between fresh weight and vegetation indices.
Table 5, 6에 청명가을과 불암 3호의 생체중과 각 모델별로 선택된 VIs들의 회귀분석 결과를 나타내었다. 청명가을에서 LR의 변수는 TCARI, GRVI, DVI, PRI가 선택되었으며, 나머지 4개 모델은 모두 NDRE, GRVI, GNDVI로 총 3개의 VIs가 선택되었다. 청명가을의 생체중 회귀분석 결과 RR의 성능이 R2C = 0.582, RMSEC = 485.9 g, MAPEC = 11.70%, R2V = 0.542, RMSEV = 567.7 g, MAPEV = 14.02%로 가장 높은 Validation성능을 나타내었다. MAPEV의 경우 비선형회귀모델이 RR보다 더 나은 성능을 보였으나 R2V를 확인하였을 때 과적합되었다고 판단하여 RR을 가장 좋은 모델로 선정하였다. 불암 3호의 LR에서 GRVI, DVI, TCARI, EVI, PRI가, RR은 TCARI, PRI, NDRE, DVI가, MLR, KNR, SVR은 TCARI, PRI, NDRE가 선택되었다. BC는 RR의 성능이 R2C = 0.781, RMSEC = 391.1 g, MAPEC = 9.352%, R2V = 0.553, RMSEV = 478.1 g, MAPEV = 11.28%로 가장 높은 Validation성능을 나타내었다.
Table 5.
Regression Analysis results of Cheongmyeonggaeul.
Table 6.
Regression Analysis results of Bulam No.3.
통합품종배추의 회귀분석결과(Table 7)에서 MLR의 변수는 NDRE, TCARI가 RR, KNR, SVR은 NDRE, TCARI, GRVI가, LR은 TCARI, GRVI, PRI, DVI가 선택되었다. 단일품종모델과 달리 MLR의 성능이 R2C = 0.636, RMSEC = 493.1 g, MAPEC = 11.67%, R2V = 0.446, RMSEV = 543.3 g, MAPEV = 13.03%로 가장 높은 성능을 나타내었다. 청명가을과 불암 3호에서 가장 좋은 성능을 보인 RR의 변수와, 통합품종배추에서 가장 좋은 성능을 보인 MLR의 변수를 확인하였을 때 각 품종에서 가장 상관성이 높은 NDRE, TCARI가 통합품종배추 MLR에서 선택되어 모델의 주요 변수로 작용하는 것으로 판단된다.
Table 7.
Regression Analysis results of integrated cabbage.
Table 8, 9에 각각 청명가을, 불암 3호 모델에 적산온도를 적용한 결과를 나타내었다. 적산온도 적용 후, 청명가을 및 불암 3호의 모든 평가지표에서 성능이 향상하였음을 확인하였다. 적산온도를 적용한 청명가을 모델 중 RR이 R2C = 0.737, RMSEC = 396.7 g, MAPEC = 9.302%, R2V = 0.701, RMSEV = 418.5 g, MAPEV = 10.61%로 Validation 성능이 가장 높았다. 적산온도를 적용한 불암 3호에서 RR이 R2C = 0.818, RMSEC = 355.7g, MAPEC = 8.161%, R2V = 0.672, RMSEV = 395.3g, MAPEV = 9.736%로 Validation성능이 가장 높았다.
Table 8.
Regression Analysis results of Cheongmyeonggaeul with accumulated temperature.
Table 9.
Regression Analysis results of Bulam No.3 with accumulated temperature.
Table 10에 통합품종 배추의 기존 모델에 적산온도를 적용한 결과를 나타내었다. 통합품종 배추모델에 적산온도를 적용한 MLR은 R2C = 0.733, RMSEC = 424.8 g, MAPEC = 9.600%, R2V = 0.607, RMSEV = 470.3 g, MAPEV = 10.99%로 가장 좋은 성능을 보였다. 모든 모델에서 성능의 향상을 확인할 수 있었는데, 이는 VIs가 포함하지 못하는 배추의 생장단계의 환경을 적산온도가 반영하기 때문으로 사료된다. 기존 VIs만 사용한 모델 중 각 품종별로 가장 높은 성능을 보인 모델이 적산온도 적용 후에도 가장 높은 성능을 보여 청명가을과 불암 3호의 RR을, 통합품종배추의 MLR을 각 데이터의 최적의 생체중 추정모델로 선정하였다.
Table 10.
Regression Analysis results of integrated cabbage with accumulated temperature.
Figs. 4, 5, 6 및 Eqs. (4), (5), (6)에 각 품종별로 선정된 생체중 추정모델들의 산점도와 회귀식을 나타내었다.
공통적으로 적산온도 적용 전 산점도가 1:1선을 따라 연속적으로 분포함을 확인하였으나, 적산온도 적용 후 군집화 및 일원화 현상이 나타났다. 이는 배추 데이터에 대한 시계열 상 적산온도의 다양성의 부족이 원인으로 사료된다.
청명가을과 불암 3호의 RR에 비해 통합품종배추의 MLR은 다양한 품종에 대한 적용 가능성과 예측 범용성이 높으며, 청명가을과 불암 3호에서 각각 먼저 선택된 NDRE, TCARI가 선택되었다. 적산온도 적용 전 청명가을의 RR은 통합품종배추의 MLR 보다 낮은 성능을 나타낸 반면, 적산온도 적용 후 청명가을, 불암 3호의 RR은 통합품종배추의 MLR보다 더 높은 성능을 보였다. 데이터 활용성, 다양한 품종에 대한 적용 가능성 및 예측 범용성을 고려하여 통합품종배추의 MLR모델을 최적의 배추 생체중 추정모델로 판단하였다. 추후 다양한 시기의 데이터를 획득한다면 선정된 변수 및 적산온도를 이용하여 모델성능을 향상시켜 다양한 환경에 따른 배추 생체중추정이 가능할 것으로 사료된다.
본 연구는 단순히 생육정보나 수확량 예측에 그치지 않고, 작물 생육에 중요한 환경 요인인 적산온도를 회귀모델에 적용함으로서, 기존 다중분광영상 기반 다중분광영상 기반 수확량 및 생육 정보 예측 연구(Tanabe et al., 2023; Shammi et al., 2024)들과 차별화된 접근을 시도하였다. 이는 VIs만으로는 반영되지 않는 시계열적 환경 스트레스나 생장조건의 누적 효과를 보완함으로써, 예측 모델의 오차를 줄이고, 실용성을 높인다는 점에서 의미가 있다. 따라서 UAV 기반 다중분광영상과 적산온도를 융합한 생육예측모델을 제시함으로서, 향후 다양한 환경 조건과 시계열 데이터에 대응할 수 있는 적용 가능성 면에서 기존 연구에 비해 뚜렷한 강점을 지닌다고 판단된다. 그러나 본 연구는 2개의 품종과 2년간의 한정된 데이터를 기반으로 수행되어 시계열 데이터 부족으로 인해 생육 단계별 충분한 학습이 이루어지지 않아 군집화 현상이 나타났다는 한계가 존재하기 때문에, 더 다양한 품종과 재배 환경에 대한 연속적인 데이터의 확보를 통해 모델의 일반화 성능을 더욱 향상시킬 수 있을 것으로 사료된다.
Conclusion
본 연구는 무인기를 이용한 다중분광영상으로부터 계산된 식생지수를 활용하여 배추의 생체중을 추정하고, 여기에 적산온도를 적용함으로써 환경에 따른 예측 오차를 보정하는 것을 목적으로 수행되었다. 생체중과 적산온도 모두 연도 간 유의미한 차이를 보였으며, 적산온도와 생체중사이의 비례 관계도 확인되었다. VIs 기반 모델에 적산온도를 추가한 결과, 모든 회귀모델에서 예측 성능이 전반적으로 향상되었으며, 이는 VIs만으로는 반영되지 않는 생육 환경의 요소를 AT가 보완해주었기 때문으로 판단된다. 통합배추의 MLR는 적산온도 적용 R2C = 0.733, RMSEC = 424.8g, MAPEC = 9.600%, R2V = 0.607, RMSEV = 470.3 g, MAPEV = 10.99%로 청명가을 및 불암 3호의 RR 보다 낮은 성능을 나타냈지만, 데이터 활용성, 다양한 품종에 대한 적용 가능성 및 예측 범용성을 고려하여 통합품종배추의 MLR모델을 최적의 배추 생체중 추정모델로 판단하였다. 하지만 적산온도 적용 후 산점도에서 군집화 및 일원화 현상을 확인하였는데, 이는 적산온도 데이터의 시계열적 다양성이 부족했기 때문으로 판단하였다. 향후 다양한 생육 시기의 데이터를 추가 확보하고 모델을 보완한다면, 보다 다양한 환경 조건에서 배추 생체중을 안정적으로 추정할 수 있을 것으로 기대된다. 수행된 연구는 최근 대두되고 있는 노지 스마트 농업기술에 활용될 수 있을 것이며, 무인기 기반 생육 진단과 환경 정보 융합을 통한 작물 생육 예측모델의 정밀도 향상 및 고도화에 기여할 수 있을 것 기대된다.