Mobile QR Code QR CODE : Journal of the Korean Society of Civil Engineers

  1. 고려대학교 건축사회환경공학과 박사과정 (Korea University · purunyr@korea.ac.kr)
  2. 종신회원 · 고려대학교 건축사회환경공학부 교수 (Korea University · hchoi2@korea.ac.kr)
  3. 종신회원 · 교신저자 · 차세대융합기술연구원 재난안전연구센터 선임연구원 (Advanced Institute of Convergence Technology · kibb56@snu.ac.kr)



전단강도정수, 점착력, 내부마찰각, 암석, 기호회귀
Shear strength parameter, Cohesion, Angle of internal friction, Rock, Symbolic regression

1. 서 론

암석의 전단강도정수는 터널, 기초 등 토목구조물의 장기적 안정성 평가의 핵심 요소이다(Monjezi and Singh, 2000; Zhang et al., 2018). 특히, Mohr-Coulomb 파괴기준에서의 점착력(Cohesion, c)과 내부마찰각(Angle of internal friction, φ)은 암반의 전단거동을 대표하는 강도정수로서, 암반사면 안정해석을 포함한 다양한 공학적 의사결정의 기초 자료로 활용된다(Gong et al., 2020). 따라서, 전단강도정수의 합리적 산정은 암반 구조물의 안정성 확보 및 경제적 설계 수행을 위해 필수적이다.

일반적으로 암석의 전단강도정수는 직접전단시험, 삼축압축시험과 같은 실내시험을 통해 산정된다. 그러나, 암석은 불균질성(Heterogeneity) 및 이방성(Anisotropy)을 가지므로 시편의 형상과 크기, 불연속면의 분포, 풍화 정도 등의 요인에 따라 측정 결과가 민감하게 변동할 수 있으며, 시편 크기에 따른 크기효과(Scale effect)에 의해 실내시험 결과가 실제 현장 암반의 거동을 충분히 대표하지 못할 가능성이 있다. 또한, 시험 표본이 부족한 경우에는 통계적 신뢰성이 낮아 적용성이 제한된다(Abdi et al., 2018; Hussain et al., 2025). 특히, 전단강도정수의 직접 산정을 위해서는 수직하중 조건을 단계적으로 변화시키며 최소 3회 이상의 반복시험이 요구되며, 이에 따라 시편 준비 및 시험 과정이 복잡하고 상당한 시간과 비용이 소요된다는 한계가 있다.

최근에는 초음파 속도, 밀도, 일축압축강도, 인장강도 등 비교적 획득이 용이한 물성치를 활용하여 암석의 전단강도정수를 간접적으로 추정하는 연구가 수행되고 있다. 기존의 간접 추정 연구에서는 회귀분석을 기반으로 한 경험식이 제시되고, 머신러닝, 퍼지추론 등을 활용한 데이터 기반 모델이 개발되어 왔다(Lal, 1999; Armaghani et al., 2014; Sivakugan et al., 2014; Kainthola et al., 2015; Karaman et al., 2015; Shen and Jimenez, 2018; Ding et al., 2024; Han and Xue, 2024; Zhu et al., 2024). 그러나, 전통적인 회귀분석 기반 경험식은 변수 간 복잡한 비선형 관계를 반영하기 위한 회귀식 형태의 적절한 가정이 어려우며(Zhao et al., 2024), 머신러닝 및 퍼지추론과 같은 고차원 비선형 모델은 블랙박스(Black-box) 특성, 퍼지 규칙 수 증가에 따른 복잡성 등으로 인해 내부 구조에 대한 해석력이 낮다(Kwon et al., 2023; Wang et al., 2024; Kwon et al., 2025b). 토목구조물 설계 과정에서는 모델의 정확도뿐만 아니라 입력 변수들이 전단강도정수에 미치는 영향을 명확하게 파악하여야 하므로, 변수 간의 관계를 직관적으로 해석할 수 있는 명시적 수식 형태의 예측 모델 도출이 요구된다(Kwon et al., 2025a).

기호회귀(Symbolic regression)는 변수 간의 관계를 수식 형태로 도출하는 머신러닝 기법으로써, 예측 성능과 해석력을 동시에 확보하는 방법으로 평가된다(Makke and Chawla, 2024). 특히, 기호회귀는 수식의 형태에 대한 사전 가정 없이 다양한 수학 연산자를 조합하여 데이터에 가장 적합한 함수 구조를 직접 탐색한다. 이에 따라, 변수 간의 복잡한 비선형 관계를 효과적으로 반영하는 데 이점이 있으며, 제시된 수식을 통해 입력변수 값에 따른 출력변수의 거동을 정량적으로 분석할 수 있다(Angelis et al., 2023). 이러한 특성으로 인해, 기호회귀는 다양한 인자의 영향을 받는 지반 및 암반 물성치 예측에 꾸준히 활용되고 있다(Shen and Jimenez, 2018; Han and Xue, 2024; Pham et al., 2024; Zhang et al., 2025; Yang et al., 2026). 이 중 암석 전단강도정수에 대하여 유전 프로그래밍(Genetic programming) 및 유전자 발현 프로그래밍(Gene expression programming) 기반의 예측식이 제안된 바 있다(Shen and Jimenez, 2018; Han and Xue, 2024; Zhang et al., 2025). 그러나 기존 연구들은 주로 사용 가능한 입력변수를 모두 포함하여 예측식을 도출하고 그 성능을 평가하는 데 초점을 두었으며, 최종 수식에 포함된 변수 구성에 대한 논의는 제한적이었다. 이러한 접근은 예측식의 구조적 복잡도를 증가시켜 변수 간 관계 및 예측 경향 파악을 어렵게 하는 한계가 있다. 따라서, 기호회귀의 해석 가능성을 확보하기 위해서는 예측 성능과 함께 최종 수식의 변수 구성과 간결성을 검토하여야 한다.

본 연구에서는 암석의 P파 속도, 밀도, 일축압축강도, 인장강도를 입력변수로 활용하여 전단강도정수(c, φ)를 추정하기 위해 기호회귀 접근법을 도입하였다. 먼저, 총 199개의 샘플로 구성된 데이터베이스를 기반으로 변수 간 상관분석을 수행하여 입력변수와 전단강도정수 간의 관계를 검토하였다. 이후, 기호회귀 기법인 PySR(Python and Julia package for Scientific Symbolic Regression)을 적용하여 예측 성능과 수식의 간결성을 함께 고려한 점착력 및 내부마찰각 예측식을 제안하였다. 또한, 11종의 기존 예측식과의 성능 비교를 통해 제안된 식의 적용 가능성을 검증하였다.

2. 데이터베이스

2.1 데이터 수집

본 연구에서는 4종의 암석에 대해 총 199개(규암 50개, 석영운모편암 50개, 점판암 50개, 석회암 49개)의 샘플로 구성된 데이터베이스를 활용하였다(Kainthola et al., 2015). 해당 데이터베이스는 P파 속도(Vp), 밀도(ρ), 일축압축강도(Uniaxial compressive strength, UCS), 인장강도(Tensile strength, TS), 그리고 전단강도정수인 점착력(c) 및 내부마찰각(φ)을 포함한다. Table 1에는 각 변수에 대한 기초통계량을 제시하였다. 밀도와 내부마찰각을 제외한 4가지 변수의 변동계수(Coefficient of variation, CV)가 0.2 이상으로 나타났으며, 이는 해당 변수들의 상대적 분산이 높음을 의미한다(Mothibe and Shongwe, 2026). 따라서, 본 데이터베이스는 다양한 암석의 물리·역학적 조건을 반영하고 있어, 추후 제시될 예측식의 일반화 성능 확보에 기여할 것으로 판단된다.

Table 1. Statistical Descriptions of the Compiled Database

Parameter Min Q1 Medium Q2 Max CV Unit
Vp 2.21 3.60 4.24 5.29 6.33 0.25 km/s
ρ 2.41 2.59 2.67 2.74 2.89 0.04 g/cm3
UCS 40.97 88.00 120.90 165.05 237.76 0.43 MPa
TS 5.20 10.60 15.13 20.89 29.85 0.43 MPa
c 9.96 15.54 18.70 22.03 32.11 0.27 MPa
φ 24.57 30.43 34.55 37.70 43.35 0.13 °

Note. Q1 = First quartile, Q3 = Third quartile, CV = Coefficient of variation.

2.2 데이터 분석

4가지 변수(P파 속도, 밀도, 일축압축강도, 인장강도)에 대한 점착력 및 내부마찰각과의 상관분석 결과를 각각 Fig. 1(a)Fig. 1(b)에 제시하였다. 행렬의 주대각선에 나타난 데이터 분포로부터, 각 변수의 값은 전반적으로 정규분포에 근사한 형태를 띠는 것을 확인할 수 있다. 또한, 행렬의 상삼각부에 제시된 값은 가로축과 세로축에 해당하는 변수 간의 스피어만 상관계수(γs)이다. 스피어만 상관계수는 두 변수값의 순위에 기반하여 단조 증가 또는 단조 감소 관계의 강도를 정량적으로 평가하는 지표로, -1에서 1 사이의 값을 갖는다. 음수는 단조 감소 관계를, 양수는 단조 증가 관계를 나타내며, 절댓값이 클수록 변수 간의 상관성이 높음을 의미한다.

Fig. 1(a)에 따르면, P파 속도, 일축압축강도, 인장강도의 세 변수는 점착력과 높은 수준의 양의 상관관계를 나타냈다(γs≥0.95). 동시에, 이들 세 변수는 상호 간에도 매우 강한 양의 상관성이 확인되었으며(γs=0.99), 이러한 경향은 기존 선행연구와도 일치한다(Horsrud, 2001; Kahraman, 2001; Yasar and Erdogan, 2004; Altindag, 2012). P파 속도, 일축압축강도, 인장강도 간의 높은 상관성은 이들 변수가 점착력 예측에 대해 유사한 정보를 제공함을 의미하며, 이는 다중공선성(Multicollinearity) 문제를 초래하여 회귀모델의 안정성과 해석력 저하로 이어질 수 있다(Yang et al., 2025). 따라서, 본 연구에서는 각 변수를 단일 입력변수로 사용하는 점착력 예측식을 제안하고자 한다. 한편, Fig. 1(b)에 따르면 내부마찰각은 밀도와 가장 높은 양의 상관성을 보였으며(γs=0.72), P파 속도, 일축압축강도, 인장강도와도 약 0.3 수준의 γs를 갖는 양의 상관성을 나타냈다. 이처럼 내부마찰각은 여러 변수와의 상관성이 분산되어 나타나므로, P파 속도, 밀도, 일축압축강도, 인장강도를 모두 입력변수로 사용하여 예측 모델링을 수행하고자 한다. 즉, 본 연구에서는 데이터 분석 결과를 바탕으로 점착력은 단일변수 기반으로, 내부마찰각은 다변수 기반으로 예측식을 도출하고자 한다.

Fig. 1. Results of Correlation Analysis; (a) Cohesion, (b) Angle of Internal Friction

../../Resources/KSCE/Ksce.2026.46.3.0237/fig1.png

3. 암석 전단강도정수 예측 모델링

3.1 기호회귀 기법

기호회귀는 데이터로부터 독립변수와 종속변수 사이의 관계를 학습하고, 이를 설명하는 최적의 수학적 식을 탐색하는 기법이다(Makke and Chawla, 2024). 일반적으로 유전 프로그래밍(Genetic programming) 기반으로 구현되며, 이에 따라 각 개체(Individual)는 변수, 상수 및 연산자로 구성된 트리 구조의 후보 식으로 표현된다. 초기 모집단(Population)은 무작위로 생성된 여러 개체로 구성되며, 각 개체는 주어진 데이터에 대해 평균제곱오차(Mean Squared Error, MSE)와 같은 지표를 이용하여 적합도(Fitness)가 평가된다. 이후 적합도가 높은 일부 개체가 다음 세대의 부모(Parents)로 선택(Selection)되며, 이들의 교차(Crossover) 및 돌연변이(Mutation) 연산을 통해 새로운 개체가 생성된다. 생성된 개체들은 기존 모집단을 대체하거나 일부와 결합하여 다음 세대를 구성하고, 이러한 진화(Evolution) 과정은 사전에 지정한 반복 횟수 또는 성능 기준에 도달할 때까지 반복된다(Yu and Gen, 2010). 유전 프로그래밍 기반 기호회귀의 절차는 Fig. 2에 도시하였다.

본 연구에서는 Python 인터페이스와 Julia 연산 백엔드를 결합한 기호회귀 기법인 PySR을 활용하였다(Cranmer, 2023). PySR은 기존의 유전 프로그래밍 기반 기호회귀 구조에 다중 모집단(Multi-population) 진화 전략을 적용하여 탐색의 다양성과 효율성을 향상시킨다. 또한, Simulated annealing, Evolve-simplify-optimize loop, Adaptive parsimony metric을 도입함으로써, 국소 최적해(Local minimum)로의 조기 수렴을 완화하고 과도하게 복잡한 식이 선택되는 것을 방지한다. 이때 각 개체의 복잡도(Complexity)는 변수, 상수, 연산자의 총 개수로 정의되며, 다양한 복잡도 수준에서 적합도가 우수한 후보 식을 동시에 탐색한다. 특히, 적합도와 복잡도 간의 균형을 고려한 최적해 집합을 구성함으로써 서로 다른 복잡도의 최적 후보 식을 제공한다(Fox et al., 2024). 이후 사전에 정의된 선정 기준(최소 오차 등)에 따라 최종 예측식을 결정한다. 이러한 특성으로 인해 PySR은 탐색 공간(Search space)을 효율적으로 탐색할 수 있으며, 예측 성능과 해석력을 동시에 만족하는 수식을 도출하는 데 적합하다.

Fig. 2. Flowchart of Genetic Programming-Based Symbolic Regression

../../Resources/KSCE/Ksce.2026.46.3.0237/fig2.png

3.2 모델 구현

데이터베이스 내의 199개 암석 데이터를 무작위로 7:3의 비율로 분할하여, 각각 139개와 60개의 데이터로 이루어진 학습 데이터셋(Training set)과 시험 데이터셋(Test set)을 구성하였다. 이때, 각 데이터셋의 암종별 분포는 전체 데이터베이스 내 비율과 동일하게 유지하여, 모든 암종의 특성이 학습 및 시험 단계에서 균등하게 반영되도록 하였다.

기호회귀 모델은 Python 환경에서 PySR 라이브러리를 이용하여 구현하였으며, 주요 파라미터 설정은 Table 2에 제시하였다. 본 연구에서는 예측식의 실용성 확보를 위해 기호회귀 적용 선행연구를 참고하여 수식의 최대 복잡도(max_size)를 20으로 제한하였다(Yang et al., 2015; Wang et al., 2025; Huang et al., 2026). 이러한 제한은 특히 내부마찰각 예측 시 4개의 입력변수(P파 속도, 밀도, 일축압축강도, 인장강도)를 모두 포함하기보다, 모델 예측에 영향도가 높은 변수 조합을 선택하여 수식의 간결성을 확보하기 위함이다.

학습 데이터셋을 기반으로 다양한 후보 식을 생성하고, 각 식의 적합도는 평균제곱오차(Mean Squared Error, MSE)를 이용하여 평가하였다. 후보 식 f에 대한 손실함수는 Eq. (1)과 같이 정의된다.

(1)
$\mathcal{L}(f) = \frac{1}{n} \sum_{i=1}^{n} (y_i - f(\mathbf{x}_i))^2$

이때 n은 학습 데이터 수, yi는 실제값, xi는 i번째 데이터의 입력변수 벡터, f(xi)는 후보 식의 예측값을 의미한다. 이후 최종 예측식은 후보 식의 손실값과 복잡도 간의 균형을 고려하여 선정하였다. 구체적으로, 우선 가장 낮은 손실값을 갖는 후보 식의 손실값($\mathcal{L}_{\text{min}}$)을 기준으로 손실값이 $1.5\mathcal{L}_{\text{min}}$ 이하인 후보 식들을 고려하였다. 이들 중 복잡도 증가에 따른 log-loss 감소 수준이 가장 큰 식을 최종 예측식으로 선정하였다. 복잡도 증가에 따른 log-loss 감소는 Eq. (2)의 Score 함수로 평가된다.

(2)
$S(f) = -\frac{\Delta \log \mathcal{L}(f)}{\Delta C(f)}$

여기서, C(f)는 후보 식의 복잡도를 의미한다. 선정된 최종 예측식은 시험 데이터셋에 적용하여 일반화 성능을 검증하였다. 특히, 최종 예측식의 암종별 예측 성능을 분석함으로써 각 암종에 대한 적용성을 평가하였다.

Table 2. PySR Parameter Space

Parameter Description Value
Binary_operators Operator with two arguments +, -, ×, ÷
Unary_operators Operator with one argument sqrt, square, exp
populations Number of a group of formulas running 30
population_size Number of formulas in each population 30
niterations Number of iterations to run 100
max_size Maximum complexity of a formula 20

3.3 성능 평가 지표

기호회귀를 통해 도출된 식의 예측 성능을 평가하기 위하여 평균절대오차(Mean Absolute Error, MAE), 평균제곱근오차(Root Mean Square Error, RMSE), 평균절대백분율오차(Mean Absolute Percentage Error, MAPE), 결정계수(Coefficient of determination, R2)의 4가지 지표를 사용하였다. MAE와 RMSE는 예측값과 실제값 간 오차의 절대적 크기를 평가하며, MAPE는 실제값 대비 상대 오차를 백분율로 나타낸다. 또한, R2는 예측식이 실제값의 변동성을 설명하는 정도를 나타내는 지표이다. 각 성능 평가 지표는 Eqs. (3)-(6)와 같이 정의된다.

(3)
$\text{MAE} = \frac{1}{N} \sum_{i=1}^{N} |y_i - \hat{y}_i|$
(4)
$\text{RMSE} = \sqrt{\frac{1}{N} \sum_{i=1}^{N} (y_i - \hat{y}_i)^2}$
(5)
$\text{MAPE} = \frac{100\%}{N} \sum_{i=1}^{N} \frac{|y_i - \hat{y}_i|}{y_i}$
(6)
$R^2 = 1 - \frac{\sum_{i=1}^{N} (y_i - \hat{y}_i)^2}{\sum_{i=1}^{N} (y_i - \bar{y})^2}$

이때 N은 데이터 개수, yi는 실제값, $\hat{y}_i$는 예측값, $\bar{y}$는 실제값의 평균이다. MAE, RMSE, MAPE는 값이 작을수록, R2는 1에 가까울수록 예측 성능이 우수함을 의미한다.

4. 결과 및 논의

4.1 점착력 예측식

P파 속도, 일축압축강도, 인장강도를 각각 단일 입력변수로 사용하여 점착력 예측식을 도출하였으며, 그 결과를 Eqs. (7)-(9)에 제시하였다. 이때, 점착력, 일축압축강도, 인장강도의 단위는 MPa이며, P파 속도의 단위는 km/s이다. P파 속도 기반 예측식은 단순 비선형 회귀식 형태를 띠는 반면, 일축압축강도와 인장강도 기반의 예측식은 단순 선형 회귀식 형태로 표현되었다. 각 예측식은 P파 속도, 일축압축강도, 인장강도의 증가에 따라 점착력이 함께 증가하는 경향을 나타냈으며, 이는 Fig. 1(a)에 나타난 세 변수와 점착력 사이의 강한 양의 상관관계(γs≥0.95)가 반영된 결과이다. 또한, 이러한 경향은 암석 재료의 치밀성 및 내부 결속 상태가 향상될수록 탄성파 전달 속도 및 강도가 증가하고, 이와 동시에 점착력이 커지는 일반적인 역학적 거동과 부합한다(Sousa et al., 2005; Zhu et al., 2021).

(7)
$c = \frac{85.15}{9.04 - V_p}$
(8)
$c = 0.09 \text{UCS} + 7.76$
(9)
$c = 0.72 \text{TS} + 7.75$

Fig. 3. Comparison Plots of Actual and Predicted Cohesion for Eq. (7). (a) Training Set, (b) Test Set

../../Resources/KSCE/Ksce.2026.46.3.0237/fig3.png

Fig. 4. Comparison Plots of Actual and Predicted Cohesion for Eq. (8). (a) Training Set, (b) Test Set

../../Resources/KSCE/Ksce.2026.46.3.0237/fig4.png

Fig. 5. Comparison Plots of Actual and Predicted Cohesion for Eq. (9). (a) Training Set, (b) Test Set

../../Resources/KSCE/Ksce.2026.46.3.0237/fig5.png

Eqs. (7)-(9)에 의해 산정된 점착력의 예측값과 실제값을 비교한 산점도(Scatter plot)와 성능 평가 지표 결과를 Figs. 3-5에 제시하였다. 3종류의 예측식 모두 우수한 예측 성능을 보여 산점도 상의 점들이 대체로 y=x 선 부근에 분포하였으며, 시험 데이터셋에 대해 MAE는 1.03-1.11 MPa, RMSE는 1.25-1.36 MPa, MAPE는 5.61-6.20 %, R2은 0.93-0.94의 범위를 나타내었다. 또한, 학습 단계와 시험 단계 간 성능 차이가 전반적으로 크지 않아, 제안된 식이 특정 데이터 범위에 편향되지 않음을 확인할 수 있다. 결과적으로, 제안된 예측식들은 높은 예측 정확도와 일반화 성능을 나타내므로, 확보 가능한 물성치 데이터에 따라 암석의 점착력 추정에 선택적으로 활용될 수 있을 것으로 판단된다.

4.2 내부마찰각 예측식

내부마찰각 예측식은 Eq. (10)과 같이 다중 비선형 회귀식의 형태로 도출되었다. 여기서, 내부마찰각의 단위는 °, P파 속도의 단위는 km/s, 밀도의 단위는 g/cm3이다. 내부마찰각 예측식 도출 과정에서 P파 속도, 밀도, 일축압축강도, 인장강도의 4가지 입력변수를 모두 고려하였으나, 최대 복잡도 제한(3.2절 참조)에 따라 최종 식에는 P파 속도와 밀도만이 포함되었다. 이러한 변수 선택 결과는 Fig. 1(b)에 제시된 바와 같이, P파 속도와 밀도가 다른 입력변수들에 비해 내부마찰각과 상대적으로 높은 양의 상관성을 보인 것과 일관된다(P파 속도 γs=0.33, 밀도 γs=0.72). 아울러, 제안된 식은 P파 속도, 밀도 값의 범위에 따라 내부마찰각의 증감 경향이 상이하게 나타났다. 그러나 본 연구에서 사용된 데이터 범위 내에서는 두 변수 모두 내부마찰각과 양의 관계를 나타내어, 데이터베이스의 특성을 적절히 반영한 것으로 판단된다.

(10)
$\phi = V_p^2 + 48.81 (1 - 0.52 \rho)^2 (6.35 - V_p)$

Eq. (10)에 의해 산정된 내부마찰각의 예측값과 실제값 비교 결과 및 성능 평가 지표를 Fig. 6에 제시하였다. 성능 평가 결과, 시험 데이터셋에 대해 MAE는 1.59°, RMSE는 1.89°, MAPE는 4.96 %, R2은 0.83으로 나타나 전반적으로 양호한 예측 성능을 보였다. 또한, 학습 단계와 시험 단계에서 유사한 예측 성능을 나타내어, 내부마찰각 예측식이 과대적합에 해당하지 않음을 확인하였다. 결과적으로, 제안된 식은 비교적 단순한 형태와 안정적인 예측 성능을 동시에 확보하여, 암석 내부마찰각의 효율적인 추정에 기여할 것으로 사료된다.

Fig. 6. Comparison Plots of Actual and Predicted Angle of Internal Friction for Eq. (10). (a) Training Set, (b) Test Set

../../Resources/KSCE/Ksce.2026.46.3.0237/fig6.png

4.3 암종별 예측 성능 검토

4종의 암석(규암, 석영운모편암, 점판암, 석회암)에 대한 제안된 Eqs. (7)-(10)의 적용성을 검토하고자, 시험 데이터셋의 60개 데이터를 이용하여 암종별 예측 성능을 도출하였다(Table 3). 이때, 점착력과 내부마찰각의 단위 및 값의 범위 차이에 따른 영향을 최소화하고자 MAPE를 성능 평가 지표로 사용하였다.

분석 결과, 암종별로 유사한 데이터 개수로 학습이 수행되었음에도 불구하고, 모든 제안식은 규암에 대해 가장 낮은 MAPE를 나타내어 우수한 예측 성능을 보였다. 반면, Eq. (7)는 석영운모편암과 석회암에서 상대적으로 큰 오차를 보였으며, Eq. (8)과 Eq. (9)은 점판암에서 MAPE가 크게 증가하는 경향이 확인되었다. 또한, Eq. (10)은 점판암과 석회암에서 다른 암종 대비 상대적으로 높은 오차가 발생하였다. 이렇듯 암종별로 나타난 오차의 차이는 제안식 적용 시 각 암종의 특성을 고려한 선택적 활용이 필요함을 시사한다.

Table 3. MAPE Values of the Proposed Equations for Each Rock Type

Proposed equation MAPE
Quartzite Quartz mica schist Slate Limestone Total
$c = \frac{85.15}{9.04 - V_p}$ (Eq. (7)) 3.57 % 7.52 % 5.09 % 8.56 % 6.20 %
$c = 0.09 \text{UCS} + 7.76$ (Eq. (8)) 3.09 % 4.95 % 8.09 % 5.78 % 5.61 %
$c = 0.72 \text{TS} + 7.75$ (Eq. (9)) 3.14 % 5.63 % 9.17 % 6.05 % 6.19 %
$\phi = V_p^2 + 48.81 (1 - 0.52 \rho)^2 (6.35 - V_p)$ (Eq. (10)) 2.91 % 3.20 % 7.35 % 6.47 % 4.96 %

4.4 기존 예측식과의 비교 검증

제안된 Eqs. (7)-(10)의 예측 성능을 검증하기 위하여, 선행연구에서 제안된 총 11종의 기존 식을 대상으로 비교 분석을 수행하였다(Lal, 1999; Sivakugan et al., 2014; Kainthola et al., 2015; Karaman et al., 2015; Shen and Jimenez, 2018). 비교 대상은 P파 속도, 밀도, 일축압축강도, 인장강도 중 하나 이상을 입력변수로 사용하는 식으로 한정하였다. Table 4에는 기존 점착력 예측식 5종과 내부마찰각 예측식 6종을 제시하고, 시험 데이터셋의 60개 데이터에 대한 예측 성능을 함께 나타내었다. 이때, R2<0의 경우, 해당 모델은 종속변수의 평균값으로 단순 예측하는 경우보다 낮은 설명력을 가짐을 나타낸다.

점착력과 내부마찰각의 단위 및 값의 범위 차이에 따른 영향을 최소화하고자 대표적으로 MAPE로 성능을 분석하였다. 분석 결과, 기존 점착력 예측식 5종의 MAPE는 9.54-62.68 %로 산정되어, 본 연구에서 제안한 점착력 예측식(Eqs. (7)-(9))에서 확인된 5.61-6.20 %의 MAPE에 비해 전반적으로 높은 오차 수준을 보였다. 또한, 본 연구의 내부마찰각 예측식(Eq. (10))의 MAPE는 4.96 %로 나타난 반면, 기존 내부마찰각 예측식 6종의 MAPE는 19.26-126.96 %로 평가되었다. 이에 따라, 본 연구에서 제안한 전단강도정수 예측식이 기존 식 대비 우수한 예측 성능을 가짐을 검증하였다. 비교 검증 결과는 본 연구에서 활용된 데이터베이스에 한정된 것으로, 향후 외부 데이터를 활용한 검증을 통해 모델의 범용성을 평가할 필요가 있다. 또한, 제안된 예측식은 4종의 암석(규암, 석영운모편암, 점판암, 석회암)과 Table 1에 제시된 입력변수 및 전단강도정수 범위를 대상으로 검증된 것이므로, 해당 암종 및 범위를 벗어나는 조건에 대해서는 추가적인 검토가 요구된다.

Table 4. Predictive Performances of Existing Equations

Target variable Equation MAE RMSE MAPE R2 Reference
c $c = \frac{\text{UCS} \times \text{TS}}{2 \sqrt{\text{TS}(\text{UCS} - 3\text{TS})}}$ 11.35 MPa 14.64 MPa 43.30 % -4.47 Sivakugan et al. (2014)
$c = 9V_p - 27.89$ 10.79 MPa 13.21 MPa 54.70 % -2.85 Kainthola et al. (2015)
$c = 0.17\text{UCS} + 3.427$ 8.13 MPa 10.64 MPa 26.60 % -1.10 Karaman et al. (2015)
$c = 0.85\text{TS} + 7.255$ 5.27 MPa 6.88 MPa 9.54 % 0.78 Karaman et al. (2015)
$c = 0.19\text{UCS} + 7.6$ 12.79 MPa 15.57 MPa 62.68 % -6.31 Shen and Jimenez (2018)
$\phi$ $\phi = \sin^{-1} \left( \frac{V_p - 1}{V_p + 1} \right)$ 7.01° 7.50° 21.83 % -1.70 Lal (1999)
$\phi = \sin^{-1} \left( \frac{\text{UCS} - 4\text{TS}}{\text{UCS} - 2\text{TS}} \right)$ 8.01° 8.99° 25.77 % -2.87 Sivakugan et al. (2014)
$\phi = 9V_p + 9.545$ 14.20° 16.89° 43.49 % -12.68 Kainthola et al. (2015)
$\phi = 0.05\text{UCS} + 40.23$ 12.65° 13.45° 39.79 % -7.67 Karaman et al. (2015)
$\phi = 0.226\text{TS} + 41.74$ 41.48° 41.71° 126.96 % -82.38 Karaman et al. (2015)
$\phi = -0.1\text{TS} + 40.6$ 5.82° 7.13° 19.26 % -1.43 Shen and Jimenez (2018)

* [Unit] c: MPa, φ : °, Vp: km/s, UCS: MPa, TS: MPa

5. 결 론

본 연구에서는 4개 암종(석영운모편암, 규암, 점판암, 석회암)에 대해 총 199개의 샘플로 구성된 데이터베이스를 활용하여, 암석의 주요 물성치인 P파 속도(Vp), 밀도(ρ), 일축압축강도(UCS), 인장강도(TS)와 전단강도정수인 점착력(c), 내부마찰각(φ)과의 상관관계를 분석하였다. 분석 결과를 바탕으로 기호회귀 기법인 PySR을 적용하여 점착력과 내부마찰각에 대한 예측식을 도출하였으며, 11종의 기존 식들과의 예측 성능 비교를 통해 제안식의 적용성을 검증하였다.

1) 상관분석 결과, 점착력은 P파 속도, 일축압축강도, 인장강도와 매우 높은 양의 상관성(γs≥0.95)을 보여 단일변수 기반 예측 방식을 도입하였다. 반면, 내부마찰각은 밀도와 가장 높은 상관성(γs=0.72)을 보였으나, P파 속도, 일축압축강도, 인장강도와도 일정 수준의 상관성이 분산되어 나타나(γs=0.28-0.33) 다변수 기반 예측이 적합한 것으로 확인되었다.

2) PySR 예측 모델링 결과, P파 속도, 일축압축강도, 인장강도를 각각 단일변수로 사용하는 점착력 예측식은 모두 우수한 예측 성능(MAPE=5.61-6.20 %, R2=0.93-0.94)을 나타냈다. 내부마찰각의 경우, P파 속도와 밀도를 구성된 다변수 예측식이 도출되었으며, 전반적으로 양호한 예측성능(MAPE=4.96 %, R2=0.83)을 보였다. 또한, 제안된 예측식에서 변수값 변화에 따른 점착력 및 내부마찰각의 증감 경향이 상관분석 결과와 일관되어, 변수 간 관계를 적절히 반영한 것으로 판단된다.

3) 기존 점착력 예측식 5종과 내부마찰각 예측식 6종의 MAPE는 각각 9.54-62.68 %와 19.26-126.96 %로 높은 오차 수준을 나타냈으며, 이는 본 연구에서 제안된 예측식의 적용성이 상대적으로 우수함을 보여준다.

4) 본 연구를 통해 기호회귀 기법이 암석 물성치와 전단강도정수 간의 비선형 관계를 해석 가능한 수식으로 표현하면서 우수한 예측 성능을 확보하는 효과적인 방법임을 확인하였다. 따라서, 본 접근법은 향후 투수계수, 간극비 등 다양한 물성치에 대한 데이터 기반 예측식 개발로 확장될 수 있을 것으로 사료된다.

Acknowledgements

This research was supported by the Korea Agency for Infrastructure Technology Advancement under the Ministry of Land, Infrastructure, and Transport (No. RS-2022-00144188).

References

1
Abdi, Y., Garavand, A. T., Sahamieh, R. Z. (2018). Prediction of strength parameters of sedimentary rocks using artificial neural networks and regression analysis, Arabian Journal of Geosciences, 11(19).DOI
2
Altindag, R. (2012). Correlation between P-wave velocity and some mechanical properties for sedimentary rocks, Journal of the Southern African Institute of Mining and Metallurgy, 112(3), 229-237.Google Search
3
Angelis, D., Sofos, F., Karakasidis, T. E. (2023). Artificial intelligence in physical sciences: Symbolic regression trends and perspectives, Archives of Computational Methods in Engineering, 30(6), 3845-3865.DOI
4
Armaghani, D. J., Hajihassani, M., Bejarbaneh, B. Y., Marto, A., Mohamad, E. T. (2014). Indirect measure of shale shear strength parameters by means of rock index tests through an optimized artificial neural network, Measurement, 55, 487-498.DOI
5
Cranmer, M. (2023). Interpretable machine learning for science with PySR and SymbolicRegression. jl, arXiv preprint arXiv.DOI
6
Ding, X., Amiri, M., Hasanipanah, M. (2024). Enhancing shear strength predictions of rocks using a hierarchical ensemble model, Scientific Reports, 14(1).DOI
7
Fox, C., Tran, N. D., Nacion, F. N., Sharlin, S., Josephson, T. R. (2024). Incorporating background knowledge in symbolic regression using a computer algebra system, Machine Learning: Science and Technology, 5(2).DOI
8
Gong, F., Luo, S., Lin, G., Li, X. (2020). Evaluation of shear strength parameters of rocks by preset angle shear, direct shear and triaxial compression tests, Rock Mechanics and Rock Engineering, 53(5), 2505-2519.DOI
9
Han, D., Xue, X. (2024). Machine learning-based prediction of shear strength parameters of rock materials, Rock Mechanics and Rock Engineering, 57(10), 8795-8819.DOI
10
Horsrud, P. (2001). Estimating mechanical properties of shale from empirical correlations, SPE Drilling & Completion, 16(2), 68-73.DOI
11
Huang, X., Tang, J., Shen, Y., Yi, H., Zhang, C. (2026). Formula for irregular wave overtopping on vegetated seawall derived from physics-guided deep symbolic regression, Advanced Engineering Informatics, 70.DOI
12
Hussain, J., Fu, X., Chen, J., Ali, N., Iqbal, S. M., Hussain, W., Hussain, A., Saleem, A. (2025). Estimation of rock strength parameters from petrological contents using tree-based machine learning techniques, AI in Civil Engineering, 4(1).DOI
13
Kahraman, S. (2001). Evaluation of simple methods for assessing the uniaxial compressive strength of rock, International Journal of Rock Mechanics and Mining Sciences, 38(7), 981-994.DOI
14
Kainthola, A., Singh, P. K., Verma, D., Singh, R., Sarkar, K., Singh, T. N. (2015). Prediction of strength parameters of himalayan rocks: a statistical and ANFIS approach, Geotechnical and Geological Engineering, 33(5), 1255-1278.DOI
15
Karaman, K., Cihangir, F., Ercikdi, B., Kesimal, A., Demirel, S. (2015). Utilization of the Brazilian test for estimating the uniaxial compressive strength and shear strength parameters, Journal of the Southern African Institute of Mining and Metallurgy, 115(3), 185-192.DOI
16
Kwon, K., Kang, M., Kim, D., Choi, H. (2023). Prioritization of hazardous zones using an advanced risk management model combining the analytic hierarchy process and fuzzy set theory, Sustainability, 15(15).DOI
17
Kwon, K., Kang, M., Kim, D., Pham, K., Choi, H. (2025). Optimized ground settlement classification during TBM tunneling by combining machine learning with statistical analysis, Geomechanics & Engineering, 42(3), 179-189.DOI
18
Kwon, K., Kang, M., Shin, Y. J., Ahn, B., Choi, H. (2025). An interpretable framework for risk management in TBM excavation using expert elicitation integrated with fuzzy set theory, Scientific Reports, 15(1).DOI
19
Lal, M. (1999). Shale stability: drilling fluid interaction and shale strength, SPE-54356-MS.DOI
20
Makke, N., Chawla, S. (2024). Interpretable scientific discovery with symbolic regression: a review, Artificial Intelligence Review, 57(1).DOI
21
Monjezi, M., Singh, T. N. (2000). Slope instability in an open cast mine, Coal International, 8, 145-147.Google Search
22
Mothibe, L. B., Shongwe, S. C. (2026). Model averaging and grid maps for modeling heavy-tailed insurance data, Risks, 14(1).DOI
23
Pham, K., Nguyen, K., Lim, K., Kim, Y., Choi, H. (2024). A generalized formula for predicting soil compression index using multi-evolutionary algorithm, Engineering Geology, 343.DOI
24
Shen, J., Jimenez, R. (2018). Predicting the shear strength parameters of sandstone using genetic programming, Bulletin of Engineering Geology and the Environment, 77(4), 1647-1662.DOI
25
Sivakugan, N., Das, B. M., Lovisa, J., Patra, C. R. (2014). Determination of c and φ of rocks from indirect tensile strength and uniaxial compression tests, International Journal of Geotechnical Engineering, 8(1), 59-65.DOI
26
Sousa, L. M., del Río, L. M. S., Calleja, L., de Argandona, V. G. R., Rey, A. R. (2005). Influence of microfractures and porosity on the physico-mechanical properties and weathering of ornamental granites, Engineering Geology, 77(1-2), 153-168.DOI
27
Wang, D., Feng, D., Zhou, K., Chen, Y., Liao, S. J., Chen, S. (2025). Symbolic regression-enhanced dynamic wake meandering: fast and physically consistent wind turbine wake modelling, Journal of Fluid Mechanics, 1025.DOI
28
Wang, Y., Wei, Y., Du, Y., Li, Z., Wang, T. (2024). Causality analysis and prediction of soil saturated hydraulic conductivity by combining empirical modeling and machine learning techniques, Journal of Hydrology, 644.DOI
29
Yang, G., Li, X., Wang, J., Lian, L., Ma, T. (2015). Modeling oil production based on symbolic regression, Energy Policy, 82, 48-61.DOI
30
Yang, Y., Choi, H., Kim, Y., Kwon, K. (2026). Symbolic regression-based prediction of coefficient of permeability for granular soils, Engineering Geology, 364.DOI
31
Yang, Y., Choi, H., Yeom, Y., Kwon, K. (2025). Data‐augmented machine learning for risk management of tunnel boring machine jamming considering coupled geological factors, Computer‐Aided Civil and Infrastructure Engineering, 40(27), 5010-5026.DOI
32
Yasar, E., Erdogan, Y. (2004). Correlating sound velocity with the density, compressive strength and Young's modulus of carbonate rocks, International Journal of Rock Mechanics and Mining Sciences, 41(5), 871-875.DOI
33
Yu, X., Gen, M. (2010). Introduction to evolutionary algorithms, Springer Science & Business Media, Berlin.Google Search
34
Zhang, F. P., Li, D. Q., Cao, Z. J., Xiao, T., Zhao, J. (2018). Revisiting statistical correlation between Mohr-Coulomb shear strength parameters of Hoek-Brown rock masses, Tunnelling and Underground Space Technology, 77, 36-44.DOI
35
Zhang, H., Wu, S., Liu, W., Long, Y. (2025). Uncertainty estimation of rock shear strength parameters based on gene expression programming—Bayesian inference, KSCE Journal of Civil Engineering, 29(12).DOI
36
Zhao, T., Shen, F., Xu, L. (2024). Review and comparison of machine learning methods in developing optimal models for predicting geotechnical properties with consideration of feature selection, Soils and Foundations, 64(6).DOI
37
Zhu, D., Yu, B., Wang, D., Zhang, Y. (2024). Fusion of finite element and machine learning methods to predict rock shear strength parameters, Journal of Geophysics and Engineering, 21(4), 1183-1193.DOI
38
Zhu, Z., Ranjith, P. G., Tian, H., Jiang, G., Dou, B., Mei, G. (2021). Relationships between P-wave velocity and mechanical properties of granite after exposure to different cyclic heating and water cooling treatments, Renewable Energy, 168, 375-392.DOI