챗GPT, 기후위기 해법 놓고 전문가와 ‘대결’ 붙여보니
챗GPT에 기후정책 수단 평가하라 요구 스페인 연구팀, 기후전문가 설문과 비교 탄소세와 직접 규제를 더 중요하게 평가 전문가들은 보조금과 배출권거래제 선호
[ESG경제신문=강찬수 환경전문기자] 기후변화 정책을 놓고 평가하라고 했을 때 인공지능 챗GPT(ChatGPT)과 사람 전문가들 가운데 누가 더 똑똑할까?
다양한 기후 정책 수단을 비교 평가하라고 요구했더니 챗GTP는 배출권거래제(ETS, Emission Trading Scheme)나 보조금 지급보다는 직접 규제나 세금 부과를 더 높게 평가하는 것으로 확인됐다. 사람 전문가들 역시 비슷한 답을 내놓았지만, 챗GPT보다는 배출권거래제를 상대적으로 더 중요시했다.
바르셀로나 자치대학교 등 스페인과 네덜란드·러시아 등 국제연구팀은 최근 챗GPT에 기후정책을 평가하는 질문을 던지고 그 답변 내용을 정리한 논문을 ‘생태경제학(Ecological Economics)’ 국제 저널에 발표했다. 챗GPT는 오픈AI에서 개발한 대화형 인공지능 서비스다.
연구팀은 특히 자신들이 전 세계 기후 분야 전문가들을 대상으로 실시했던 동일한 설문조사 결과와 챗GPT의 답변을 비교했다.
‘생태경제학’ 저널에 별도의 논문으로도 소개된 전문가 설문조사는 관련 분야 논문(2016~2021년 6월 사이에 발표)의 저자 1만5000여 명에게 2021년 9~12월 이메일을 보내서 답변을 얻는 방식으로 진행했다. 최종적으로 789개의 전문가 답변을 얻어 분석했다.
효과성 등 4개 기준에 동일한 ‘가중치’
연구팀은 먼저 챗GPT에 “기후 정책 도구를 평가하는 데 어떤 기준을 중요하게 생각하느냐?”고 질문을 했다.
챗GPT는 효과성, 효율성, 형평성, 실행가능성 등 4가지 기준에 골고루 최고 점수인 5점을 부여했다. 챗GPT는 “각 기준은 상호 연결되어 있으며 효과적인 기후 정책 평가를 위해서는 전체적인 접근 방식이 필요하다”고 덧붙였다.
챗GPT에게 이들 기준을 가지고 각 정책 수단을 평가하도록 했다. 기술적 기준을 정하거나 할당량을 부과하는 것 같은 ‘직접 규제’의 경우 효과성은 높지만 효율성은 낮거나 중간 정도로 평가했다.
“직접규제는 비용이 가장 싼 해결책을 찾도록 하는 융통성이나 시장 메커니즘을 허용하지 않기 때문에 경제적으로 비효율적일 수 있다”고 챗GPT는 설명했다.
‘탄소세’의 경우 효율성은 높지만 효과성은 낮거나 중간 정도로 평가했다. 탄소세는 배출 감소에 대한 명확한 재정적 인센티브를 제공하지만, 전반적인 효율성은 세율에 따라 달라진다는 것이다.
‘배출권 거래제’에 대해서는 효과성과 효율성 모두 높은 것으로 평가했다. “배출권이 적절하게 설정되면 일정 수준의 배출 감소가 보장된다(효과성)”면서 “거래 메커니즘으로 인해 가장 경제적인 곳에서 배출 감소가 발생할 수 있다(효율성)”고 밝혔다.
‘보조금 지급’의 경우 효과성은 ‘보통’, 효율성은 ‘낮음’으로 평가했다. 보조금은 청정기술 채택을 장려하지만, 시장 왜곡으로 이어질 수 있고 비용 효율적인 배출감소로 이어지지 않을 수 있다는 것이다. 형평성과 실행가능성에서는 ‘높음’으로 평가했다. 보조금이 잘 설계되면 저소득층에 혜택을 줄 수 있고, 정치적으로 인기가 높다는 점을 들었다.
배출권거래제를 탄소세보다 낮게 평가
다음 질문으로 “국가의 기후 정책 조합에서 이들 기후 정책 수단이 얼마나 중요하다고 생각하느냐?”고 챗GPT에 물었다.
챗GPT는 5점 척도(1 = 중요하지 않음, 2 = 다소 중요함, 3 = 중요함, 4 = 매우 중요함, 5 = 극히 중요함)에서 직접규제와 탄소세, 혁신지원(연구개발 보조금) 등 세 가지 수단에 대해 각각 4점을 부여해 ‘매우 중요함’이라고 평가했다.
배출권 거래제와 보조금지원은 3점으로 ‘중요함’으로 평가했고, 정보 제공은 2점을 부여했다. 가장 성공적인 탄소 가격 책정 시스템이라고 하는 배출권거래제를 탄소세보다 낮게 평가했다.
챗GPT는 “직접 규제는 규정 준수를 보장하고 업계 표준을 빠르게 변화시킬 수 있으므로 즉각적인 환경 목표를 달성하는 데 중요한 도구가 되고, 탄소세는 배출을 줄이기 위한 명확한 경제적 신호를 제공하며 환경 목표와 경제적 고려 사항의 균형을 맞추도록 조정될 수 있다”고 강조했다.
혁신 지원에 대해서는 “기후 변화에 대한 장기적인 해결책은 기술혁신에 달려 있으며, 연구개발 지원은 나중에 대대적으로 보급에 나설 수 있는 새로운 기술을 개발하는 데 매우 중요하다”고 지적했다.
배출권 거래에 대해서는 “탄소 배출 시장을 확립하고, 한도를 야심차게 설정하면 배출을 줄이는 효과적인 방법이 될 수 있다”고 밝혔다. 보조금 지원의 경우 “녹색 기술의 활용을 장려하고 특히 기술 개발 초기 단계에서 저탄소 경제로의 전환을 가속화할 수 있다”고 덧붙였다.
환경 교육이나 환경제품 표시 같은 정보 제공에 대해서는 “규제나 금융 수단만큼 직접적인 영향을 미치지는 않지만, 소비자 행동을 변화시키고 지속 가능성을 향한 문화적 전환을 지원할 수 있다”고 필요성을 인정했다.
“탄소 가격이 소비자 행동에 영향 준다”
연구팀은 기후정책과 관련해 10가지 진술에 대해 챗GPT에게 동의하는지 동의하지 않는지를 질문했다.
우선 ‘탄소 가격 책정이 기업과 소비자의 의사 결정에 영향을 미치는가’라는 진술에 ‘매우 동의한다’고 답했다. ‘탄소 가격 책정은 구매 결정을 내릴 때 대부분의 소비자가 환경 문제보다 가격에 더 많은 영향을 받는다는 점을 고려한다’는 진술에도 챗GPT는 ‘매우 동의한다’고 답했다.
챗GPT는 “탄소 가격 책정은 경제적 이기심을 활용하여 행동 변화를 주도한다”면서 “이는 일반적으로 자발적인 환경 고려보다 소비자 행동에 더 큰 영향을 미친다”고 설명했다.
챗GPT는 ‘탄소 가격 책정은 다른 수단보다 더 쉽게 규모를 확대하고 전 세계적으로 조화를 이룰 수 있다’는 진술에도 ‘매우 동의한다’고 답했다. 탄소 가격 책정 메커니즘, 특히 배출권 거래 시스템은 국경을 넘어 통합될 수 있는 잠재력을 갖고 있어 글로벌 배출량 감소에 대한 확장 가능한 접근 방식을 제공한다는 것이다.
아울러 ‘다른 수단에 비해 탄소 가격 책정의 독특한 장점은 다양한 목적으로 사용될 수 있는 공공 수익을 창출한다는 것이다’라는 진술에 대해서도 챗GPT는 “세금 감면, 청정에너지 투자 또는 취약 계층에 대한 지원 등 수익 창출은 탄소 가격정책의 중요한 이점”이라고 강조했다.
다만 챗GPT는 ‘탄소 가격은 저탄소 혁신 속도에 거의 영향을 미치지 않는다’, ‘탄소 가격 책정은 소비자와 기업이 합리적인 선택을 하지 않을 때 다른 수단보다 더 나쁜 기능을 한다’는 진술에 대해서는 동의하지 않았다.
전문가들 가장 중시하는 평가 기준은 ‘효과성’
연구팀이 전 세계 기후 전문가들 대상으로 진행한 설문 조사에서, 전문가들은 4개 평가 기준 가운데 ‘효과성’을 가장 중요한 기준(평균 4.42점)으로 여겼고, 그 다음으로 실행 가능성(4.03점)과 형평성(4.0점)이었으며, 효율성은 마지막 순위(3.63점)였다.
챗GPT처럼 4가지 기준을 모두 "매우 중요"하다고 선택한 사람의 수는 응답자의 6.5%에 불과했다. 또, 4가지 기준 중 하나만 매우 중요하다고 평가한 응답자(다른 기준은 낮게 평가)의 수는 260명(33%)에 이르렀다. “챗GPT와 달리 전문가가 다른 기준보다 특정 기준을 선호하는 명확한 선택을 한다는 것을 보여준다”고 연구팀은 지적했다.
각 정책 수단의 중요도를 평가하는 데 있어 전문가들과 챗GPT는 차이가 나타났다. 전문가들은 보조금 지급과 배출권 거래에 대해 3.5점 안팎의 점수를 부여해 챗GPT가 평가한 것보다는 더 중요하게 생각했다. 챗GPT는 각각 3점을 부여했다. 정보 제공의 중요성에 대해 전문가들은 3.5점을 부여한 반면, 챗GPT는 2점만 부여했다.
전문가들은 챗GPT보다 직접규제에 대해서는 조금 더 중요하게 생각했고(전문가 4.1점, 챗GPT 3.9점), 탄소세에 대해서는 조금 덜 중요하다고 판단했다(전문가 3.75점, 챗GPT 4.0점).
“정책 결정의 보완 수단으로 활용을”
연구팀은 논문에서 “챗GPT와 전문가 답변을 비교하면, 챗GPT가 매우 잘 대답했고, 다양한 분야의 전문가들이 한 답변 범위와 매우 일치했다”고 평가했다. 전체적으로 전문가 다수의 답변과 일치했다는 것이다.
하지만, 몇 가지 차이점도 확인됐다. 챗GPT는 기후 정책의 모든 성과 기준을 동등하게 중요하게 여기는 반면, 전문가들은 일부에 다른 기준보다 더 큰 가중치를 두거나 심지어 하나(특히 효과성)에 집중하는 경향이 있었다.
챗GPT는 탄소 가격 책정 수단(탄소세 및 배출권거래)을 전문가보다 효과적이고 효율적이지만 공평하지 않고 정치적으로 실행 가능하지 않다고 평가하는 경향이 있었다. 전문가들은 기후 정책 믹스에서 혁신 보조금 및 탄소세보다 직접 규제를 약간 선호하는 반면, 챗tGPT는 세 가지 수단을 동등하게 높게 평가했다.
연구팀은 “챗GPT가 방대한 양의 학술문헌과 회색문헌(정식 출판되지 않은 불투명한 정보)을 종합하는 새로운 방법을 제공하고, 이런 의미에서 챗GPT는 매우 우수한 성과를 보여준다”고 밝혔다.
챗GPT는 전문가보다 편향이 적은 것으로 보이고 이는 새로운 방법으로 정책을 결정하는 데 도움이 될 수 있다.
이러한 강점에도 불구하고 챗GPT는 모든 정보에 동일한 가중치를 두는 탓에 관련성이 낮은 자료와 높은 자료를 더 잘 분리하는 전문가의 역할을 여전히 무시할 수는 없다는 것이다.
연구팀은 “챗GPT가 정보를 수집하고 요약하는 절차는 여전히 ‘블랙박스’이기 때문에 전통적인 문헌 검토 및 전문가 설문 조사를 대체하는 것이 아니라 보완하는 것으로 보는 것이 가장 좋다”고 충고했다.
챗GPT가 어떻게 유도하느냐에 따라 응답이 안정적이지 않다는 점에서도 주의가 필요하다는 것이다.
[강찬수 환경전문기자 겸 칼럼니스트]