번역: 윤성진(albert_yoon@naver.com)
감수: 오영진(michidoroc@hanmail.net) 허민재(hmj2341@naver.com)
한국학에서의 딥러닝[1] Deep Learning in Korean Studies
한국학에서 딥러닝은 어떻게 여겨지는가? 이 질문은 특히 이 분야의 미래에 대해 생각하고자 하는 사람에게 실용적인 난제이다. "딥러닝"이라는 용어는 오늘날 "지능"의 인공적인 형태와 인간 지식이 깊이 몰입한 형태*라는 중요한 이중적 의미를 모두 갖게 되었다. 이와 유사하게 "어떻게 여겨지는가" 하는 물음은 가치 판단과 관련된 과정(누가 또는 무엇이 가치를 인정하는지) 및 그 결과, 특히 누가 또는 무엇이 가치를 인정받는지(즉, 중요한지)의 문제 모두를 수반한다. 한국학의 의미는 늘 그랬듯 정해진 형태가 없어 유용한 주제다.
* 기계학습 방식으로서의 딥러닝이 아닌, 깊은 배움(deep learning)을 의미함. 이하에서 이 형식의 주석은 감수자가 작성한 것이다.
따라서 이 질문에는 설명이 아니라 고찰이 필요하다. 이 에세이에서는 한국학이라는 용어의 근본적인 의미를 논한다. 그것은 여러 복합적인 주제를 간략하게 다루는 실험이 될 것이다. 그 주제의 예로는 한국학이라는 분야에 대해 어떻게 생각해야 할지, 이 분야를 다른 분야와 어떻게 구분할 수 있을지, 이 분야를 지탱하는 인프라는 무엇인지, 인공 지능과 연구, 공동체로서 어떤 유형의 딥러닝을 촉진해야 할지 등이 있다. 나는 한 가지 중심 가설에 논의의 토대를 두고자 한다. 그 가설은 불편할 정도로 단순하다. 다른 분야에서와 마찬가지로, 사본들**과 복제의 관행이 한국학의 학술적 인프라를 형성한다는 것이다.
** 이 글에서 사본(copies)은 받아적기, 필사, 인쇄, 디지털 복제 등을 통해 생산된 모든 형태의 자료들을 아우르는 개념으로 사용되고 있는 것으로 보인다. 마찬가지로, 복제(copying)는 디지털적이거나 물리적인 복사나 복제, 인쇄 따위를 모두 포괄한다. 대부분의 경우 ‘copies’를 ‘자료’로 옮기는 것이 더 자연스러울 수 있으나, 이 글의 핵심이 되는 ‘복제’라는 맥락을 유지하기 위해 이하에서는 맥락에 따라 ‘인쇄본’과 ‘사본’으로 옮겼다.
이 가설의 필연적인 결론은, 한국학이라는 분야가 미래로 나아감에 따라, 목록 작성, 설명, 비평과 신중한 추가 복제를 통해 사본에 관해 설명하는 오래된 기술이자 과학-즉 서지학을[2] 우리 공동체가 중요한 자원으로서 더 명백하게 인식해야 한다는 데 있다. 결론에서 간략하게 서술할 바와 같이, 서지학은 우리가 한국학을 떠받치는 학술적 인프라를 이루는 물질적 대상과 과정에 관심을 기울이는 데 도움을 줄 수 있다. 내가 제안하고자 하듯, 우리가 서지학 연구를 통해 문헌학적 헌신에 더 명확하게 관심을 기울이게 되는 미래에는, 더 강력한 형태의 인공 지능을 촉진하게 될 것이다. 한국에 대한 연구, 그리고 무엇보다도 더 깊은 의미에서 한국을 알기 위한 인간적 방법들과 관련되는 인공지능을 말이다. 보다 계획적으로 서지학적 도구를 사용한다면, 우리는 딥러닝이 오늘날 갖는 두 가지 의미를 모두 가능케 할 수 있을 것이다.
한국학
Korean Studies
베네딕트 앤더슨(Benedict Anderson)의 주장에 따르면, 국가는 적어도 부분적으로나마 개인이 자신을 공동체의 일원이라고 상상할 기회로 이해할 수 있다.[3] 앤더슨은 신문의 생산에 주안점을 두고 이러한 상상의 과정을 촉진하는 물질적 메커니즘을 인쇄 자본주의(print capitalism)로 정의했다. 앤더슨의 분석에는 충실성을 갖고, 일정한 간격을 두고, 산업적인 규모로 생산된 인쇄본과의 소통이 개인으로 하여금 국가 공동체라는 집단에 소속되었다고 상상할 수 있게 해 준다는 생각이 내포되어 있다. 나는 ‘한국학’도 이와 비슷하게 상상의 공동체로 이해할 수 있다고 생각한다. 우리의 경우에는 일간 신문이 아니라, 학술지와 같은 출판물의 사본을 통해, 서로 경쟁하며 한국이라는 개념을 정립해 나가는 지적 지형도들에 대한 관심을 공유하는 사람들의 공동체를 상상해 볼 수 있다.
학술지 <Korean Studies>에 소개된 딥러닝은 사본을 생산하고 이에 대해 고려하는 공공의 관행이 한국학을 어떻게 지탱하는지 보여주는 사례이다. (본 원고의 원안이 되는 에세이 및) 디지털 인문학에 관한 특별 섹션이 포함된 <Korean Studies> 2023년호를 살펴보자. 앤더슨의 공동체 구축 메커니즘에서 다뤘던 뉴스 기사의 다양성, 그리고 분야로서 한국학이 갖는 다양성과 마찬가지로, <Korean Studies>에 실린 연구들 역시 학제적 다양성을 지닌다. 하지만, 그러한 다양성에도 불구하고 모든 연구는 똑같이 역사적 현상의 디지털 표상, 다시 말해 디지털 사본을 수집, 창작, 고려함으로써 가능했다. 이러한 사본들의 디지털적인 물성, 그리고 그들이 ‘복제하는’ 역사적 현상과의 유사성은 해당 특별호에서 이루어진 한국에 대한 논의를 가능케 했다. 디지털 형태로 표상된 한국의 문서들과, 한국의 사람 및 장소들의 디지털 시뮬라크르 없이 이 연구들은 이루어질 수 없었을 것이다. 그 간단한 사실은, 사본들이 <Korean Studies>의 연구들에서 얻을 수 있는 종류의 배움을 위한 인프라로 작용하는 방식을 밝혀 준다. 디지털 사본과 그 물성적 특징들은, 저자들의 창의력 및 통찰력과 더불어, 한국에 대해 가능한 주장들과, 우리 독자들이 배울 수 있는 것들을 정립하는 데 기여한다. 그리고, 우리는 정말 많은 것들을 배울 수 있다!
점토, 대나무, 돌 또는 종이로 생산된 사본들이 한국학에서 지식으로 정립될 수 있는 바를 강력하게 형성했고, 계속 형성하고 있듯, 이제 디지털 사본들이 한국에 대해 이해하고 학습할 수 있는 바를 정립하는 데 강력하게 기여하고 있다. <Korea Studies>의 특별 섹션은 한국에 대한 연구의 지식 관행이 변화하고 있음을 보여주는 수많은 징후 중 한 가지에 불과하다. 해당 특별호에서는 디지털 사본을 생산하고 처리함으로써 무엇을 학습할 수 있는지의 문제를 전면화하면서, 한편으로 다른 물질적인 형태의 매개(mediation)가 한국에 대해 이해하고 논의하는 방법을 과거부터 현재까지 형성해 온 중요한 방법임을 암시적으로 강조한다.
다양성 있는 학제적 공동체
Our Diverse Disciplinary Community
사본에 대한 검토는 우리 공동체의 다원성을 비롯해, 다른 공동체와 어떻게 소통하는지 고려하는 데도 도움이 될 수 있다. 대학원 이후로 나의 연구는 많은 부분이 20세기 초반의 한국 시와 관련되어 있다. 내가 해당 주제에 대한 전문성이나 "깊은 배움(deep learning)"을 주장할 수 있다면, 이는 내가 한국 시의 다양한 사본을 탐구하고, 고려하고, 비교하는 데 들인 수년의 시간에서 비롯되었을 것이다. 시와 포이에시스(poiesis)에 대한 나의 관심은 내가 공부한 많은 사본과 가까워지는 방식을 결정했다.
우리가 겪은 경험, 중심적인 관심사, 우리가 받은 학제적 훈련에 따라, 우리의 배움에 영향을 주는 사본에 익숙해지는 방식들은, 우리 각자가 연구하는 다양한 유형의 사본들만큼이나 뚜렷이 구별된다. 하지만 아무리 우리의 연구가 서로 갖는 연관성이 희박하더라도, 우리가 연구를 수행하는 표상들은 “한국”과 일정한 관계를 가질 것이다. 그것이 일시적이거나 상상된 연관성이라고 해도 말이다. 우리는 20세기 초 시집을 다룰 수 있듯, 르네상스 시기 유럽에서 일어난 고전학의 부활도 다룰 수 있다. 그것은 송나라와 조선에서 유학이 부흥하고 재구성된 사건과 연관될 수도 있다. (이와 같은 부흥과 재구성이 20세기 초나 오늘날 우리가 살아가는 시대의 다양한 문학, 역사, 사회정치적 혁명에 영향을 준 것은 말할 것도 없다.) 어떤 주제를 다루건, 복제(reproduction)의 평가와 생산은 우리가 무엇을/어떻게 배웠는지의 핵심이 될 것이다. 우리가 공자와 아리스토텔레스를 지금과 같이 알고 있는 것은, 이러한 사상가들이 말하거나 글로 남긴 바, 또는 말하거나 글로 남겼다고 상상하는 바가 복제되고 다시 복제되었기 때문이다. 이 사상가들에 대한 지식의 깊이(내 지식은 그리 깊지 않지만)는 우리가 서로 다른 사본을 얼마나 많이 접했는지와 각 사본에 얼마나 익숙한지를 변수로 갖는 함수이다.
모든 분야의 역사학자, 문학 전문가, 사회학자, 언어학자, 큐레이터, 기록물관리사로 구성된 우리 한국학 공동체는, 하나의 국가가 사회정치적으로 다양한 만큼 학제적으로 다양하며, 우리 관심 대상을 표상하는 자료들과 다양한 방식으로 친밀하다. 이렇게 다양한 ‘친밀성’이 우리 배움의 기반이 되며, 우리가 연구 대상들을 아는 방식과 함께, 한국학자로서 자신들을 아는 방식을 정립한다. 또한 우리가 타자들과의 관계에서 우리를 보는 방식 역시 결정한다.
정보학
Information Science
물론 사본들은 적어도 미미하거나 간헐적으로나마 우리가 만나거나 거주하는 다른 상상의 연구 공동체들에서도 중심적인 역할을 한다. 필자는 최근 동료 마이클 버클랜드(Michael Buckland)와 함께, 정보학과 관련된 광범위한 학문 공동체에서 사본과 복제가 중심적인 역할을 한다고 논했다.[4] 클로드 섀넌(Claude Shannon)이 ‘엔트로피로서의 정보’라는 개념 규정을 담아 1948년에 발표한 중대한 논문 "의사소통의 수학적 이론(A Mathematical Theory of Communication)"에서, 본질적인 내용은 메시지를 복제하는 방식에 대한 이론이다. 섀넌의 의사소통 이론은, 목적지(destination)에서 이용하기 위해 소스에서 정보를 복제하는 것을 다룬다(그림. 1 참조).
섀넌을 비롯해 정보학자로 자처하는 많은 이들에게는, 인간의 지식을 구현하고 정립하는 사본들을 복제하고 보존하는 데 관한 공학적인 문제에 의의와 목적이 있다. 이는 한국학에서 우리가, 시의 의미를 설명하거나 정부 보고서에서 발견된 경제 데이터를 요약하려고 할 때와 같이, 특정 사본의 중요성을 확립하려 하는 것과는 다르다. 예를 들어 테프코 사라체비치(Tefko Saracevic)는 "정보학의 영역은 정보를 아는 것이 아니라 정보를 처리(표현, 조직, 검색)하는 데 중점을 두고 기록의 형태로 인간 지식의 방대한 분야를 전달하는 것"이라 주장한 바 있다.[5] 사본들과 맺는 독특한 관계가 정보학이라는 하나의 분야를 형성한다. 마찬가지로 독특한 관계가 한국학 분야를 형성하는 것처럼 말이다.
인프라
Infrastructures
정보학자가 사본을 다루고 생산하는 방법을 이해하는 것은, 사본과 복제, 그리고 점점 더 많은 수의 디지털 사본과 복제가 일종의 인프라로서 우리의 학습 관행에 포함되는(embedded) 방식을 이해하는 데 도움이 된다. 사회적, 기술적 시스템 내의 다양한 요소들이 서로 어떻게 연결되고 상호작용하는지 설명하는 리 스타(Leigh Star)의 내재성(embeddedness) 개념은 인프라에 대해 사고하는 체계에서 핵심적인 요소이다.[6] 사본과 복제는 한국학에서 너무나도 명백하게 중요하기 때문에 오히려 투명해져 눈에 잘 띄지 않는다. 사본에는 도달할 수 있는 거리와 범위가 있다. 사본은 원본과 다른 곳에 존재하면서, 그것들이 재현하도록(또는 복제하도록) 되어 있는 것을 제시한다. 한국학자로서 우리가 사본과 복제에 관심을 기울이는 방식은 (다양한 대학 시험 시스템, 언어 능력, 논문 심사 위원회와 학술 위원회를 통해 세심히 조직되는) 학제적 공동체 회원 자격의 일환으로 학습되며, (연구를 체계화하는 데 사용하는 방법론, 연구 결과를 제시하기 위해 채택하는 학술적 장르, 심지어는 로마자 표기법 등) 발전하고 있는 관행과 연관되어 있다. 사본을 다루고 생산하는 방법은 확립된 지식적 기반을 사용하여 점진적으로 형성되는 실천적 표준이 된다. 다른 인프라와 마찬가지로, 이전 형태는 "무너뜨려"지고 그 위에 새로운 복제 형태가 구축된다. 어떻게 우리의 학술 논문과 저널이 다른 학제 및 분야의 학술 논문이나 저널과 유사하게 형성되었는지, 어떻게 북미의 논문(monograph)과 대한민국의 논문(journal article)이 각각의 공동체에서 필수적으로 통용되는 형식이 되었는지, 그리고 어떻게 새롭게 등장한 디지털 출판물들도 이전의 아날로그 출판물과 유사한 형태가 되었는지 생각해 보자. 인쇄물과 원고 사본은, 다른 비(非)디지털 시뮬라크르와 마찬가지로, 한국학에서 수행하는 연구의 대부분을 위한 확립된 기반으로서 기능하며, 계속 다양한 형태의 학술적 연구를 뒷받침할 것이다. 설사 언젠가 인프라로서 “무너뜨려져”, 새로운 형태의 디지털 복제물들을 사용할 때만 가능한 다양한 연구를 단독으로는 촉진할 수 없게 되더라도 말이다.
딥러닝과 인공 지능
Deep Learning and Artificial Intelligence
일반적인 인간의 배움에서, 특히 한국학에서 사본이 수행하는 인프라 역할을 인식하면, 사본과 복제가 인공적인 형태의 "지능"에서 수행하는 인프라 역할을 이해하고 개념화하기 더 쉬울 것이다. 디지털 사본이 발전하는 형태의 인공 지능과 딥러닝에 필수적이라는 것은 당연한 사실이다. 그것은 또한 각양의 관행 공동체에서 다양한 연구를 떠받치는 당연한 인프라를 인지하는 어려움뿐만 아니라, 서로 다른 공동체에서 서로 다르게 사용할 수 있는 공유 인프라가 제시하는 기회와 과제 역시 인식하는 일이다.
인공 지능(AI), 기계 학습(ML), 딥러닝(DL)이라는 용어는 서로 바꿔 쓰는 경우가 많다. 대중 매체에서 AI는 거의 모든 종류의 컴퓨터 분석을 의미할 수 있다.[7] 하지만 전문가들은 진정한 인간과 같은 "범용" 인공 지능과 "좁은" 인공 지능을 구분한다. AI 시스템들이 더욱 정교해졌음에도, 그것들은 여전히 "좁은" "수학적 예측 방법"[8]이며, 이를 구현하는 것은, 다름 아닌, 우리의 멋진 ‘복제’다. 내가 아래에서 인공 지능이라는 용어를 사용할 경우, 의미하는 바 역시 수학적 예측 방법이다.
AI가 자체적인 분야로 공식화된 이후로 AI와 ML은 밀접한 관계가 되었다. 데이터 과학자 존 켈러허(John Kelleher)와 브렌단 티어니(Brendan Tierney)가 시사한 바와 같이 "기계 학습"이라는 용어는 인공 지능이 개발된 초창기에 "데이터로부터 학습하는 기능을 컴퓨터에 부여하는 프로그램을 묘사하는 데에"[9] 사용되었다. 기계는 데이터를 비교하고, 비교에 대한 기록을 유지함으로써 "학습"한다. 기계가 데이터 카테고리 간의 관계를 유용하게 설명하는 비교 기록을 만들 때 무언가를 "학습"한 것이다. 이러한 설명(description)을 보통 "모델"이라고 부르며, 필자가 이 용어를 사용할 때 의미하는 바도 이와 같다. 켈러허와 동료들이 사용한 더 격식 있는 표현을 빌리자면, "기계 학습 알고리즘은 데이터 세트의 설명 특성과 목표 특성*** 사이의 관계를 포착하여 모델을 학습시키는 과정을 자동화한다."[10]
*** 특성(feature)이란 데이터가 갖는 특정한 속성 내지는 값을 의미한다. 설명 특성(descriptive feature)은 데이터 세트를 설명하는 역할을 하며, 목표 특성(target feature)은 모델이 예측하고자 하는 목표가 된다. 예를 들어, 어떤 수술 이후 환자의 생존율을 예측하는 모델을 구축하고자 한다면, 설명 특성은 환자들의 성별이나 나이, 병력, 생활 습관, 심리적 상태 등이 될 것이다. 기계 학습 알고리즘은 이를 바탕으로 학습하여, 목적 특성인 생존율을 예측하는 모델을 구축한다.
이러한 “설명” 특성과 "목표" 특성은 무엇이든 될 수 있다. 나는 최근에 동료 김상훈 개발자와 국립중앙도서관에 있는 희귀한 연속 간행물의 이미지 전사를 자동화하는 기능을 갖춘 딥러닝 모델을 개발하는 특성 집합을 구성했다.[11] 우리는 도서관의 정기 연속 간행물에 대한 서술 메타데이터를 향상하고, 이에 더해 연구자와 고객들이 "전체 텍스트" 디지털 사본을 이용할 수 있도록 연속 간행물을 전사하는 경제적인 방법을 개발하는 작업을 맡았다. 김상훈 개발자와 내가 개발한 첫 번째 "설명" 특성과 "목표" 특성 세트는 연속 간행물 페이지의 이미지에서 판권 정보와 관련되는 특정 영역을 식별하는 기능과 관련이 있다. 우리는 연속 간행물의 각 호를 받아 판권 정보를 전사하여, 연속 간행물 특정 호의 인쇄 책임자와 인쇄된 장소를 서술하는 정보를 활용해 도서관의 표준 저자–출판사–출판일 메타데이터를 개선할 계획을 세웠다. 두 번째 설명 특성과 목표 특성 세트는 판권지에서 얼룩 따위와 달리 의미 있는 요소, 예를 들어 한글 글자 또는 한자를 식별하는 기능과 관련되어 있었다. 또한 더 광범위한 서지 시스템에서 활용 가능한, 도서관 연속 간행물에 담긴 의미 있는 요소를 분류하기 위한 설명 특성과 목표 특성도 구성했다. 즉, 개별 한글 음절과 한자, 문장 부호에 대한 설명 특성과 목표 특성을 구성해, 예컨대 다음과 같은 글자의 이미지(“印”)가 적절한 목표와 연결될 수 있도록 했다. 당연하지만 사소하지는 않은 점을 짚고 넘어가자면, 이 데이터와 알고리즘을 사용하여 구축한 합성곱 신경망****과 관련된 딥러닝 모델은, 새로운 사본들(인코딩된 텍스트)을 생산하기 위해, 디지털 사본들(디지털 이미지)을 사용하여 구축한 것이다.
**** 이미지 처리에 특화된 인공신경망의 종류
덜 명백하며, 마찬가지로 사소하지 않은 점을 짚고 넘어가자면, 딥러닝 모델 자체를 구축하는 데 사용한 알고리즘 자체도 작업을 수행하는 데 정교한 복제에 의존한다는 점이다. 기계 학습을 통해 컴퓨터는 설명 특성을 목표에 매핑하는 패턴을 자동으로 식별(즉 학습)할 수 있게 된다. 거기서 딥러닝은 특성 안의 어떤 패턴들이 그 특성을 알아볼 수 있게 하는지 식별하는 구체적인 유형의 기계 학습이다. 이러한 과정을 "딥러닝"이라고 부르는 이유는, 특성의 각 표상이 재귀적으로, 더 단순한 표상으로 나타나며 설명 특성의 어떤 부분이 "목표"와 가장 잘 연결되는지 식별하게 되기 때문이다. 딥러닝은 더 복잡한 표상 안에 점점 더 단순한 표상(충실도가 낮은 사본)을 중첩하고 네트워킹하는 프로세스를 자동화하여 특정한 목표에 연결할 수 있는 복잡한 설명을 구축한다. 이 과정은 끝없는 거북이들*****이 아니라, 끝없는 사본들(copies all the way down)을 만든다. 그 사본들이 딥러닝의 예측 능력을 가능케 한다.
***** 거북이가 세계를 떠받치고 있다는 인도 신화에서 유래한 표현. 세계를 떠받치는 거북이 밑에는 그 거북이를 떠받치는 다른 거북이가 있어야 하며, 이것이 무한히 반복된다. 여기서 저자는 거북이를 사본들로 바꾸어, 특성(feature)의 각 표상에 더 단순한 표상을 복제하여 겹쳐 놓는 회귀적인 구조를 빗대고 있다.
마지막으로, 김상훈 개발자와의 작업은 도서관의 메타데이터를 향상하고, 한국의 희귀본 연속 간행물의 이미지 컬렉션에서 판권 정보의 위치 및 전사를 예측할 수 있는 딥러닝 모델을 만들었을 뿐 아니라, 이전에는 대부분 알려지지 않았던 연속 간행물 생산을 담당했던 수백 곳의 인쇄 회사와 인쇄 업자를 파악함으로써 한국 출판 및 인쇄 문화에 대해 깊이 있게 이해할 수 있게 되었다는 점을 짚고 넘어가고자 한다. 다른 두 편의 간행물에서 서술한 바와 같이[12] 해당 작업은 두 가지 모두의 의미에서 딥러닝을 구현했다.
서지학적인 새로운 접근 방식을 통해 본 문헌학
Philology in a New Key with a Bibliographical Bent
사본과 복제 과정을 학습의 인간적이고 인공적인 유형 모두를 뒷받침하는 필수 인프라로 인정하면, 두 가지 학습 유형이 얼마나 깊이 얽혀 있는지 고려하기 더 쉬워진다. 이를 통해 공동체로서의 한국학, 한국학 공동체와 다른 공동체와의 관계 발전, 한국학에서의 딥러닝은 어떻게 여겨지는지까지도 정립하는 인프라의 메커니즘들을 고려할 기회가 주어졌다. 우리는 어떻게 인프라가 인간적이고 인공적인 형태 모두의 딥러닝을 지원하는가 하는 문제가, 한국의 다양한 표상을 판단하고 설명함으로써 한국에 대해 무엇을 알 수 있는지를 정립하는 문제와 얽혀 있고, 또 이에 기여한다는 사실을 고려할 수 있게 되었다. 가능한 여러 상황 중 예시를 한 가지만 들자면, 우리는 인쇄업자과 그들이 일했던 인쇄소를 세어 봄으로써 인쇄물로 한국을 표현한 사람들에 대해 뭔가를 배울 수 있다. 우리는 이제, 정보학 및 컴퓨터 과학의 도구와 방법론이 점점 더 한국에 대한 탐구를 용이하게 하듯, 한국을 표상하기 위해 선택된 사람, 사물, 사건에 대한 친밀한 이해에 기반한 인간의 ‘깊은 배움’이, 정보 및 컴퓨터 과학의 방법론에 영향을 줄 수 있고, 또 그래야만 한다는 것을 알 수 있다. 우리는 알고리즘과 인공지능의 시대에도, 우리의 오래된 문헌학적 도구들이 잘 쓰일 거라는 사실을 알고서 한국에 대한 탐구를 수행하게 될 것이다. 알고리즘과 지능은, 우리가 잘 떠올리지는 않더라도 우리의 연구와 우리가 한국을 아는 방식들에 기반이 되어 주는, 우리가 가깝게 잘 아는 사물들과 과정들, 즉 사본들과 그것을 생산하는 사회-기계적 과정에 의해 정립되기 때문이다.
사실 서지학적인 "새로운 접근"에서 문헌학은 한국을 표상(represent)하는 것, 즉, 한국을 다시 보여주는(present again) 것들과의 관계 발전을 통해 새로 드러난 학술적 지평을 탐구하는 데 유용한 틀을 제시할 수 있다. 문헌학은 "텍스트, 언어, 언어 자체의 현상에 대한 다각적 연구"[13]로 생각할 수 있지만, 새로운 접근에서 문헌학은 "인간의 기억과 그 물질적 표상에 '함축된 질서'를 연구하기 위한 절차"를 제안한다.[14] 서지학은 인간의 기억과 그 물질적 표상, 즉, 사본을 통해 (원본과) 다른 곳에서 사용될 정도로 관심을 받은 것들과 관련을 맺는, 전 세계적으로 다양하고 역사적으로 영향 받은 목록화, 설명, 분석, 비판의 재귀적 관행[15]을 수반한다. ‘한국’이 제공하는 맥락 속에서 무엇이 의미 있는 표상인지 판단하고 설명하는 서지학의 재귀적인 특성은, 우리가 무엇을/어떻게 학습하는지를 더 잘 이해하도록 도와준다. 복제의 기계적 과정에 대한 분석 서지학의 관심을 활용하면, 디지털 복제와 인공 지능의 기계적 과정, 그리고 그 두 가지가 ‘배움(learning)’을 형성하는 방식에 훨씬 깊이 있게 참여할 수 있다. 비판적 서지학은 무엇을 어떻게 복제해야 하는지 우리가 생각하는 방식에 대한 풍부한 논쟁적 담론을 제공한다. 이는 누가 또는 무엇이 복제를 통해 다른 곳에서, 또 미래에 이용할 수 있게 될지에 관해 고려할 때, 이러한 결정이 얼마나 어렵고 중대한 것인지를 분명하게 만드는 담론이다. 서지학적인 경향으로 새로운 접근을 이루는 문헌학은 한국학자들에게 깊이, 그리고 더욱 깊이 배울 기회를 제시한다. 국립중앙도서관에서 동료와 함께한 작업에 관해 설명하면서 시사했듯, 한국학자들이 서지학적 연구를 통해 문헌학의 헌신적 연구 성과를 더욱 의식적으로 탐구하는 미래에는, 강력한 인공 지능의 개발을 촉진할 수 있게 될 것이다. 그 인공지능은 한국에 대한 연구, 그리고 무엇보다도, 한국에 대해 더욱 많이 배울 수 있는, 더 심층적인 인간의 방식들과 연관될 것이다.
미주
[1]이 에세이에서는 중심 테마 중 하나로 이전 소논문의 일부를 다시 소개한다. 이 에세이의 이전 버전은 “What Counts as Deep Learning in Korean Studies? <Korean Studies> 47 (2023): 300–311에서 확인할 수 있다. <Korean Studies>의 편집 위원회에, 나의 논문(article) "Epilogue: What Counts as Deep Learning in Korean Studies?"를 해당 저널의 "디지털 한국학" 2023년 특별 섹션에 게재해 준 데 대해 감사를 표하고자 한다. 논문 일부 버전과 에세이의 일부는 다른 여러 출판물에서도 소개된 바 있다. 이전 연구에 대한 수많은 인용문을 작성하는 대신 다음과 같은 콘퍼런스 및 출판물의 편집자 및 주최자에게 각각의 장소에 필자의 연구를 발표할 기회를 준 데 대해 감사를 표하고자 한다. Wayne de Fremery, “Teaching Computers to Read Korean: Big Data and Artificial Intelligence at Adan Mun’go,” Muncha wa sasang 3 (2018): 107–115; Wayne de Fremery, “Twenty-First-Century Pleasures: Some Notes on Form, Media Transformations, and Korean Literary Translation,” Translation Review 108 (2021): 78–103; Wayne de Fremery, “Opportunities for Deep Learning: Early-to-mid Twentieth-Century Korean Periodicals” presented at the “New Perspectives on the History of Books and Reading in Korea” conference, Harvard University, December 8, 2022; Wayne de Fremery, Cats, Carpenters, and Accountants: Bibliographical Foundations of Information Science (Cambridge Massachusetts and London England: MIT Press, 2024); Wayne de Fremery, “Comparative Global—Digital—Humanities,” History of Humanities 9 no. 1 (2024): 115–128; Wayne de Fremery and Michael Buckland, “Copy Theory,” Journal for the Association of Information Science and Technology 73, no. 3 (2022): 407–418.
[2] 서지학의 정의는 de Fremery, Cats, Carpenters, and Accountants 참조.
[3] Benedict Anderson, Imagined Communities: Reflections on the Origins and Spread of Nationalism, 2nd ed. (New York and London: Verso, 2006) 참조
[4] Wayne de Fremery and Michael Buckland, “Copy Theory” 및 de Fremery, “Twenty-First-Century Pleasures: Some Notes on Form, Media Transformations, and Korean Literary Translation.” 참조
[5] Tefko Saracevic, “Information Science,” in Encyclopedia of Library and Information Science, 4th ed., eds. John McDonald and Michael Levine-Clark (Boca Raton: CRC Press, 2018), 2216.
[6] 스타에 따르면 인프라는 내재적이고 투명한 대상이다. 인프라는 “범위”가 있고 “회원 자격의 일환으로 학습된다.” “관행과 연관되어 있다.” 인프라는 표준을 촉진하지만, “표준의 전형”이기도 하다. 인프라는 스타가 "설치된 기반"으로 부르는 개념을 기반으로 구축되며, "무너뜨려지고 나서야 볼 수 있게" 된다. "모듈식 증가"의 방식으로 수정될 수 있지만, "한 번에 또는 전 세계적으로" 그렇게 되지는 않는다. Geoffrey Bowker and Susan Leigh Star, Sorting Things Out: Classification and Its Consequences (Cambridge, MA and London, England: MIT Press, 1999), loc. 572 of 4690, Kindle, citing Susan Leigh Star and Karen Ruhleder, “Steps Toward an Ecology of Infrastructure: Design and Access for Large Information Spaces,” in Information Systems Research 7 (1996): 111–134.
[7] Mariya Yao, Adelyn Zhou, and Marlene Jia, Applied Artificial Intelligence: A Handbook for Business Leaders (NP, Topbots, 2018), 8.
[8] Mariya Yao, Adelyn Zhou, and Marlene Jia, Applied Artificial Intelligence, 8.
[9] John D. Kelleher and Brendan Tierney, Data Science (Cambridge, MA and London, England: MIT Press, 2018), 14. Kindle.
[10] John D. Kelleher, Brian Mac Namee, and Aoife D'Arcy, Fundamentals of Machine Learning for Predictive Data Analytics: Algorithms, Worked Examples, and Case Studies (Cambridge, Massachusetts and London, England: MIT Press, 2015), locs. 475–476 of 13053. Kindle.
[11] Wayne de Fremery et al., Han’gukhyŏng ingong chinŭng kwanghak muncha insik (AI OCR) palchŏn ŭihan yŏn’gu 한국형 인공지능 광학적문자인식(AI OCR) 발전을 위한 연구 (Toward the development of a Korean AI optical character recognition system) (Seoul: National Library of Korea, 2021). 참조
[12] de Fremery et al., Han’gukhyŏng ingong chinŭng kwanghak muncha insik (AI OCR) palchŏn ŭihan yŏn’gu and de Fremery, “Opportunities for Deep Learning: Early-to-mid Twentieth-Century Korean Periodicals.”
[13] James Turner, Philology: The Forgotten Origins of the Modern Humanities (Princeton: Princeton University Press, 2014), loc. 115 of 19247, Kindle.
[14] Jerome McGann, A New Republic of Letters: Memory and Scholarship in the Age of Digital Reproduction (Cambridge, MA and London, England: Harvard University Press, 2014), 3. Kindle
[15] For a description of these key elements of bibliography see Wayne de Fremery, Cats, Carpenters, and Accountants: Bibliographical Foundations of Information Science, Boston and London: MIT Press, 2024.
참조 문헌
Anderson, Benedict. Imagined Communities: Reflections on the Origins and Spread of Nationalism, 2nd ed. New York and London: Verso, 2006.
Bowker, Geoffrey, and Susan Leigh Star. Sorting Things Out: Classification and Its Consequences. Cambridge, Massachusetts and London, England: MIT Press, 1999. Kindle.
Broussard, Meredith. Artificial Unintelligence: How Computers Misunderstand the World.
Cambridge, Massachusetts and London, England: MIT Press, 2018. Kindle.
de Fremery, Wayne. “Teaching Computers to Read Korean: Big Data and Artificial Intelligence at Adan Mun’go.” Muncha wa Sasang 3 (2018): 107–15.
de Fremery, Wayne. “Twenty-First-Century Pleasures: Some Notes on Form, Media Transformations, and Korean Literary Translation.” Translation Review 108 (2021): 78–103.
de Fremery, Wayne. “Opportunities for Deep Learning: Early-to-mid Twentieth-Century Korean Periodicals.” Paper presented at the “New Perspectives on the History of Books and Reading in Korea” conference, Harvard University, December 8, 2022.
de Fremery, Wayne. “Comparative Global—Digital—Humanities.” History of Humanities 9 no. 1 (2024): 115–128
de Fremery, Wayne. Cats, Carpenters, and Accountants: Bibliographical Foundations of Information Science. Cambridge, Massachusetts and London, England: MIT Press, 2024.
de Fremery, Wayne, and Michael Buckland. “Copy Theory.” Journal for the Association of Information Science and Technology 73, no. 3 (2022): 407–418.
de Fremery, Wayne, et al., Han’gukhyŏng ingong chin˘ung kwanghak muncha insik (AI OCR) palchŏnŭihan yŏn’gu 한국형 인공지능 광학적문자인식 (AI OCR) 발전을 위한 연구 (Toward the development of a Korean AI optical character recognition system). Seoul: National Library of Korea, 2021.
Kelleher, John D., and Brendan Tierney. Data Science. Cambridge, MA and London, England: MIT Press, 2018. Kindle.
Kelleher, John D., Brian Mac Namee, and Aoife D’Arcy. Fundamentals of Machine Learning for Predictive Data Analytics: Algorithms, Worked Examples, and Case Studies. Cambridge, Massachusetts and London, England: MIT Press, 2015. Kindle.
McGann, Jerome. A New Republic of Letters: Memory and Scholarship in the Age of Digital Reproduction. Cambridge, MA and London, England: Harvard University Press, 2014. Kindle.
Saracevic, Tefko. “Information Science.” In Encyclopedia of Library and Information Science, 4th ed., edited by John McDonald and Michael Levine-Clark, 3105–3116. Boca Raton: CRC Press, 2018.
Shannon, Claude E. “A Mathematical Theory of Communication.” The Bell System Technical Journal (July and October, 1948): 379–423, 623–656, https://archive.org/details/ bellsystemtechni27amerrich/page/n9
Star, Susan Leigh, and Karen Ruhleder. “Steps Toward an Ecology of Infrastructure: Design and Access for Large Information Spaces.” Information Systems Research 7 (1996): 111–34.
Turner, James. Philology: The Forgotten Origins of the Modern Humanities. Princeton: Princeton University Press, 2014. Kindle.
Yao, Mariya, Adelyn Zhou, and Marlene Jia. Applied Artificial Intelligence: A Handbook for Business Leaders. NP, Topbots, 2018.
Komentáře