필자는 대학원에서 한국 중세사를 전공했고 부전공이었던 디지털인문학 분야로 취직을 했다. 홍콩과 네덜란드에서 근무한 경험이 있고 온라인 수업으로 덴마크의 한국학 학생들에게 코딩을 가르쳐 본 경험도 있다. 지금은 서울대 자유전공학부에서 근무하면서 시대의 변화를 느끼며 산다.
자유전공학부에서 수업은 철저히 시장 논리로 돌아간다. 동아시아의 사상에 대한 수업을 개설하면 정원의 절반도 못 채우는데 디지털인문학 수업을 개설하면 수강정정 신청서가 밀려온다. 한번은 수강생을 거의 두 배로 늘린 적도 있다.
내가 강의를 잘 하는 교수자라서가 아니다. “디지털”이라는 키워드가 교과명에 포함되면 학생들이 수업에 관심을 보이고 들어보고 싶어 한다. 학부생들뿐만 아니라 인문대의 대학원생들도 종종 나의 랩으로 찾아와서 디지털인문학과 관련된 문의를 하고 공부모임을 만들기도 한다.
디지털인문학이란 2005년경부터 유행하기 시작한 용어라서 최근에 탄생한 학문으로 잘못 알려져있다. 영문학에서는 '디지털인문학'이라는 명칭이 정착되기 훨씬 전인 1940년대부터 컴퓨팅 기술과 인문사회 연구를 접목해 보는 시도가 꾸준히 있어왔고 한국학의 경우에도 1960년대부터 유사한 연구과 진행되어 왔다. 이토록 수많은 선구자들이 닦아놓은 기반에 자리잡은 학문이 디지털인문학이다.
디지털인문학의 정의에 대해서는 종사자마다 의견이 다르기로 유명하다. 다양한 방식으로 학계의 흐름을 돌아볼 수 있겠지만 컴퓨터의 두가지 기능을 기준으로 나누어 볼 수 있겠다. 첫째는 컴퓨터 프로세서의 계산 능력이고, 두번째는 컴퓨터에 장착된 저장매체의 정보 저장 능력이다.
컴퓨터 프로세서의 우수한 계산 능력을 활용하는 연구자들은 기계가독이 가능해 보이는 자료를 수집하고 데이터로 가공해서 텍스트 및 네트워크 분석, 데이터 시각화, 머신러닝 등을 사용해 여러가지 의미있는 연구성과를 내고 있다. 데이터 기반의 인문학 연구는 실험 단계를 넘어서 학술 담론을 형성하기도 하고 논쟁이 일어나기도 한다. 또한, 영문학에서 개발된 방법론을 일본문학 연구에서 적용해 보는 등 여러 방면으로 학문 경계를 넘나드는 활발한 교류가 이루어 지고 있다.
디지털 기술의 정보 저장 능력을 중시하는 자들은 주로 역사학이나 서지학에서 영감을 받은 연구자들이다. 디지털 시대 이전의 주요 매체였던 필사본이나 인쇄물들은 제한적인 정보만 담을 수 있었지만 보존 능력이 뛰어났다. 종이가 산성이나 습도로부터 잘 보호가 되면 수백년이 지난 조선시대의 책을 연구자가 아직도 읽을 수 있다. 그렇지만 대부분의 디지털 매체는 직사광선이나 습도에 매우 민감하고 10년 이상의 장기보존이 어렵다. 아카이브용 매체도 대부분의 경우 최대 30년에서 100년 정도만 보존이 가능하다.
이러한 상황에서 대부분의 인문학자들은 어떻게 대처해야 바람직할까? 디지털인문학에 대해 상당히 적대적인 분들도 있고 적극적으로 공부하고 싶지만 어디서부터 시작을 해야할지 모르겠다며 난감해 하는 분들도 있다. 그렇지만 대부분의 인문학 종사자들은 디지털 기술에 대해 무관심하다.
하지만 코로나19 팬데믹이 보여주었듯이 디지털 기술은 인문학 생태계에 너무나도 중요한 존재로 깊숙히 자리잡았다. 줌이나 유튜브 서비스가 없이는 2년동안 학술교류가 불가능했고 데이터베이스로 정리되어 있는 1차 자료와 학술자료 덕에 어느 정도 연구가 가능했다.
디지털인문학은 막연히 코딩을 하거나 데이터 시각화를 하는 학문이 아니다. 디지털 형태로 정리된 자료를 관람하는 것이 일상이 된 연구자들이 비판적인 시각으로 자신이 평소에 사용하는 학술 데이터베이스의 형성과정에 대하여 공부하고 자료가 종이가 위주인 매체에서 디지털 매체로 전환이 되어 가능해지는 새로운 방법론을 공부하는 학문이다.
자신의 학문분야에서 지금까지 해오던 방식의 연구를 무시하고 자료를 통계처리 하거나 데이터 사이언스의 여러 분석 기법을 억지로 사용하는 것은 더욱 아니다. 자료를 기계가독형인 방식으로 새롭게 정리해보고 컴퓨터의 도움을 받으며 실험적인 연구를 해보는 학문이다. 이런 방식으로 나온 연구결과물이 의미가 있고 설득력이 있는지는 학계의 비판을 통해 판단을 해야할 것이다. 그렇지만 디지털인문학 연구를 합리적으로 평가하려면 학계에서 디지털 리터러시 트레이닝을 진행해야 할 것이다.
한국의 대학에는 이미 디지털인문학 관련 워크숍이 여기저기서 개최되고 있다. 인문학자가 데이터를 가공해야 하는 이유가 무엇이고 파이썬은 어떠한 맥락에서 사용되는지 학습자에게 좀 더 명확히 안내를 해주면 더 바람직 하지 않을까 하는 생각을 해본다.
다른 한편으로는 “빅데이터”라고 불리는 정보의 홍수에 대한 방안도 필요하다. 한류의 영향으로 한국의 역사와 문화는 전세계의 많은 사람들의 관심의 대상이 되고 있다. 디지털 시대에 엄청난 분량으로 생성되고 있는 한국학 관련 본 디지털 자료들은 보존이 잘 되고 있는가? 자료를 수집하는 기관이 있기는 한가?
선술하였듯이 디지털 매체는 정보의 장기보존 능력이 매우 미흡하다. 그래서 1980년대부터 디지털 아카이브 전문가들은 디지털 암흑시대의 초래를 우려해 왔다. 필자는 한국학에도 20년 이내에 디지털 암흑시대가 올 것이라는 예감이 든다. 걱정이 태산이다. 이에 대한 방안도 학계에서 논의했으면 하는 바램이다.
Comments