탐색과 울림

국학연구원 바로가기

마을인문학 바로가기


작성일 : 17-01-16 10:49
제목 [참관기] 제38차 사회인문학 워크숍 <빅데이터와 인문학>

<빅데이터와 인문학>

 

*일시: 201612월 23(금) 15:00~18:00

*장소: 연세대학교 위당관 313

*작성: 조영추 (국문과 박사과정)


 

noname01.jpg


20161223일 연세대학교 국학연구원 발표실에서 제38차 사회인문학 워크숍 "빅데이터와 인문학"이 열렸다. 최근 인문학 영역에서 빅데이터 분석 연구를 선도하고 계시는 허수 선생님(서울대학교)과 이재연 선생님(울산과기원)은 발표를 맡아주셨으며, 이어서 이기훈 선생님(연세대)과 이원재 선생님(카이스트)은 빅데이터 연구의 의미와 문제점, 그리고 향후의 가능성 등에 대해 검토하여 의미 있는 토론의 시간이 가졌다.

허수 선생님은 네트워크 분석을 통해 본 1980년대 '민중'-동아일보의 용례를 중심으로이라는 제목으로 발표를 하였다. 허수 선생님의 작업은 20년 동안(1975-1994)동아일보에 게재된 논설, 기획, 사건·사고 및 현실보도 기사 등 다양한 신문자료(6,922)를 활용하여 당시 실제 문맥에서 민중이라는 단어가 사용되는 용례(12,828)와 그 공기어들(共起語, 14,983, 118,676)의 양상을 정리·분석함으로써 '민중'이 논의되는 맥락을 파악하고자 하였다. '네트워크 분석' 기법을 사용하여 데이터를 분석하는 결과를 보면, '민중'의 논의 맥락은 크게 '사회운동', '제도정치', '변혁이론', '공연예술'의 네 영역으로 구축되어 있다는 것을 알 수 있다. 5년 단위로 맥락의 시기별 동향을 살펴보면 '민중'의 고빈도 사용 현상은 '운동'이라는 공기어와 관련이 깊은데, 이는 "1980년에 일어난 광주민중항쟁이라는 '사건'1980년대 후반에 '사회운동'으로 이어지고, 또 이러한 '사회운동'1990년대 전반에는 민중당 설립이라는 '제도정치'로 연결되었"(발제문 23)고 추론할 수 있다. 이와 달리, '공연예술' 영역의 경우에, 핵심 공기어인 '극단'의 높은 사용 빈도는 정치운동에 크게 영향을 받지 않고 지속적으로 유지되었다. 이는 '민중''극단'을 비롯된 비정치적·문화적 용례와 논의 맥락 안에도 놓일 수 있다는 것을 보여 준다는 것이다.

다음에 이재연 선생님께서 발표하신 주제는 '생활''태도': 기계가 읽은 개벽조선문단의 작품 비평어와 비평가이었다. 이재연 선생님의 작업도 역시 빅데이터의 수집과 분석을 바탕으로 진행되는데, 주로 워드투백(Word2Vec)이라는 알고리듬을 통해 개벽조선문단의 소설 논평들에서 나타나는 비평용어들을 미시적으로 살펴본 것이다. 이를 통하여 당시 전문 비평가들이 아직 나오지 않았던 문학비평사초기에 작가-비평가들이 사용했던 비평용어들, 즉 역사 속에서 제도화 되지는 않았지만 당시에 일시적으로 의미 있게 사용되었던 비평용어들을 탐구하고자 하였다. 출현 빈도가 높은 단어들 중에서 특히 개벽에서 '생활', 조선문단에서 '태도'는 눈에 많이 띄는데, 전자는 작가-비평가들이 소설 주인공의 삶에서 경험하던 사건과 그 원인을 이론화하는 과정에서 많이 사용되었으며, 후자는 주로 작품의 특성에 대한 논평에서 많이 나타났다. 그중에서 특히 염상섭이 '태도'를 다양하게 활용하여 당시 비평의 주요 논쟁에서 자신의 주장을 펼친 바가 있다.

위의 두 분 선생님의 발표는 인문학 연구와 빅데이터 활용에 대해 많은 시사점을 제공해 준다. 빅데이터는 인문학 연구 자료를 확대하는 데에 많은 도움이 줄 뿐만 아니라, 그러한 자료를 기반으로 기존에 확고한 인식의 틀에 벗어나 새로운 분석 지평을 열어주는 데에도 크게 기여할 수 있다. 개념사 연구에 있어서 빅데어터는 무척 유용하는 것인데, 거시적으로는 특정한 한 개념의 전체적인 의미장을 제시할 수 있으며 미시적으로는 개념의 자세한 의미 변화 양상을 자세하게 보여줄 수 있다. 그러나 이처럼 사람들의 주관적인 선입견을 깨 주고 새로운 인문학 연구 영역을 개척해 주는 역할을 하지만, 빅데이터 연구도 그 나름의 한계와 문제점을 가지고 있다. 이를테면, 빅데이터 분석이 과연 그만큼 생산적이고 신선한 발견을 도출할 수 있을까라는 점이다. , 잡다하고 방대한 자료를 수집·정리하고 꼼꼼한 검토를 거친 다음에 추출하는 결론이 신선하지 않고 흔히 사람들이 알고 있는 것과 다름이 없다는 것이라면 이러한 빅데이터 연구의 가치는 어떻게 평가하고 정립해야 할 것일까. 빅데이터의 수집과 전시에만 치우치고 빅데이터에 대한 인문학적인 해석과 반성이 부족하다는 위험에 쉽게 빠질 수 있으니 우리는 빅데이터를 수집·정리·도표화하는 것보다는 데이터를 의미 있게 분석하는 방법과 시각을 적극적으로 모색해야 한다. 인문학 빅데이터 연구는 학제간 연구의 특성을 살리는 연구 영역이다. 토론 자리에서 여러 선생님들이 지적했듯이, 알고리듬이나 통계 기법을 잘 모르는 인문계 학생과 학자들은 이공계나 언어학 쪽에 계신 학자들과 서로 협력하고, 서로의 장점을 발휘하면서 빅데이터 연구를 추진시켜야 할 것이다.<formulas></formulas>

허수 선생님은 네트워크 분석을 통해 본 1980년대 '민중'-동아일보의 용례를 중심으로이라는 제목으로 발표를 하였다. 허수 선생님의 작업은 20년 동안(1975-1994)동아일보에 게재된 논설, 기획, 사건·사고 및 현실보도 기사 등 다양한 신문자료(6,922)를 활용하여 당시 실제 문맥에서 민중이라는 단어가 사용되는 용례(12,828)와 그 공기어들(共起語, 14,983, 118,676)의 양상을 정리·분석함으로써 '민중'이 논의되는 맥락을 파악하고자 하였다. '네트워크 분석' 기법을 사용하여 데이터를 분석하는 결과를 보면, '민중'의 논의 맥락은 크게 '사회운동', '제도정치', '변혁이론', '공연예술'의 네 영역으로 구축되어 있다는 것을 알 수 있다. 5년 단위로 맥락의 시기별 동향을 살펴보면 '민중'의 고빈도 사용 현상은 '운동'이라는 공기어와 관련이 깊은데, 이는 "1980년에 일어난 광주민중항쟁이라는 '사건'1980년대 후반에 '사회운동'으로 이어지고, 또 이러한 '사회운동'1990년대 전반에는 민중당 설립이라는 '제도정치'로 연결되었"(발제문 23)고 추론할 수 있다. 이와 달리, '공연예술' 영역의 경우에, 핵심 공기어인 '극단'의 높은 사용 빈도는 정치운동에 크게 영향을 받지 않고 지속적으로 유지되었다. 이는 '민중''극단'을 비롯된 비정치적·문화적 용례와 논의 맥락 안에도 놓일 수 있다는 것을 보여 준다는 것이다.

다음에 이재연 선생님께서 발표하신 주제는 '생활''태도': 기계가 읽은 개벽조선문단의 작품 비평어와 비평가이었다. 이재연 선생님의 작업도 역시 빅데이터의 수집과 분석을 바탕으로 진행되는데, 주로 워드투백(Word2Vec)이라는 알고리듬을 통해 개벽조선문단의 소설 논평들에서 나타나는 비평용어들을 미시적으로 살펴본 것이다. 이를 통하여 당시 전문 비평가들이 아직 나오지 않았던 문학비평사초기에 작가-비평가들이 사용했던 비평용어들, 즉 역사 속에서 제도화 되지는 않았지만 당시에 일시적으로 의미 있게 사용되었던 비평용어들을 탐구하고자 하였다. 출현 빈도가 높은 단어들 중에서 특히 개벽에서 '생활', 조선문단에서 '태도'는 눈에 많이 띄는데, 전자는 작가-비평가들이 소설 주인공의 삶에서 경험하던 사건과 그 원인을 이론화하는 과정에서 많이 사용되었으며, 후자는 주로 작품의 특성에 대한 논평에서 많이 나타났다. 그중에서 특히 염상섭이 '태도'를 다양하게 활용하여 당시 비평의 주요 논쟁에서 자신의 주장을 펼친 바가 있다.

위의 두 분 선생님의 발표는 인문학 연구와 빅데이터 활용에 대해 많은 시사점을 제공해 준다. 빅데이터는 인문학 연구 자료를 확대하는 데에 많은 도움이 줄 뿐만 아니라, 그러한 자료를 기반으로 기존에 확고한 인식의 틀에 벗어나 새로운 분석 지평을 열어주는 데에도 크게 기여할 수 있다. 개념사 연구에 있어서 빅데어터는 무척 유용하는 것인데, 거시적으로는 특정한 한 개념의 전체적인 의미장을 제시할 수 있으며 미시적으로는 개념의 자세한 의미 변화 양상을 자세하게 보여줄 수 있다. 그러나 이처럼 사람들의 주관적인 선입견을 깨 주고 새로운 인문학 연구 영역을 개척해 주는 역할을 하지만, 빅데이터 연구도 그 나름의 한계와 문제점을 가지고 있다. 이를테면, 빅데이터 분석이 과연 그만큼 생산적이고 신선한 발견을 도출할 수 있을까라는 점이다. , 잡다하고 방대한 자료를 수집·정리하고 꼼꼼한 검토를 거친 다음에 추출하는 결론이 신선하지 않고 흔히 사람들이 알고 있는 것과 다름이 없다는 것이라면 이러한 빅데이터 연구의 가치는 어떻게 평가하고 정립해야 할 것일까. 빅데이터의 수집과 전시에만 치우치고 빅데이터에 대한 인문학적인 해석과 반성이 부족하다는 위험에 쉽게 빠질 수 있으니 우리는 빅데이터를 수집·정리·도표화하는 것보다는 데이터를 의미 있게 분석하는 방법과 시각을 적극적으로 모색해야 한다. 인문학 빅데이터 연구는 학제간 연구의 특성을 살리는 연구 영역이다. 토론 자리에서 여러 선생님들이 지적했듯이, 알고리듬이나 통계 기법을 잘 모르는 인문계 학생과 학자들은 이공계나 언어학 쪽에 계신 학자들과 서로 협력하고, 서로의 장점을 발휘하면서 빅데이터 연구를 추진시켜야 할 것이다.<formulas></formulas>