탐험적 자료 분석 워크샵에 다녀왔습니다. 워크샵에 참가신청할 때는 "탐험"이란 말은 크게 신경 쓰지 않았는데, 워크샵에 참여하고 나서 보니 재미를 추구하는데 있어 필요한 것이 이 단어에 담겨있었습니다. 집에 돌아와서 탐험(探險)이란 말의 뜻을 찾아보았습니다. 국립국어원 표준대사전에서는 탐험을 "위험을 무릅쓰고 어떤 곳을 찾아가서 살펴보고 조사함"으로 정의합니다. 전문가 분들께서 정의한 뜻이겠지만, 제가 보기에는 '모험'의 뜻에 더 가까운 것 같습니다. 이보다는 "실패를 무릅쓰고 미지의 대상을 살펴보고 조사함"이 더 알맞은 뜻이 아닐까 제 멋대로 생각해보았습니다. 일단 제가 이번 워크샵에서 느낀 탐험의 의미가 그랬습니다. 그리고 이런 의미의 탐험을 통해서 재미를 느낄 수 있겠다고 생각했습니다.


1. 작업의 성패는 신경쓰지 않는다.

성공을 염두에 두지 않았기 때문에 극적인 희열을 느낄 수 있고 실패를 신경쓰지 않기 때문에 재미에 반하는 스트레스를 적게 받습니다. 목적을 위해서 스트레스를 감내해야하는 상황과 다릅니다. 사실 이 워크샵에는 성공이나 실패 자체가 모호했습니다. 뚜렷한 분석 목표가 없었기 때문입니다. 목표가 없으면 성패는 어불성설이 됩니다. 목표가 있다면 탐색이라고 불러야 적절할 것 같습니다. 탐험은 무엇인가 이룬다는 완결형이 아니라 진행형이라 생각합니다.


2. 명확한 목적은 필요 없다.

다른 학문 분야와 마찬가지로 통계는 제 전공분야에서도 유용한 도구입니다. 계산할 때는 SPSS(SAS나 S-PLUS 보다 쉽다는 평판이 있음) 같은 통계 패키지를 많이 씁니다. 개인적으로 마이크로소프트 엑셀을 통계 계산에 이용하는 경우는 많지 않았습니다. 엑셀이 유연한 도구이기는 하지만 통계 계산에 최적화된 도구는 아니기 때문인것 같습니다. 최적화된 도구일 수록 목적이 뚜렷합니다. 통계 패키지의 사용 목적은 통계적으로 의미있는 정보를 얻어내는 것입니다. 통계적으로 가설을 검증하는게 분석자의 목적입니다. 그러나 탐험적 접근 방법에서는 분석 결과 그 자체에 어떤 의미가 있는지 보이지 않더라도 경험 정보로서 가치가 있습니다. 따라서 통계적으로 의미가 있을 만한 가설을 세우느라 스트레스 받지 않아도 됩니다. 분석할 때마다 가치있는 정보가 나오니 재미가 납니다.


이러한 탐험적 접근 방법은 일상에서 매우 유용할 것 같습니다. 일상에서의 자료를 분석해서 가치를 얻는 일은 누구나가 재미있어할 만한 주제입니다. 탐험적 접근 방법은 일상 자료를 분석하고 "아는 것과 삶을 연결"(김창준 님)하는 손쉬운 방법입니다. 또한 일상에서 뿐만 아니라 학문에도 유용합니다.  실제로 지리학에서도 많이 이용하고 있습니다. 저 멀리 지리상의 발견시대를 언급하지 않더라도 탐험은 지리학 연구의 주요 방법 중 하나입니다. 지리 답사가 이러한 접근 방법이 가장 극명하게 드러나는 활동이 아닐까 생각합니다. 워크샵에서처럼 통계를 이용한 탐험은 현상을 통계적으로 유의미하게 정립하는 방법이 안될지 몰라도 대화의 도구는 될 수 있기 때문에(김승범 님) proto-study 방법으로도 유용할 것 같습니다. 이제는 토마스 쿤 식의 과학적 방법이 대세를 이루면서 탐험적 방법을 통한 연구의 가치가 평가절하되기도 하고 이용 빈도가 줄어든것 같긴 합니다.지리학이 점차 계통화된 것도 한가지 원인인것 같고요. 이러한 세태가 조금 안타깝습니다.


(과학적 방법의 가치를 부정할 생각은 없습니다. 다만 재미와 다양성을 추구하는 사람으로서 사족을 달았습니다. 그리고 뭔가 결론을 내려고 시작한 글은 아니고 워크샵에서의 경험과 마치고 돌아오면서 들었던 이런 저런 생각을 정리한 것입니다.)

파이썬(python)에서 range 함수는 자주 쓰이는 함수 중 하나입니다. 등간격의 정수 리스트 자체가 필요할 때도 쓰이지만, 시퀀셜 자료를 인덱싱할 숫자들를 만들어낼 때도 쓸모가 있습니다. 그런데 파이썬에는 ranage와 비슷한 함수가 또 있습니다. 바로 xrange와 arange입니다.


xrange는 range 함수와 마찬가지로 built-in 함수입니다. range와 사용방법도 같습니다.

xrange(start, stop, step)

그런데 xrange는 range 함수처럼 리스트를 리턴하는 것이아니라 xrange 객체를 리턴합니다. xrange 객체는 익덱싱 등의 요청이 있을 때마다 해당하는 값을 리턴해주며 range와 매우 유사한 방식으로 이용할 수 있습니다. 하지만 리스트 리턴값이 필요한 표현은 사용할 수가 없습니다. 이런 방식의 장점은 리스트를 만드는 시간과 리스트가 차지하는 메모리를 절약할 수 있다는 것입니다. 필요한 정수 리스트가 길면 길 수록 효과가 더 눈에 띄겠죠.

>>> xrange(5)
xrange(5)
>>> xrange(5)[3]
3
>>> [n for n in xrange(5)]
[0, 1, 2, 3, 4]
>>> xrange(5)[2:-1]
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
TypeError: sequence index must be integer, not 'slice'
>>> xrange(5)+[5,6,7]
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
TypeError: unsupported operand type(s) for +: 'xrange' and 'list'


다음은 arange입니다. arange는 built-in 함수는 아니고 numpy나 numeric 모듈을 설치하면 사용할 수 있습니다. arange는 영단어 arrange와는 별 관계가 없고 array range 정도로 생각하시면 되겠습니다. 말 그대로 range 사용방법과 같으나 리스트를 리턴하는 것이 아니라 행렬(array)를 리턴합니다. 행렬arange의 장점은 리스트range에서는 사용할 수 없는 실수를 사용할 수 있고, 리스트에 없는 다양한 메소드가 있으며, 행렬 계산으로 리스트보다 빠른 속도로 계산할 수 있다는 것입니다. 행렬에 대해서는 이 곳을 참고하시기 바랍니다.


시 읽는 기쁨 상세보기
정효구 지음 | 작가정신 펴냄
한국 현대 시인 25인과의 아름다운 만남. 1985년 <한국문학 신인상>을 수상하며 활발한 문학평론을 해온 문학평론가가 쓴 현대시 평론서. 시를 더 구체적이고 진실되게 이해할 수 있도록, 시 뿐만이 아니라 오히려 시인에 대한 더 자세한 이해와 정보를 제공한다. 무한이 부르는 소리, 무한에 다가가는 소리, 천상병의 <귀천>부터 말의 힘을 느껴보세요, 황인숙의 <말의 힘>까지 현대의 대표적인 시인들을 소개

서점에 가보면 각종 시 모음집에 해설집들이 많습니다. 사람들은 시험을 위해서 이런 책들을 읽기도 하고 그냥 재미 삼아 읽기도 합니다. 그런데 시험용이라면 모르겠지만, 재미삼아 읽기에는 지루하고 따분한 책들이 많습니다. 이런 책들을 볼 때마다 차라리 주석이나 해설이 달리지 않으면 좋겠다는 생각을 했습니다. 마음에 쏙 드는 책도 있긴 했지만, 한시간이고 두시간이고 정독하게 만드는 시에 관한 책을 찾기가 어려웠습니다. 그도 그럴것이 천편일률로 이것저것 나열하는데 치중하여 정작 작자의 고향이 왜 중요한지, 왜 그런 의미로 해석되는지 와닿지가 않았습니다.

시 읽는 기쁨은 조금 달라보여서 구해다 읽게 되었습니다. 이 책은 시 보다는 시인에게 먼저 다가갑니다. 다른 책처럼 시인이 태어난 고향이나 주변 사람들, 등단한 시기 등도 설명합니다. 하지만 단순한 열거가 아니라 그 정보들이 시인과 시에 있어 어떤 의미가 있는지 설명해주기 때문에 시인의 입장에 서서 시를 바라볼 수 있는 바닥을 깔아줍니다. 그리고 시인의 궤적을 따라가며 시를 읽는 과정을 보여줍니다. 그래서 시가 담고 있는 의미를 쉽게 수긍할 수 있었습니다. 책을 읽고 생각한건데, 사람들이 시를 어려워하는 이유는 시인이 시 속에 숨겨져있기 때문인것 같습니다. 자신을 적나라하게 드러내는 분들도 계시지만 좀처럼 보여주질 않습니다. 숨은 그림 찾기 하듯 꽁꽁 숨겨져 있습니다. 어떤 시인은 시어의 추상화를 통해 숨기도 하고 어떤 시인은 일반인이 보기에 암호 같은 단서만 남기고 숨기도 합니다. 이 책에서는 숨은 그림 찾기의 힌트를 주는 것에 성이 안찼는지 친절하게 위치까지 콕콕 짚어줍니다. 그래서 시인 찾기가 전혀 어렵지 않았습니다.

일단 시인을 찾고 나니 시가 무리 없이 읽혔습니다. '바다'라고만 해도 '작년 여름밤에 친구들과 불꽃놀이를 했던 바다'로 이해할 수 있었기 때문입니다. 시를 쓰게된 시인의 상황을 알면 시인의 입장에서 시를 바라보는 것이 한결 수월해질텐데, 그 상황은 시인의 성격, 경험, 사회적 배경 등의 총체적 집합인것 같습니다. 이 책은 그런 독자가 그 상황에 몰입할 수 있도록 도와주는 역할을 합니다. 이 책을 읽으면서 신기했습니다. 평소같으면 뭔 소린지 알 수가 없어 그냥 넘겨버릴 만한 시도 의외로 잘 받아들여졌습니다. 이유가 궁금해서 책을 되짚어 보니 그런 이유가 있었던 것입니다.
 
이 책은 일부 전문가들처럼 거두절미하고 예술의 아름다움만을 강변하지 않습니다. 시를 읽는 방법을 먼저 알려주고 이를 통해 시를 읽는 기쁨을 알려주는 책이었습니다. 개인적으로는 평소에 엄두 못내던 시들도 다시 읽어볼 수 있겠다는 자신감을 심어줬다는데에 큰 의의를 두고 있습니다. 이러한 방식으로 접근한 책이 시 뿐만 아니라 다른 예술 분야에 대해서도 나오면 좋겠다는 생각을 했습니다. 그런 책을 읽어보고 싶습니다. 예술을 읽는 기쁨을 더 알고 싶어요. 그러나 왠지 이 책의 속편은 보고 싶은 마음이 들지 않습니다. 속편이 가지는 징크스를 믿는 편은 아니지만 실망하면 어쩌나 하는 불암감이 무의식 속에서 작용하고 있는지도 모르겠습니다.
우분투 저장소에서 R 패키지를 설치하면 버전도 낮고 rpy 실행시 오류가 났습니다. 아예 소스를 가져다 설치하거나 rpy 설치할 때 손을 좀 보면 될 것도 같았지만, 귀찮아서 R 미러에서 제공하는 저장소를 이용하여 설치해봤더니 잘 굴러갑니다.

- 저장소
deb http://bibs.snu.ac.kr/R/bin/linux/ubuntu hardy/

- 키
gpg --keyserver subkeys.pgp.net --recv-key E2A11821
gpg -a --export E2A11821 | sudo apt-key add -

한국 미러 서버 속도가 느려서 그런지 저장소 업데이트나 설치하는데 시간이 좀 걸립니다. 설치를 매일 해야하는건 아니니까 설치 후에 저장소를 비활성화해두면 되겠지요.

프로그래머 두뇌단련 퍼즐 44제 상세보기
DENNIS E. SHASHA 지음 | 정보문화사 펴냄
퍼즐과 추리 소설로 즐기는 두되 단련하기 \프로그래밍 취업 면접을 준비하는 사람들과 단지 퍼즐을 즐기는 사람들 모두를 위해 만들어진 이 책은 문제 해결 과정을 단계적으로 밟아 나가면서 독자의 퍼즐 해결 능력을 극적으로 향상시켜 준다. 이 책에서 \스도쿠 같은 간단한 소거 문제를 해결하는 방법은 물론, 그보다 훨씬 더 어려운 문제들에 발견법적 기법을 적용하는 방법도 배울 수 있다. Dr. 샤샤가 쓴 이 책은 일정

이 책의 제목을 보고 떠오른 책이 있습니다. Programming Challenges 입니다. 내용도 비슷할 거라 생각했습니다. 그런데 예상이 빗나갔습니다. 180도라고 단언할 수 없지만, 확실히 다른 내용입니다. 이 책은 제목 그대로 퍼즐 책입니다. 책 제목에 "프로그래머"라는 말이 들어갔다고 '프로그래밍 퍼즐'을 예상하는 분들이 없길 바랍니다. 물론 프로그래밍을 통해서 문제에 접근할 수도 있습니다. 하지만 프로그래밍을 전제로 하지는 않습니다.

그러므로 꼭 프로그래머가 아니어도 좋습니다. 논리적인 사고가 가능한 사람이라면 누구든지 도전해볼만 합니다. 하지만 만만하지는 않습니다. 아직 모든 문제를 풀어보지는 못했지만, 제가 풀어본 문제들은 모두 상당한 난이도였습니다. (아마 저는 보통 수준의 지능을 가지고 있을 겁니다.) 고등 교육과정에나 나오는 복잡한 수학 공식은 필요하지 않습니다. 하지만 높은 수준의 수학적 사고가 필요합니다. 하지만 겁먹을 필요도 없습니다. 보통 사람인 저도 해냈으니까요. 풀이 시간에 여유를 두고 차근차근 진행하다 보면 실마리를 찾으실 수 있을 겁니다. 퍼즐의 재미가 이런 것이 아닐까요? "이걸 대체 어떻게 풀까"싶은 문제도 이리저리 굴리다보면 실오라기 끝을 발견하실 수 있을겁니다. 그 다음은 집중해서 실 끝을 따라가기만 하면 되지요. 실 끝을 따라가다 보면 또다른 실뭉치를 만나는 경우나 허망하게 끊어져 있는 경우도 있습니다. 그래도 계속 시도하다 보면 풀리게 되어 있습니다.

그런데 정작 이 책에서 실마리를 풀어나가는데 방해가 되는 요인은 난이도 보다는 번역 상태였습니다. 완역하려는 노력도 바람직하지만, 그러다보니 직역된 문장이나 영어식 표현이 많았고 어색한 단어(예: 보편적발견법론자)도 많았습니다. 이런 어려운 주제일수록 입에서 술술 읽혀야 재미가 나는 법인데, 이 책은 그런 점에서는 아쉬움이 있었습니다. (책을 읽다가 가끔은 원서를 찾아보고 싶기도 했습니다.) 원래 의미를 살리면서도 읽다가 뚝뚝 끊어지지 않도록 우리말에 맞게 흐름을 고쳐썼으면 더 좋은 책이 되었을거라 생각합니다.

아쉬운 부분이 있긴 하지만 시간을 두고 천천히 읽어볼 만한 책인것 같습니다.



사용자 삽입 이미지

따끈따끈

네이쳐에 재미있는 기사가 올라왔다. 해수가 온난화되면서 지구의 자전속도가 빨라지고 하루가 그만큼 짧아졌다는 얘기. 짧아진 시간은 약 0.2 밀리초. 독일 막스플랑크 연구소에서 연구를 진행한 것 같다. 논리적으로 그럴듯한 이야기이긴 한데, 모델 시뮬레이션을 통해 연구한 것이라서 실제로 그런지 검증해봐야 할 것 같다. 그리고 지구 자전속도에 영향을 미치는 요인이 많으니까 좀 더 연구가 필요할 것 같다. 뭐, 연구 진행되는 대로 또 재미있는 기사가 올라오겠지. ㅎㅎ

+ Recent posts