노동력 남용 사회: 불 타버린 대한민국

한국으로 돌아온 지도 이제 2년 반을 넘어서고 있다. 대학에서 강의하며 벤처를 공동창업하며 다양한 곳에서 강연하며 인터넷주인찾기슬로우뉴스를 통해 멋진 블로그 벗들을 알아가며 숨가쁘게 지내온 시간이다.

‘노동’의 날을 맞아 지난 2년 반 동안 느낀 한국사회에 대한 단상을 적어보고자 한다.

지속가능하지 않은 노동력

지난 1992년 리우 지구 정상회의를 통해 탄생한 ‘지속가능성(sustainability)’이라는 개념은 그 이후 환경운동에 있어 핵심 역할을 하고 있다. 또한 지속가능성은 환경운동을 넘어 사회적 기업, IT 생태계 등 다양한 영역에서도 적용되고 있다. 이 개념은 농업경제에서 차용된 것으로 새롭게 자라나는 것 보다 많은 양이 소비되어서는 안된다는 뜻을 가지고 있다.

1997년부터 7년 간 연립정부에 참여한 독일 녹색당에 대한 감성적 지지 때문인지 몰라도 독일 생활을 통해 내 몸에 벤 것은 적게 소비하는 습관이다. 가능하다면 흐르는 물에 설거지를 하지 않는 습관이 생겼고, 운전을 무척 좋아하지만 가능하다면 대중교통을 이용하기 위해 노력하고, 음식을 남기지 않기 위해 애쓰고, 오래 사용하기 위해 자주 청소하는 버릇이 생겼다. 그런데 독일에선 녹색당만이 ‘지속가능성’을 외치는 것이 아니다.

건설산업이 국민경제에서 차지하는 위치가 매우 낮은 독일경제에서는 낡은 건물을 부수고 새로 짓는 것은 금지에 가까운 수준으로 제한되고 있다. 이미 1960년대 보수당인 독일 기민당(CDU)은 부동산을 10년 이내 팔고 사는 거래행위를 통해 생기는 시세차익 대부분을 세금으로 환수하는 법안을 통과시켰다. 지대를 낮게 유지시키고 이를 통해 인금을 안정시켜 파업 등 노사갈등의 원인을 줄여 자본주의를 보다 지속적으로 발전시키겠다는 ‘지속가능한 자본주의 발전모델’의 원조는 보수 독일 기민당에서 비롯되었다. 기민당은 부동산 세금정책을 심지어 주식 거래에도 적용하여 주식을 1년 내로 사고팔 경우 발생하는 시세차익 대부분을 세금으로 환수하고 있다. 투자는 하되 투기는 하지말라는 정책의도였다. 이 1년이 과하다며 그 기간을 6개월로 줄인 것은 1997년 집권한 독일 사민당(SPD)이다. 집세 걱정 없는 사회, 전세값 및 집값 동향과 관련된 뉴스를 읽지 않아도 되는 사회, 부동산과 주식을 통한 한탕주의가 없는 사회, 바로 지속가능성의 출발이다. 노동하는 한 개인에게 천문학적 액수인 수도권 아파트 시세. 이를 위해 대다수는 새롭게 생겨나는 노동력보다 야근, 주말근무 등을 통해 사라지는 노동력의 규모가 큰 삶을 살아가고 있다. 대다수가 화전민처럼 부동산과 자녀 교육비를 위해 자신의 노동력을 불 태우며 살아간다.

노동력 뿐 아니라 양심도 불 태우고 있어

이념을 떠나, 지지하는 정당을 떠나 최소한의 양심으로 판단할 때 잘못된 것은 우리 주변에 수 없이 많다. 타인의 재산을 강탈하는 행위, 성희롱을 강한 남자의 덕목으로 생각하는 마쵸 근성 등등. 개인 양심에는 다양한 사회환경에서 살아가다 보면 사라지는 부분도 있고 새롭게 성장하는 부분도 있다. 그러나 그 균형이 깨지게 되면 양심도 지속가능성을 상실하게 된다.

대학에는 특수 대학원과 각종 고위자 과정이 넘처난다. 제한된 강의제원에서는 자연스럽게 학부강의는 부차적 의미를 가지게 된다. 영어강의 비율에 따라 교과부의 대학지원예산규모가 비례하자 각 대학에는 모순덩어리 영어강의가 확산되었다. 이렇게 몰락하는 대학교육을 질타하는 대학 교직원의 성명서를 볼 수 없었다.

대다수 언론사의 뉴스사이트를 보자. 성인광고로 둔갑한 비뇨기과광고가 넘쳐난다. 기사 내용 및 수준과 상관없이 한국 저널리즘 전체가 황색 저널리즘으로 변한지 오래다. 이에 괴로워하며 기자직을 계속할지 말지를 술자리에서라도 고민하는 기자를 난 아직 만나지 못했다.

지난 설 명절. 컨설팅하고 있는 모 회사의 정규직 직원에게는 작지 않은 액수의 상품권이 명절선물로 전달되었다. 대다수 비정규직원은 그들에게만 주어진 화장품 세트를 들고 퇴근하며 “내가 비정규직이야”라는 명찰을 달았다. 이에 가슴 아파하며 상품권을 반납하고 화장품 세트를 들고 퇴근한 정규직 직원이 과연 있었을까. 참고로 이 기업의 노조는 민주노총 산하다.

에너지 경제만 지속가능해야하는 것이 아니다. 재충전 기회를 잃고 내일의 노동을 두려워하는 사회, 괴로워하는 양심마저 마음에서 자라나지 않는 영혼. 화전민처럼 불 태워버린 노동과 양심. 2012년 노동절을 맞은 대한민국의 자화상이다.

Posted in 힘의 법칙 | 3 Comments

프랑스 대통령 선거분석: 극우의 확산과 SNS

<아래의 글은 ‘슬로우뉴스‘에 실린 글입니다.>

지난 4월 22일 일요일에 있었던 프랑스 대통령선거 결과에는 조직화되지 못한 유권자의 분노가 극명하게 드러났다. 또한 페이스북과 트위터은 프랑스 대통령선거법과 관련된 새로운 도전을 제시하고 있다. 프랑스 대통령선거의 흥미로운 결과를 분석해 보자.

<4월 22일 프랑스 대선 결과: 출처 리베라시옹Libération>

선거 결과의 첫 번째 특징은 사회당의 올랑드(François Hollande) 후보가 28.63%를 득표해 27.18%를 얻은 우파 대중운동연합의 현 대통령 사르코지(Nicolas Sarkozy) 후보를 약 1.5% 정도 앞섰다는 점이다. 그러나 선거 이전부터 올랑드 후보가 1위를 차지할 것이라는 일렬의 여론조사 결과가 서구언론을 통해 보도되었기 때문에 그의 승리는 사실 큰 놀라움이 되지 못한다. 이번 1차 선거에서 매력없고 지루하기까지 한 사회당 올랑드 후보가 1위를 차지함에 따라 프랑스에는 사회당 출신 대통령이 1995년 이후 다시 등장할 가능성이 매우 높아졌다. 1차투표에서 1위한 후보가 결선투표에서 승리하는 전통도 작지않은 역할을 하겠지만 ‘내가 제일 잘났다’는 이미지를 가진 사르코지 현 대통령 진영에서 이번 선거에서 표출된 프랑스 유권자의 분노를 자신의 것으로 만들 능력을 찾을 수 없기 때문이다.

두 번째 특징은 총 17.9%의 표-약 640만 표-를 얻어 3위를 차지한 극우정당인 국민전선의 마린 르 펜(Marine Le Pen) 후보의 상상을 초월하는 높은 득표율이다. 더불어 좌파대중주의를 대표하는 장 뤽 멜랑숑(Jean-Luc Mélenchon) 후보의 예상 밖의 선전이다. 특히 마린 르 펜 후보가 얻은 이번 결과는 2002년 프랑스 대선에서 그녀의 아버지 장마리 르 펜(Jean-Marie Le Pen)이 얻은 16.86%를 뛰어넘은 결과다. 중화학공업 중심으로 한 때 프랑스 경제를 이끌었으나 이제는 망해버린 프랑스 남부지역에 거주하는 실업자와 도시 빈민이 아버지 르 펜의 지지층이었다면 마린 르 펜은 프랑스 전역에서 빈민층과 저소득층의 지지를 확보한 것으로 보인다. 위의 그림 출처인 프랑스 좌파 일간지 ‘리베라시옹’ 에서 마린 르 펜의 전국적인 지지를 확인할 수 있다. 2002년 당시 유럽의 언론들이 프랑스의 극우화를 우려하며 놀라움을 감추지 못했던 기억을 상기한다면 프랑스 저소득층 사이에서 극우파가 일시적 지지가 아니라 지속성을 갖는 정치세력으로 성장하고 있다는 점은 매우 놀라운 일이다. 여기서 오늘 5월 6일에 있을 프랑스 대통령 결선투표에서 사르코지 후보가 극우파의 지지를 확보하기 어려울 것이라는 점을 예측할 수 있다. 마린 르 펜 후보를 지지했던 프랑스 빈민층 및 저소득층이 ‘부자를 위한 대통령’, ‘권력, 돈, 여자(카를라 브루니)를 모두 얻은 마초 엘리트’의 상징 사르코지 후보를 쉽게 지지 하지 않을 것으로 보이기 때문이다.

아래 표에서 확인할 수 있는 것 처럼 이번 프랑스 대통령 선거에서 ‘프랑스민주주의 연맹UDF’를 지지했던 중간층(-9.44%)과 ‘대중운동연합UMP’를 지지했던 전통 보수층(-4%)이 이 양 극단의 마린 르 펜 후보와 장 뤽 멜랑숑 후보 지지로 양분되고 있다. 또한 주류 정치세력인 ‘대중운동연합UMP’와 ‘사회당PS’ 각각은 마치 비주류 정치세력인 ‘민족전선FN’과 ‘좌파전선FDG’ 연합에 앞도당하고 있는 모양세다. 위의 그림 <4월 22일 프랑스 대선 결과: 출처 리베라시옹Libération> 의 출처를 통해 확인할 수 있는 것은 프랑스 총 95개 선거구 중 15개 선거구에서 마린 르 펜이 근소한 차이로 2위를 차지고 하고 있다는 점이다. 이 점은 마린 르 펜이 전국적으로 고른 지지를 얻고 있다는 점과 함께 현재 프랑스 사회의 갈등지점과 사회당 및 집권 사르코지 정부의 무능력을 반증하고 있다. 따라서 이번 선거에서 1위를 차지한 올랑드 후보가 사회당의 경제정책, 사회정책 등으로 사회당 지지세력의 외연을 확장하는데 성공한 것으로 보기는 어렵다.

<2007년과 2012년 프랑스 대선 1차 투표 1비교>

이번 4월 22일 선거의 세 번째 특징은 80%에 가까운 매우 놀라운 수준의 투표 참여율이다. 물론 이는 지난 2007년 1차 대선 투표에서 나타난 83.77%보다 다소 낮은 수치다. 2007년에 나타난 투표 참여현상을 일시적으로 볼 수 없는 연속성이 이번 선거를 통해 확인되었다. 도대체 무엇으로 이러한 높은 참여율을 설명할  수 있을까? 약 9.7% 이르는 높은 실업율(출처)과 지속적으로 하락하고 있는 구매력(출처) 은 주요 원인으로 분석되고 있다. 다시말해 사회빈곤층이 계속해서 증가하고 있는 것이 현재 프랑스 경제의 가장 큰 문제점으로 지적될 수 있고, 이는 지난 5년간 집권한 사르코지 대통령에 대한 불신, 경제자유주의자(UDF)에 대한 반감으로 이어지고 있는 것으로 해석할 수 있다. 최근 대통령 선거에서 나타난 80%가 넘는 투표 참여율은 프랑스 유권자의 높은 정치의식보다는 불신을 넘어 분노에 가까운 민심으로 설명할 수 있다.

마지막으로 이번 프랑스 대통령선거의 특징은 SNS를 중심으로 변화한 미디어 환경과 낡은 프랑스 선거법 사이의 정면충돌이다. 프랑스의 투표소는 농촌지역 등 저녁 6시30분에 투표를 마감하는 곳이 있고 대도시 등 저녁 8시에 투표를 마감하는 투표소로 나뉜다. 프랑스 선거관리위원회(CNCCEP)는 저녁 8시 이전 출구조사 등 여론조사 결과를 발표하는 것을 엄격하게 금지하고 있다. 그러나 저널리스트 모랑디니(Jean-Marc Morandini)는 2007년 대선 1차 투표일 저녁 6시에 자신의 블로그를 통해 출구조사 결과를 공개하겠다고 위협하였고 지난 22일에도 저녁 6시에 예측결과를 공개하지 못하게 하는 프랑스 선거법을 강력하게 비판하고 있다. 그는 “투표일 하루 동안 마치 외국(언론)과 인터넷은 존재하지 않는 것으로 프랑스 선관위는 생각하고 있다. 이는 우스깡스러운 일이다”(출처)라고 주장하며 프랑스 선거법이 적용되지 않는 프랑스어를 사용하는 스위스, 모로코 ,알제리 등의 언론이 저녁 6시에 선거 출구조사를 발표하고 있음을 지적하고 있다. 그의 말처럼 이미 2007년 프랑스어권 스위스 방송사 RTS는 저녁 6시에 출구조사를 발표하였고, 이번 22일에도 저녁 8시 이전에 선거결과 예측방송을 진행하였다. 또한, ‘리베라시옹’은 저녁 8시 이전에 출구조사결과 발표를 금지한 현행 프랑스 선거법을 강력하게 비판하며(출처보기) 저녁 6시 15분부터 결과예측 보도를 시작하였다.

문제는 지난 2007년과 현재의 달라진 미디어 환경이다. 트위터 프랑스 사용자가 현재 5백만 명을 넘어서고 있으며(출처), 페이스북 프랑스 사용자는 약 2400만  명에 이르고 있다(출처). 가정해보자. 저녁 6시 사르코지 후보가 올랑드 후보에 뒤지고 있다는 예측보도가 트위터와 페이스북을 통해 빠르게 확산된다. 다급해진 사르코지 후보의 잠재적 지지자들이 막판 투표에 대거 참여한다.  그리고 사르코지 후보 지지자들의 눈물겨운 노력으로 최종 결과가 바뀌었다면 프랑스 사회는 현재 어떻게 되었을까? 일반적으로 출구조사 결과는 발표 2시간 이전에 방송사에 전달된다. 발표방송을 준비하기 위해서다. 이러한 예측 결과가 방송사, 언론사 또는 후보진영에 의해 투표마감 이전에 공개될 가능성을 차단하는 것이 가능한 일일까? 아니 필요한 일일까? 이렇게 선거법과 관련된 흥미로운 논쟁이 한국사회 뿐 아니라 프랑스에서도 진행되고 있다.

“파리에 있는 정치 엘리트 집단”을 직접 공격한 프랑스 극우 ‘민족전선NF’의 강력한 도전에 무능한 기존 정치세력. 화려한 80% 투표 참여율 뒤에 숨겨진 이번 프랑스 대통령선거 1차투표의 의미다.

Posted in net policy | Leave a comment

[연구노트] 혁신과 위험의 빅데이터, 긴장과 균형

(미 완성 글이지만, 피드팩을 부탁드립니다.)

“The ability to take data – to be able to understand it, to process it, to extract value from it, to visualize it, to communicate it — that’s going to be a hugely important skill in the next decades.” (Varian, H. R. 2009)

1. 도입: 빅데이터의 도전

인 터넷은 지난 반세기 동안 기계와 기계사이 소통수단, 사람과 사람사이 소통수단, 사물과 사물사이 소통수단 등으로 기능을 확장하며 상하수도망, 전기망과 같은 사회운영의 기본망으로 성장 및 진화하고 있다. 나아가 인터넷과 월드와이드웹을 통해 형성되고 있는 가상세계는 첨차 실세계와 유사성을 띄어가면서 가상세계와 실세계 사이의 차이가 첨차 사라지고 있다는 주장도 등장하고 있다(Adams 2012, Dueck 2012). 세계 곳곳에서 진행되는 주식거래 및 은행거래가 디지털 처리되고 있으며, 슈퍼마켓에서 이루어지는 개별 소비자의 구매행위가 신용카드 및 고객카드를 통해 해당 기업의 전산망에서 디지털 데이터 형식으로 기록, 저장 및 분석되고 있다. 또한 개인 휴대폰에 데이터로 저장된 전화번호는 개인과 개인을 연결하는 식별자(identifier) 및 노드(node)에서 최근 스마트폰의 대중화와 함께 매일 수백만 개의 메시지 데이터가 오고가는 ‘거대 네트워크 노드’로 진화하고 있다. 실세계의 모든 객체 (node)정보, 객체 사이의 연결(edge)정보, 연결망(network)을 통해 교환 및 집적되는 상태정보, 행위 정보 및 상호작용 정보가 가상세계에서 비트 데이터 형식으로 존재하면서 가상세계는 실세계와 보다 유사해지고 있다.

CCTV 정보, 전자지문 정보, 유전자 정보 등 국가기구에 의해 수집되는 센서 데이터의 증가, 오픈 데이터 정책에 따라 공개되는 정부 및 의회 정보의 확대, 빠른 속도로 늘어나는 디지털 개인 의료정보, 기업활동에 의해 생산된 기업정보와 기업과 소비자 사이에서 발생하는 상호작용정보와 소비자 행위정보의 증가, 인터넷과 월드와이드웹을 통해 생산 및 처리되는 데이터 양의 팽창 등 데이터의 총량은 최근 폭발적 상승세를 보이고 있다. 또한 데이터 분석시스템이 전통적인 데이터 분석도구로서는 데이터 증가 속도를 따라가지 못하는 현상과 대용량 데이터를 분석하는 전문 인력이 부족한 현상 등이 사회문제 및 경제문제로 지적되고 있다. 이렇게 ① 전례없이 빠른 속도로 급팽창하는 데이터의 양, ② 이를 저장, 분석 및 해석하는 전통 기술시스템의 한계[1], ③ 대용량 데이터에 대한 진화된 저장기술, 분석기술 및 시각화기술 그리고 ④ 대용량 데이터에 기반으로 컴퓨터과학 및 사회과학에서 진행되는 새로운 연구방법 등과 관련된 현상을 미디어, 산업계, 학술 영역에서 총칭하는 개념으로 ‘빅데이터’가 사용되고 있다(Albanese 2010, Boyd 2010, Economist 2010, Loukides 2011a, Croll 2012, Dumbill 2012).

또 한 빅데이터 현상을 분석하는 일렬의 분석에는  빅데이터 처리능력이 기업 또는 국민경제의 생산성 향상 및 경쟁력 강화로 이어질 수 있다는 “데이터 산업혁명(Economist 2010, McKinsey 2011)” 주장과 전통적 학술 방법론으로는 트위터 및 페이스북 사용자의 관계망과 행위 정보를 (실시간으로) 분석할 수 없다는 이른바 “이론의 종말 The End of Theory(Anderson 2008)” 주장 등도 포함되어 있다. 그러나 생산성 및 경쟁력과 결부된 ‘시장재화로서의 빅데이터’는 과연 무엇을 의미하는가, ‘시장재화로서의 빅데이터’의 생산구조 및 가치창출구조의 특징은 무엇인가 등 빅데이터의 시장구조에 대한 질문은 여전히 그 답을 기다리고 있다. 다시 말해 빅데이터와 관련된 다양한 시장행위자와 이들의 의해 진행되는 시장행위 그리고 이를 둘러싼 시장환경에 대한 체계적인 연구는 아직까지 시작되지 못하고 있다. 다른 한편 연구자가 대용량 데이터에 손쉽게 접근할 수 있는 가능성[2]이 확대되면서 설문, 인터뷰 및 실험 등 표본조사에 기초한 연구방법론에 대한 무용론도 등장하고 이다(Boyd 2010). 그러나 표본의 절대량 증가가 전체성(wholeness) 및 표본의 대표성(representativeness)으로 대치될 수는 없다. 따라서 빅데이터 기반 연구방법론에 대한 비판적 성찰이 절실하다(ibid.).

따 라서 본 연구는 빅데이터에 대한 비판적 분석체계를 구성하는 것을 목표로 ① 빅데이터의 물리적 특성 분석, ② 시장에서 거래되는 상품으로서의 데이터에 대한 정의와 데이터 상품의 가치창출구조 및 특성 분석, ③ 데이터 상품화 과정과 관련된 다양한 기술적 도전, ④ 빅데이터 생산, 유통 및 소비과정에서 발생할 수 있는 ‘개인정보보호’ 등 사회적 위험성과 빅데이터 기반 연구방법론의 위험성을 살펴보고자 한다.

2. 상품으로서의 빅데이터

2.1. 데이터와 해석된 데이터

빅 데이터에서 지칭되는 ‘데이터 (data)’에 대한 정의는 이를 다루는 학문영역에 따라서 작지않은 차이를 보이고 있다. (네트워크) 경제학자인 Shapiro와 Varian의 경우 데이터와 정보 (information)를 동일시하며 이를 매우 포괄적으로 해석하고 있다(Shapiro/Varian 1999). 그들은 디지털화가 가능한 모든 것을 정보 또는 정보재(information goods)로 정의[3]하고 “야구경기 점수, 책, 데이터베이스, 매거진, 영화, 음악, 주식 시세, 웹 페이지” 등을 데이터 및 정보재로 분류하고 있다(ibid.). 이에 반해 기호학의 경우 기호와 기호를 통해 표현된 사물의 관계를 연구하는 의미론(semantics), 기호와 기호 사이의 연결 및 관계를 연구하는 통사론(syntactics) 그리고 기호 사용자(subject)에 대한 기호의 영향을 분석하는 화용론 (Pragmatics) 등 3개 층위에서 각각 기호(sign), 데이터(data) 그리고 정보(information)를 구별한다(Liebenau/Back- house 1990, Wikipedia 2012). 이러한 기호학의 인식은 컴퓨터 과학에서 데이터를 기호 및 정보와 구별하는 접근법과 유사성을 가지고 있다(Stamper 1985). 아래 <그림 1>처럼 신호는 규칙(semantics)과 연결되어 데이터로 변화한다. 또한 컴퓨터 과학에서는 데이터가 특수한 의미문맥을 통해 해석된 것이 정보로 간주된다(ibid.). 다시 말해 특정 데이터가 분석가 또는 분석 시스템에 해석된 결과물이 정보이다. 본 연구에서는 컴퓨터 과학의 분류법을 따라 시스템 및 인간행위의 결과물로서의 데이터를 데이터 상품(data product) 또는 해석된 데이터 (interpreted data)로 칭하고 데이터 생산물을 해석과정 이전의 데이터(data itself/data as data)와 구별하고자 한다.

<그림 1: 데이터와 해석된 데이터> (강정수)

2.2. 데이터 생산과정 및 가치창출구조: 피드백 경제

빅 데이터의 경제성을 논한다면 이는 인터넷, 월드와이드웹 등 디지털 네트위크에서 분산되어 존재하는 거대한 규모의 데이터 자체(data itself/data as data)에 기초한 것이 아니라 이를 처리하여 다양한 경제 및 학술 분야에서 활용되는 해석된 데이터(interpreted data)  또는 데이터 생산물(data product)를 대상으로 한다. 따라서 데이터 자체가 데이터 생산물로 전환 및 변화 (transition & transformation)되는 과정에 대한 체계적 이해는 빅데이터 경제성 연구의 주요한 분석틀[4]로 기능할 수 있다. 아래에서는 문헌연구와 실제 데이터 분석 경험[5]에 기초하여 데이터 가치창출구조에 대한 형상화를 시도한다(<그림 2> 참조). <그림 2: 데이터 가치창출 구조> (강정수, 참조: Dumbill 2012)

 데이터 가치창출의 첫번째 단계는 데이터 수집(data collection)이 다. 데이터는 상거래 정보 및 공공 정보 등 전통적인 데이터 공급원 뿐 아니라 월드와이드웹과 스마트미디어에 남겨지는 개별 사용자의 ‘사용자취(digital trace/information trails/data shadows/data exhaust)[6]’를 통해 수 집된다. 또한 페이스북, 트위터, 유튜브, 사운드클라우드 등 일렬의 웹서비스는 풍부한 API를 통해 외부 서비스 사업체 및 개별 개발자에게 전례없이 손쉬운 방식으로 사용자 데이터에 대한 탐색 가능성을 제공하고 있다. 한편 데이터 수집이 주는 기술적 도전은 이러한 수집 가능한 데이터 양의 상대적 증가와 함께 데이터 수집의 속도에 놓여 있다. 다양한 공급처로부터 실시간으로 수집되는 대용량 데이터는 수집 병행성이라는 과제와 함께 수집 속도의 과제를 제기하고 있기 때문이다(Agrawal et. al. 2011, Dumbill 2012)[7].

데이터 수집의 다음 단계는 데이터 조절(data conditioning)이 다. 수집되는 데이터의 대부분은 ① 동일한 구조형식의 데이터가 아니며[8], ② 대량의 불필요한 데이터(data garbage)를 포함하고 있기 때문에 이후 단일한 구조 내에서 조작가능한 형식으로 전환되어야 함과 동시에 불필요한 데이터에 대한 정제작업이 필요하다. 또한 데이터를 분류하기 위한 해석 작업이 동시에 진행된다. 이를 위해 다양한 파싱(parsing) 기법과 의미가 모호한 데이터를 분류하기 위해 자연어 사전에 기초한 기계학습(machine learning) 프로그램[9]이 사용된다. 그러나 이러한 자연어 처리 과정을 통해 모든 데이터가 이후 분석 및 분류 가능한 형태로 정제되지는 않는다. 이때 인간의 판단력이 직접 투입되어야 하는 필요성이 제기된다. 아마존이 운영하는 Mechanical Tuck은 기계학습에 의해 처리되지 못한 불필요한 데이터를 사람의 해석 및 판단에 따라 정제 및 분류하는 대표적인 시스템이다. 이러한 사람에 의한 데이터 정제과정을 인간탐사(human exploration)라 칭한다(Dumbill 2012).

이러한 기계와 사람의 정제과정과 동시에[10] 데이터는 데이터 저장과정(data storage operation)을 거치게 된다. 저장기술과 관련된 도전 또한 데이터 ‘양’이 아닌 ① 분산되고 탈구조화된 데이터 수집원과 ② 수집된 데이터의 비일관성과  복잡성에 놓여있다(Loukides2011a). 이러한 데이터 저장에서 발생한 기술적 도전과 관련하여 NoSQL, Cassandra, HBase 등 비관계형 데이터베이스 기술이 지속적으로 발전하고 있다. 비관계형 데이터베이스에 저장된 대용량 데이터의 연산처리를 위한 MapReduce[11] 등 다양한 병렬연산처리 기술영역과 이에 기초한 분산형 파일시스템 기술영역에서 혁신이 진행되고 있다.

데이터 저장과정과 동시에 또는 그 이후 진행되는 단계는 데이터 분석과 통합(data analysis & mashup)이다. 데이터 저장과 함께 방대하고 분산되고 일치성이 떨어지는 데이터에 대한 서로 다른 가설에 대한 검증작업과 이에 필요한 서로 다른 알고리즘 적용이 이뤄진다. 이러한 실시간 데이터 분석을 위해 Hadoop Online Prototype(HOP)과 같은 스트림 프로세싱 연산처리 기술과 R Language 등 다양한 통계 기법이 사용된다. 빅데이터의 가치는 거대한 양의 데이터의 존재를 의미하는 것이 아니라 일치성이 떨어지고 분산되어 존재하는 데이터로 사용자 및 소비자에게 유의미한 결과값을 도출하는 작업에 놓여있다(Boyd 2010, Loukides 2011a). 따라서 표본에 기초하고 있는 전통적인 통계 방법론은 새로운 병렬연산처리 기술 및 대용량처리 기술과 상호보완 관계를 이루며 데이터 분석과정에서 유효성을 상실하지 않고 있다. 또한 데이터 통합과 분석에서 개발, 검증 및 적용되는 알고리즘은 통계적 연산 방정식과 다름 없다. 가설을 세우고 검증하는 과정에서 중요한 또 다른 과정은 서로 다른 데이터베이스의 통합 또는 융합(mashup)이다(Loukides 2011b). 예를들어 음악추천 알고리즘위해 개별 사용자의 음악소비 역사데이터 뿐 아니라 해당 사용자의 문화소비패턴 분석데이터, 친구관계망에서 수집된 음악 관련 상호작용데이터 등이 결합된 데이터 집합이 활용되고 있다.

데이터 수집, 처리 및 분석의 결과물이 상품화되는 마지막 단계는 데이터 스토리텔링 및 시각화(data storytelling & visualization)다. 데이터 분석 및 통합 과정을 거친 결과는 언제나 수치(numerical value)다. 수치가 의미하는 것을 전달하기 위해서는 결과값에 대한 시각화가 필수적이다. 지도데이터와 결합된 전염병 확산데이터, 위치데이터와 시간데이터가 결합된 ‘시내버스’ 앱, 음향파동을 형상화한 사운드클라우드(www.soundcloud.com)의 개별 음악데이터 등 시각화[12]는 데이터 상품화의 마지막 단계로서 데이터의 문맥화를 통한 해석작업이다.

상 품화되어 사용자 및 소비자에게 제공되는 데이터는 그 소비과정에서 사용자에 의한 사용자취(digital trace) 생산의 매개가 된다. 이렇게 생산된 사용자취는 데이터 수집 단계로 이어지면서 데이터 수집원으로 기능한다. 예를 들면 개별 소비자의 아마존(amazon) 책 구매 데이터 또는 평가 데이터는 다시 데이터 분석대상이 되어 아마존의 추천 알고리즘을 진화시키는 추가가치(added value)를 가지고 있다. 다시 말해 소비과정에서 발생하는 사용자취는 데이터 가치창출과정의 첫 단계인 데이터 수집과 연결되는 피드백 고리(feedback loop)의 역할을 담당한다. 이러한 피드백 고리는 데이터 수집, 데이터 조절, 데이터 분석 등과 사용자취를 반복(iteration)적으로 연결시키는 것을 통하여 빅데이터 기술진화에 주요 역할을 담당하게 된다(Loukides 2011a, Loukides 2011b, Dumbill 2012). 이러한 반복성 또는 재귀성 (recursiveness)은 데이터 가치창출구조의 구조적 특징[13]이라 할 수 있다.

한편 데이터 상품의 가치창출구조 전체의 순환성을 가능케하는 것이 피드백 고리라면 클라우드 컴퓨팅(cloud computing)은 데이터 상품 가치창출구조의 기술적 기반시설 역할을 담당한다(Agrawal et. al. 2011). 대용량 데이터 처리에 있어 높은 기술 탄력성, 사용량에 따른 요금제와 이에 따른 낮은 초기 비용투자, 위험 분산효과, 데이터 상품의 시장진출 시간단축(low time to market) 등 클라우드 컴퓨팅 기술은 빅데이터의 수집, 조절, 저장, 분석, 시각화 과정에서 다양한 경제적 장점을 제공한다. 클라우드 컴퓨팅은 이와 동시에 거대한 양의 데이터 처리능력을 제공하고 데이터 수집, 조절 및 분석의 동시작업을 가능케 하는 등 클라우드 컴퓨팅은 데이터 상품 전체 생산과정에서 반드시 필요한 기술조건이다(ibid.)[14][15].

그 러나 <그림 2>에 표현된 데이터 가치창출구조는 ‘하나의’ 데이터 상품과 관련된  가치창출구조를 보여주고 있을 뿐 독립된 복수의 데이터 상품이 데이터 분석 및 통합 단계에서 결합되는 과정을 형상화하지 못하는 약점을 가지고 있다. 예를들어 페이스북 개별 사용자의 뉴스피드 분석을 기초로 개별 사용자에게 방송프로그램, 음악, 영화를 추천하는 데이터 상품에는 이미 뉴스피드에 적용되고 있는 페이스북 엣지랭크(EdgeRank)라는 데이터 상품이 결합되고 있다. 이렇게 공존하며 상호작용하는 서로 다른 데이터 상품의 가치창출구조 사이에 존재하는 관계성 및 의존성에 대해 <그림 2>는 설명하지 못하고 있다. 이를 위해서는 서로 다른 데이터 가치창출구조를 연결하는 API(Application Program Interface)의 역할 분석, 서로 다른 데이터 상품 사이에 존재하는 가치창출 기여도에 대한 분석 등 보다 실증적인 연구가 요구된다[16].

2.3. 데이터 상품 분류: 가시적 데이터 상품과 비가시적 데이터 상품

데 이터 가치창출과정에서 생산되는 데이터 상품, 다시 말해 시스템과 인간의 해석과정을 거친 데이터 상품은 구글의 페이지랭크(PageRank)처럼 소비자의 눈에 직접 보이지는 않으나 검색결과의 품질을 결정하는 중간재(intermediary goods)[17]로 기능하거나 또는 ‘서울버스’ 앱처럼 버스의 GPS기반 위치정보를 시각화한 최종 소비재의 형태로도 제공되기도 있다[18]. 디지털 오디오 파일, 디지털 비디오 파일, 전자책 등은 디지털 데이터 형식을 띄고 있는 미디어 콘텐츠로서 본 연구에서는 데이터 상품으로 분류하지 않는다. 여기서 언급한 미디어 콘텐츠는 디지털 데이터 그 자체이며 이에 반해 데이터 상품은 ‘데이터에 기초한 결과물’이다. 예를 들어 미디어 콘텐츠인 디지털 오디오 파일의 메타데이터(metadata)를 시각화한 것에 다름아닌 아이튠즈(iTunes)는 데이터 상품이다[19].

Loukides(2011b) 는 중간재, 최종 소비재 등 전통적인 시장재화 구분법이 아닌 다른 방식으로 데이터 상품을 분류하고 있다. 오디오 CD의 데이터 상품인 CDDB[20], 페이스북의 친구추천, 트위터의 팔로잉 추천, 버스 도착시간 및 버스 위치를 알려주는 ‘서울버스’ 앱, 교통혼잡 정도를 시각화하여 보여주는 ‘다음지도’ 앱과 ‘네이버 지도’ 앱 등은 데이터에 기초한 결과물을 다시금 (시각화된) 데이터로 보여주는 데이터 상품으로 분류할 수 있다. Loukides(ibid.)는 이를 가시적 데이터 상품(overt data product)이라 칭하면서 현존하는 대다수의 데이터 상품을 가시적 데이터 상품으로 분류하고 있다. 가시적 데이터 상품보다 진일보한 데이터 상품은 Loukides의 주장에 따르면 비가시적 데이터 상품(covert data product)이다. 비가시적 데이터 상품의 대표적인 예는 구글과 포드(Ford)에 의해 공동으로 개발되고 있는 ‘하이브리드 자동차 스마트 서비스’다.  이 서비스는 운전자의 과거 운전 데이터를 기계학습하고 실시간으로 수집되는 교통정보 데이터를 분석하여 교통혼잡지역을 피함과 동시에 운전자의 운전습관에 기초하여 가장 에네지를 절약하는 방식으로 운전자의 목적지 경로를 추천한다. 다시 말해 구글과 포드의 이 서비스는 자동차 엔진의 효율적 사용과 에너지 절약을 교통정보 및 도로정보 제공보다 부각시킨다. 이렇게 데이터 분석의 결과물에서 데이터 스스로가 강조되지 않는 상품을 Loukides는 비가시적 데이터 상품으로 분류[21]하며 실생활의 편익을 증대시킬 수 있는 비가시적 데이터 상품의 확대에서 데이터 상품의 긍정적 경제 및 사회 기여도를 찾고 있다(ibid.).

3. 빅데이터 가능성과 위험성의 긴장관계

3.1 가능성: 데이터 상품시장과 데이터 기술시장

전 사회적인 디지털화는 현재 빠른 속도로 진행되고 있다. 스마트폰 3천 만 시대가 눈 앞으로 다가오고 있으며 다양한 가전제품과 자동차 등이 인터넷으로 연결되는 사물의 인터넷(internet of things) 또한 초기단계를 넘어 본격적인 발전경로에 진입하고 있다. 또한 디지털화는 인간 개개인과 사물을 데이터 생산체(digital data generator)이자 동시에 데이터 소비자로 전환시키고 있다. 한편 1장과 2장에서 살펴본 것처럼 데이터의 경제적 가치는 기하급수적으로 증가하는 데이터의 양에 존재하지 않는다. 분산되어 존재하고 일관성 없는 거대한 양의 데이터를 분석 및 해석을 통해 소비자 편익을 증대시킬 수 있는 다양한 데이터 상품이 형성하는 데이터 상품시장의 규모와 수준에 따라 데이터 경제성은 평가 및 예측될 수 있다. 따라서 개별 경제주체-개인, 기업 및 국가-에게 중요한 것은 데이터 소유가 아닌 2장에서 서술된 각 데이터 가치창출단계의 기술능력 및 해석능력[22]과 각 가치창출단계를 아우르는 Enabling Technology인 클라우드 컴퓨팅 능력이다.

따라서 ‘빅데이터 미래(시장)가치’를 논하기에 앞서 한 사회가 가지고 있는 기술능력, 해석능력 그리고 클라우드 컴퓨팅 능력에 대한 정밀한 평가가 선행되어야 한다. 이러한 관점에서 볼 때 최근 한국 대중매체를 통해 쏟아지는 ‘빅데이터 바람’[23]은 근거없는 낙관에 불과하다.

3.2 위험성: 개인식별정보와 해석과정

빅데이터 가치창출구조와 데이터 상품시장의 위험성은 크게 두가지 차원에서 논의할 수 있다.

첫 째는 데이터 수집 및 분석 과정에서 개인식별정보(Personally Identifiable Information)가 활용될 수 있다는 점이다. 온라인 실명제-제한적 본인확인제-와 연관되어 웹 서비스 업체에 입력된 주민등록번호, 전화번호 등 개인식별정보가 유출되어 보이스피싱, 선거용 문자메시지 등에 활용되고 있는 점에서 유추가능한 것은 개인식별정보에 대한 수요시장이 존재한다는 점이다. 개인식별정보에 대한 수요시장은 데이터 가치창출구조의 데이터 수집 단계에서 개인식별정보가 수집, 활용 및 유출될 수 있는  강력한 위험요소다. 또한 IP주소가 나라에 따라 개인식별정보로 분류되는 경우와 그렇지 않은 경우가 존재하듯[24], 소셜 미디어, 사물의 인터넷 등을 통해 현재 생산되고 있고 이후 생산될 수 있는 다양한 종류의 데이터 중 개인식별정보에 대한 지속적인 분류와 이에 대한 법적, 윤리적 규제 장치 마련에 어려움이 존재한다.

두 번째 위험성은 데이터 해석과정에서 나타날 수 있는 연구방법론의 오류이다. Boyd(2010)는 전체성 함정, 정확성 함정, ‘what’과 ‘why’의 혼동, 해석의 오류 가능성 등 네 가지의 빅데이터 기반 연구방법론의 위험성을 지적하고 있다. 전체성 함정은 표본의 절대량 증가에 따라 전체성(wholeness)과 표본의 대표성 (representativeness)을 혼동하는데서 발생할 수 있다. 정확성 함정은 데이터 양이 증가하면 바이어스가 축소되어 정확성이 높아진다는 잘못된 ‘믿음’에서 기인한다. ‘what’과 ‘why’의 혼동은 특히 소셜 데이터 중 행위데이터와 상호작용데이터를 분석하는 과정에서 빈번하게 발생한다. 코카콜라 페이스북 팬페이지의 행위데이터 및 상호행위데이터-좋아요 수, 댓글 수 등-는 현재 약 5천만 명이 넘는 페이스북 사용자가 ‘왜’ 코카콜라의 포스트를 구독하는지에 대한 이유는 설명하지 못한다. Boyd에 따르면 소셜 데이터 분석을 통해 어떤 질문에 대해서 답변이 가능한지 반대의 경우는 무엇인지에 대한 인식이 대다수 연구자에게 결여되어 있다. 끝으로 질적 방법 연구자는 스토리를 해석하고 양적 방법 연구자는 사실(fact)을 찾아낸다는 잘못된 믿음이 빅데이터 연구에도 유지되고 있다. < 그림 2>의 ①, ②, ③, ④, ⑤은 데이터 가치창출단계에서 진행되는 해석작업을 표시하고 있다. 어떤 데이터를 수집하고, 무엇을 계측할지 등 데이터 연구는 언제나 해석의 연장성이다.

- 참고문헌 -

Adams, P., 2012. Grouped: How small groups of friends are the key to influence on the social web, Berkeley, CA.

Agrawal, D. / Das, S. / Abbadi, A. E., 2011. “Big Data and Cloud Computing: Current State and Future Opportunities”, in: EDBT/ICDT ’11 Proceedings of the 14th International Conference on Extending Database Technology, New York. http://dl.acm.org/citation.cfm?id=1951432

Anderson, C., 2008. “The End of Theory: The Data Deluge Makes the Scientific Method Obsolete”, in: Wired (16.07) http://www.wired.com/science/discoveries/magazine/16-07/pb_theory

Albanese, E., 2010. “Scaling Social Science with Hadoop”,
http://www.cloudera.com/blog/2010/04/scaling-social-science-with-hadoop/

Boyd, D., 2010. “Privacy and Publicity in the Context of Big Data”, WWW. Raleigh, North Carolina, April 29, http://www.danah.org/papers/talks/2010/WWW2010.html

Croll, A., 2012. “The Feedback Economy”, in: Dumbill (Edt.). Planning for Big Data, eBook, http://shop.oreilly.com/product/0636920025559.do

Dueck, G., 2012. Professionelle Intelligenz: Worauf es morgen ankommt, Frankfurt am Main.

Dumbill, E., 2012. “What is Big Data”, in: Dumbill E. (Edt.), Planning for Big Data, eBook, http://shop.oreilly.com/product/0636920025559.do

Economist 2010. “Data, data everywhere”, http://www.economist.com/node/15557443

Hammerbacher, J. 2009. “information platforms as dataspaces”, in: Segaran, T. / Hammerbacher, J. (edit.). Beautiful Data: The Stories Behind Elegant Data Solutions, eBook, http://shop.oreilly.com/product/9780596157128.do

Liebenau, J. / Backhouse, J., 1990. Understanding Information: An Introduction, Basingstoke.

Loukides, M., 2011a. “What is data science?”, in: O’Reilly Radar Team (Edt.). Big Data Now, eBook, http://shop.oreilly.com/product/0636920022640.do

Loukides, M., 2011b. The Evolution of Data Products, eBook, http://radar.oreilly.com/2011/09/evolution-of-data-products.html

McKinsey Global Institute 2011. Big data: the next frontier for innovation, competition, and productivity, McKinsey & Company, http://www.mckinsey.com/Insights/MGI/Research/Technology_and_Innovation/Big_data_The_next_frontier_for_innovation

Neches, R., Fikes, R. E., Finin, T., Gruber, T., Patil, R., Senator, T., Swartout, W. R. 1991. “Enabling Technology for Knowledge Sharing”, in: AI Magazine, Vol. 12, No. 3., p. 47-56.

Porter, M., 1985. Competitive Advantage: Creating and Sustaining Superior Performance, New York et al.

Shapiro, C. / Varian, H. R., 1999. Information Rules – a strategic guide to the network economy, Boston, Mass.

Stamper, R. K., 1985. “Toward a theory of information: Mystical fluid or a subject for scientific enquiry?” in: The Computer Journal, Vol. 28, No. 3, p 195-199.

Wikipedia 2012. Semiotics, http://en.wikipedia.org/wiki/Semiotics (2002. 3. 26.)

Footnotes    (↵ returns to text)
  1. 데이터의 양(quantity)은 ‘빅’데이터를 정의할 수 있는 기준이 될 수 없다. 이미 1990년대부터 통신회사 및 은행 등은 거대한 양의 디지털 데이터를 저장하고 있기 때문이다. Loukides(2011a)은 “big data is when the size of the data itself becomes part of the problem.”, Dumbill(2012)은 “Big data is data that becomes large enough that it cannot be processed using conventional methods”라고 정의하면서 현존하는 데이터 시스템으로 분석하지 못하는 규모의 데이터를 빅데이터로 정의하면서 데이터 양의 기술적 상대성을 강조하고 있다.
  2. Vinton Cerf의 표현을 재인용(Boyd 2010): “We never, ever in the history of mankind have had access to so much information so quickly and so easily”.
  3. “Anything that can be digitized – encoded as a stream of bits – is information” (Shapiro/Varian 1999: 3).
  4. Porter(1985)의 가치창출구조(Value Chain) 분석방법론은 하나의 재화가 생산, 유통 및 소비되는 과정에 참여하는 개별 경제주체의 ‘추가가치(added value)’ 행위와 이들 사이의 관계를 분석하는 틀이다. Porter의 가치창출구조는 1개 기업차원(firm level)의 분석틀에서 관련 산업계(industry level)의 분석틀-공급사슬(supply chain)-까지 확장가능하다.
  5. 2011년 11월부터 831개에 이르는 국내 뮤지션 및 밴드의 소셜 데이터-facebook, twitter, youtube- 마이닝 작업이 진행되고 있다. 참조: http://chart.muzrang.com/
  6. 월드와이드웹에서 방문 시간, 체류시간, 클릭 패턴, 검색 역사 등의 사용자취는 로그파일(logfile)에 매우 자세하게 기록된다. 또한 진화하는 스마트폰 기술은 개별 사용자의 위치정보, 날씨정보, 인근 네트워크 망 정보 등의 데이터 수집을 가능하게 한다. 이 때 스마트폰은 데이터를 공급하는 ‘데이터 센서(data sensor)’ 기능을 담당한다(Dumbill 2012). 따라서 스미트 미디어 및 사물의 인터넷(internet of things)의 확산 등 사회의 디지털화는 인간 일상의 부산물로 방대한 양의 데이터를 생산 가능케 한다(Albanese 2010).
  7. 데이터 수집 과정에는 개인식별정보(Personally Identifiable Information) 수집 금지 등 다양한 법적 제약이 존재한다.
  8. 수집되는 데이터의 대다수는 기계에 의해 자동으로 읽힐 수 있는(machine-readable) 형식이 아니다. 또한 동일 데이터도 데이터 저장 및 생산 디바이스에 따라 다른 형식으로 수집되는 경우도 존재한다. 그러나 최근 수집되는 많은 데이터 형식은 XML 등 기계수집이 가능한 구조형식으로 진화하고 있다(Loukides 2011a).
  9. 기계학습 프로그램은 이를 위한 라이브러리를 필요로 한다. 관련 오픈소스 라이브러리는 다음과 같다: http://pybrain.org/, http://elefant.developer.nicta.com.au/, http://mahout.apache.org 등.
  10. (빅)데이터 가치창출과정은 실시간으로 수집 및 분류되고 또한 실시간으로 저장 및 연산처리 과정이 진행되기 때문에 단계별 진행이라기 보다는 동시진행의 특징을 가지고 있다. 본 단락에서는 그러나 가치창출과정에 대한 분석의 편의성을 위해 단계별로 서술되고 있다.
  11. MapReduce의 오픈소스 실현 형태가 Hadoop이다: http://hadoop.apache.org/mapreduce/
  12. 대용량 데이터 시각화와 관련된 기술은 다음과 같다: GnuPlot(http://www.gnuplot.info/), Processing (http://processing.org/), ManyEyes(http://www-958.ibm.com/software/data/cognos/manyeyes/) 등.
  13. 이와 대조적으로 Porter(1985)의 가치창출구조 또는 공급사슬 이론은 생산, 유통 그리고 소비로 이어지는 단계성 및 선형성(linearity)을 그 특징으로 하고 있으며, 최종 단계에 있는 소비자의 추가가치 행위에 대한 분석을 결여하고 있다.
  14. 월드와이드웹, 클라우드컴퓨팅, 스마트폰처럼 독립적인 복수의 기술이 결합되어 새로운 기술 및 경제 혁신을 가능케하는 기술을 “Enabling Technology”라고 한다(Neches, et. al. 1991). Enabling Technology는 관련 플랫품의 형성, 유지, 발전에 기여하는 기초 기술환경이며 Enabling Technology의 진화는 관련 플랫품의 경제성 상승과 정(+)의 상관관계를 가지고 있다(ibid.).
  15. 클라우드 컴퓨팅은 데이터 상품의 가치창출구조 또는 생산과정 전체 단계에서 요구되는 기술이기에 에서 클라우드 컴퓨팅은 점선 형식으로 프로세스 전체를 포괄하고 있다.
  16. Hammerbacher(2009)는 서로 다른 데이터 상품이 관계 맺는 플랫폼을 ‘데이터 공간(Dataspace)’라 칭하고 있다.
  17. 또 다른 중간재의 예로는 페이스북의 엣지랭크(EdgeRank)를 들 수 있다. 개별 사용자의 뉴스피드의 양은 해당 사용자의 친구관계망이 확장될 수록 증가한다. 이 때 발생되는 정보과잉(information overload)을 해결하기 위해 페이스북에 의해 제공되는 데이터 상품이 엣지랭크다. 엣지랭크는 페이스북 친구 사이의 상호작용 빈도 및 시기를 기준으로 뉴스피드의 순서를 결정하는 ‘추천 알고리즘’이다.
  18. 2.1.에서 설명한 것처럼 가공되지 않은 데이터 또는 해석과정 이전의 데이터(data as data)는 데이터 상품으로 볼 수 없다.
  19. 디지털 미디어 콘텐츠와 데이터 상품을 구별하는 특징에 대한 보다 자세한 연구는 다음 기회에 진행할 계획이다.
  20. CDDB는 오디오 CD의 개별 곡(track)에서 뮤지션, 제목, 길이, 장르 등의 데이터를 추출해 이를 웹에서 사용할 수 있게한 데이터베이스다. 참조: http://en.wikipedia.org/wiki/CDDB
  21. 비가시적 데이터 상품의 다양한 사례는 Loukides 2011b 참조.
  22. 데이터 가치창출구조의 각 단계에서 해석능력이 요구되는 단계는 에서 ①, ②, ③, ④, ⑤로 표시되어 있다.
  23. 특히 김성태 한국정보화진흥원장 서울신문 기고 (2012년 3월 28일). http://muz.lu/CbfcE
  24. 미국 연방법원은 2009년 IP 주소를 개인식별정보가 아니라고 판결하였으나 유럽연합 국가들은 IP 주소를 개인식별정보로 분류하고 있다. 참조: http://www.mediapost.com/publications/article/109242/
Posted in Big Data | 1 Comment

뉴스의 미래 1: 저널리즘의 위기

신문산업이 몰락의 길로 본격 접어들고 있다. 그러나 신문 소멸과정에서 이를 대체할 디지털 저널리즘과 관련된 새로운 산업모델이 형성되지 못하고 있다. 이에 따라 한국 저널리즘 전체가 위기에 직면하고 있다. 저널리즘은 경제 시스템 및 조직 시스템에서 작동한다. 시스템은 변화하기 마련이고 때론 위기에 직면하면서 ‘전환(transformation)’ 과정을 겪는다. 여기서 관심을 집중해야할 부분은 종이매체냐 온라인이냐, 아날로그냐 디지털이냐 등의 전략선택이 아니라 변화하는 환경에 조응하는 저널리즘 시스템은 무엇인가에 대한 물음이다.

조직문화투쟁의 실패: 종이신문 기자 중심의 무늬만 개혁

신문산업의 위기와 관련하여 다양한 주장과 실험이 이어지고 있다. 통합 뉴스룸,  모바일 우선 전략, 소셜 미디어 편집팀, 비뇨기과 광고 없는 뉴스사이트, 온라인 뉴스팀 강화 등등. 이러한 고민과 실천에도 변화하지 않는 그 무엇이 한국 언론사 조직내에 존재한다. 바로 ‘종이신문 기자’의 권력독점이다. 언론 ‘기업’의 주요요직은 기자의 몫이며 온라인 뉴스 비즈니스 책임자도 종이신문 기자출신이 차지한다. 신참 기자의 눈에도 이는 자연스럽다. 자신들의 ‘미래 밥그릇’을 선배(!) 기자들이 지켜주기 때문이다. 온라인 뉴스팀 주요역할은 종이신문 기자가 생산한 기사를 포털, 뉴스사이트, 트위터 및 페이스북으로 확산시키는 일과 낚시성 기사로 포털 트래픽을 극대화하는데 놓여있다. 다시말해 뉴스룸 통합 여부와 관계없이 온라인 뉴스팀은 종이신문 기자의 하위집단에 머물고 있다. 홍보성 기사에 기초한 휴가성 해외취재도 종이신문 기자의 몫이고, 가뭄의 단비처럼 찾아오는 기자해외연수 프로그램의 수혜는 대부분의 경우 종이신문 기자가 가져간다. 월급 차이는 물론이고 시간이 지날 수록 강화되는 ‘자존감 상실’은 (온라인) 저널리즘의 혁신을 방해하는 요인이다.

경영진과 온라인 조직이 함께 싸워야

최근 영국 가디언은 ‘열린 참여 저널리즘(참조)’이라는 기치아래 조직질서를 재편하고 있다(참조). “The Guardian: Web. Print. Tablet. Mobile.”은 외부용 선전문구 뿐 아니라 현재 가디언의 권력구조를 대변하고 있다. 조직내 권력질서에 대한 재조정없는 저널리즘 방향 재편은 불가능하다. 조직문화 및 조직질서의 변화는 저널리즘 혁신의 시작이요 주요 결과물이다. 니만저널리즘연구소(NJL)가 최근 주장한 것 처럼(참조), 아래로부터의 개혁 또는 종이신문 편집국 등 기자 상부조직으로부터의 개혁만으로 저널리즘 혁신은 불가능하다. 디지털 저널리즘 혁신을 주도하는 세력이 존재해야하며 이를 강력하게 지원하는 경영진 등 두 개의 조건은 ‘디지털 전환’의 전제조건이다. 때문에 아래 그림의 ‘문화 투쟁 실패’는 한국 저널리즘 위기의 핵심 이유다. ‘권력 의지’ 없는 개혁의 성공 사례를 역사에서 찾기 어렵기 때문이다.

 정보 접근성이 경쟁력이던 시대는 지나갔다

1990년대까지 32권 분량의 브리태니커백과사전을 소유한 사람 또는 일상적 접근권을 가진 사람과 가지지 못한 사람 사이에는 개인의 지식 범위 또는 정보 범위에서 분명한 차이가 존재했다. 1990년대까지 좋아하는 뮤지션의 앨범을 ‘모두’ 구매할 수 있는 경제적 능력을 가진 사람과 가지지 못한 사람 사이에는 음악에 대한 이해 수준에서 부정할 수 없는 차이가 존재했다. 그러나 위키피디아가 지식문화를 멋지게 혁신한 이후 백과사전에 대한 접근권과 각 개인의 지식 또는 정보 능력 사이의 상관 관계는 사라졌다. 앨범이 아닌 ‘개별 곡 구입’이 가능해진 아이튠즈 혁신과 유튜브, 스포티파이 등 (저렴한) 음악 스트리밍서비스의 대중화는 음악 접근권에 기초한 음악 취향의 차이를 사라지게 하고 있다. 이와 유사하게 취재원 및 취재처 접근권의 차이에 따른 저널리즘의 경쟁 우위는 점차 약화되고 있다. 제이 로젠(Jay Rosen)이 최근 영상인터뷰에서 밝힌 것처럼 디지털 기자에게 필요한 것은 취재처에 대한 수직적 네트워크가 아닌 사용자,  취재처 등에 대한 수평적 네트워크다(동영상 보기). 위 그림에 표현된 ‘기자 전문성 위기’는 사라지는 (종이)매체에서 글쓰기에 익숙한 기자에 대한 다양한 위협 요인을 묘사하고 있다.

약점의 연결: 신문 수익성 악화와 기업 홍보 기능의 강화

종이신문의 광고 효과가 급감하면 자연스럽게 광고 매출이 줄어든다. 광고 매출이 줄어들면 경영진과 편집국에는 위기의식이 강화된다. 정상적인 경영조직은 매출감소가 일시적 현상인지 구조적 현상인지를 구별하고 전자의 경우 비용절감을 시도하고 후자의 경우 새로운 수익원을 모색한다. 그런데 문제는 구조적 위기에 따른 새로운 수익원 발굴이 한국 대형 언론사의 경우 (공)기업,  대학교 및 관공서에 대한 홍보성 기사로 이어졌다는 점이다. 장기간 지속되고 있는 홍보성 기사가 언론 비판정신 실종과 신뢰도 상실로 이어지는 것은 지극히 정상적인 수순이다.

(출처: factoll.com)

시스템 위기와 디지털 전환

한국 저널리즘은 경제성 위기를 시작으로 다양한 저널리즘 개혁 시도가 성공하지 못하면서 신문산업 위기를 넘어 저널리즘 시스템 전체의 위기와 직면하고 있다. 탈진 상태에 빠져든 일선 기자 그러나 이들에게 계속되는 ‘신문기자’ 특권의식. 겉으로는 변화에 수긍하나 조직개혁에는 단호히 저항하며 자기 잇속에 환한 등불을 밝혀둔 부장급 이상의 간부들. 포털 낚시성 기사 생산과 조직내 차별 문화로 자존감을 빼앗긴 온라인 뉴스편집국 ‘직원들’. 디지털 비즈니스에 애정을 가지고 열중하기 보다는 부동산, 전단광고 등 손쉽게 현금을 만질 수 있는 단기수익 사업에 집중하는 경영진. 추천하고픈 저널리즘스쿨 하나없이 ‘언론홍보 특수 대학원’ 만들어 돈벌기 바쁜 대학. 어디를 둘러보아도 한국 저널리즘 시스템에서 가슴을 뛰게하는 희망을 찾을 수 없다. 어쩌면 바로 이러한 시스템 위기를 인정하는 것에서부터 ‘뉴스의 미래’는 태어날지 모른다. 리부팅이 불가능하다면 교체가 답이다.

Posted in 온라인 저널리즘 | Leave a comment

페이스북 페이지 2.0: 당근과 채찍

지난 3월 1일 페이스북은 페이지에 타임라인, 1대1 메시지 등 다양한 기능을 선보였다(참조 1, 참조 2). 새로운 페이지 기능은 오늘 4월 1일부터 모든 페이스북 페이지에 강제 적용될 예정이다. 여기서 문제는 이번 페이지 개편이 몇가지 추가 기능 업데이트가 아닌 페이스북 페이지 작동원리의 근본적인 변화를 의미한다는 점이다. 결과적으로 페이스북 페이지는 (기업) 페이지 운영자에게 주어진 맛있는 당근이다. 그러나 이 당근은 가까이 놓여 있으나 쉽게 먹을 수 없다. 페이지 운영자는 당근을 먹기 위해서 무거운 짐수레를 힘겹게 끌어야하는 슬픈 당나귀 운명을 맞이하게 된 것이다.

앱은 잊어라

지금까지 페이스북 (기업)페이지 운영자 대다수는 트위트 팔로우 수를 높이는 것처럼 자의반 타의반 페이스북 팬 수를 늘리는 것에 모든 노력을 기울여왔다. 랜딩페이지, (탭) 앱 등에서 각종 경품 이벤트를 진행하고 이를 통해 팬 수가 늘어나면 자기만족에 빠지곤 한다. 그러나 이번 개편을 통해 경품 이벤트의 기능을 담당했던 랜딩페이지는 역사 속으로 사라져버렸고, 지금까지 왼쪽 메뉴 탭에 위치했던 앱은 사실상 그 기능을 상실할 것으로 전망된다. 아래 그림의 코카콜라 예처럼 페이지 방문자에게 노출되는 앱은 1개 정도이며 사용자가 추가 앱을 구경하기 위해서는 아래 그림에서 파란 화살표가 가르키는 “8″을 클릭해야만 한다. 매우 특별한 경우를 제외한다면 페이스북 페이지 앱은 그 수명을 다한 것으로 평가할 수 있다.

한국 페이스북 사용자 규모는 최근 630만 명을 넘어서면서 가파른 성장세를 보이고 있다(참조). (잠재) 고객이 있는 곳에 기업은 응당 찾아오기 마련이다. 그러나 사용자의 관심을 끌기 위한 각종 경품 행사는 첫 번째 페이스북의 서비스 정책 및 수익 모델과 충돌한다. 사용자와 기업 사이 지속적인 상호작용의 플랫폼으로 기능해야할 페이스북 페이지가 하나의 경품 행사가 끝나면 또 다른 경품 행사가 진행되는 곳으로 변질되어 가고 있다. 페이스북 경영진 입장에서는 우려스러운 상황이다. 경품 행사를 페이스북에서 추방하기 위해 랜딩페이지 삭제와 앱 기능에 대한 강력한 제한이 이뤄진 것이다. 이 때 페이지 운영자 입장에서는 두 가지 선택이 남게 된다. 하나는 타임라인을 멋지게 꾸밀 콘텐츠 및 스토리다. 이를 통해 사용자 및 팬과 끊이없이 상호작용을 시도해야 한다. 그렇지 못할 경우 페이스북에 설치된 강력한 파괴력을 자랑하는 지뢰인 엣지랭크(EdgeRank)를 통과할 수 없기 때문이다. 그러나 페이스북 경영진은 페이지의 메시지가 위험한 지뢰밭을 통과해 개별사용자의 타임라인에 도달하는 것을 도와주는 매력적인 편법을 제공한다. 바로 점점 다양해지는 페이스북 광고다.

경품 행사는 잊어야

각종 경품 행사는 두 번째로 다양한 법적 논쟁을 불러 올 수 있다. 특히 약품, 건강식품 및 화장품 관련회사의 과대광고가 경품 행사에 포장되어 사용자를 유혹할 수 있다. 기업의 페이스북 페이지 활용이 많아질수록 페이지 공간을 제공하는 페이스북과 사법부 및 소비자보호기관 사이의 갈등은 필연적이다. 이러한 서비스 정책, 매출 정책 그리고 법적 갈등 예방이라는 배경에서 페이스북 경영진은 각종 경품 행사를 페이스북 페이지에서 추방하기로 결정한 것이다. 페이스북 경영진은 그렇다고 채찍만 준비하지 않았다. 몇가지 달콤한 당근으로 기업을 유혹하고 있다.

사용자 포스트 및 댓글에 대한 통제 기능

페이지 운영자에게는 아래 그림의 빨간 박스처럼 “관리자 검토 전에” 사용자 및 팬의 포스트와 댓글이 페이지에 게시되는 것을 막을 수 있는 기능이 제공되었다.

굳이 이러한 기능이 필요할까라는 의문이 일 수 있다. 2011년도 북미 및 유럽 기업들은 페이스북 페이지에 순간적으로 집중해서 올라오는 해당 기업에 대한 비판 또는 비난에 작지않은 어려움을 겪었다. 이와 관련하여 ‘shitstorm(격렬한 상황)’이라는 신조어가 페이스북 페이지 운영자 사이에서 유행할 정도였다. 때문에 이번 ‘게시글 사전 관리 기능’은 기업 페이지 운영자에게 위기상황에 대한 제어기능이라는 안도감을 선사하기 위한 것이다. 참고로 이 기능은 위기상황이 아닌 경우에는 절대 사용해서 안된다. 사용자는 자신이 쓴 글이 바로 나타나지 않을 경우 검열 가능성에 대한 불쾌감을 느낄 수 있기 때문이다. 또한 사용자의 포스트는 앞으로 페이지 우측 중간쯤에 별도의 공간에 모여지기 때문에 ‘게시글 사전 관리 기능’을 사용할 이유는 매우 특별한 경우를 제외하면 없다.

1대 1 고객상담 기능

기업 트위터 계정의 주요 기능은 1대 1 고객상담이다. 고객 불만이나 사후 관리를 페이지에서 해결할 수 있도록 ‘메시지’ 기능이 페이지에 추가되었다. 아래 그림처럼 ‘메시지’ 버튼 위 커버이미지에 “고객상담은 아래 ‘메시지’를 클릭하세요”라는 문구를 추가한다면 사용자 및 팬과의 1대1 대화가 활성화될 수 있다.

쉽게 공유되고 사용자 참여를 확대시킬 소셜 콘텐츠가 필요

또한 타임라인 상단에 위치하는 ‘톱 포스트(top post)’는 커버이미지와 함께 페이지의 얼굴이 될 전망이다. 톱 포스트는 페이지 운영자 판단에 따라서는 최대 30일 동안 유지될 수 있다. 소중한 톱 포스트를 ‘주말 잘 보내셨나요?’, ‘오늘은 비가 내리는 수요일입니다’라는 가벼운 인사로 대신할 수는 없다. 보다 진일보한 콘텐츠 운영전략이 필요해진 것이다.

고객과의 소통은 기업 마케팅 담당자에게 말처럼 쉬운 일이 아니다. 광고를 방송 및 인쇄 매체를 통해 대량으로 살포하는 방식에 익숙한 그들이기 때문이다. 연인들이 다정한 눈빛을 주고 받으며 향기나는 차를 마시고 있는 카페에 메가폰을 들고 뛰어든 영업 사원이 큰 소리로 ‘모든 미래에 대한 걱정 끝! xx 보험!’을 외치며 그의 이름이 크게 적힌 명함과 사은품을 돌릴 때, 그와 이야기하고 싶은 카페 손님은 과연 몇이나 될까?

때문에 페이스북 페이지의 이번 개편은 지금까지의 페이스북 페이지 운영전략을 처음부터 다시 검토해야하는 숙제를 던져주고 있다.

Posted in 소셜 미디어 | 5 Comments

아기돼지 3형제와 영국 가디언의 열린 저널리즘

아기돼지 3형제와 늑대에 대한 동화가 있다. 볏짚 또는 나무로 쉽게 집을 지은 돼지들은 그 만큼 쉽게 늑대에게 공격을 당하지만 벽돌로 꼼꼼하게 땀을 흘리며 집을 만든 돼지는 늑대의 공격을 이겨낸다는 근면과 성실한 노동을 강조한 자본주의 초기 사회상을 반영한 동화다.

(출처 보기, CC-BY)

아기돼지 3형제와 늑대의 이야기가 영국 가디언에 의해 새롭게 각색되었다. ‘사악한 늑대’를 처형한 돼지 3형제가 법정에 섰다. 돼지에 의한 ‘늑대 살인’은 시대를 뒤흔든 사건이다. 영국 가디언은 독자 및 사용자들과 함께 이 사건을 취재 및 보도한다. 뉴스사이트와 유튜브를 통해 재판과정에 대한 현장 보도가 이뤄지며 기자들과 독자/사용자의 집요한 질문들이 이어진다. 이번 사건은 돼지들의 정당방위가 아니라, 그 뒤에는 뭔가 다른 의도가 있다는 이른바 음모론도 제기된다. 기자들과 사용자들은 다양한 방법을 통해 심층취재에 뛰어들고 중간 중간 서로의 정보를 블로그, 트위터 및 페이스북으로 공유하고, 공유된 정보는 ‘오픈소스’ 형식으로 가디언 뉴스사이트에 통합되어 공개된다.

가디언과 독자/사용자의 공동 조사에 따르면 이번 사건은 보험금을 노린 돼지 3형제의 ‘보험 사기극’이다. 죽은 늑대는 ‘천식(asthma)’을 앓고 있었다. 따라서 입으로 바람을 일으켜 볏짚과 나무로 만든 돼지들의 집을 부수는 것은 불가능했다.

이렇게 돼지들에 의한 보험 사기극이 알려지자 국민저항이 일어난다. 거리로 나선 국민들은 영국의 보험 및 금융시스템의 개혁을 요구한다. 이 현장에도 가디언과 사용자들이 함께하고 있다.

위와 같은 내용을 담은 (홍보) 동영상을 통해 영국 가디언은 최근 지속적으로 확대하고 있는 ‘열린 저널리즘(Open Journalism)’을 보다 쉽게 알리고자 한다(동영상 보기).

뉴욕타임즈와 함께 저널리즘 혁신을 이끌고 있는 가디언의 이번 홍보영상은 뛰어난 창의성을 자랑하고 있다. 수익 모델의 결여 등 많은 비판 속에서도 흔들림 없이 ‘열린 저널리즘’을 추구하고 있는 가디언에게 큰 박수를 보낸다.

- 가디언의 열린 저널리즘 프로젝트 보기

(특히 편집장 Alan Rusbridger의 “Journalists are not the only experts in the world” 영상 추천)

Posted in 온라인 저널리즘 | 3 Comments

2010년 독일 정보기관 3,700만 개 이메일 감시

지난 2월 25일자 독일 쉬피겔 보도에 따르면, 독일 연방헌법보호청(위키 보기), 연방정보부(위키 보기) 및 방첩부대(MAD)에서 지난 2010년 37,292,862 개의 이메일을 감시한 것으로 알려졌다(쉬피겔 보도 보기). 이러한 이메일 감시 규모는 지난 2009년의 약 680만 개 에 비해 약 5배 증가한 수준이다.

감시방법을 살펴보면 독일 정보기관들은 독일을 거점으로 왕래되는 이메일 등 인터넷 기반 소통을 전면 감시하고 있는 것으로 보인다. 예를 들어 이메일에 15,300여개의 위험단어 중  ’폭탄’ 등 위험단어 하나라도 포함되어 있으면 해당 이메일 또는 메신저 메시지가 검토된다. 이렇게 검토된 이메일 수가 2010년 3,700만 개를 넘어서고 있는 것이다.

과연 독일 정보기관만 자국의 이메일 및 인터넷 커뮤니케이션을 감시하고 있을까? 한국의 경우는 어떨까? 2010년 한국 사용자(발신자 및 수신자)의 총 이메일 수는 어떻게될까? 이 중 한국 정보기관에 의해 감시된 비율은? 그리고 그 내용이 정보기관에 넘어가 정밀 감시를 받은 이메일 수는? 여기에 사용된 예산과 인원은? 이와 관련하여 국회 등 감시기구는 정기적인 조사 및 감사를 진행하고 있는가? 또한 이러한 이메일 감시 사실, 그 규모와 방법에 대해 정기적으로 공개해야하지 않을까? 이를 위해 협조하고 있는 기업 및 서비스까지 포함해서 말이다.

Posted in net policy | Leave a comment

방송통신심의위원회 웹툰 심의에 대한 단상: 시스템 오류?

지난 2월 16일 모 인터넷 기업에서 일하고 있는 지인과 점심식사를 하게되었다. 끝자락에 나누었던 대화소재는 방송통신심의위원회(이하: 방심위)가 네이버와 다음을 통해 게재된 일부 웹툰에 대해 ‘청소년 유해매체물 결정관련 사전통지’(관련정보1, 관련정보 2)와 관련된 심의의 필요성, 국가기구에 의한 심의의 타당성 등이다.

그가 던진 질문이 꼬리에 꼬리를 물며 이어지면서 오랜만에 얻은 주말 휴식에도 머리는 점점 복잡해 지고 있다. 지난 1월 14일 열린 인터넷주인찾기의 네번째 컨퍼런스 <심의를 심의한다>(동영상 및 녹취록 보기)에 참여하여 발표도 꼼꼼히 들었고 관련 자료도 챙겨보았지만 심의에 대한 이해력과 판단력은 나아질 전망이 없다.

답답한 마음에 아래에 몇가지 단상을 기록해 본다.

- 방심위의 이번 웹툰 심의가 어떠한 정치적 배경 아래 진행되었는지는 그리 중요하지 않다. 사전 심의든지 사후 심의든지 심의의 필요성은 존재한다. (어떠한 형식이라할지라도 심의 그 자체의 사회적 필요성을 인정하지 않는다면 아래 글을 읽지 않아도 된다.)

- 문제는 ‘누가’ 심의할 것인가다. 여기서 방송통신심의위원회가 심의행정주체인가 아니면 간행물윤리위원회가 웹툰 심의를 담당해야하는가는 부차적인 문제다.

- capcold님의 평가처럼(위의 ‘관련정보 2‘) 업계자율규제’만’으로 심의 주체를 제한할 수 없다면, 결국 (유사)국가기관에 의한 심의는 피할 수 없는 것인가?

- 현 정부에 의한 심의는 문제이고 과거 정부에 의한 심의는 괜찮다고 주장할 수는 없다.

- ‘망중립성’에 관한 미국의 사례를 여기서 참조할 수 있다.

- 망중립성을 (제한적으로) 옹호하고 정책적 중재에 나서고 있는 FCC(미국 연방통신위원회: 한국의 방통위)에 대한 EFF의 강한 거부감을 이해할 필요가 있다. EFF(Electronic Frontier Foundation)은 표현의 자유, 저작물의 자유로운 사용 등을 위해 다방면으로 사회운동을 진행하는 미국중심의 국제비영리시민단체다. 특히 EFF는 ‘망중립성’을 적극 옹호하며 힘든 싸움을 전개해 온 것으로 유명하다. 그러나 EFF는 FCC가 망중립성을 유지하기 위해 갈등 기업들을 중재하는 것에 ‘적극 반대’하고 있다(참조).

그 반대 이유는 두 가지 차원에서 이해할 수 있다. 첫 번째는 미국 시민단체들이 가지고 있는 ‘(연방)정부 개입’에 대한 전통적인 거부감이다. ‘국가(의 기능과 역할)’에 대한 입장은 각 나라마다 다를 수 밖에 없다-’개인적으로!’ EFF의 ‘국가 개입에 대한 원칙적인 반대’에는 동의하지 않는다-. 두 번째 이유는 FCC가 과거 그리고 현재에도 관련 기업의 로비 영향권 아래 놓여있다는 점이다. 다시 말해 ‘중재자’를 믿지 못하겠다는 것이다. 지금은 FCC가 망중립성을 옹호하지만 언제든지 그 입장은 상황에 따라 변할 수 있다는 점을 EFF는 부각시키고 있다.

- FCC와 EFF의 갈등에서 한국사회가 얻을 수 있는 교훈은 무엇일까?

- ‘믿을 만한 국가기구’가 (사후)심의를 진행하고 망중립 정책의 중재 기능을 담당한다면-현 정부에서는 불가능한 가정법!- 어떨까?

- 업체자율 + 신뢰할 수 있는 국가기구가 그렇다면 해결방안의 방향성일까?

- 혹 ‘국가기구’는 또는 해당 국가기구에서 ‘일하는 사람-공무원, 외부 전문가 등-’은 구조적으로 관련 기업의 로비 영향권을 벗어날 수 없는 것은 아닌가? ‘공평한 결정’은 불가능하지 않을까? 아니 ‘공평함’이라는 것 자체가 허상에 불과하지 않을까? 심의와 망중립성 이슈에 대한 ‘공평한 중재’는 불가능하며 따라서 현재의 시스템은 구조적 오류인가?

- ‘구조적 오류’라면 해답은 새로운 구조를 구상하는 것에서부터 시작해야 하는 것은 아닐까?

- 노르웨이의 경우 망중립성 등 우편, 통신, 인터넷 관련 이슈를 중재하는 기구는 ‘시민/사용자 옴부즈맨 및 소비자 위원회’와 노르웨이 정보통신부가 함께 운영하는 ‘자율기구’인 NPT다(참조보기). NPT는 ‘소비자 우선’과 ‘재정 자립에 기초한 자율성’이라는 시스템 작동원리를 실현하고 있다.

- 심의, 망중립성 뿐 아니라 이후 디지털 사회에서 일어날 다양한 분쟁과 갈등을 조정하기 위해서는 새로운 시스템 패러다임이 필요할 수 있다. 한편 절대다수 ‘시민 및 소비자’ 유익을 우선시하고 다른 한편 산업발전과 사회발전을 함께 생각하고 이를 지원하고 각종 분쟁을 해결하는 자율적 행정 기구가 필요하다.

- 또한 모든 회의록, 관련 자료 등을 공개하는 ‘정보 공개(Open Data)’ 정책을 함께 운영한다면 위의 자율적 행정기구에 대한 디지털 사회의 감시와 견제는 가능하지 않을까? (참조: 독일 베를린 오픈 데이터 정책 소개)

이 모든 것이 꿈과 같은 이야기지만 이렇게 단상을 정리해 가다보면 해답의 실마리를 찾을 수 있지 않을까라는 기대를 가져본다.

Posted in net policy | 5 Comments

독일 베를린 오픈 데이터 정책 소개

지난 2011년 가을부터 본격적으로 시작된 베를린 시정부 오픈 데이터 정책이 한걸음 성숙해질 것으로 보인다. 파일럿 프로그램인 Open Data Berlin에 대한 호응이 점차 높아지고 있다는 점 때문이다. 또한 최근 베를린 시정부의 위탁 연구를 맡은 독일 프라우엔호퍼 연구소는 지난 2월 16일 ‘오픈 데이터 전략’이라는 훌륭한 보고서를 공개했다(보고서(독일어) 받아보기, 참고로 2010년 1월에 공개된 프라운엔호퍼 연구소의 ‘공공기관 크라우드 전략‘ 보고서(독일어)도 훌륭하다 ).

이번 ‘오픈 데이터 전략’ 보고서는 베를린 뿐 아니라 공공정보 공개정책을 계획하고 있는 모든 공공기관에게 도움이 될 듯 하다. 175쪽에 이르는 보고서 전체를 꼼꼼하게 살펴보지는 못했지만, 121쪽부터 설명되는 ‘단기 정책’, ‘중기 정책’, ‘장기 정책’ 등 총 39개의 정책 제안을 살펴보면 연구자들의 입체적인 고민의 수준에 놀라게 된다. 오픈 데이터의 기술적 측면 뿐 아니라, 거버넌스 원칙, 법적 및 경제적 고려 사항 등이 39개 정책 제안을 도출하는 과정에서 검토되고 있다.

39개 정책 제안 중 일부를 간략하게 소개하면,

- 담당 국장(?) 임명과 연관 부서를 엮어내는 위원회 신설

- 오픈 데이터를 시민들이 활용할 수 있는 ‘교육 프로그램’ 운영: “오픈 데이터는 많은 영역에서 패러다임 변화를 요구한다. 명백하게 ‘비밀/보안’ 처리되지 않는 모든 데이터는 공개하는 것을 원칙으로 한다.” 따라서 이를 쉽게 활용할 수 있도록 시민교육이 함께 진행되어야 한다.

- (중기 과제) 시정부의 “모든” 의결 사항, 안건, 회의록을 공개하며 시가 소유한 공기업 또는 공공기관의 모든 데이터를 공개한다.

- 공개되는 데이터는 CC:by 라이센스 정책을 선택한다. 따라서 데이터의 ‘상업적 이용’도 가능하다. 공개 데이터를 이용할 수 있는 능력이 상대적으로 뛰어난 특정 기업에게 정보공개가 유리하게 작용할 경우, 데이터 이용 활용정도에 따른 과금체계로 부과함으로써 ‘공정 경쟁 환경’-다시말해 대기업에게 불리한 경쟁 환경-을 조성한다.

- (장기: 3년에서 5년 사이) 기계가 쉽게 공개된 데이터를 분석하고 의미해석을 풍부하게 할 수 있도록 유럽연합 차원의 시멘틱 포멧을 개발한다.

- 이 모든 것을 가능케 하기 위해서는 정부 스스로가 ‘정보 공개’의 정치적 의미를 공개적으로 밝히는 것이 필요하며, 이를 위한 법적 및 재무적 환경을 만들어 가는 것이 중요하다.

- 또한 2011년 처음으로 진행된 Berlin Open Data Day를 정례화하고 이를 통해 행정, 정치, 시민사회, 기업 등이 오픈 데이터 네트워크를 형성하는 것을 지원할 필요가 있다.

관련 공무원의 네트워크, Open Knowledge Foundation 등 최근 정보 공개와 관련된 다양한 조직들이 베를린에 생겨나고 있어, 베를린 시정부의 정보 공개 정책은 이후 보다 진일보한 모습을 보일 것으로 전망된다.

Posted in net policy | 1 Comment

확산되는 반 ACTA 저항

한국정부 또한 협상에 참여하고 있는 ‘위조품 거래 방지에 관한 협정(Anti-Counterfeiting Trade Agreement, 이하 ACTA)에 대한 저항이 유럽 사회를 중심으로 거세지고 있다. ACTA는 저작권 보호 명목아래 (법원의 명령없이) 상시적인 인터넷 사용자 검열 및 심의을 포함하고 있다는 점과 망중립성을 훼손할 수 있다는 점이 핵심 반대 근거다.

1월에는 폴란드 의회 승인을 비판하는 폴란드 사용자가 거리로 나섰고 지난 2월 11일 독일의 경우 약 55개 도시에서 3만 명 이상이 거리시위에 나섰다(쉬피겔 보도).

지난 2월 11일 시위는 페이스북 이벤트 기능을 통해서도 사전 조직되었다. 약 35000명 이상이 참여를 표시했고, 참여가 불확실하지만 참여의사를 표시한 독일 사용자는 약 11000명 수준이었다(페이스북 이벤트 보기).

오는 2월 25일에는 유럽 전역에서 반ACTA 저항시위가 예고되고 있다. 현재까지 페이스북 이벤트를 통해 약  7만 명이 참여 의사를 밝히고 있다.

http://acta.cwdesigns.de/ 에서는 유럽 도시 별 참여 의사를 밝힌 사용자 통계(우)가 도시별로 시각화(좌)되어 있다. 멋진 작업이다.

한국정부 또한 ACTA 협상에 참여하고 있기에 이에 대한 반대의 목소리를 한국 사용자 또한 조직할 필요가 있다.

Posted in net policy | Tagged | Leave a comment