01
정보시대의 배기가스
컴퓨터는 끊임없이 데이터를 만들어낸다. 데이터는 컴퓨터에 입력되기도 하고 출력되기도 하지만, 컴퓨터가 하는 모든 작업의 부산물이기도 하다. 컴퓨터는 정상적으로 작동하는 과정에서 자기가 하고 있는 작업을 끊임없이 기록한다. 컴퓨터는 사람들이 알고 있는 것보다 더 많은 것을 감지하고 기록한다.
예를 들어 워드프로세서는 사용자의 초고와 수정 내용을 포함하여 사용자가 작성하는 문서를 계속 기록한다. 사용자가 ‘저장’을 누르면 워드프로세서는 새로운 문서를 기록하지만, 다른 문서를 위한 디스크 공간이 필요하기 전까지는 이전 문서를 지우지 않는다. 워드프로세서는 문서를 빈번히 자동 저장하는데, 내가 사용하는 마이크로소프트 워드의 경우엔 20분마다 저장하고 누가 문서를 만들었는지, 다른 누가 그 문서를 작업했는지도 기록해둔다.
인터넷에 연결되면 우리가 만들어내는 데이터는 크게 늘어난다. 방문한 웹사이트, 클릭한 광고, 입력한 단어가 기록된다. 컴퓨터, 방문한 사이트, 그리고 네트워크에 연결된 컴퓨터도 각자 데이터를 만들어낸다. 브라우저는 사용자가 어떤 소프트웨어를 보유했는지, 언제 설치했는지, 어떤 기능을 작동했는지 등에 관해 웹사이트에 데이터를 전송한다. 많은 경우 이 데이터는 특정 사용자의 컴퓨터를 정확하게 식별할 수 있을 정도로 충분하다.
이메일이나 문자 메시지, 페이스북, 트위터, 인스타그램, 스냅챗, 왓츠앱 등의 한창 인기 있는 사이트나 앱을 이용하여 가족이나 친구, 동료, 지인과 의사소통하는 일은 점점 더 늘어나고 있다. 데이터는 이런 최첨단 기술을 통한 사회화의 부산물이다. 이 시스템들은 데이터를 전송하는 데 그치지 않고 다른 사람들과 주고받는 상호작용의 데이터 기록까지도 만들어낸다.
밖을 돌아다닐 때는 자신이 데이터를 만들어내고 있다는 생각이 안 들겠지만, 사실 그렇지 않다. 휴대폰은 가까운 기지국을 근거로 자기 위치를 끊임없이 계산해내고 있다. 통신사가 특별히 당신의 위치에 신경 써서가 아니라 당신에게 걸려온 전화를 전달하려면 휴대폰 위치를 알아야 하기 때문이다.
실제로 휴대폰을 사용하면 당연히 더 많은 데이터가 만들어진다. 전화를 걸고 받은 전화번호와 주고받은 문자 메시지, 통화 시간 등의 데이터가 생산된다. 만약 스마트폰을 사용한다면, 스마트폰도 컴퓨터이기 때문에 앱을 사용할 때, 때로는 사용하지 않을 때도 데이터가 만들어진다. 휴대폰에는 GPS 수신기가 장착되어 있을 수 있다. GPS 수신기는 기지국 위치보다도 훨씬 더 정확한 위치정보를 만들어낸다. 기지국은 대략 600미터 이내까지 위치를 찾아내지만 스마트폰에 장착된 SGPS 수신기는 4,8~8.2미터 이내까지 정확히 찾아낸다.
상점에서 무언가를 구매해도 데이터가 만들어진다. 현금 등록기가 컴퓨터이기 때문에 당신이 구매한 물건과 구매 시간 및 날짜에 대한 기록이 만들어진다. 그 데이터는 가게 주인의 컴퓨터 시스템으로 흘러들어간다. 현금을 내지 않았다면 신용카드나 체크카드 정보가 구매와 연관되어 기록된다. 그 데이터는 신용카드 회사에도 전송되고, 일부는 월별 청구서라는 형태로 당신에게 돌아간다.
가게에는 절도나 사기에 대비한 증거를 기록하기 위해 비디오카메라가 설치되어 있을 수 있다. ATM을 사용할 때도 카메라가 당신을 찍고 있다. 밖에는 빌딩, 보도, 도로, 그리고 다른 공공장소들을 모니터링하기 위해 더 많은 카메라가 있다.
자동차를 타도 많은 데이터가 만들어진다. 현대의 자동차에는 컴퓨터가 장착되어 있어서 얼마나 빨리 운전하는지, 얼마나 세게 페달을 누르고 있는지, 운전대가 어떤 위치에 있는지 등의 데이터가 만들어진다. 대부분 블랙박스에 자동으로 기록되며 사고가 발생했을 때 무슨 일이 일어났는지 알아내는 데 유용하게 쓰인다. 각각의 타이어에도 컴퓨터가 있어서 타이어의 압력 데이터를 수집한다. 자동차를 정비소에 가져가면 정비사는 우선 그런 데이터에 접근하여 문제의 원인을 밝혀낼 것이다. 무인자동차는 매 초마다 1기가바이트의 데이터를 생산할 수 있다.
사진을 찍어도 데이터가 생긴다. 디지털 사진에는 사진이 찍힌 시각과 날짜는 물론, 많은 카메라에 장착된 GPS 때문에 사진이 찍힌 위치까지 저장되어 있다. 그리고 카메라, 렌즈, 설정에 대한 일반적인 정보와 카메라 자체의 ID도 포함되어 있다. 사진을 웹에 업로드할 때 종종 그 정보가 파일에 첨부되어 함께 올라가기도 한다.
과거에는 이렇지 않았다. 신문, 라디오, 텔레비전 시대 사람들도 정보를 받았지만, 그 기록이 만들어지지는 않았다. 이제 사람들은 인터넷에서 뉴스와 오락거리를 얻는다. 예전에는 직접 마주보고 이야기하다가 전화로 이야기했다. 이제는 문자 메시지나 이메일로 대화를 나눈다. 예전에 사람들은 가게에서 현금으로 물건을 구입했지만 이제는 인터넷에서 신용카드를 사용한다. 그리고 예전에는 톨게이트나 지하철 개찰구, 주차 요금 징수기에 동전을 넣었지만 이제는 ‘EZ패스’처럼 차량 번호판과 신용카드에 연결되어 있는 자동 지불 시스템을 이용한다. 예전에 택시는 현금만 받았다. 그러다가 신용카드로 지불할 수 있게 되었고, 이제는 스마트폰을 이용하여 우버나 리프트처럼 네트워크로 연결된 택시 시스템에 접근한다. 이런 시스템은 택시를 타고 내린 위치 같은 거래 데이터 기록을 만들어낸다. 몇 가지 특수한 경우를 제외하면 이제 컴퓨터는 사람들이 상거래에 참여하는 모든 곳을 비롯하여 서로 만나는 대부분의 장소에 존재한다.
지난해에 우리 집 냉장고가 고장 났을 때였다. 수리 기사는 냉장고를 조절하는 컴퓨터를 교체했다. 나는 내가 냉장고의 정체를 반대로 생각하고 있었음을 깨달았다. 냉장고는 컴퓨터가 달린 기계가 아니라 음식을 차게 유지시켜주는 컴퓨터다. 자동차는 바퀴와 엔진이 달린 컴퓨터다. 오븐은 라자냐를 굽는 컴퓨터고 카메라도 사진을 찍는 컴퓨터다. 심지어 반려동물과 가축에도 정기적으로 전자 칩을 심는다. 우리 집 고양이는 사실상 하루 종일 햇볕 아래서 잠을 자는 컴퓨터다.
컴퓨터는 인터넷에 연결되는 물건들에 점점 더 많이 장착되고 있다. 구글이 2014년에 30억 달러를 넘게 주고 사들인 네스트Nest라는 회사는 인터넷 접속이 가능한 자동 온도 조절기를 만든다. 이 스마트 자동 온도 조절기는 사용자의 행동 양식에 적응하고 전력망에서 발생하는 상황에 대응한다. 그런데 그러기 위해 사용자의 에너지 사용량을 기록할 뿐 아니라 집의 온도와 습도, 조도, 주변 움직임까지 추적하여 기록한다. 요즘엔 식품의 유통기한을 추적하는 스마트 냉장고와 사용자의 선호도를 알아내서 에너지 효율을 극대화하는 스마트 에어컨도 구입할 수 있다. 그리고 계속해서 신제품이 등장하고 있다. 현재 네스트는 연기나 일산화탄소를 감지하는 스마트 감지기를 판매하고 있으며 추가로 가정용 감지기 일체를 출시할 계획을 세우고 있다. 다른 여러 업체들도 다양한 스마트 가전제품을 연구 중이다. 사회 전체의 에너지 사용량과 온실가스 배출량을 줄여줄 스마트 전력망을 세우려면 이 모든 것들이 필요할 것이다.
우리는 건강과 행복을 증진하기 위해 자신의 신체 데이터를 수집하여 분석하기 시작했다. 핏비트Fitbit나 조본Jawbone 같은 건강 추적 장치를 착용하면 깨어 있을 때나 수면 중일 때의 움직임에 관한 정보가 수집된다. 이 장치들은 그 데이터를 이용하여 사용자의 운동 및 수면 습관을 분석하며 언제 섹스를 하는지도 알아낼 수 있다. 이 장치에 몸무게나 먹는 음식 등 스스로에 관한 정보를 더 많이 제공하면 훨씬 더 많은 것을 알아낼 수 있다. 물론 당신이 제공하는 모든 데이터는 온라인으로 접근 가능하다.
많은 의료 장비는 인터넷 접속이 가능해지면서 다양한 생체 인식 데이터를 수집하며 보고하고 있다. 이미 호흡, 체온, 심장 박동 등의 활력 징후와 기분, 뇌 활동을 끊임없이 측정하는 장비가 등장했거나 머지않아 등장할 것이다. 여기에는 단순히 전문 장비만 해당하지 않는다. 현재 우리가 사용하는 스마트폰에는 감도가 뛰어난 동작 감지기가 내장되어 있다. DNA 서열 분석 가격이 점점 더 저렴해지면서 자신의 유전자 데이터를 분석해달라고 의뢰하는 사람들이 늘고 있다. 트웬티스리앤드미23andMe 같은 기업들은 고객의 게놈 데이터를 이용하여 질병과 관련된 유전자를 발견함으로써 수익성이 높은 새로운 치료법을 알아낼 수 있기를 고대하고 있다. 이 기업들은 맞춤형 마케팅에 관해서도 논의 중인데 언젠가 보험회사들이 사업상의 결정을 내리기 위해 그들이 수집한 데이터를 사들일지도 모른다.
스스로 자신의 데이터를 만들어내는 추세의 극단에 있는 것은 아마 라이프로깅lifelogging, 즉 지속적으로 자기 일상을 기록하는 일일 것이다. 친구와 나눈 대화나 플레이하고 있는 게임, 관람한 영화처럼 자신의 활동을 기록하는 라이프로깅 앱은 이미 많이 나와 있다. 그렇지만 이런 앱은 미래의 라이프로깅의 모습을 미미하게나마 보여줄 뿐이다. 미래의 라이프로깅에는 비디오 기록이 포함될 것이다. 구글 글래스Google Glass는 이러한 가능성을 지닌 최초의 웨어러블 장치지만 다른 장치들도 크게 뒤처져 있지 않다.
다음은 모두 사물인터넷의 예이다. 환경 감지기는 오염도를 감지할 것이다. 스마트 재고관리 시스템은 낭비를 줄이고 돈을 아껴줄 것이다. 인터넷에 연결된 컴퓨터는 도시, 칫솔, 전구, 광장, 약통, 의류 등 모든 사물에 존재하게 될 것이다. 그러지 않을 이유가 없기 때문이다. 추산에 따르면 현재 인터넷에 연결된 장치는 100억 개에 달한다. 이는 이미 전 세계 인구수를 넘는 수치이며, 2020년이 되면 300억 개에 이를 것이라는 예측도 있다. 대대적인 광고가 상당한 수준으로 이루어지고 있으며, 무엇이 성공하고 실패할지는 알지 못한다. 우리가 아는 것은 그 장치들이 아주 많은 데이터를 만들어낼 것이라는 점이다. 우리 주위의 사물들은 인터넷의 눈과 귀가 되어줄 것이다.
이러한 연결성은 프라이버시에 매우 깊은 영향을 미친다. 스마트 기기들은 온실가스 배출을 줄여줄 것이다. 한편 사람들이 자기 집 안에서 어떻게 움직이고 어떻게 시간을 보내는지에 관한 데이터를 쉴 새 없이 내보내기도 할 것이다. 스마트 가로등은 집 밖에서 사람들의 움직임에 관한 정보를 수집할 것이다. 카메라는 점점 더 좋아지고 더 작아지고 더욱 가동성이 높아지기만 할 것이다. 레이시언Raytheon은 2015년에 워싱턴과 볼티모어 상공에 비행선을 띄워 육해공의 ‘표적’을 추적하는 능력을 테스트할 예정이다.
결론적으로 사람들은 매일 수백 개의 컴퓨터와 상호작용을 하며 머지않아 그 수치는 수천 개에 도달할 것이다. 이런 컴퓨터는 모두 데이터를 만들어낸다. 이 데이터 중에 식당에서 주문한 음식, 저녁 조깅 동안의 심박수, 마지막으로 쓴 연애편지처럼 흥미진진한 종류의 데이터는 거의 없다. 대부분은 메타데이터metadata라고 부리는 유형의 데이터다. 메타데이터는 데이터에 관한 데이터, 즉 컴퓨터 시스템이 작동을 위해 사용하는 정보 또는 그 작동의 부산물인 데이터를 말한다. 문자 메시지 시스템에서 메시지 자체는 데이터다. 메시지를 주고받은 계정, 메시지를 주고받은 날짜와 시간은 모두 메타데이터다. 이메일 시스템도 비슷하다. 이메일의 본문은 데이터지만 보내는 사람, 받는 사람, 라우팅 데이터서버까지 이메일의 데이터 패킷이 거쳐가는 경로 ─ 옮긴이, 메시지 용량은 모두 메타데이터다. 이메일 제목이 데이터인지 메타데이터인지에 관해서는 논란의 여지가 있다. 사진에서도 사진 자체는 데이터지만 사진을 찍은 날짜와 시간, 카메라 설정, 카메라의 일련번호, GPS 좌표는 메타데이터다. 메타데이터가 재미없는 정보처럼 보이겠지만, 결코 그렇지 않다. 앞으로 좀 더 설명하겠다.
우리가 만들어내는 이 연무 같은 데이터는 누군가의 입장에서 보면 반드시 기만의 결과물은 아니다. 대부분의 데이터는 컴퓨팅의 자연스러운 부산물일 뿐이다. 이것은 현재 기술이 작동하는 방식에 불과하다. 데이터는 정보시대의 배기가스다.
(본문 중 일부)
★ 저작권법에 의해 한국 내에서 보호를 받는 저작물이므로 무단전재와 복제를 금합니다.