오늘 매드매스에 다룰 주제는 지난번에 이어서 네트워크 관련 2탄이라네. 네트워크 이론의 기본이 되는 그래프 이론에 대해 살펴보겠네. 꼭꼬가 보고 있는 그림을 보게나. 점과 선으로 연결되어 있지? 이산수학에서 이렇게 점(Vertex)과 선(Edge)으로 구성된 녀석을 그래프라고 부른다네. 이 그래프에 대한 탐구와 연구가 바로 그래프 이론이지.
1. 그래프 = 점 + 선
간단하게 그래프 이론을 설명해보겠네. 딱 그래프의 정의만 살펴보려고 할 테니 너무 긴장말고, 어렵다면 넘겨도 된다네. 점과 선의 개념을 알아두면 이후에 설명할 네트워크 분석과 이해에 큰 도움이 될걸세!
왼쪽 꼭지점부터 시계방향으로 1, 2, 3 이렇게 점에게 이름을 부여한다고 해봄세. V라는 꼭짓점 집합을 생각해보면 V에 {1, 2, 3}이 포함될걸세. 이번엔 변의 집합 E를 살펴보겠네. 왼쪽 꼭지점(1번 꼭지점)에서 출발해서 2번 꼭지점으로 향하고 있지? 이렇게 방향이 있는 경우를 유향 그래프(방향이 있는 그래프)라고 하는데 표현을 (1, 2)라고 하지. 위의 그래프의 선을 모두 표현해보면 E = {(1, 2), (2, 3), (3, 2), (3, 1)} 이렇게 되겠군.
이렇게 정의된 꼭짓점의 집합 V와 변의 집합 E의 모음이 바로 그래프라네. 그래프의 정의 자체가 V와 E로 되는 것이지. 어렵지 않지? 이 그래프 이론이 발전을 거듭해 태어난 게 바로 네트워크 이론이라네. 더 많은 여러개의 점과 선이 복잡하게 얽혀있는 연결망을 수학적으로 분석하는 것이지. 이전에 그래프에서 점(Vertex)과 선(Edge)이 네트워크 이론에서는 노드(Node)와 링크(Link)라고 불리는 차이가 있을 뿐.
현실 세계를 설명하는데에 이 네트워크 이론은 아주 중요한 역할을 차지하고 있네. 이전엔 세상을 구성하는 개인 개인에 집중했다면, 네트워크 이론 이후에는 그들 사이의 관계에 집중해본것이지. 개인 하나 하나에서는 보이지 않았던 거대한 무언가가 얽혀있는 관계 속에선 밝혀지기 시작했네. 그 결과 네트워크 이론은 생물학, 사회학, 경제학 등 여러 분야에 활용되고 있지. 관련해서는 예전 매드매스 [정규분포와 멱함수 분포]편에서 다뤄보았으니 궁금한 벗들은 아래 링크에서 봐보게나!
2. 데이터 저널리즘, 근데 이제 네트워크 분석을 곁들인…
데이터 저널리즘도 네트워크 분석을 종종 사용하고 분석하고 있네. SNS 분석부터 시작해서 새로운 연결망을 발견하거나 구조화해서 분석하기도 하지. 우리 마부작침 탐정사무소에서도 종종 네트워크 분석을 이용해보았었네. 아래 소개하는 기사들은 탐정사무소에서 네트워크 분석을 다뤘던 기사들이니 한 번 찬찬히 살펴보게나. 이미지를 클릭하면 자세한 기사를 읽어볼 수 있을걸세.
1) 국회의원 공동발의 네트워크
국회의원이 법안을 발의하려면 최소 10명의 의원들이 함께 공동으로 발의를 해야 하는데, 여기서 착안해서 의원들 사이의 공동발의 네트워크를 그려본 것이지. 의원 한명 한명이 노드에 해당하고, 서로 공동발의에 참여해주면 링크가 그어지는 형태일세. 네트워크에서 조정훈 시대전환 의원과 최연숙 국민의당 의원이 중간에 위치하고 있군!
2) 5.18 왜곡의 네트워크
극우세력에서 5.18 민주화 운동을 북한군이 개입된 폭동 사건이라고 왜곡하려는 시도가 있어왔네. 특히 일부 사이트에서 주장하는 글을 공유하면서 왜곡 여론을 슬금슬금 확장했지. 이 네트워크는 게시글 공유 정도에 따른 사이트별 관계를 표현한 거라네. 웹사이트가 노드가 되고, 게시글을 공유해가면 링크가 연결되는 식이지. 분석 결과 특정 사이트의 글들이 집중적으로 공유되고 있음을 알 수 있었네.