제공 :
한빛 네트워크
저자 : Alex Iskold
역자 : 이남진
원문 :
Facebook Open Graph: A new take on semantic web
수 주일 전,
페이스북(facebook)이 오픈 그래프 개시를 발표했다. 이 조처는 단순히 소셜 네트워킹 거인에게 뿐만 아니라 웹 전반에 걸쳐 하나의 전환점이 될 것이라 생각한다. 회사의 새로운 비전은 이제 단순히 사람 사이의 연결로 그쳐서는 안 된다는 것이다. 페이스북은 이제 웹 주변과 웹에 접속한 사람들을, 그들이 관심을 갖는 컨셉을 통하여 연결하고자 한다.
웹에 대한 이 비전은 실제는 새로운 것이 아니다. 그 기원은 웹을 처음 창안한 사람, 팀 버너스 리 경으로 거슬러 올라간다. 이 비전에 대하여 지난 십 년간 기술공학계에서 널리 격렬한 토의가 이뤄졌었다. 페이스북이 오픈 그래프라고 내놓은 것은 많은 사람들이
시맨틱 웹으로 상상해 왔던 것이다.
사람과 사물의 웹
이 비전의 중심에는 상이한 웹 페이지들은 동일한 대상을 내포하고 있다는 생각이 깔려 있다. 누가 어떤 책을 읽을 때, 그가 반스&노블에서 읽건, 오라일리나 또는 책 리뷰 블로그에서 읽건, 그것은 문제가 되지 않는다. 중요한 것은 그 독자가 바로 이 책에 관심이 있다는 그 사실이다. 그래서 때와 장소에 구애되지 않고, 그를 친구들이나 같은 책에 흥미를 가진 다른 독자들과 연결시켜주는 것은 괜찮은 일이다.
이 사실은 우리가 웹 상에서 일상 찾는 것(소재)들 즉, 영화, 앨범, 배우, 식당, 와인, 음악가, 사건, 기사(記事)거리, 정치인 등에서도 마찬가지다. 동일한 소재가 다른 여러 페이지에서 참조되기도 한다. 우리의 뇌는 힘 안들이고 금방 연상(聯想)을 이끌어내지만, 컴퓨터는 Cinematical.com에 있는 "아바타" 리뷰가 IMDB.com의 한 페이지에 기술되어 있는 영화에 관하여 말하고 있다는 것을 연역해내지 못한다.
사물의 연관됨이 중요하다고 판단되기 때문에 사람들은 그들이 들어간 웹사이트에서 연결되지 않고 그들의 관심사에서 서로가 연결될 수 있다. 내 친구들이 "아바타"의 어디를 읽고 있는지는 내게 중요치 않다. 중요한 것은 내 친구 중 누가 그 영화를 좋아했으며 그들이 이야기해야 할 것은 무엇이냐는 것이다. 상이(相異)한 사이트를 통하여 대상을 연결 짓지 않으면 지구적인 취향도표는 너무 희박하고 무미건조해진다. 웹을, 우리가 관심 있는 사물의 도표로 재구상(再構想)함으로써, 새로운 차원, 새로운 연결장치가 풀려 나온다. - 모든 사물과 모든 사람이 전혀 새로운 방식으로 연결 짓게 된다.
시맨틱(의미적) 마크 업의 약사(略史)
사람과 사물의 웹을 만드는 문제는 한 페이지에 있는 것을 묘사하고 그것을 다른 페이지에도 연결하는 데에까지 이르렀다. 팀 버너스 리의 최초의 비전에는 소재와 그들 사이의 관계가 RDF를 사용하여 기술되도록 했다. 이 수리언어는 대상과 관계의 본질을 정확하게 파악하도록 설계되었다. RDF 주석(달기)이 가장 완전한 것은 사실이지만 그것은 또 아주 복잡한 것으로 들어났다.
업계에서 지난 몇 년 동안 해결을 시도했던 것은 이 복잡성이다. Microformats라는 보다 간단한 접근법을 탄텍 쎌릭, 크리스 메시나 등 여러 사람이 개발했다. RDF와 달리 Microformats는 기존의 XHTML 표준을 토대로 하고 CSS급을 차용하여 컨텐츠를 마크 업 한다. 비판하자면 Microformats는 페이지에 어떤 정보도 추가하지 않고 그 페이지의 기존 자료에 주석을 달 뿐이라는 것이다.
Microformats는 비교적 간단하면서 기존의 컨텐츠를 마크 업 하는 데에 초점을 맞춘 덕에, 지원을 받고 더 널리 채택되었다. 그러나 여전히 문제는 남아 있다. 첫째, 지원을 받는 소재의 수가 제한되어 있고, 조직이나 사람과 사건 그리고 리뷰의 마크 업에 그 초점이 두어 졌지만, 예컨대, 영화나 책이나 노래를 마크 업 할 방법이 없다. 둘째, Microformats는 얼마간 암호적이어서 읽어내기가 힘들다. 마크 업 하는 방법을 알아내는 교묘한 수법이 있지만 그리 권장할 만한 것이 못 된다.
2005년에 현 탈리스의 최고 기술책임자인 이안 데이비스가 Microformats에서 영감을 받고 eRDF을 개발했다. 이것은 RDF의 단순화한 버전을 표현하기 위한 HTML 내의 한 신택스(구문론)이다. 그의 접근법은, RDF의 규범적 개념과, Microformats에는 데이터가 이미 페이지 안에 있다는 아이디어를 접합시켰다. 이안 작품의 RDFa라는 반복기능은 W3C의 표준으로 채택되었다. 드러나고 있는 모든 징후는 RDFa가 HTML 페이지 내 소재를 기술하는 데 필요한 최적의 솔루션이 된다는 쪽으로 지향하고 있다.
최근까지 마크 업의 진전에도 불구하고, 출판인들에게 페이지 주석 달기에 대한 자극이 부족하여 채택이 되지 않았다. 이를 이용할 수 있는 애플리케이션이 없으면 그런 지향(RDFa 의 최적 솔루션화 예측)이 무슨 소용인가? 다행히 2009년에 야후와 구글 둘 다가 이 페이지 마크 업의 이면에서 그들의 힘을 과시했다.
먼저 야후가
Search Monkey라는 멋진 검색 프로그램을 개발하였다. 이 애플리케이션에 힘입어 사이트에서 야후의 검색엔진이 어떻게 결과를 나타내는지 통제할 수 있게 되었다. 이 솔루션은 페이지 마크 업과 개발자 플러그 인 기반으로 해서 출판인이 사용자에게 보여줄 결과물을 관리할 수 있게 하였다. 그 후 구글이
rich snippets를 발표하였다. 이것은 Microformats와 RDFa 의 마크 업을 지원하고 웹 마스터가 그들의 검색 결과를 어떻게 나타낼지 관리할 수 있게 하였다.
이 작업에서 여전히 빠져있는 것은 일상의 것들을 기술할 단순한 공통어휘였다. 2008-2009년에, 본인은 야후 리서치의 피터 미카의 도움을 받아,
abmeta라는 마크 업을 개발하였다. 이 확장 형 RDFa 기반 마크 업은 영화, 앨범, 책, 식당 등과 같은 일상의 소재를 기술하기에 적합한 어휘를 제공했다. 단순성을 염두에 두고 설계된 abmeta는 두(단수, 복수) 메타 헤더를 사용하고 또 페이지 내 RDFa 마크 업을 활용하여, 페이지 내 단, 복수 소재들을 공시(공시)할 수 있도록 지원한다.
페이스북 오픈 그래프 프로토콜
페이스북이 발표한 마크 업은 메타 태그를 이용한 소재의 공표를 지원하기 때문에 abmeta 의 부분집합으로 여겨질 수 있다. 이 포맷의 중요한 사항은 단순성이다. 그것은 영어 글자 그대로 읽을 수 있는 것이다.
이 마크 업은 몇 가지 필수적인 속성 -- 양식(type), 제목(title), URL, 이미지와 기술(記述) -- 에 관하여 정의하고 있다. 프로토콜은 양식(type) 의 분류가 비교적 풍부하여서 오락, 뉴스, 장소, 기사(記事) 및 일반 웹 페이지도 지원한다. 출판인들이 페이지 상의 소재들을 기술할 때 이 프로토콜을 사용하게 되는 것이 페이스북의 바람이다. 사용자들이 LIKE 버튼을 클릭하면 페이스북은 한 링크뿐만 아니라 특정 형태의 특정 대상도 수용(受容)한다.
이것이 온전하고 정확하게 연산이 되면, 페이스북은 사용자 프로필에 풍성하게 집적된 소재들을 펼쳐낼 수 있고 또 사이트와 상관없이 웹 주변의 동호인 친구들에게 당신을 보여줄 수 있을 것이다. 그리하여 페이스북은, 이 프로토콜을 발간하여, 웹 사이트에서 이를 기꺼이 선택해 주기를 바라면서, 사람과 사물의 웹 즉, 시맨틱 웹에 진출할 것을 분명하게 밝힌다. (aka)
페이스북의 프로토콜과 연관한 기술적인 문제점들
본인이 ReadWriteWeb의
본인 포스트에서 이미 지적했던 바와 같이 페이스북이 제안한 마크 업에는 몇 가지 문제점이 있다.
1. 사물을 명확히 분별할 길이 없다. 이는 페이스북으로선 큰 실책으로, 사용자 프로필에 가짜 데이터가 나타난 데서 이미 드러났다. 이 모호성은 프로토콜이 어떤 데이터 양식(type)에 대해서는 2차 속성이 결여된 데에 기인한다. 예컨대 영화를 그 리메이크와 구분을 못하는 것이다. 일반적으로 그러한 명확화는 유도자(誘導子)나 연도(年度) 같은 도구를 사용하여 수행되지만, 페이스북의 프로토콜은 이런 속성을 분명히 밝히지 못한다. 그로 인하여 복제품이나 오염 데이터가 나오는 것이다.
2. 페이지 상의 복수 대상을 분명히 밝힐 길이 없다. 이는 또 하나의 놀라운 한계인데 이유는 Microformats 나 abmeta 같은 이전의 마크 업들이 이러한 용도에 부합하고 있기 때문이다. 물론 페이스북이 사람들을 오로지 LIKE 페이지로만 받아들여 그들이 광고사냥(애드 타기팅)을 더 잘 할 수 있다면 페이지 안에 복수 대상을 굳이 둘 필요가 없다. 그러나 페이스북은 이 제안을 시맨틱 웹이라 주장하고 내놓았기 때문에 단일 페이지에 복수의 소재를 공시할 방법이 없다는 것은 놀라운 일이다. 확실히 어떤 포괄적인 솔루션이 이를 해내어야 한다.
3. 공개된 프로토콜은 닫을 수 없다. 마지막으로 페이스북은 이것을 하는데 누구하고도 공동연구를 하지 않았다. 오픈 그래프 프로토콜로 당당히 불릴 수 있으려면 웹과 공개적으로 합작하여 개발되어야 한다. 시맨틱 웹 공간에서 활동하는 구글이나 야후!, W3C 및 군소 창업자들 까지도 여기에 공헌할 훌륭한 기제들을 가지고 있을 것임에 틀림없다.
불행히도, 시맨틱 웹 요소들을 올바르게 하는 것은 페이스북에게는 최우선순위가 아니었다. 그 대신, 이 발표는 트위터, 구글 및 출판인들에게 간편한 길을 제공하여 그들을 계속 순환경로 안에 가두어두려는 이들에 대한 도전이 되는 것 같다.
다음은 어디로?
결점들이 있음에도 불구하고 페이스북의 발표가 웹 전반을 위해서는 하나의 긍정적인 네트가 될 것은 의심의 여지가 없다. 정상의 회사들 중 하나가 180도 회전하여 10여 년간 검토되어 온 한 비전을 기꺼이 받아들이면 누구나 멈추어 경청한다. 사람과 사물의 웹은 이제 매우 중요할 뿐만 아니라 한 걸음 더 가까워졌다. 문제는 바른 길은 무엇인가? 또 어떻게 거기에 도달하는가? 에 있다.
초보자들은 페이스북 오픈 그래프에 몇 개 홀을 채우는 것이 좋을 것이다. 그것이 전반적으로 옳은 길이던 아니던 최소한 우리는 그것을 완성할 필요가 있다. 중요한 것은 명확화하는 데 필요한 2차적 속성들에 대한 지원을 보태는 것과 페이지(비록 전체 페이지에 LIKE 버튼 한 개만 있을지라도)에 내재하는 복수의 소재들에 대한 지원을 추가하는 것이다. 이 두 가지는 이미 Microformats 와 abmeta로 해결이 시도되고 있어 쉽게 마무리될 것이다.
기술적인 문제 외에 페이스북은 이 프로토콜을 공개하여, 한 개 회사의 사업 안건으로 다루는 대신 이를 공동소유화 해야 한다. 주요 웹 회사, 출판인과 군소 창업자들로 구성된 진정한 원탁회의가 있으면 올바르고 포괄적이며 공개적인 프로토콜로 귀착될 것이다. 페이스북이 바르게 수행하여 여타의 모든 관계자들과 합력하여, 수년을 걸쳐서 많은 사람들에게 중요한 일이 되어왔던 것들에 웹을 형성하리라 믿고 싶다. 우리는 방금 거대한 도약을 했기 때문에 전망은 고무적이다. 우리는 이제 올바른 곳에 안착해 있다고 확신해야 한다.