본문 바로가기

Digital Insights

구글 뛰어넘는 정보집적 '시맨틱 웹 2.0'


내가 지금까지 기다려왔다고 할 수 있는 기사가 났다.
바로 시맨틱 웹2.0에 관해 보다 구체적으로 접근한 내용.
구글 뛰어넘는 정보집적 '시맨틱 웹 2.0'


요즘, 웹2.0과 시맨틱웹에 관해 기사가 많이 뜨지만,
실상 기사를 쓰는 기자들 또한 전문가라기보다는 공부해가면서 기사를 쓰고있다는 느낌을 버릴 수가 없었는데(물론 다는 아니지만), 13일날 개최된 시맨틱 웹 2.0 콘퍼런스에서 시맨틱 웹 최고 권위자인 스테판 데커(Stefan Decker)교수의 강연에 관한 기사는 뭐랄까,
매일 껍질만 햝으며 향만을 느껴오다가 드디어 껍질을 벗겨 맛을 보는 듯한 느낌.


아래는 기사내용.
0123


“구글 검색엔진은 여러 가지 다양한 사이트로 갈 수 있는 기능을 제공할 뿐이지, 근본적으로 좋은 정보를 찾아낼 수 있도록 도와주진 못합니다. 웹에 분산되어 있는 핵심 정보를 효과적으로 집적해 줄 수 있는 시맨틱 웹 기술이 필요합니다.”

서울대 의생명지식공학연구실(Biomedical Knowledge Engineering Lab ,이하 BK랩)은 13일 삼성동 코엑스에서 국내 최초로 ‘시맨틱 웹 2.0 콘퍼런스(Semantic Web 2.0 Conference,
http://www.semanticweb2.org)’를 개최했다.

이날 행사에서는 시맨틱 웹 최고 권위자인 스테판 데커(Stefan Decker) 아일랜드 DERI 연구소 교수가 방한해 ‘소셜 시맨틱 정보 공간 만들기(Creating Social Semantic Information Spaces)’라는 주제로 기조연설을 진행했다.

스테판 테커 교수는 오전 강연에서 시맨틱 웹 2.0을 지향하고 있는 ‘쇼크 프로젝트(SIOC project,
http://sioc-project.org)’에 대해 설명하며 시맨틱 웹 2.0의 방향에 대해 설명했다.

그는 초기 웹에서 출발한 두 개념이 플랫폼으로서 ‘웹 2.0’ 구조와 기계들끼리 지능적인 의사소통이 가능한 ‘시맨틱 웹’ 표준 두 가지 영역을 연결, 접목시키려는 것임을 강조했다. 이를 통해 향후 ‘소셜 시맨틱 정보 공간(Social Semantic Information Spaces)’으로 형성이 가능하다는 설명이다.
좀 더 쉽게 풀어보자. 현재 사용자들이 웹을 사용하고 있다면 어떤 형식으로든 웹 1.0식 온라인 커뮤니티에 참여하고 있는 셈이다. 구글에서 정보 검색을 하면 종종 온라인 커뮤니티 게시판이나 블로그 등으로 연결된다. 각 정보 그룹들은 일정한 주제를 가지고 다양한 웹사이트에 무질서하게 분산되어 있다. 이러한 분산 정보를 시스템 경계를 넘어 메타 데이터 등을 바탕으로 정보를 자동으로 묶어낼 수 있는 것이 시맨틱 웹 2.0으로서의 온라인 커뮤니티 진화다.

이러한 점에서 데커 교수는 “구글이 ‘정보’를 검색하기엔 좋은 사이트가 못 된다”고 설명했다. 여러 가지 다양한 사이트로 갈 수 있는 기능을 제공할 뿐이지, 알짜 정보를 연관성이 높은 것끼리 집적해줄 수 있는 역할은 안 된다는 설명이다.

이와 달리 그가 집중하고 있는 ‘쇼크 프로젝트(SIOC project)’는 시맨틱하게 상호 연결되어 있는 온라인 커뮤니티 기술을 지향하고 있다. 예를 들어 블로그에 글을 쓰면 ‘블로고스피어’를 형성한다. 다양한 게시판에 글을 쓰면 하이퍼링크 등을 통해 서로 연결된다. 그러나 웹에서는 각각의 정보들이 분산된 채 존재한다. 데커 교수는 “시맨틱한 웹 기술이 활성화되면 이들이 속해 있는 시스템 경계를 넘어 비슷한 주제로 묶고, 공유할 수 있다”고 설명했다. 이를 위해 현재 쇼크 프로젝트에서는 워드프레스 등 주요 설치형 블로그 도구, 설치형 게시판 도구에 맞는 쇼크 데이터 추출 API를 제공하고 있다.

그는 이 밖에도 읽기에만 최적화되어 있는 기존 블로깅 방식을 탈피, 보다 구조적이고 콘텍스트 기반의 ‘시맨틱 블로깅’에 대해서도 강조했다. 이렇게 되면 시맨틱 메타데이터를 활용해 느슨한 통합 커뮤니티가 형성될 수 있고, 나아가 시맨틱 웹 데스크톱 형성도 가능하다는 설명이다.

또한 데커 교수는 “웹 2.0은 시맨틱 웹의 애플리케이션 분야고, 시맨틱 웹은 정보교류 표준을 제공해 사용자 상호 반응을 이끌어내는 웹 기술”이라며 “향후 웹 2.0 기술 흐름에 자연스럽게 시맨틱 웹이 통합되는 방향으로 진화할 것”이라고 내다봤다. 다만 그는 “시맨틱 웹 기반이 갖춰지지 않은 상황에서 시맨틱 웹 서비스는 다소 이르다”며 “5년 정도 후를 기약해야 될 것 같다”고 덧붙였다.

한편, 이날 전체 행사는 시맨틱 웹 2.0의 핵심 요소인 ▲시맨틱 데스크톱(Semantic Desktop)과 ▲소셜 네트워크(Social Network)에 대해 소개하며, ▲온톨로지(Ontology)와 ▲소셜 태깅(Social tagging)이 어떻게 적용되고 있는지 알 수 있는 자리로 마련됐다.
 

◆차세대 두 웹기술 ‘시맨틱 웹’과 ‘웹 2.0’의 만남 = 시맨틱 웹이란 컴퓨터가 정보자원의 뜻을 이해하고, 논리적 추론까지 할 수 있는 차세대 지능형 웹을 말한다. 즉 사람이 마우스나 키보드를 이용해 원하는 정보를 찾아 눈으로 이해하는 웹이 아니라, 컴퓨터가 이해할 수 있는 웹이다.

이를 위해선 사람들이 이해할 수 있도록 자연어 위주로 되어 있는 현재의 웹 문서와 달리, 정보자원들 사이에 연결되어 있는 의미를 컴퓨터가 이해할 수 있는 형태의 언어로 바꿔야 한다. 컴퓨터가 정보자원의 뜻을 해석하고, 기계들끼리 서로 정보를 주고받으면서 자동 처리가 가능해진다.

이와 달리 팀 오라일 리가 제안한 ‘웹 2.0’은 보다 경제적, 사회문화적 개념이다. 참여와 개방을 핵심으로 한 ‘플랫폼으로서 웹’을 의미한다. 닷컴 거품이 붕괴된 후에 살아남은 공룡들의 특징을 모아서 새로운 개념을 묶어낸 것이 계기가 됐다.

김중태 IT 칼럼니스트는 자신의 책에서 “시맨틱웹이 목적지를 향한 ‘기술’에 관심을 두고 있다면 웹2.0은 시맨틱웹의 기술을 어떻게 응용하여 경제와 인간생활에 ‘적용’시킬 것인가에 관심을 두고 있다는 정도의 차이가 있다”고 말하기도 했다.

그러나 일부에서는 시맨틱 웹에 대한 논의가 끊임없이 진행됐음에도 불구하고 표준 제시 이외에 어떤 공헌을 했는지 의문을 제기하기도 한다. 보다 인간 중심(Human-readable)의 시맨틱 웹으로 돌아가야 한다는 주장이다. RSS 등 보다 대중적으로 인정받을 수 있는 정보 표현 프레임워크(RDF) 부산물이 끊임없이 제시돼야 한다는 설명이다.

이에 따라 공학적 개념의 ‘시맨틱 웹’과 사회문화적 개념 ‘웹 2.0’이 결합되어 차세대 웹 기술로서 탄생한 '시맨틱 웹 2.0’은 참여와 개방의 원칙이 적용되고, 정보의 의미적 표현과 검색이 가능한 기술을 표방하고 있다.

김홍기 서울대 BK랩 교수는 기조연설에 앞서 진행한 환영 인사말에서 “웹 2.0은 사회과학적, 문화적 요소를 내포하고 있기 때문에, ‘사회학적으로 상호 연결된(Socially interconnected)’ 세상을 만들기 위한 것”이라며 “시맨틱 웹 2.0이란 끊임없이 진화되는 기술을 바탕으로 본래의 ‘웹 2.0’ 의미로 돌아가자는 의미”라고 설명했다.

김교수는 “한국은 인터넷 규모에 비해 자신의 생각들을 웹에서 공유하는데 인색하다”며 “대중의 참여에 의해 기술의 진보가 이뤄져야 할 뿐만 아니라 그 기술을 유포하는 것도 대중이 소외되어서는 안 된다는 관점에서 이번 행사를 기획된 것”이라고 덧붙였다.

글, 사진 = 세계일보 인터넷뉴스부 서명덕기자 mdseo@segye.com