Login     Mobile II
Hint Food 맛과향 Diet Health 불량지식 자연과학 My Book 유튜브 Frims 원 료 제 품 Update Site

단어문장

문장 : 단어의 결합

- 글쓰기 비결

문장력

최재천 이화여대 에코과학부 석좌교수는 “과학이든 인문이든 모든 일의 끝은 궁극적으로 글쓰기에서 판가름난다. 살아보니깐 세상에서 제일 중요한 게 ‘읽기’고 ‘쓰기’이다”라고 말했다. 전문가들은 한결같이 글쓰기란 인간만의 독특한 의사전달 방법으로 상위지식을 전달하기 위해서는 오직 글로써만 가능하며 이는 앞으로도 달라지지 않을 것이라고 말한다. 오히려 미래 사회에서는 자신의 의견을 효과적으로 글로 전달하는 능력이 경쟁력이 될 것이라고 강조했다.

워드넷과 한국어 어휘의미망

워드넷은 1985년 Princeton 대학의 G. Miller, Ch. Fellbaum 등 심리학자, 언어학자, 전산학자등을 중심으로 구축이 시작되었으며 2005년 11월 현재 2.1버전까지 발표되어 있다[14]. 기존의 사전이 가나다순으로 제작된 것과는 달리 워드넷은 개념을 바탕으로 네트워크를 구축한 대용량 지식베이스이다. 일반적인 시소러스에는 용어 간 관계를 나타내기 위해 상하위관계, 동등관계, 부분-전체관계, 연관관계, 사례관계 등을 이용하며 워드넷에서는 동의관계, 반의관계, 상의관계, 하의관계, 분의 관계, 양식관계, 함의관계를 이용하였다.

워드넷을 바탕으로 세계 각국에서 각국의 언어로 확장하는 연구가 진행되고 있으며 국내에서는 부산대학교 한국어정보처리연구실에서 한국어 어휘 의미망(KorLex)을 구축하는 연구[15]를 진행하고 있다. 연구가 진행 중인 KorLex는 1차로 영어 워드넷을 영-한 대역하여 구축한 다음 2차로 문제점을 분석하고 유형화하였다. 3차로 구축된 영-한 대역 어휘의미망을 정제하여 한국어 어휘의미망을 구축하였다. 이렇게 구축된 어휘의미망은 여러분야에서 활용될 수 있다. 정보검색, 자동번역, 문장분석 등과 온톨로지를 구축하기 위한 기반으로 사용될 수 있다. 권혁철(2004)은 어휘의미망을 기반으로 온톨로지를 구축하면 온톨로지의 범용성이나 통합문제를 어느 정도 해결할 수 있다고 하였다

 

온톨로지(ontology)

  용어 사이의 관계를 정의하고 있는 일종의 사전과 같은 것이라 할 수 있다. 온톨로지는 어휘의 정의를 다른 어휘와의 논리뿐만 아니라 가장 기본적(primitive) 어휘부터 파악해 나가는(bottom-out) 구조를 통해 나타낸다. 이는 지식표현이 해당 분야의 전문가들이 동의하거나 공통적으로 사용하는 가장 기본적인 어휘에서 출발한다는 점에서 해당 분야에 특정적이라 할 수 있다. 온톨로지는 해당 분야의 전문가들의 관심, 목적, 관점을 반영한다. 따라서 온톨로지의 역할은 해당 분야에서 사용되는 어휘의 해석과 의미의 한계를 정하는 데 있다. 이러한 의미에서 온톨로지는 사용되는 어휘 사이의 논리적 형식보다는 어휘의 내용을 중심으로 창조된다고 할 수 있다.

1. 어원 및 기본 개념
  온톨로지는 철학에서의 존재론으로 실재(reality)에 대한 정확한 이해를 추구하는 학문이다. 실재, 즉 이 세상을 규정하기 위해 이 세상에 존재하는 실체들에 대한 명확한 이해와 정의가 필요한데, 단순화시켜 말하면 ‘이 세상의 기본이 되는 구성요소에 대한 명확한 이해와 정의’라고 할 수 있다.
 컴퓨터 분야에서의 온톨로지 역시 정보시스템의 대상이 되는 분야에 존재하는 개체와 개념에 대한 명세로서 철학적 용어를 빌려 쓰는데 무리는 없어 보인다. 모든 정보시스템은 정보시스템이 바라보는 적용영역(실재)에 대한 관점(view)의 반영이라 할 수 있는 온톨로지를 갖고 있다. 물론 그것이 독립된 형태로 구축되어 있지 않고 데이터베이스나 프로그램 코드에 스며들어 있을 수는 있으나 어쨌든 해당 응용의 개체나 개념, 프로세스 등은 엄연히 존재한다.

2. 구성 및 기반 시스템
  온톨로지는 의료, 기계 제조, 부동산, 금융 등 특정 응용 영역에 대해 만들어지는데, 그 분야의 기본 개념에 대한 정의와 그들 간의 관계에 대한 명세로 이뤄진다. 가장 단순한 형태로는 어휘사전이나 용어모음을 생각할 수 있지만 컴퓨터가 처리할 수 있을 만큼의 구조성과 구체성을 갖춰야 온톨로지로 불리는 것이 일반적이다.
 온톨로지의 기본은 해당 영역에 존재하는 개념들이다. 예를 들어 책, 컴퓨터, 책상, 의자,구매, 입찰 등이다. 각 개념은 다시 그 개념을 설명하는 속성들을 갖게 되는데, 책은 저자, 출판사, 쪽, 가격 등의 속성을 갖고, 입찰은 대상, 날짜, 방식, 조건 등의 속성을 가질 수 있을 것이다. 또 개념들은 서로 관계를 가질 수 있는데, 가장 기본적인 관계는 상하포함관계다. 예를 들어 동화책은 책에 포함되는 하위개념이 된다. 발전된 온톨로지에서는 속성의 특성, 좀 더 복잡한 형식의 관계 등을 정의함으로써 풍부한 내용을 담을 수 있게 된다.
 온톨로지를 독립적인 하나의 중심 구성요소로 보고 이를 개발과 운영의 중심에 놓는 것이 온톨로지 기반의 시스템(ontology-driven system) 또는 시스템 개발인데, 이는 몇가지 측면에서 장점을 갖는다. 대표적인 장점으로는
➀ 정보 콘텐츠의 구조에 대한 명세로서의 역할
➁ 해당 영역의 지식 공유와 재사용
➂ 해당 영역의 제약과 가정에 대한 명시
➃ 지식(정보)과 프로세스의 분리
➄ 요구사항 분석의 기본 단계 등이다.
 
3. 적용사례
  온톨로지는 정보검색, 의료정보와 바이오정보, 인공지능 및 에이전트, 전자상거래, 지능형 인터넷 등 다양한 기술 분야에 적용되며, 이미 분야별로 이에 대한 연구가 활발히 진행되고 있다.
 가장 먼저 온톨로지 개념을 적용한 컴퓨터 분야는 역시 지식표현과 활용을 연구하는 인공지능 분야다. 특히 에이전트 분야는 이미 90년대 초부터 분산된 환경에서 에이전트들이 상호작용을 통해 의미 있는 문제를 해결하기 위해서는 서로 공유할 수 있는 기본 지식기반의 필요하다는 것을 인식하여 일종의 온톨로지라 할 수 있는 개념 계층도(concept hierarchy) 등을 이용했으며, 지식과 정보를 교환하기 위한 질의어(예 KQML-Knowledge Query and Manipulation Language)와 지식교환형식(예 KIF-Knowledge Interchange Format) 등을 정의했다. 특히 미 국방연구처(DARPA)의 DAML-OIL(DARPA Agent Markup Language - Ontology Inference Layer)은 대표적인 온톨로지 표현 언어 및 형식으로 받아들여지고 있다.
 또 다른 대표적인 분야는 정보검색이다. 용어모음이나 동의어사전 형태만으로도 불필요한 오류를 방지할 수 있고 검색효율을 높일 수 있다. 예를 들어 사용자가 잘못 기재한 ‘불공정 거레’라는 키워드는 온톨로지를 이용해 ‘불공정 거래’로 바로잡아질 것이며, ‘불공정 경쟁, 독점, 덤핑, 정부 보조금’과 같은 유사 또는 관련어를 이용해 더욱 풍부한 검색서비스를 제공할 수 있게 된다. 개방형 디렉터리 프로젝트(ODP http://www.dmoz.com)에서는 자발적으로 참여하는 사람들에 의해 인터넷 정보의 분류체계를 만들고 있으며, 이 분류체계는 구글( http://www.google.co.kr) 등 상용검색사이트를 비롯한 수많은 사이트에서도 사용될 정도로 대표적인 웹정보 분류체계로 받아들여지고 있어 처음 방문하는 사이트에서도 익숙한 분류 카테고리를 이용할 수 있는 경우가 점점 많아지고 있다.

➀ 시맨틱 웹
 시맨틱 웹(semantic web)의 궁극적 목표는 컴퓨터도 이해할 수 있는 지식의 원천으로서의 웹을 만드는 것인데, HTML 형태의 문서들로 이뤄진 현재의 웹은 사람에게 정보를 주는 역할은 하고 있지만 컴퓨터 프로그램이 각 문서의 내용을 정확히 파악할 수 없다는 문제의식에서 출발한다.
 ‘불공정 거래에 대한 사례를 열거한 석사 또는 박사 논문’에 해당하는 문서를 컴퓨터 프로그램이 찾을 수 있도록 하기 위해 우선 문서내용에 의미 있는 태그(tag)를 붙여야 하며, 각 태그가 의미하는 개념에 대한 온톨로지가 있어야 할 것이다. 시맨틱 웹의 중심에 확장성표기언어(XML)를 기반으로 하는 RDF(Resource Description Framework)와 DAML-OIL을 발전시킨 OWL(Ontology Web Language)이 있는 것은 이러한 이유다.

 유비쿼터스 컴퓨팅(ubiquitous computing)은 또 다른 흥미로운 분야다.
 휴대형의 작은 무선기기들이 동적으로 임의 네트워크를 형성하는 환경에서 각 기기들이 서로의 서비스 기능을 광고하고 또 인식할 수 있어야 하는데, 서로 다른 시기에 상이한 업체에 의해 제조된 기기들 사이에서 이를 가능하게 하기 위해서는 동적으로 접근이 가능한 온톨로지의 사용이 타당한 대안으로 제시된다.

➁ 자연어 이해 (Natural Language Understanding)
  자연어 처리(Natural Language Processing)에서 가장 핵심이 되는 것은 자연어 이해(Natural Language Understanding)이며, 이 때 이해 여부 및 정도는 자연어 번역 (Natural Language Translation)을 통해 확인 가능하다.
온톨로지는 개념(concept) 중심의 구조물로 여기에 적절한 indexing 알고리즘이 주어질 경우, 이것은 동일한 개념을 표현하고 있는 서로 상이한 자연 언어의 어휘(lexicon)들을 매개시켜 주는 역할을 할 수 있다. 따라서 온톨로지는 자연어 문서에 대해 구문론 수준이 아니라 의미론 수준에서의 접근을 지원하며, 이를 통해 보다 지능적인 방식의 자연어 번역 및 나아가 생성(generation)이 가능하다.

➂ 지식 관리 (Knowledge Management)
  지식 관리는 조직 안에서 지식을 어떻게 효과적으로 찾아서 가져오고, 유지할 수 있으며, 접근할 수 있는가를 다룬다. 시맨틱 웹 기반에서의 지식관리는 문서 중심의 관리체계를 문서 내에 존재하는 지식의 조각들로 그 관점을 옮겨 놓았다. 문서 내에 존재하는 지식들은 의미적으로 상호 연결시켜 놓음으로써 지능적인 푸싱 서비스, 통합지식관리, 비즈니스 프로세스의 처리가 가능하다. 온톨로지는 이러한 기능을 수행하기 위한 핵심적인 수단을 제공한다.

➃ 전자상거래에서의 온톨로지
  온톨로지가 가장 널리 파급될 가능성이 있는 분야는 전자상거래 분야다. 컴퓨터 프로그램이 상거래의 일부 또는 전부를 맡아서 처리하는 것이므로 프로그램이 다양한 상거래 개념을 이해하고 처리해야 할 것이다. 로제타넷과 같은 전자상거래 프래임워크는 종합 온톨로지라 할 수 있는데, 예를 들어 로제타넷의 PIP(Partner Interface Process)는 거래 프로세스의 온톨로지로 볼 수 있고 로제타넷비즈니스사전(RNBD)과 로제타넷기술사전(RNTD)은 각각 비즈니스와 기술적인 개념들의 온톨로지로 볼 수 있다. 즉 표준화할 수 있고 일반화할 수 있는 개념들을 컴퓨터가 처리할 수 있는 형식으로 명시함으로써 공유할 수 있고 재사용이 가능한 틀을 제공할 수 있는 것이다.
 전자카탈로그 또한 온톨로지와 직접적으로 관련이 있다. 상품분류체계의 표준인 국제상품분류코드체제(UNSPSC)나 HS, e클라스(eClass) 등은 각각 상품이라는 개념들을 나름대로의 관점으로 계층관계를 정의한 단순한 형태의 온톨로지라 할 수 있다. 안타까운 것은 이들 분류체계가 전자카탈로그 구축의 핵심으로 인식되고 있다는 점이다. 예를 들어 전자카탈로그 구축작업이 이들 분류체계 밑단에 상품을 달아보려는 노력으로 시작되곤 하는데, 이는 주객이 전도된 경우다.
 상품 온톨로지 또는 전자카탈로그 온톨로지의 중심은 상품이며, 그 상품에 어떤 속성이 있는가는 2차적인 문제다. UNSPSC의 어느 부분에 이 상품이 분류되는가는 이 상품을 바라보는 하나의 관점인 속성에 불과할 뿐 이 상품을 결정짓는 핵심사항이 될 수 없는 것이다. 구축하는 전자카탈로그의 질적인 우수성 확보라는 측면에서 온톨로지 기반의 방법론을 권고하는 바다.


페이스북       방명록      수정 2014-01-23 / 등록 2011-01-24 / 조회 : 18126 (556)



우리의 건강을 해치는 불량지식이 없는 아름다운 세상을 꿈꾸며 ...  2009.12  최낙언