태그 : 검색

차세대 검색기술 키워드 '시맨틱'!?

출처 : http://www.newsprime.co.kr/news/articleView.html?idxno=72402

지난 STS2008행사에서 설문조사한 내용이 설문조사를 통해 '의미기반(시맨틱) 검색'이 앞으로 가장 주목 받는 검색기술로 꼽혔다고 보도했다.

현재 '의미기반 검색'이라는 buzz word를 장악하고 있는 회사는 큐로보라는 검색사이트를 운영하고 있는 시맨틱스라는 회사이다.
이 회사에서 말하는 '의미기반 검색'은 (시맨틱하게 만들어진 웹이 아닌 일반)웹으로부터 의미 정보를 추출하고 이를 (온톨로지가 아닌) 나름의 개념DB를 생성한 후 이용한 검색시스템을 말한다고 한다.
사람의 수작업율은 1%정도라고 한다.

기업검색 쪽에서 이와 비슷한 시도는 예전 쓰리소프트의 엠피드 서비스와 솔트룩스의 아울림 서비스정도라고 할 수 있겠다.

현재의 '의미기반 검색'은 어느정도에 와 있을까? 어느정도 활용이 가능할까?
다음의 '의미기반 검색' 사이트를 이용하여 보자
* RISS 온톨로지기반 의미검색
* 국가기록원 나라기록 의미검색
뭔가 느끼는 것이 있는가?
위 동영상의 시맨틱스의 이영진 부장은 현재는 10단계중 2단계 정도라고 말한다. 앞으로 "갈길이 멀다"라는 얘기이다.

분명한것은 '의미기반 검색'이 차세대 트랜드인것은 확실하지만 이는 학계의 이야기이며 업계에서는 이보다 구체적이고 피부로 느낄 수 있는 것들을 보여주기를 기대한다.

by 슈퍼맨 | 2008/12/23 14:36 | 기업검색 | 트랙백 | 덧글(0)

기업검색을 효과적으로 고칠수 있는 9가지 방법

KM Column의 James Robertson이라는 사람이 2006년에 쓴 컬럼이다.

크게 감동적(?)인 내용은 아니지만, 우리가 일상으로 간과하고 있는 내용들이 전부 들어 있는 듯 하다.
기본 챙기는게 가장 어려운 듯...

----------------

1. Make search work like magic
   사용자 들은 몇개의 검색어를 넣고 "검색"버튼을 클릭하는 것으로 그들이 찾고자 하는 정보를 마술처럼 보여줘야 한다
   그렇게 하기 위해서는 실 데이타를 가지고 시뮬레이션을 통해 검색결과의 정확성(relevance)를 높여야 할 것이다.

2. Provide an effective default search
   검색관련 설정을 변경하지 않은 기본(default)상태에서의 검색결과 품질을 높혀야 한다.

3. Refine the results page
   검색결과 페이지를 재 정의 해야 한다.   불필요한 내용을 과감하게 정리를 하여 사용자의 검색결과 가독성을 높혀야 한다.
   제거해야 할 항목은 검색정확율, URL, page size, last updated date 등...

4. Tune the search engine
   검색엔진을 튜닝해야 한다. <-- 어찌보면 너무 당연한 일이지 않는가?

5. Track search usage
  운영 중 가장 인기있는 검색어, 검색에 실패한 검색어와 같은 정보를 이용하여 개선해야 할 방향을 산정해야 한다.

6. Implement synonyms
  동의어 사전을 구축하여 'Bike'와 'bicycle'이 다른 결과로 나오지 않도록 해야 한다.
  <-- 우리나라로 표현하면 "효도르", "표도르" 정도???

7. Implement 'best bets'
  'best bets'는 검색결과를 검색엔진을 통하지 않고 관리자가 이미 만들어 낸 결과를 보여주는 기능으로 검색엔진을
   통하는 것에 비해 훨신 좋은 검색결과를 얻을 수 있다.
   <-- 우리나라에서는 '프로모션'기능으로 표현하기도 하며, 특정 검색어 일때 특정 문서를 상위에 표현하는 기능을 나타낸다.

8. Target specialised search users
   Google과 같은 검색결과를 필요로 하는 general search user와 다르게
   특별한 기능을 필요로 하는 specialist serach user가 존재하기 마련이다.
   따라서, general serach user와 specialist serach user를 각각 만족 시킬 수 있는 방안이 있어야 겠다.
   --> 보통의 경우 'advanced serach'로 표현된다.

9. Devote ongoing resources
   단 몇시간이라도 계속적인 작업이 이루어져야 한다.
   '이용 리포트를 보기', '동의어 사전 추가', 'best bets 추가', 'meta data 추가' 등등


출처 : http://www.steptwo.com.au/papers/kmc_fixingsearch/index.html

by 슈퍼맨 | 2008/07/25 15:09 | 기업검색 | 트랙백 | 핑백(2) | 덧글(0)

◀ 이전 페이지다음 페이지 ▶