태그 : 솔트룩스

솔트룩스 공유문서 검색시스템 "서치박스" 공개

솔트룩스에서 공유문서 검색시스템 “서치박스”를 공개했다.
4월 27일 솔트룩스 세미나에서도 발표를 한다고 한다.

”서치박스”는 외장하드나 파일서버에 있는 공유문서들을 검색할 수 있도록 구성되었으며, 하드웨어 일체형으로 설치, 관리 또한 간편하도록 구성되었다.

간단한 기능을 동영상으로 살펴보도록 하자.



솔트룩스가 잘~ 할수 있는 몇몇 기능들이 눈에 보이고 여기저기 신경을 많이 쓴 표시가 난다.
전체적으로는 잘 구성된 시스템으로 보인다. (물론 실제로 사용해봐야 정확하게 알 수 있겠지만…)

눈에 띄는 장점
  1. 텍스트마이닝 기능들(군집, 요약, 추출, 유사문서검색)은 장점으로 이야기 할 수 있을 것 같다.
  2. 하드웨어 일체형으로 비용, 관리, 설치를 쉽게 할 수 있도록 하고 있다.
  3. 얼마나 사용될지는 모르겠지만, 문서내의 “이미지”, “그래프”, “표”등의 오브젝트를 검색할 수 있는 기능이 있다.
  4. 문서이력, 버전관리 기능이 있다.

몇가지 생각할 점……

  1. 아무래도 공유폴더 검색의 핵심은 ACL(문서접근권한)이 될 것 같다.
    하지만, “서치박스”의 기능 설명으로 보면 “문서다운로드시” 사용자권한을 체크한다고 되어 있는데…
    이는 검색시에는 권한이 없는 사용자일지라도 모든 문서를 검색할 수 있다는 얘기가 된다.
    이는, 보안에는 좀 치명적이지 않을까?
    기술적인 어려움은 알겠는데 어렵다고 넘길 부분은 아닌 것 같다.
  2. 일반적으로 “통합검색”을 구현할 때 “파일서버”도 같이 검색될 수 있도록 구현되지 않나?
    따라서, “파일서버”만 별도로 검색되어지는 시스템은 아무래도 시장성이 떨어질 것 같다는…
  3. 일반 데스크탑검색 패키지로도 공유문서 검색같은 것은 구현할 수 있지 않을까?
  4. 약 2년전부터 패키지 형태로 유사제품을 판매하고 있는 K업체에 비해 시장진입이 너무 늦은 것 아닌것 아닌가?

by 슈퍼맨 | 2009/04/21 16:55 | 기업검색 | 트랙백 | 덧글(2)

솔트룩스 아울림 공식 오픈

지난 5일날 솔트룩스아울림을 공식 베타오픈 하였다.
그에 관한 포스팅을 바로 하려다가 몇몇 서비스가 불안정한 것 같아 몇일이 지난 오늘 다시 한번 들어가 보고 내용을 파헤쳐 보기로 하였다.

일단, 전체적인 느낌은 공을 상당히 많이 들였다는 생각이 든다.
이 서비스를 통해 큰돈을 벌려고 한다면 많이 모자라지만 회사의 능력을 보여주려는 서비스로는 괜찮은 출발이라고 할 수 있겠다.

가장 눈에 띄는 것이 역시 "토글"이라고 하는 원반형태의 단어띠를 볼 수 있다.

 
이는 검색시에도 나타나게되며 그날의 메인 이슈 키워드를 보여주거나, 검색어와 관련된 다른 단어를 보여주는 용도로 사용될 수 있겠다.
단어 옆의 아이콘을 클릭하게 되면 관련된 문서, 이미지, 위키사전, 인명사전 등을 볼 수 있다.
 


검색은 "블로그", "뉴스", 잡지"의 내용을 색인하여 이용하고 있는 것으로 보이며, 아마도 RSS Feed를 이용하여 수집을 하고 있을 것으로 판단된다.


검색창의 자동완성 기능은 개체명사전을 연동시켜 놓은다.


검색결과화면에서는 "토글" 이외에 클러스터링 결과를 그래픽하게 보여준다.


또한, "통계"기능으로 해당 검색어의 빈도를 날짜별로 볼 수 있도록 구성하였다.

검색 및 분석의 모든 기능은 8개의 분류로 구분되었으며, 해당 분류에 따라 다른 결과를 보여준다.

느낀점

  1. 추출된 단어가 아닌 "구" 형태로 나름 의미있는 분석을 해 낸 것으로 판단된다. - 내부적으로 구형태에 높은 가중치를 주는 것으로 판단된다.
  2. 자동완성은 개체명사전을 이용것으로 판단되나, 현재의 트랜드 단어가 추가되거나 하지 않는 것으로 보아 어디서 도입한 사전으로 걍~ 이용하고 있는 것으로 보인다.
  3. 검색엔진의 색인주기가 실시간이 아님
  4. 검색되는 단어가 많아질수록 토글의 속도가 현저하게 느려짐 - 때로는 검색불가
  5. 부가적인 비쥬얼("토글", "통계", "이미지", "클러스터링")에 비해 검색결과가 눈에 들어오지 않는다. 이는 향후 계속적인 고민이 필요할 것으로 판단됨.
  6. 뉴스 및 잡지 데이터의 저작권은 해결했는지 궁금...
  7. ‘토글’이라는 단어의 탄생배경이 무엇인지?
  8. '시맨틱'이라는 단어를 전면에 내세웠는데....(이름도 '아울'림 아니던가?) 어떤 부분에서 시맨틱 기술을 이용했는지....???
  9. 아직은 시스템이 불충분하여 그런것인지는 알 수 없으나, 검색속도가 전반적으로 충분하지 않다.
  10. 알려주기 싫은 것인지는 알 수 없으나, 색인된 건수를 알 수가 없다. 따라서 시스템의 성능을 대략적으로 측정할 수 있는 기준이 없는 것이다.
  11. 엠피드, 큐로보와 차별성이 떨어진다. 비슷한 서비스를 만들려고 한것이라면 어느정도 성공했지만, 좀더 좋은 서비스를 구상한 것이라면 아직은 할일이 더 많아 보인다.

by 슈퍼맨 | 2008/11/10 13:47 | 기업검색 | 트랙백 | 덧글(0)

시맨틱웹 시장은 없다

시맨틱웹은 여러 측면에서 미래의 웹기술로 인정받고 있으며 국내외에서 많은 연구가 진행 중에 있다.
정보처리나 언어처리에서 "시맨틱웹", "온톨로지"이라는 단어를 제외하고는 대화하기가 어렵게 된 게 상당히 오래된 느낌이다.

또한 신문같은 매체에서도 "Web3.0"이니 "차세대 인터넷 기술"이니 하는 단어로 시맨틱웹으로 소개하고 있기도 한다.

[차세대 인터넷기술 시맨틱 웹ⓛ]똑똑한 인터넷시대 열린다
[차세세 인터넷 기술 시맨틱 웹②] 똑똑한 웹은 현재진행형
[차세대 인터넷기술 시맨틱 웹③] 온톨로지, 시맨틱 웹 기술의 핵심

현재 국내에서 "시맨틱웹'이라는 단어를 선점하고 있는 회사로 솔트룩스, 씨컴테크, 시맨틱스 코리아 등이 알려져 있으며, 기업검색엔진 개발업체들이 트랜드를 따라가려는 모양새를 취하고 있다.

 

하지만, 시맨틱웹에 대한 회의적인 목소리가 상존하고 있으며 이는 현재까지도 진행형이라고 할 수 있다.

시맨틱웹이 허구가 되는 경우
시맨틱 웹(Semantic Web) 기술에 대한 회의론들
온톨로지 유감 - 온톨로지로 뭘 할수 있지 ?

시맨틱웹이 많은 시간과 돈이 들어가는 온톨로지를 구축해야하는 부담이 있지만 실제로 나타난 결과물은 기대에 훨씬 못미치기 때문이리라...
몇년전까지만  당장 엄청난 시장규모가 되리라 이야기 하셨던 분들도 현재는 그런 이야기를 하지 않고 있으며, 큰 돈을 들여 시작한 국내의 대형 프로젝트도 큰 성과없이 끝낸 경우도 있다.
현재는 정부예산으로 진행되는 연구프로젝트나 일부 대기업의 파일럿형태의 프로젝트가 전부인 상황이다.

그럼 그 이유가 무엇일까? - 내 나름대로 정리하면 다음과 같다.

  • 어렵다.
    나 같은 경우에 많은 시맨틱웹관련 교육/워크샵, 세미나를 듣고 인터넷자료를 찾아 보아도 아직도 이해가 않되는 부분이 많이 튀어 나올 정도로 어렵다.
    아마 대부분의 대중들이 그러할 것이며, 이는 웹이 HTTP/HTML이라는 쉬운 방법 때문에 널리 유통될 수 있었다는 것과는 반대되는 사실이다.
  • 대중에게 혼동을 주고 있다.
    Web2.0, Web3.0등의 용어와 같이 사용되면서 대중에게 어필하는 것에는 성공하였을지 모르겠지만, 반대로 너무 먼 미래의 꿈과 희망을 주어 버렸다.
    때문에 대중들은 위의 "내용의 어려움"과 어울려 "만능 요술방망이"정도로 시맨틱웹을 외곡되게 바라보는 시각이 생기게 되었다.
  • 뭔가를 보여줘야 한다.
    특정분야에서(의학, 지역정보 등)에서 온톨로지가 제 역활을 한 케이스가 없지 않지만, 더 많은 영역에서 실망감을 준 사례도 많다.

그럼 기업검색엔진 벤더의 입장에서 시맨틱웹에 대해 어떤 전략을 수립하고 있을까?
"시맨틱웹"이라는 단어를 가장 열성적으로 홍보(?)했었던 솔트룩스는 "Search 2.0"이라는 단어로 살짝 옮겨간 상태이며, 기업검색엔진 개발업체들은 회사 내부적으로 준비를 하고 있으나 본격적인 마케팅을 벌이는 등의 노력은 기울이지 않고 있다.
오히려, (Search 2.0이라는 이름으로) 검색랭킹관련 기술이나 텍스트마이닝 기술들을 부각을 시키려는 상황으로 볼 수 있다.
고객들 또한 시맨틱웹이 본격적으로 뭔가를 보여줄때까지 고객들도 역시 때를 기다리는 상태라고 할 수 있다.

시맨틱웹이 차세대의 중요한 기술로 계속적으로 연구되고 발전되어야 하는것은 자명하지만, 현재 산업적인 측면에서는 "두고 보자"는 것이 전반적인 시장인식인 것 같다.


따라서 "시맨틱웹 시장은 (아직은) 없다"라고 말하는 것이 맞을 것 같다.

참조 : 시맨틱 웹 : 기술을 넘어 서비스 플랫폼으로 - 솔트룩스 _ 이경일 대표

by 슈퍼맨 | 2008/09/17 14:45 | 기업검색 | 트랙백 | 덧글(0)

국내 주요 기업검색 업체 리스트

현재 우리나라에서 메이저라고 할 수 있는 기업검색회사는 STS2008에 참가하는 6개 업체정도라고 할 수 있겠다.

다이퀘스트솔트룩스, 쓰리소프트오픈베이스, 코난테크놀로지코리아와이즈넛

그외에도
    - 패스트서치 코리아
    - 쓰리웨어
    - 레피아컴
    - 아워텍 
    - 건지소프트
   
등 주로 작은 회사들이 있으며, 대부분 검색엔진을 기본으로하는 부가 제품을 같이 병행하여 판매하고 있다.

전체적인 시장판세는
        쓰리소프트는 민간기업시장
        다이퀘스트는 온라인마켓시장
        코리아와이즈넛은 공공시장
        솔트룩스는 시맨틱웹시장
으로 주로 편중되었었으나 최근 그 경계가 무너지고 있는 상황으로 보인다.

우리나라는 전체적인 시장규모가 작고 상대적으로 많은 업체가 존립하고 있어 경쟁이 심한 상태이나
STS2008를 계기로 업계가 전체적으로 발전하는 계기가 되었으면 하는 바램이다.

주)
    빠진 업체가 많이 있으며, 알려주시면 추후 계속적으로 수정하도록 하겠다.
    (자기들 회사 빠졌다고 삐지지 말기...^^)

by 슈퍼맨 | 2008/08/21 14:07 | 기업검색 | 트랙백 | 핑백(1) | 덧글(0)

◀ 이전 페이지다음 페이지 ▶