상세 컨텐츠

본문 제목

구글(Google)도 못 찾는 다섯가지

과학기술

by 편집국장 2009. 5. 6. 16:21

본문

 구글은 세상의 모든 것을 웹으로 검색할 수 있도록 하겠다는 목표를 가지고 있습니다. 그리고 구글의 검색 알고리즘은 업계 최고를 자랑하죠. 하지만 그런 구글도 못 찾아내는 5가지 콘텐츠가 있다고 합니다.




 1. 이미지

 만일 사진을 올리고 태그를 단다면, 구글이 해당 이미지를 찾을 수 있다. 하지만 어떤 메타데이터 텍스트도 넣지 않은 채 웹에 올려 놓으면, 구글이 찾아내지 못한다. 여기서 필요한 것은 이미지 인식 기술로, 현재 구글은 이 기술을 개발 중이다. 조지 부시 부자의 얼굴을 구별하는 안면 인식 시스템 등이 포함된다. 하지만 이미지 말고도 동영상이라는 커다란 산맥이 남아있기도 하다.  

2. 공공 DB  

구글은 여전히 생활 속의 소소한 내용까지 검색하지는 못한다. 예를 들면, 다음 비행기편은 도시명이나 비행기 번호 등으로 쉽게 찾을 수 있지만, 날씨 때문에 지연되는 일 등 공공 DB가 들어간 정보는 찾지 못한다. 또한 구글은 종종 경매 정보나 건강 기록 같은 정보도 찾지 못한다. 만일 찾더라도 충분히 자세하지 않으며, 일부 정보는 개인 DB에 들어가 잇기도 하다. 콕스믹스(Koxmix)라는 사이트가 이런 문제를 해결하기 위해서 노력 중이다.

3. 음성파일

이 부분에 대해서도 역시 연구 중인 구글은 아직까지 음성 검색을 하지 못한다. 녹음을 해서 웹에 올려도 태그를 넣지 않으면 찾을 수가 없다. 음성으로 컴퓨터를 제어하는 기술이 나오는 등, 음성 인식이 중요해 지는 만큼 음성 검색이 중요한 화두로 떠오르게 될 것이다.

 4. 출력물

 분명히, 출력물은 본래 웹 상에 존재하지 않았다. 하지만 매그클라우드(MagCloud)이나 지니오(Zinio)처럼 잡지를 디지털화해서 제공하는 사이트가 생겨나고 있다. 아직까지는 이런 잡지를 스캔해서 컴퓨터에 저장한다고 하더라도, 태그를 만들지 않는 이상 찾아볼 수가 없다.

 5. 온라인 책

 온라인 책 중 일부는 PDF 파일이고, 또 일부는 그렇지 않다. PDF 파일이 아닌 것들은 소니 리더로만 읽을 수 있는 등 독점적인 포맷이기 때문에 검색이 힘들다. 구글은 저작권 문제 때문에 books.google.com을 구축하는데 여러 가지 문제를 겪고 있다.

 

관련글 더보기