제품체험단 및 삶이야기/책에 대한 생각

정규표현식 개발자의 마음을 아는책

어린왕자같은 식객 2010. 11. 19. 08:30
728x90
반응형

정규표현식이란 무엇인가?라는 궁금증을 자아내게 한 책은 바로 '한권으로 끝내는 정규표현식'이라는 책으로 이 책에서 말하는 정규표현식은 각종 현대적 애플리케이션과 프로그래밍 언어에서 사용할 수 있는 특수한 텍스트 패턴을 말한다. 대다수의 사람들이 별 생각 안하고 웹사이트등에서 사용했던 그 입력폼을 만들기 위해서 더 큰 범위의 텍스트 내에서 특정 패턴과 일치하는 텍스트를 찾아내거나 일치하는지 여부를 검사하는등의 작업을 용이하게 해준다.

 

한빛출판사에서 나온 정규표현식이라는 책은 여덟 가지 프래그래밍 언어별 완벽 해설이라는 소제목이 붙은 책으로 정규표현식이 과연 무엇인가를 알고 싶으신 분들은 서점에서 역자 서문과 목차만 봐도 쉽게 알 수 있다.

 

이 책은 초반부에 유용한 각종 툴과 사용에 필요한 기초를 심어줄 수 있는 기본적인 내용이 설명되어 있고 중반부부터 후반부까지는 하나하나 프로그래밍하면서 필요했던 다양한 내용들을 담고 있다. 컴퓨터에서 텍스트를 조작하거나 추출하는 업무에 종사하는 사람이 정규표현식을 알아두면 상당한 시간을 절약할 수 있다고 보여진다.

 

 

  •  한권으로 끝내는 정규표현식

 

 한국사람들이 한권으로 끝내는것을 얼마나 좋아하는가는 알려면 서점에 출판된 책들만 보아도 쉽게 알 수 있다. 이 책의 제목은 Regular expressions Cookbook이지만 한권으로 끝낸다는 말이 붙음으로서 저거 한권만 있으면 다할 수 있겠구나란 기대감을 가지게 된다.

 

전반부에서는 기본 기술이나 정규표현식을 사용하기 위한 프로그래밍의 기본을 알려주고 있는데 본격적인 활용은 4장에서 8장까지 그 내용을 자세히 정리해주고 있다.

 

특히 이 책은 여덟까지 언어로 다양하게 적용하게 할 수 있어서 활용성이 높은데 수많은 문서의 내부를 검색하는 사람, 텍스트 편집기에서 텍스트를 조작하는 사람, 텍스트 검색이나 조작이 필요한 소프트웨어를 개발하는 사람 모두에게 유용한 도구로 초급보다는 중급 수준에 걸맞는 책으로 보여진다. 물론 초급도 향후 활용하기에 따라 작업속도를 상당히 줄여줄 수 있는 책이라는 판단이 들긴 한다


상당히 많은 정보를 담고 있는데 일정 표기 규정에 따라서 일관적으로 기술하고 있다. 정규표현식 (단독적인 정규표현식이나 애플리케이션의 검색 박스 안에 입력할 때의 정규표현식을 나타낸다. 정규표현식에 들어있는 빈칸은 공백 무시 모드를 제외하고는 회색 원형으로 표시된다), 치환 텍스트 (정규표현식 일치부가 검색 치환 과정에서 치환될 텍스트를 의미한다. 치환 텍스트 사이의 공백은 회색 원형으로 표시된다), 일치 텍스트 (대상 텍스트에서 정규표현식과 일치하는 부분을 표시한다), 이외에 생략부호, 개행문자, 엔터로 모든것을 설명하고 있다.

 

결국에는 텍스트 검색이긴 하지만 결국 제대로된 데이터를 추출하기 위한 방법을 알려주고 있는데 이메일주소, 날짜, 시간 나라별 우편번호, 주민번호, 사회보장번호, 단어, 행, 특수문자를 제외 혹은 포함한 검색, 숫자, URL, 경로, 인터넷 주소의 유효성이나 경로 추출, 마크업과 데이터의 상호 변환을 다루고 있다.

 

웹에서 주류 마크업 언어와 파일형식 HTML, XHTML, XML, CSV, INI를 다룰때 흔히 부딪치게 되는 정규표현식 문제는 본인도 자주 찾아보게 될것 같다.

 

중간만 펴보아도 개발자에게 유용한지 금방 눈치챌 수 있는 정규표현식이라는 책은 다양한 예제와 더불어 상당량의 일반화된 정보를 집대성해서 명쾌하게 해결해주는 책이라는 생각이 드는 좋은책

반응형