개발 관련 도서

모던 자바스크립트 - RegExp

mrban 2024. 7. 6. 23:44

1. 정규 표현식은 문자열을 대상으로 패턴 매칭 기능을 제공한다. 만약 정규표현식이 없다면 반복문을 통해서 한문자씩 연속해서 체크해야할 것이다. 정규 표현식은 자바스크립트의 고유의 문법이 아니라 대부분의 언어와 코드 에디터에 내장되어 있다.

 

2. 정규표현식 생성

  • 정규 표현식 리터럴

정규 표현식 리터럴은 패턴과 플래그로 구성된다.

const target = 'IS this all there is?';

// 패턴: is
// 플래그: i => 대소문자 구분 안하고 검색
const regexp = /is/i;

regexp.test(target); // true
  • Regexp 생성자 함수 사용
const target = 'Is this all there is?';

const regexp = new RegExp(/is/i);

regexp.test(target);

 

3. RegExp 메서드

  • RegExp.prototype.exec

exec 메서드는 인수로 전달받은 문자열에 대해 정규 표현식의 패턴을 검색하여 매칭 결과를 배열로 반환한다. 매칭 결과가 없는 경우 null을 반환한다.

const target = `Is this all there is?`;
const regExp = /is/;

regExp.exec(target); // ["is", index: 5,input: "Is this ....]

 

exec메서드는 반드시 첫 번째 매칭 결과만 반환하므로 주의하자.

 

  • RegExp.prototype.test

test메서드는 인수로 전달받은 문자열에 대해 정규 표현식의 패턴을 검색하여 매칭 결과를 불리언 값으로 반환한다.

 

const target = `Is this all there is?`;
const regExp = /is/;

regExp.test(target); // true

 

  • String.prototype.match

String 표준 빌트인 객체가 제공하는 메서드로 대상 문자열과 인수로 전달받은 정규 표현식과의 매칭 결과를 배열로 반환한다.

const target = `Is this all there is?`;
const regExp = /is/g;

target.match(regExp); // ["is", "is"]

 

exec랑 다른 점은 g플래그를 지정하면 모든 매칭 결과를 배열로 반환한다.

 

4. 플래그

 

플래그는 총 6개가 있으며 그중 중요한 3개의 플래그를 살펴보도록 한다.

i ignore 대소문자를 구별하지 않고 패턴을 검색한다.
g Global 대상 문자열 내에서 패턴과 일치하는 모든 문자열을 전역 검색한다.
m Multi line 문자열의 행이 바뀌더라도 패턴 검색을 계속한다.

 

플래그는 옵션이므로 선택적으로 사용할 수 있으며, 순서와 상관없이 하나 이상의 플래그를 동시에 설정 할 수있다.

 

5. 패턴

패턴은 / 로 열고 닫으며 문자열의 따옴표는 생략한다.

따옴표를 포함하면 따옴표까지도 패턴에 포함되어 검색된다.

어떤 문자열 내에 패턴과 일치하는 문자열이 존재할때 ‘정규 표현식과 매치한다'고 표현한다.

 

아래에서는 패턴을 표현하는 몇 가지 방법에 대해 살펴보도록 한다.

  • 문자열 검색
const target = `Is this all there is?`;
cosnt regExp = /is/ig;

// 플래그 i를 추가하여 대소문자를 구별하지 않고 검색
// 플래그 g를 추가하여 모든 문자열 전역 검색
target.match(regExp); // ["Is", "is", "is"]

 

  • 임의의 문자열 검색

.은 임의의 문자 한개를 의미한다.

. 을 3개 연속하여 패턴을 생성하면 내용과 상관없이 3자열과 매치한다.

const target = `Is this all there is?`;
cosnt regExp = /.../g;

target.match(regExp); // ["Is ", "thi", "s a", "ll ", "the", "re ", "is?"]

 

  • 반복 검색

{m,n} 은 앞선 패턴이 최소 m 번, 최대 n 번 반복되는 문자열을 의미한다.

콤마(,) 뒤에 공백이 있으면 정상 동작하지 않으니 주의해야한다.

{n,} 은 앞선 패턴이 최소 n번 이상 반복되는 문자열을 의미한다.

const target = `A AA B BB Aa Bb AAA`;
cosnt regExp = /A{1,2}/g;

// A가 최소 1번 최대 2번 반복되는 문자열을 전역 검색
target.match(regExp); // ["A", "AA", "A", "AA", A"]

 

+ 는 앞선 패턴이 최소 한번 이상 반복되는 문자열을 의미한다. = {1,}

? 는 앞선 패턴이 최대 한 번(0번 포함) 이상 반복되는 문자열을 의미한다. = {0,1}

 

const target = `A AA B BB Aa Bb AAA`;
cosnt regExp = /A+/g;

// A가 최소 1번 이상 반복되는 문자열을 전역 검색
target.match(regExp); // ["A", "AA", "A", "AAA"]

const target = 'color colour';

// colou다음 u가 최대 한번 이상 반복되고 r이 이어지는 문자열을 검색한다.
const regExp = /colou?r/g;

target.match(regExp); //["color", "colour"];

 

  • OR 검색

|  or 의 의미를 갖는다.

const target = `A AA B BB Aa Bb`;
cosnt regExp = /A|B/g;

// A또는 B를 전역 검색
target.match(regExp); // ["A", "A", "A", "B", "B", "B", "A", "B"]

 

[ ] 내의 문자는 or로 동작한다.

범위를 지정하려면 [ ]내에 - 를 사용한다.

const target = `AA BB Aa Bb`;
cosnt regExp = /[A-Za-z]+/g;

// A~Z, a~z 가 1번 이상 반복되는 문자열을 전역 검색
target.match(regExp); // ["AA", "BB", "Aa", "Bb"]

 

\d는 숫자([0 ~ 9]) 를 의미한다.

\D  \d 와 반대로 동작한다. (즉, 숫자가 아닌 문자를 의미)

\w  알파벳, 숫자, 언더스코어([A-Za-z0-9_]) 를 의미한다.

\W  \w 와 반대로 동작한다. (즉, 알파벳, 숫자, 언더스코어가 아닌 문자를 의미)

 

  • NOT 검색

[...]  ^  not 의 의미를 갖는다. [^0-9]는 숫자를 제외한 문자를 의미한다.

 

  • 시작 위치로 검색

[...]  ^  문자열의 시작 을 의미 한다. /^https/ 는 http로 시작하는 지 검사한다.

 

  • 마지막 위치로 검색

$  문자열의 마지막 을 의미 한다. /$com/ 은 com으로 끝나는지 검사한다.

 

6. 자주 사용하는 정규표현식

 

특정 단어로 시작하는지 검사

const url = 'https://example.com';

// 'http://' 또는 'https://'로 시작하는지 검사한다.
/^https:?\/\//.test(url); // true
/^(http|https):\/\//.test(url); // true

특정 단어로 끝나는지 검사

const fileName = 'index.html';

// 'html'로 끝나는지 검사한다.
/html$/.test(fileName); // true

숫자로만 이루어진 문자열인지 검사

const target = '12345';

// 숫자로만 이루어진 문자열인지 검사한다.
/^\d+$/.test(target); // true

하나 이상의 공백으로 시작하는지 검사

const target = ' Hi!';

// 하나 이상의 공백으로 시작하는지 검사한다.
/^[\s]+/.test(target); // true

아이디로 사용 가능한지 검사

const id = 'abc123';

// 알파벳 대소문자 또는 숫자로 시작하고 끝나며 4~10자리인지 검사한다.
/^[A-Za-z0-9]{4,10}$/.test(id); // true

메일 주소 형식에 맞는지 검사

const email = 'goww1357@gmail.com'

/^[0-9a-zA-Z]([-_\.]?[0-9a-zA-Z])*@[0-9a-zA-Z]([-_\.]?[0-9a-zA-Z])*\.[a-zA-Z]{2,3}$/.test(email); // true

핸드폰 번호 형식에 맞는지 검사

const cellphone = '010-5033-1643';

/^\d{3}-\d{3,4}-\d{4}$/.test(cellphone); // true

특수 문자 포함 여부 검사

const target = "abc#123";

// A-Za-z0-9 이외의 문자가 있는지 검사한다.
/[^A-Za-z0-9]/gi.test(target); // true