SQL Server에서 데이터 값에 문자와 숫자가 같이 있는 경우 숫자 또는 문자만 추출하고 싶은 경우가 있습니다.
TRANSLATE 함수를 사용하여 추출할 수도 있지만 SQL Server 2017부터 사용 가능한 함수입니다.
TRANSLATE 함수를 사용 못하는 경우에 숫자나 문자만 추출하는 방법을 알아보겠습니다.
사용할 함수는 REPLACE와 PATINDEX입니다.
우선 REPLACE와 PATINDEX 함수가 어떤 것인지 간단하게 살펴보겠습니다.
REPLACE
지정한 문자열의 값을 다른 문자열로 변환.
PATINDEX
패턴과 매칭 된 처음 위치를 반환. 패턴을 찾지 못한 경우에는 0을 반환.
정규 표현식처럼 사용.
와일드카드도 사용 가능.
SELECT PatIndex('%[0-9]%', '(123)4A56-7B89c0')
(123)4A56-7B89c0 이라는 문자열에서 처음에 매칭 된 숫자의 위치를 반환해줍니다.
숫자 1이 가장 앞에 있기 때문에 1과 매칭이 되고 1은 문자열 2번째에 위치하고 있기 때문에 반환 값은 2가 됩니다.
REPLACE와 PATINDEX 함수를 사용하여 숫자만 추출해보도록 하겠습니다.
DECLARE @telnum varchar(max) = '(123)4A56-7B89c0'
WHILE PatIndex('%[^0-9]%', @telnum) > 0
BEGIN
SELECT @telnum = Replace(@telnum, Substring(@telnum, PatIndex('%[^0-9]%',@telnum) , 1), '')
END
SELECT @telnum
결과
1234567890
숫자만 출력되었습니다.
문자열의 마지막까지 확인을 해야 하기 때문에 반복문인 WHILE문을 사용하였습니다.
이번에는 문자만 추출해보도록 하겠습니다.
DECLARE @telnum varchar(max) = '(123)4A56-7B89c0'
WHILE PatIndex('%[^a-z]%', @telnum) > 0
BEGIN
SELECT @telnum = Replace(@telnum, Substring(@telnum, PatIndex('%[^a-z]%',@telnum) , 1), '')
END
SELECT @telnum
결과
ABc
문자만 추출되었습니다.
변경한 곳은 정규식 부분만입니다.
자주 사용해야 하는 경우라면 함수로 만들어두는 것도 좋습니다.
댓글