python re 예제

정규표현식은 일반적으로 많은 텍스트 처리가 포함된 응용 프로그램에서 사용됩니다. 예를 들어 vi, emac및 최신 IID를 포함하여 개발자가 사용하는 텍스트 편집 프로그램의 검색 패턴으로 일반적으로 사용됩니다. 또한 sed, grep 및 awk와 같은 유닉스 커맨드 라인 유틸리티의 필수적인 부분입니다. 많은 프로그래밍 언어에는 언어 구문(펄, 루비, Awk 및 Tcl)의 정규 식에 대한 지원이 포함됩니다. C, C++및 Python과 같은 다른 언어는 확장 라이브러리를 통해 정규식을 지원합니다. 마지막으로 일치하는 캡처 그룹의 정수 인덱스 또는 일치하는 그룹이 전혀 없는 경우 없음입니다. 예를 들어, 식 (a)b, (a)))) 및 ((ab))는 lastindex ==1 문자열 `ab`에 적용된 경우, 식(a)(b)은 lastindex == 2를 가지며, 동일한 문자열에 적용된 경우. 우리가 살펴볼 첫 번째 메타 문자는 [및]입니다. 일치하려는 문자 집합인 문자 클래스를 지정하는 데 사용됩니다.

문자는 개별적으로 나열할 수 있으며, 두 문자를 `-`로 구분하여 다양한 문자를 표시할 수 있습니다. 예를 들어 [abc]는 a, b 또는 c의 문자와 일치합니다. 이는 범위를 사용하여 동일한 문자 집합을 표현하는 [a-c]와 동일합니다. 소문자만 일치시려면 RE가 [a-z]가 됩니다. 다음은 sub() 메서드를 사용하는 간단한 예입니다. 색상 이름을 색상이라는 단어로 바꿉니다. 이 방법은 전화 북을 만드는 다음 예제에서 설명 한 바와 같이 Python에서 쉽게 읽고 수정 할 수있는 데이터 구조로 텍스트 데이터를 변환하는 데 매우 중요합니다. 파이썬은 Perl의 확장 구문에 확장 구문을 추가합니다. 물음표 다음의 첫 번째 문자가 P인 경우 파이썬에 만연한 확장입니다. 현재 두 개의 확장이 있습니다 : (? P…) 명명된 그룹을 정의 하 고 (? P=name)은 명명된 그룹에 대한 백레퍼런스입니다.

Perl 5의 이후 버전에서 다른 구문을 사용하여 유사한 기능을 추가하는 경우 호환성을 위해 Python 특정 구문을 유지하면서 새 구문을 지원하도록 다시 모듈이 변경됩니다. 참고: 정규식에 따라 파이썬은 두 가지 다른 기본 연산을 제공합니다. match 메서드는 문자열의 시작 부분에서만 일치를 검사하는 동안 검색은 문자열의 아무 곳이나 일치하는 일치를 확인합니다. 패턴과 일치하는 번호가 매겨진 그룹과 명명된 그룹을 표시하는 업데이트된 버전의 test_pattern()은 다음 예제를 보다 쉽게 따를 수 있도록 합니다. 보시다시피 정규 표현식은 매우 강력하며이 자습서에서는 파이썬에서 사용하는 법을 배웁니다.