본문 바로가기

정보

한글 문자 수를 세는 로직을 구현 코드

반응형

한글 문자 수를 세는 로직을 구현할 때, 파이썬에서는 문자열의 `len()` 함수를 사용하여 간단하게 문자 수를 셀 수 있습니다. 이 함수는 문자열에 포함된 문자의 총 수를 반환합니다. 한글에서는 각 한글 문자, 알파벳, 숫자, 공백, 특수문자 등이 모두 한 문자로 계산됩니다.

다음은 파이썬에서 문자열의 글자 수를 세는 간단한 예제 코드입니다:

### 한글 문자 수 세기

```python
# 문자열 정의
text = "안녕하세요. 한글 글자수를 세어 봅시다."

# 문자 수 세기
count = len(text)
print("문자 수:", count)
```

### 공백 포함 및 제외하기

공백을 포함하지 않고 문자 수를 세려면, 문자열에서 공백을 제거한 후 길이를 측정할 수 있습니다. 이를 위해 `replace()` 메서드를 사용하여 공백을 제거할 수 있습니다.

```python
# 공백을 제외한 문자 수 세기
count_no_spaces = len(text.replace(" ", ""))
print("공백을 제외한 문자 수:", count_no_spaces)
```

이 로직은 각 문자를 개별적으로 셉니다. 한글 문자열에서 각각의 문자는 자음과 모음이 조합된 완성형 문자로 취급되기 때문에, '안녕하세요'는 5개의 문자로 계산됩니다.

### 고급 문자 수 세기

보다 복잡한 문자 수 계산이 필요한 경우, 예를 들어 특정 유형의 문자만 세거나, 특수 문자를 제외하는 등의 조건을 추가할 수 있습니다. 이러한 고급 계산을 위해서는 정규 표현식 등을 활용할 수 있습니다.

```python
import re

# 한글 문자만 세기
korean_only_count = len(re.findall(r'[가-힣]', text))
print("한글 문자만의 수:", korean_only_count)
```

위 코드에서 `re.findall()` 함수는 정규 표현식을 사용하여 텍스트에서 한글 문자만을 찾아내고, 그 길이를 계산합니다. 이렇게 하면 문자열에서 한글 문자만을 세어볼 수 있습니다.

이러한 기법들은 한글 텍스트 데이터를 다룰 때 유용하게 사용될 수 있으며, 특정 요구사항에 따라 로직을 조정하여 다양한 계산이 가능합니다.

반응형