코드체계 및 표기 특성
자모가 구성하는 단위
음절 단위로 표기하기 때문에 2-바이트 코드체계를 사용하지만 각음절을 구성하고 있는 자음과 모음이 명확하게 구별되므로 '음절단위처리' 와 '자모단위처리'가 동시에 지원되는 코드체계로 구현
한개이상의 형태소가 어절 을 구성하고 있어서 어절단위로 띄어쓰는 특징->띄어쓰기 경계가 명확하지 않는 경우가 있다.
형태론적 특성
한국어의 단어는 한개 이상의 형태소들이 결합하여 단어를 구성->어절
형태론적 변형을 복원
구문론적 특성
이중주어현상, 주어의 생략이 자유롭다.
품사체계
한글 음절 특성
한글 자모 빈도
'검색엔진 > 형태소' 카테고리의 다른 글
6. 한국어의 형태론적 특성 (0) | 2016.05.30 |
---|---|
5. 어절 빈도 조사 (0) | 2016.05.23 |
4. 코드 변환과 인코딩 (0) | 2016.05.23 |
3. 한글코드와 코드 변환 (0) | 2016.02.17 |
1. 한국어 정보처리 개요 (0) | 2016.02.11 |