검색엔진/형태소
4. 코드 변환과 인코딩
문죄송
2016. 5. 23. 16:35
4.1. 완성형-조합형 한글코드 변환
한국어 정보처리용 한글코드로 상용 조합형이나 3 바이트 한글코드, 혹은 유니코드를 사용할 때 입출력 한글코드와 다른 경우에는 정보처리용 한글코드
와 입출력 한글코드를 서로 변환하는 기능이 필수적이다.
4.2. 효율적인 코드변환 기법
이진탐색 알고리즘을 사용하지 않고 배열의 인덱스만 계산하여 변환 속도가 매우 빠르다.
4.3. 완성형-조합형 코드 변환표의 최소화
음성 합성 소프트웨어와 같이 하드웨어적으로 한글코드 변환 프로그램을 구현할 떄는 코드 변환표의크기를 최소화할 필요가 있다.
4.4. KS 완성형 한자-한글 코드변환
KS 완성형 한자를 KS 완성형 한글로 변환하려면 KS 완성형 한자 4,888자에 대한<한자, 한글> 코드 변환표가 필요하다.
두음법칙이 적용되는 한자는 두 음절 모두 생성하지 못하는 오류가 발생할수 있다.
4.5. 전자우편과 한글문서
4.6. 문자 처리 프로그램
한국어 정보처리의 가장 기본적인 프로그램은 한글코드와 관련된 기능이다. 한국어 정보처리 프로그램을 작성하는 기초 과정으로 한글코드와 관련된
프로그램은 다음과 같다.
1. 영문 아스키 코드 출력 프로그램
2. 한글 완성형 코드 출력 프로그램
3. 한글 조합형 코드 출력 프로그램
4. 특정 음절로 시작되는 단어의 출력
5. 영문 빈도조사 프로그램
6. 한글 빈도조사 프로그램