Develop
2015.11.10 15:49
[c] 한글 문자열 출력
Views 1675 Comment 0
영어는 1byte, 한글은 2byte 차지한다.
따라서 문자열 처리할 때 한 포인터씩 출력을 하게 되면 한글이 깨지는 현상이 발생한다.
예를 들어 한글과 영어가 섞여있는 문자열을 출력할 때 다음과 같은 소스를 이용하면 한글이 깨져서 출력된다.
#include <stdio.h> #include <stdlib.h> const int MAX_SIZE = 1000; int main(){ FILE *fp = fopen("test.txt","r"); char* inp = (char*)malloc(sizeof(char)*MAX_SIZE); int i; while(fgets(inp, MAX_SIZE, fp)){ printf("%s" , inp); for(i = 0 ; i < strlen(inp) ; i++){ printf("%c " , inp[i]) ; } printf("\n"); } return 0; }
그렇다면, 한글과 영어를 판단해서 영어는 1byte, 한글은 2byte를 출력해야 할텐데,
어떻게 하면 한글인지 영어인지 확인할 수 있을까?
#include <stdio.h> #include <stdlib.h> const int MAX_SIZE = 1000; typedef enum {false, true} bool; int main(){ FILE *fp = fopen("test.txt","r"); char* inp = (char*)malloc(sizeof(char)*MAX_SIZE); int i; bool HANGUL = false; while(fgets(inp, MAX_SIZE, fp)){ printf("%s" , inp); for(i = 0 ; i < strlen(inp) ; i++){ if((inp[i] & 0x80) == 0x80) HANGUL = true; //한글인지 확인 if(!HANGUL)printf("%c " , inp[i]) ; //아니면 그냥 출력 else{ printf("%c%c" , inp[i] , inp[i+1]); //한글이면 2byte 출력 i++; } HANGUL = false; } printf("\n"); } return 0; }
위의 소스는 각 char 마다 한글인지 아닌지를 판단해서 한글인 경우 2byte를 출력하게 해준다.
No. | Category | Subject | Author | Date | Views |
---|---|---|---|---|---|
841 | Develop | 프로그램 문서 관리 (Doxygen) | hooni | 2013.04.23 | 16385 |
840 | Develop | 프로그래밍에서 foo, bar 함수의 유래 | hooni | 2013.06.25 | 21253 |
839 | Develop | 프로그래밍 소스 관련 사이트.. | hooni | 2013.04.23 | 16485 |
838 | Develop | 페이팔에서 돈 찾기 (Paypal withdraw) | hooni | 2014.02.20 | 11372 |
837 | Develop | 캘리포니아 운전면허 족보 | hooni | 2017.06.12 | 734 |
836 | Develop | 최근 논문 자료 (2011/01/03, 만현형한테 보낸거..) | hooni | 2013.04.23 | 10366 |
835 | Develop | 참고하고 지울 자료.. 집에서 바야지.. ㅋㅋ | hooni | 2013.04.23 | 12123 |
834 | Develop | 정리할 자료. | hooni | 2015.07.02 | 677 |
833 | Develop | 자주 쓰는 Docker 명령어 alias | hooni | 2020.01.10 | 269299 |
832 | Develop | 이어서 작업할 내용~ | hooni | 2013.11.21 | 0 |
831 | Develop | 웹페이지 성능 테스트 툴 설명 | hooni | 2013.04.23 | 27445 |
830 | Develop | 알고리즘 성능분석 | hooni | 2014.06.24 | 2963 |