대만 번체, 일본어 엑셀에서 CSV로 안깨지게 저장하는법
대만, 일본 데이터를 DB에 넣기위해 CSV 파일로 읽어들이려는데
CSV에 자꾸 글씨가 깨져 들어가서 엄청 삽질을 했다.
깨지지않게 CSV로 저장하는 법은 아래와 같다.
1. 일반 엑셀 파일에 (확장자 : .xlsx) 데이터들을 저장한다.
여기선 글자가 깨지지 않음
2. 1번에서 작업한 엑셀파일을 다른이름으로 저장 - 파일형식 : 유니코드 텍스트(*.txt)로 저장
3. 2번에서 저장한 유니코드 텍스트 (.txt) 파일을 메모장으로 연다.
아래와 같은식으로 탭으로 구분되어 들어있을 것이다.
JP 旭川医科大学 医学部 JP 旭川医科大学 医学科 .......(생략) |
아래와 같이, 인코딩을 UTF-8로 변경하여 저장한다.
4. editPlus 프로그램으로 위의 파일을 연다.
다운로드 (http://www.editplus.com/kr/download.html)
유료에디터임 ㅠ_ㅠ 난 그냥 급한김에 30일 사용으로 쓰고 있지만 회사에 신청을 해야겠다.
유사품(?)으로 notePad++ 이 있지만, 얘는 일본어와 번체를 지원하지 않았다..
쨌든, 3번에서 저장한 txt파일을 에디트플러스에서 열고,
ctrl + h 키로 치환을 할 것이다.
탭을 콤마로 변경한다.
5. 저장할 차례!!
새이름으로 저장 누르고, 파일 형식은 사용자 지정.
.csv로 저장한다.
인코딩을 보면 UTF-8 + BOM 으로 되어있고, 그대로 저장하면 된다.
끝.
6. 이제 저장한 CSV파일을 엑셀로 열어보자.
잘 들어가져 있을 것이다.
이렇게 하지 않으면 글자가 깨지거나
또는
CSV파일을 엑셀로 열어봤을 때, 콤마로 각각 나눠져있지 않고, 한셀에 콤마가 붙은채로 다닥다닥 붙어있었다.