개발/ETC

대만 번체, 일본어 엑셀에서 CSV로 안깨지게 저장하는법

신매력 2014. 3. 13. 21:27

대만, 일본 데이터를 DB에 넣기위해 CSV 파일로 읽어들이려는데

CSV에 자꾸 글씨가 깨져 들어가서 엄청 삽질을 했다.


깨지지않게 CSV로 저장하는 법은 아래와 같다.




1. 일반 엑셀 파일에 (확장자 :  .xlsx) 데이터들을 저장한다.

여기선 글자가 깨지지 않음


2. 1번에서 작업한 엑셀파일을 다른이름으로 저장 - 파일형식 : 유니코드 텍스트(*.txt)로 저장


3. 2번에서 저장한 유니코드 텍스트 (.txt) 파일을 메모장으로 연다.

아래와 같은식으로 탭으로 구분되어 들어있을 것이다.


JP 旭川医科大学 医学部

JP 旭川医科大学 医学科

.......(생략)



아래와 같이, 인코딩을 UTF-8로 변경하여 저장한다.





4. editPlus 프로그램으로 위의 파일을 연다.


다운로드 (http://www.editplus.com/kr/download.html

유료에디터임 ㅠ_ㅠ 난 그냥 급한김에 30일 사용으로 쓰고 있지만 회사에 신청을 해야겠다.

유사품(?)으로 notePad++ 이 있지만, 얘는 일본어와 번체를 지원하지 않았다..


쨌든, 3번에서 저장한 txt파일을 에디트플러스에서 열고,

ctrl + h 키로 치환을 할 것이다.

탭을 콤마로 변경한다.






5. 저장할 차례!!


새이름으로 저장 누르고, 파일 형식은 사용자 지정.

.csv로 저장한다.

인코딩을 보면 UTF-8 + BOM 으로 되어있고, 그대로 저장하면 된다.


끝.





6. 이제 저장한 CSV파일을 엑셀로 열어보자.

잘 들어가져 있을 것이다.








이렇게 하지 않으면 글자가 깨지거나 

또는 

CSV파일을 엑셀로 열어봤을 때, 콤마로 각각 나눠져있지 않고, 한셀에 콤마가 붙은채로 다닥다닥 붙어있었다.