우분투에서 파일 인코딩 확인 및 변환

Reading time ~1 minute

우분투는 기본적으로 utf-8 인코딩을 사용하고, 윈도우는 다른 인코딩을 사용해서 생기는 문제입니다. 무슨 프로그램으로 파일을 열어 보셨는지 모르지만, gedit나 vi 에디터 등의 프로그램에서는 encoding을 설정해서 볼 수 있습니다. 해당 프로그램의 메뉴에서 encoding을 euc-kr 등의 다른 한글 인코딩 방법으로 선택하면 보일 겁니다.

우분투는 기본적으로 utf-8 인코딩을 사용하고 있어 윈도우 등 다른 인코딩 방식을 사용하고 있는 방식서 만들어진 파일을 열면 글자가 깨지는 경우가 발생 합니다. 이런 경우 해결 하는 방법을 알아 보도록 하겠습니다.

iconv1


1.파일 인코딩 확인

file -bi 파일명

text/plain; charset=iso-8859-1

iconv2

iso-8859-1라고 나오고 있긴 하지만 변환 할 때는 euc-kr로 생각하고 진행 해야 합니다. 자료를 찾다보니 같은 경우들이 나오긴 하는데 euc-kr로 진행 해보라는 것 말곤 아직 정확한 원인은 찾진 못했습니다만 이게 당장 중요한 부분은 아니니…
(해당 부분은 좀 알아 보는 중으로 차후 정확히 알게 되면 추가를 하도록 하겠습니다.)

2.파일 인코딩 변환

파일 인코딩을 변환 하려면 추가로 무엇을 설치 할 필요 없이 iconv 명령어를 사용하면 됩니다.

위에서 예시를 보인 파일의 인코딩을 변경하는 것을 보도록 하겠습니다.

iconv -c -f 기존 인코딩 -t 새로운 인코딩 원본 파일명 > 새로운 파일명
iconv -c -f euc-kr -t utf-8 원본 파일명 > 새로운 파일명
iconv -c -f euc-kr -t utf-8 ko_add_keyword_template.csv > aa.csv

iconv3

file로 위에서 생성한 aa.csv 파일을 확인 해보면 인코딩이 변한걸 볼 수 있습니다.

iconv4

그래면 아래와 같이 한글이 깨짐 없이 잘 보입니다!!

iconv5