티스토리 뷰
Tip and Error/Python
[Error] UnicodeDecodeError: 'cp949' codec can't decode byte 0xec in position 4: illegal multibyte sequence
geonwoopaeng@gmail.com 2021. 5. 2. 16:44open error
txt file을 open 하고 .readlines()할때 문제가 발생한 것 같습니다.
그래서 찾아보니
UnicodeDecodeError : 'cp949'코덱은 위치 4에서 0xec 바이트를 디코딩 할 수 없습니다. 잘못된 멀티 바이트 시퀀스
조금 쉽게 이해 해보면
cp949(한글을 컴퓨터에 표시하는 방식(인코딩 방식) https://namu.wiki/w/CP949)을 다시 디코딩(컴퓨터-> 한글https://200301.tistory.com/9)하기힘들다 라는 말이었습니다.
즉,
=> txt 파일의 문자 인코딩 방식 차이로 인해 python이 인식을 하지 못합니다.
- python3 같은 경우 ASNI 기준으로 작성된 파일만 읽어온다고 합니다. (txt 파일이 UTF-8로 저장되어 있다.)
- UTF-8<https://jeongdowon.medium.com/unicode%EC%99%80-utf-8-%EA%B0%84%EB%8B%A8%ED%9E%88-%EC%9D%B4%ED%95%B4%ED%95%98%EA%B8%B0-b6aa3f7edf96>
해결
1.
file_open = open("file path", 'r', encoding="UTF-8")
2.
file 인코딩을 ANSI로 바꿔준다.
(txt 파일 인코딩 방식 찾기: https://gompam.kr/18 )
반응형
'Tip and Error > Python' 카테고리의 다른 글
.exe 파일(실행 파일) 만들기 (0) | 2021.04.15 |
---|---|
이진탐색 - bisect (0) | 2020.10.26 |
defaultdict - collections 모듈 (0) | 2020.10.14 |
reverse() & reversed() & [::-1] (0) | 2020.10.02 |
문자열(' ')은 변경 할 수 없다. (0) | 2020.09.06 |
공지사항
최근에 올라온 글