[Python] 규칙이 있는 영어 한글 패턴 분리해보기
영단어를 복사해서 표로 만들고 싶었는데, 아래 그림과 같은 형태로 복사되었다. 그래서 바로 엑셀에 붙여 넣기를 하니 오른쪽 그림처럼 되었다. ㅠㅠ 그래서 내가 할 줄 아는 것은 파이썬하고 R뿐인데, 그중 요즘은 파이썬을 많이 사용하니 파이썬으로 분리해보기로 했다. 다행히 저기 글에는 패턴이 있었다. 바로 [영어~~] [한글, 영어 기타] 같은 형태로 되어 있었다. 그래서 저 [영어] [한글,영어] 을 하는 저 중간에 인덱스값만 안다면 분리할 수 있다는 것을 알았다. 그래서 코드는 다음과 같다. 일단 읽어들이고 중간에 \n 을 제거해보자. import re f = open("./영어_한글_혼합.txt","r") lines = f.readlines() 공백제거 = [line for line in lines ..
2020.04.12