less than 1 minute read

Pandas에서 NULL 값을 이전 행의 값으로 채우기

# 엑셀에 저장된 워드리스트 불러오기. 
import pandas as pd

wordlist = pd.read_excel("wordlist.xlsx")
wordlist

워드리스트

https://www.wgtn.ac.nz/lals/resources/paul-nations-resources/vocabulary-analysis-programs 사이트에서 제공하는 Range 프로그램의 Word List는 Headword가 한 번 나오고 나머지 Word Family에 해당하는 단어는 탭으로 구분되어 있다.

# 먼저 새로운 HeadWord2 열을 HeadwWord 열에서 복사해서 만든다. 
wordlist['HeadWord2'] = wordlist['HeadWord'] 

표제어 복사

# 복사한 HeadWord2 열을 Word Family 열로 내용만 덮어 쓴다. 
wordlist['WordFamilies'] = wordlist['WordFamilies'].fillna(wordlist.pop('HeadWord2'))

표제어를 Word Family에 덮어쓰기

# HeadWord열에서 비어 있는 행은 윗행의 HeadWord를 복사하여 입력한다. 
wordlist['HeadWord'] = wordlist['HeadWord'].fillna(method='ffill')
wordlist.to_excel('wordlist_ffill.xlsx') # 수정 워드 리스트 저장
wordlist

최종 워드리스트