본문 바로가기

분류 전체보기50

[논문 리뷰] 국내 자동채점 관련 연구 박사학위논문 주제를 '자동채점'으로 생각하고 있기 때문에 오늘은 국내의 자동채점 관련 선행연구 3편을 리뷰하는 시간을 가져보았습니다. 1. 장지현(2021). 머신 러닝 기법을 활용한 영어 에세이 자동채점 방안 연구. 서울대학교 대학원. 연구의 필요성 - 영어 에세이 자동 채점 관련 연구는 주로 ETS(Educational Testing Service) 등 평가연구기관 차원에서 연구가 수행되었으나, 일선 학교 등의 폭넓은 분야에서 활용되기 위해서는 관련하여 체계적이고 구체적인 연구가 필요함 연구문제 - 첫째, 영어 에세이 자동채점을 위한 모형의 특성 구성요소는 무엇인가? - 둘째, 영어 에세이 데이터의 특징에 따라 피험자의 등급에 대한 자동채점 모형의 예측력은 어떻게 달라지는가? - 셋째, 영어 에세이 .. 2023. 2. 26.
[딥러닝을 이용한 자연어 처리 입문] 정규 표현식 텍스트를 전처리하는 과정에서 '과정중심평가', '과정 중심 평가', '과정중심 평가'와 같은 동일한 의미를 가지지만 띄어쓰기가 다르게 된 단어들을 '과정중심평가'로 통일할 필요가 있음. 이때, 모든 단어들을 각각 '과정중심평가'로 바꿀 수도 있지만 정규표현식을 사용하여 좀 더 간단하게 바꿀 수도 있음. 그럼 파이썬에서 지원하고 있는 정규 표현식 모듈 re의 사용 방법에 대해서 알아보자. 1. re 모듈함수 정규 표현식 re 모듈에서 지원하는 함수는 아래의 표와 같음. 앞으로 진행될 실습에서는 re.compile()에 정규 표현식을 컴파일하고, re.search()를 통해서 해당 정규 표현식이 입력 텍스트와 매치되는지 확인해 볼 예정임. re.search()는 매치된다면 Match Object를 리턴하고,.. 2023. 2. 25.
[논문 리뷰] A self-Attentive model for Knowledge Tracing 보호되어 있는 글 입니다. 2023. 2. 22.
[딥러닝을 이용한 자연어 처리 입문] 토큰화 및 전처리 오늘은 딥러닝을 이용한 자연어 처리 입문-1권에서 '2-1. 토큰화'와 '2-2. 정제와 정규화'에 해당되는 부분을 요약해보았습니다. 제가 텍스트 분석을 처음했을 때는 형태소 분석기의 종류가 다양하다는 것도 몰랐고, 형태소 분석기의 종류에 따라 분석 결과가 매우 다르게 나올 수 있다는 점도 몰랐습니다. 이 글을 읽고 텍스트 분석을 하신다면 분석 자료에 다양한 형태소 분석기를 테스트 해보시고, 분석 결과를 비교해보시면 좋을 것 같습니다! 2. 텍스트 전처리(Text preprocessing) 텍스트 전처리는 풀고자 하는 문제의 용도에 맞게 텍스트를 사전에 처리하는 작업 2-1. 토큰화(Tokenization) 토큰화는 주어진 자료를 토큰이라는 단위로 나누는 작업을 말하며, 토큰의 단위는 상황에 따라 다르게.. 2023. 2. 19.