상대적으로 큰 원문을 핵심 내용만 같추려서 상대적으로 작은 요약문으로 변환하는 것.
ex. 상대적으로 큰 뉴스기사를 상대적으로 작은 뉴스 제목으로 만들어내는 것
추출적 요약(Extractive Summarization)
원문에서 중요한 핵심 문장 또는 단어를 그대로 추출해서 이들로 구성된 요약문을 만드는 방법
추출적 요약의 결과로 나온 요약문의 문장이나 단어는 모두 원문에 있는 문장 혹은 단어
전통적인 머신 러닝 방식에 속하는 텍스트 랭크(TextRank)와 같은 알고리즘을 사용해서 이 방법을 사용
이미 존재하는 문장이나 단어구로 표현하기 때문에, 모델의 언어 표현 능력이 제한됨.
추상적 요약(Abstractive Summarization)
원문에 없던 문장이라도 핵심 문맥을 반영한 새로운 문장을 생성해서 원문을 요약하는 방법(NLG : Natural Language Generation)
주로 인공신경망을 사용하며, 대표적인 모델로 seq2seq를 사용
인공신경망은 기본적으로 지도학습이기 때문에 '원문'뿐안 아니라 '실제 요약문'이라는 레이블 데이터가 필요하다는 단점이 있다.
참고자료
'Aiffel > Fundamental' 카테고리의 다른 글
TensorFlow2 API (0) | 2022.01.28 |
---|---|
seq2seq(Sequence to Sequence) (0) | 2022.01.27 |
Softmax 함수와 Cross Entropy (0) | 2022.01.24 |
로지스틱 회귀분석(Logistic Regression) (0) | 2022.01.24 |
경사하강법(Gradient Descent) (0) | 2022.01.21 |
댓글