전북대학교 소프트웨어공학과의 적응형 AI 연구팀(연구책임자 조재혁 교수, 박사과정 유서현)이 국제 공동연구를 통해 소셜 미디어상의 루머 텍스트를 분류할 수 있는 ‘하이브리드 딥러닝 모델’을 개발했다.
하이브리드 딥러닝 모델은 속칭 가짜뉴스와 허위 루머 등을 효과적으로 탐지하고 분류하는 기술이다.
이같은 연구 결과를 담은 논문은 SCIE 상위 IF 10% 이내 저널인 ‘Alexandria Engineering Journal’에 게재됐다.
연구팀의 연구는 두 단계의 특징 추출 기법으로 진행됐다. 첫 번째 단계에서 자연어 처리(NLP) 분야에서 널리 사용되는 딥러닝 모델인 ‘BERT’와 이미지 처리에 최적화 된 딥러닝 모델인 ‘CNN(BERT-OPCNN)’을 활용해 텍스트 데이터를 임베딩하고 특징을 추출했다.
BERT는 문맥 정보를 양방향으로 처리하여 텍스트의 의미를 더욱 정확하게 파악하며, 최적화된 CNN은 다양한 패턴을 학습하여 지역적 및 전역적 특징을 효과적으로 추출하는 데 기여했다.
이어 두 번째 단계에서 단어 임베딩 기법인 ‘FastText’와 정보이득 기반의 개미군집 최적화(FIAC)를 적용하여 정교한 특징 벡터를 생성했다.
FastText는 단어를 n-gram 방식으로 분해해 드문 단어나 잘못된 단어에 대한 임베딩을 생성하고, 정보이득 기법(IG)을 통해 의미 있는 특징들을 선택하여 개미군집 알고리즘(AGO)으로 최적화했다.
연구 결과, 제안된 모델은 LIAR와 Fake & Real News (ISOT) 데이터셋에서 각각 98.24%의 높은 정확도를 기록했다.
조재혁 교수는 “이번 연구가 소셜 미디어에서 잘못된 정보의 확산을 방지하고 신뢰할 수 있는 정보 환경을 조성하는 데 중요한 기여를 할 것”이라며 “향후 다양한 언어와 플랫폼에 적용 가능한 확장 연구를 통해 루머 탐지 기술의 상용화를 목표로 할 것”이라고 밝혔다.
한편, 이번 연구는 한국 환경산업기술원과 과학기술정보통신부의 지원을 받아 진행됐으며, 연구팀은 현재 기술의 상용화를 위해 특허 출원(2024.07)을 마쳤으며, 등록 절차를 진행 중이다.
※ 아래 경우에는 고지 없이 삭제하겠습니다.
·음란 및 청소년 유해 정보 ·개인정보 ·명예훼손 소지가 있는 댓글 ·같은(또는 일부만 다르게 쓴) 글 2회 이상의 댓글 · 차별(비하)하는 단어를 사용하거나 내용의 댓글 ·기타 관련 법률 및 법령에 어긋나는 댓글
BEST 댓글
답글과 추천수를 합산하여 자동으로 노출됩니다.