Posted in

KAIST-국보연, 한국어 AI 댓글 판별 기술 개발

한국어 AI 댓글 판별 기술이 개발 되었습니다. 최근 KAIST-국보연은 시장에서 AI 댓글 탐지 기술이 영어권을 대상으로 개발되 한국어의 짧고 구어체 형태의 AI 댓글을 판단하는데 어려웠던 점을 개선하여, 한국어로 된 대량 AI 댓글을 탐지하여 여론 조작 활용을 차단할 토대를 마련하였습니다.

KAIST-국보연, 한국어 AI 댓글 판별 기술 개발

🇰🇷 한국어 AI 댓글 판별 기술 ‘XDAC’의 등장

KAIST 김용대 교수 연구팀은 국가보안기술연구소와 협력하여 국내 최초로 한국어 기반의 AI 댓글 탐지 기술인 ‘XDAC‘을 개발했습니다. XDAC은 기존 기술로는 판별하기 어려웠던 짧은 한국어 댓글에 특화된 탐지 기술입니다.

AI 댓글, 정말 구별할 수 없을까?

생성형 AI는 최근 기사 맥락에 맞는 감정과 논조까지 조절할 수 있는 수준에 이르렀습니다. 몇 시간 안에 수십만 개의 댓글을 자동으로 생성해 여론을 조작할 가능성도 제기되고 있습니다.

연구 결과:

  • AI 댓글의 67%는 사람이 쓴 것으로 오인됨
  • 실제 사람 댓글도 73%만 정확히 구분됨

놀랍게도 AI가 쓴 댓글은 기사 맥락 적합성, 문장 유창성, 편향성 평가 등 여러 항목에서 사람 댓글보다 더 높은 점수를 받았습니다.

기존 기술의 한계

  • 대부분의 AI 탐지 기술은 영어 기반, 장문 위주로 개발
  • 한국어 댓글은 짧고 구어체가 많아 탐지 어려움
  • 이모지, 비속어, 반복 문자 등 비정형 요소 다수 포함
  • 현실적인 데이터셋 부족으로 학습 어려움

XDAC의 기술적 전략

연구팀은 네 가지 전략을 결합한 AI 댓글 생성 프레임워크를 개발했습니다:

  1. 14종의 다양한 LLM 활용
  2. 자연스러운 표현 강화
  3. 감정 조절 세밀화
  4. 참조 자료 기반 댓글 생성

이 전략을 통해 실제 이용자 스타일에 가까운 한국어 AI 댓글 데이터셋을 구축했고, 일부는 벤치마크용으로 공개되었습니다.

AI 댓글과 사람 댓글의 차이점

형식적 표현

  • AI: “~인 것 같다”, “~에 대해”, 접속어 사용 많음
  • 사람: “ㅋㅋㅋㅋ”, “ㅎㅎㅎㅎ”, 특수기호, 줄바꿈 등 자유로운 표현 선호

특수문자 사용

  • AI: 세계적으로 통용되는 이모지 주로 사용
  • 사람: 한국어 자음(ㅋ, ㅠ, ㅜ), 문화적 특수 문자 활용

서식 문자 사용

  • 사람 댓글의 26%는 줄바꿈·공백 포함
  • AI 댓글은 단 1%만 포함

반복 문자 사용 비율

  • 사람: 52%
  • AI: 12%

XDAC의 성능과 기술력

XDAC는 위 차이점들을 정밀하게 반영해 탐지 성능을 높였습니다.

  • F1 점수 기준 탐지 정확도: 98.5%
  • 댓글 생성 모델 식별 정확도: 84.3%

또한 반복 문자 패턴 분석, 서식 문자의 기계 학습 처리를 통해 더욱 정교한 분석이 가능해졌습니다.

기술의 사회적 의미

고우영 선임연구원은 이번 연구가 세계 최초로 한국어 기반의 AI 댓글 판별 기술임을 강조하며, 다음과 같은 효과를 기대한다고 밝혔습니다:

“AI 기반 여론 조작에 대응할 수 있는 기술적 기반을 마련했습니다.”

XDAC는 탐지를 넘어 심리적 억제 장치로도 기능할 수 있습니다. 마치 음주 단속, 마약 검사, CCTV가 범죄 억제 효과를 가지듯, 이 기술의 존재만으로도 악용 시도를 줄일 수 있습니다.

앞으로의 활용 가능성

  • 플랫폼 사업자의 계정 모니터링, 조직적 여론 조작 대응
  • 실시간 감시 시스템, 자동 대응 알고리즘 확장 가능

이번 연구는 설명 가능한 AI(XAI) 기반 탐지 프레임워크로서 세계적 학회 ACL 2025에 채택되어 기술력을 인정받았습니다.

XDAC 기술은 단순히 AI 댓글을 가려내는 데서 그치지 않고, 향후 디지털 사회에서 정보의 신뢰성을 지키는 중요한 수단으로 자리매김할 것으로 기대됩니다.

[다른글]

https://teamup.kr/information/첨단-운전자-보조-시스템