기후위기시계
실시간 뉴스
  • “분명 내 딸 목소리였는데 ‘소름’” 5초 음성만 있으면 깜빡 속는다
지난해 10월 경찰청이 공식 유튜브 채널을 통해 공개한 ‘내 딸인 줄 알았는데…’라는 제목의 공익 영상. [경찰청 공식 유튜브 채널]

[헤럴드경제=박로명 기자] “엄마, 휴대폰 수리비 80만원만 보내줘. 액정도 나갔고, 부품도 갈고 하면 그 정도 하지. 아무튼 돈 보내줘.”

영상 속 어머니는 집에서 요리를 하며 딸과 통화하고 있다. 휴대폰이 고장 났다며 수화기 너머로 투정을 부리는 딸. 어머니는 “무슨 수리비가 그렇게 비싸?”라며 반문하는데, 같은 시간 열리는 현관문. 거실로 들어오며 “다녀왔습니다”라며 인사하는 딸. 그리고 아직도 휴대폰에선 엄마를 찾는 딸의 목소리가 울려 퍼진다. 어머니는 그 자리에서 얼어붙은 채 온몸에 소름이 돋는데….

이 영상은 지난해 10월 갈수록 진화하는 보이스피싱 수법에 대한 경각심을 일깨우기 위해 경찰청이 제작한 공익 영상이다. 최근 인공지능(AI) 기술이 발전하면서 5초짜리 음성 파일만 있어도 가족, 연인 등의 음색과 억양 등을 복제하는 것이 가능해졌다. 이를 ‘딥보이스’ 기술이라고 부르는데, 이미 해외에선 AI를 동원한 사기 범죄의 피해 사례가 여러 차례 보고되고 있다.

유튜브에서 큰 인기를 끌고 있는 AI 커버곡. [유튜브 캡처]
보안 전문가들 “AI 악용한 사기 범죄 우려”

보안 전문가들은 국내에서도 AI 음성 복제 기능을 악용한 사기 범죄가 확산될 수 있다고 경고하고 있다. 전문가가 아니더라도 목소리 녹음 파일과 프로그램만 있으면 실제 사람과 구분이 어려울 정도로 유사한 목소리를 만들어낼 수 있다는 게 이들의 설명이다. 실제로 유튜브엔 ‘브루노 마스가 부르는 뉴진스의 하입보이’, ‘16년 박효신을 학습한 AI’ 등 AI로 복제한 커버곡이 다수 올라와있다.

화이트 해커 전문가 그룹인 SK쉴더스 EQST랩 이호석 담당은 “AI 기술이 고도화되면서 사람의 영상이나 목소리와 합성하는 딥페이크·딥보이스 기술이 악용되고 있다”며 “5초 정도의 음성만 있으면 특정인의 목소리를 복제할 수 있어서 합성된 아이의 목소리를 들려주고 돈을 요구하는 보이스피싱 사례가 등장하고 있다”고 설명했다. 이어 “모방을 이용한 피싱 모델 패턴이 정교해지는 추세”라고 덧붙였다.

지난해 10월 경찰청이 공식 유튜브 채널을 통해 공개한 ‘내 딸인 줄 알았는데…’라는 제목의 공익 영상. [경찰청 공식 유튜브 채널]
지인에게 걸려온 영상통화…알고보니 사기범

이미 해외에서는 가까운 사람의 목소리를 흉내내 거액을 가로챘다는 보도가 나오고 있다. 지난 4월 중국 푸저우시(福州市)의 한 기업 대표 궈(郭) 모 씨는 지인을 사칭한 피싱범에게 속아 10분 만에 8억원을 이체했다. 사기범은 딥페이크·딥보이스 악용해 지인의 얼굴과 음성을 위조, 궈 모 씨에게 ‘위챗(중국 메신저앱)’으로 영상 통화를 걸어 거액을 뜯어냈다.

지난 2021년엔 아랍에미리트(UAE)의 한 대기업 임원이 거래처 전화를 받고 420억원을 송금했다가 딥보이스 범죄라는 게 밝혀지기도 했다. 올 초 캐나다에서도 73세 여성이 손자의 목소리를 위조한 사기범으로부터 “할머니, 유치장에 갇혀있는데 보석금이 필요하다”는 전화를 받고 900만원을 송금할 뻔한 사건이 발생했다.

지난 2021년 가수 아이유와 똑닮은 얼굴로 온라인에서 화제가 된 중국의 한 인플루언서. 그러나 실제 모습으로 추정되는 영상이 올라오며 딥페이크 기술을 활용한 ‘가짜’ 의혹이 불거졌다. [해당 계정 캡쳐]
딥보이스 구분 방법? “발음 부정확하면 의심”

아직 국내에선 딥보이스를 활용한 보이스피싱 신고 및 검거 사례가 보고된 적은 없는 것으로 알려졌다. 하지만 AI 기술을 악용한 사기가 국내에서도 확산될 가능성이 큰 만큼 검찰청은 2027년까지 딥보이스 가짜음성을 탐지하는 기술 개발에 착수했다. 현재로선 의심스러운 전화를 받으면 여러 차례 확인하며 조심하는 수밖엔 없다.

학계에서도 딥보이스 범죄 예방을 위한 연구에 매진하고 있다. 지난달 음성 분석 전문가인 조동욱 충북도립대 생체신호분석연구실 교수는 딥보이스 구분 방법에 대한 연구결과를 내놓았다. 조 교수는 피실험자의 음성 샘플 2개를 전문업체에 보내 딥보이스를 만든 뒤 이를 음성 분석기로 진단해 실제와의 차이를 연구했다.

조 교수는 “한국어 딥보이스는 복잡하고 긴 문장에서 발음의 정확도가 떨어져 음성 강도가 낮아지는 특성을 보였다”며 “전화기 너머로 들리는 진짜 같은 가짜 음성을 쉽게 구분하기는 힘들지만, 평소보다 힘 없이 느껴지거나 일부 단어의 발음이 부정확하다고 판단되면 보이스피싱을 의심해 볼 수 있다”고 설명했다.

dodo@heraldcorp.com

맞춤 정보
    당신을 위한 추천 정보
      많이 본 정보
      오늘의 인기정보
        이슈 & 토픽
          비즈 링크