본문 바로가기

나의 이야기/컴퓨터관련

사투리 알아듣는 갤S4 "그게 참말이여?"

"갤럭시S4가 참말로 사투리도 알아듣는교?"

지난 22일 본지가 갤럭시S4의 S트랜슬레이터를 이용해 사투리 문장 인식여부에 대한 실험을 진행한 결과 간단한 사투리 문장을 인식하고 이를 의미가 통하는 영어로 번역해주는 것으로 확인됐다.

갤럭시S4에는 음성 인식 기술을 이용한 다양한 기능이 탑재됐다. 새로운 기능인 S트랜슬레이터와 S보이스드라이브가 추가됐다. 인식률과 정확도, 속도 측면에서도 전작인 갤럭시S3와 비교해 많은 개선이 이뤄졌다.

먼저 경상도 사투리 문장을 인식하는 실험을 진행한 결과 '내 그거는 몬한다'라는 문장은 'I am poor at that'으로 '밥뭇나'는 'Did you have a meal'로 번역했다. 이 밖에도 '뭐라카노'는 'What did you say?'로, '퍼뜩 온나'는 'Come suddenly', '욕봤다'는 'It had a hard time'으로 번역이 됐다.



▲ 갤럭시S4에 탑재된 'S트랜슬레이터'가 간단한 사투리 문장을 인식하고 이를 의미가 통하는 영어로 번역해주는 것으로 확인됐다.

서술어 외에 개별 단어에 대한 인식도 가능했다. '토깽이(토끼)'는 'Rabbit', '정구지찌짐(부추부침개)'은 'Chives Jeon', 머시마(머스마)는 'Man', 가시나는 'Girl', '이바구(이야기)'는 'tell'로 변환이 됐다.

전라도 사투리도 마찬가지로 인식됐다. '허벌나게 빨리와'는 'Come very quickly'로, '벌써 했다니께요'는 'I did already', '누구 없는겨'는 'There is no with someone', 우짜까(어쩌면 좋을까)는 'I unavoidable'으로, '아니어라'는 'Isn't it'으로 각각 해석이 됐다.



강원도 사투리 '안녕하셨드래요?'라고 말하자 자동으로 '안녕하세요'로 변환돼 'Hello'로 번역됐다. 이 밖에 '마이 아파'는 'I am much sick'으로, '날래 말해보라우'는 'Tell quickly'로 변환됐다. '핵교'나 '아제' 같은 개별 단어도 각각 'School'과 'Uncle'로 번역이 됐다.

충청도 사투리에 대한 실험도 진행한 결과 '가차워(가깝다)'는 'It is near', '난 잘 모르는디'는 'I don't know well', '시방 그게 참말이여'는 'That is really the word now', '깨구락지'는 'frog'로 번역되는 것을 확인할 수 있었다.



하지만 실험 과정에서 긴 문장의 사투리의 경우 인식 정확도가 현저히 떨어졌다. 짧은 문장이나 단어의 경우에만 제대로 인식해 번역해주며 표준어와 지나치게 발음이 다르거나 혹은 지방에서도 잘 쓰이지 않는 오래된 사투리도 제외다.

기본적으로 S보이스나 S트랜슬레이터 등 음성인식 서비스는 네트워크를 기반으로 작동된다. 음성을 입력하면 데이터를 분석해서 서버에 저장된 데이터베이스(DB)와 매칭을 하는 방식이다. 삼성전자도 음성인식 서비스에 인식률을 높이기 위해 실제 인력을 투입해 다양한 억양과 어휘에 대한 테스트를 거쳤다.

삼성전자 관계자는 "음성인식 서비스는 얼마나 많은 데이터베이스를 축적했느냐에 따라 인식률이 결정된다"면서 "인식률을 높이기 위해서 자체 검증팀에서 각 지역 출신 인력을 총동원해 지역별 말에 대한 다양한 테스트를 진행했다"고 말했다.