이건재 KAIST 신소재공학과 교수. KAIST제공

인간의 달팽이관을 본따 인식률을 크게 높인 인공지능 기반 음성센서가 개발됐다.

한국과학기술원(KAIST)은 신소재공학과 이건재 교수와 전기및전자공학부 유창동 교수 공동 연구팀이 ‘인공지능 기반의 화자(話者) 인식용 유연 압전 음성센서’를 개발했다고 4일 밝혔다.

음성 센서는 인간-기계 사이 자유로운 소통을 가능케 하는 4차 산업혁명의 핵심 기술이다.

하지만 현재 산업계가 음성 신호 수신 시 정전용량을 측정하는 콘덴서 형식을 사용하기 때문에 민감도가 낮고 인식 거리 역시 짧아 ‘누가 이야기하는지 찾아내는’ 화자 인식률에 한계가 있다는 문제점이 있었다.
KAIST연구팀이 개발한 ‘인공지능 기반의 화자(話者) 인식용 유연 압전 음성센서’ 원리. KAIST 제공

이에 연구팀은 인간의 달팽이관을 모사해 주파수에 따라 다른 영역이 진동하는 사다리꼴의 얇은 막을 제작했다. 음성신호에 따른 ‘공진형 진동’을 유연 압전 물질로 감지하는 자가발전 고민감 음성 센서를 개발한 것이다.

이 음성 센서는 기존 기술 대비 2배 이상 높은 민감도를 가져 미세한 음성 신호라도 원거리에서 감지할 수 있다. 또 다채널로 신호를 받아들여 1개의 언어에서도 여러개의 데이터를 얻을 수 있다.

연구팀은 해당 기술을 화자인식 시스템에 적용해 화자인식 성공률 97.5% 확보했으며, 오류 역시 기존 기술에 비해 75% 이상 줄였다.

KAIST는 이번 연구가 스마트 홈 가전이나 인공지능 비서, 생체 인증 분야 등 차세대 기술에 활용 가능할 것으로 기대하고 있다.

이건재 교수는 “이번에 개발한 머신 러닝 기반 고민감 유연 압전 음성센서는 화자를 정확하게 구별할 수 있어 스마트 가전이나 인공지능 비서에 접목할 수 있을 것”이라며 “생체 인증 및 핀테크와 같은 보안 분야에서도 큰 역할을 할 수 있을 것이다”라고 말했다.

한편 이번 연구 결과는 국제 학술지인 나노 에너지(Nano Energy) 9월호에 ‘민감도’와 ‘화자인식’ 논문 두 편으로 동시 게재됐다.

대전=전희진 기자 heejin@kmib.co.kr
트위터페이스북구글플러스