본문 바로가기

게임

윈도우10 음성인식 명령과 음성명령 프로그램으로 PC 게임하기 (GAVPI 사용법)


윈도우에는 음성인식 엔진이 기본적으로 내장되있지만 Text-to-Speech 기능밖에 되지 않는다.

음성명령으로 키보드를 조작하고 마우스를 움직이는 등의 음성명령 기능은 아직 한국어 지원이 안된다.

윈도우10의 한국어 코타나 음성인식 프로그램도 곧 된다고 하더니 아직 소식이 없다.


아무튼 키보드 조작이 많은 게임에서 음성명령을 활용하려면 음성인식이 가능한 언어인 영어팩과 영어음성팩을 설치하고 윈도우 기본 언어를 영어로 한번 바꿔줘야 된다.

그리고 마이크 음성인식 트레이닝 설정과 코타나 설정 등을 마친 후 윈도우 기본 언어를 다시 한글로 변경하면 된다.

그 후 영어 코타나 기능을 사용해도 되고, 코타나 음성 비서 기능을 꺼두고 다른 음성명령 프로그램을 설치해서 사용해도 된다.

** 윈도우 기본 언어를 영어로해야 음성명령 기능이 활성화되는줄 알았는데 기본 언어팩을 한글로 해도 잘 작동한다. 그냥 언어팩만 영어로 설치해주면 된다.


유로트럭이나 아르마3 같은 키보드 입력이 많은 게임에서 많이 활용되고 있는 음성명령 프로그램들은 꽤 많은 편이다.

voice attack, glovePIE, articulate(arma3전용) 가 대표적임.


GlovePIE 같은 경우 이 분야에서 가장 대표적인 유틸인 것 같다.

인풋 에뮬레이터(Input Emulator) 라고 통칭되는 프로그램들인데 키보드, 마우스, 게임패드, 위모트같은 리모컨, 마이크 등의 PC입력장치들을 사용자 마음대로 바꿔서 활용할 수 있다.

glovePIE는 음성명령이나 키보드, 마우스 등의 기본적인 장치의 매크로 밖에 되지 않는 다른 프로그램과 달리 거의 모든 입력 장치들 지원하고 활용법도 다양하다.

기본 사용법은 다른 유틸과 비슷하지만, 더 심도깊게 활용하려면 스크립트를 짜야하기때문에 복잡하고 어렵다.

사용자도 많고 활용 가능한 스크립트 프로파일도 많이 나와있다.

2010년 이후 업데이트가 중단됐는데 게임 등에서 문제가 될수도 있다고 한다. 윈도우10에서 잘 작동하는지는 모르겠다.

- 다운로드

 http://www.softpedia.com/get/System/OS-Enhancements/GlovePIE.shtml

요즘엔 FreePIE 를 많이 사용하는듯.

http://andersmalmgren.github.io/FreePIE/



GAVPI 라는 프로그램도 있는데 쉽고 가볍게 작동한다는게 장점이다. 그냥 간단하게 몇가지 명령만 활용할거라면 GAVPI도 괜찮을 것 같다.


아래에 간단한 사용법을 올려본다.

(스샷이 많아 길지만 간단함 ㅡㅡ; )


윈도우10 음성인식(코타나 설치 및 사용법)


> 시간 및 언어 > 지역 및 언어 > 에 들어 언어 추가를 누르고 영어(미국)팩영어음성팩을 같이 설치한다.

영어팩이 지역별로 여러개 있는데 미국팩이 음성인식률 등에서 가장 완성도가 높다고 함.

설치 후 기본값으로 설정을 눌러 영문 윈도우로 변경해야 한다. 그리고 로그아웃이나 재부팅하면 됨.


△ 로그인해서 같은 설정 메뉴에 있는 Speech에 들어가면 음성인식 기능이 English로 활성화되어있다.

Recognize non-native를 체크해서 비원어민 억양도 인식하게 한다.

위 Speech 설정 메뉴에서 설정한건 코타나같은 윈도우 기본 음성인식 기능에 적용되는 것 같다. 다른 프로그램은 구제어판 음성인식 설정이 적용되는 것 같다.


△ 작업표시줄에 있는 키보드 레이아웃 아이콘을 좌클릭해 Korean으로 변경해야 한글 키보드 사용이 가능함.


△ GAVPI에 적용되는 음성인식 설정은 제어판Speech Recognition에서 하면 된다.


△ 음성 인식 설정 메뉴에 들어가 Advanced speech options  클릭.


Audio Input을 눌러 마이크 레벨을 조정해서 인식률을 높인다.

위의 볼륨 70에 증폭 +20 은 저가 마이크 추천 설정값이다..


△ 그 다음에 Configure Microphone를 눌러 마이크 설정을 한다.


△ 마이크 종류를 설정하고 next를 클릭.


△ 그러면 음성인식률을 높이기 위한 마이크 테스트가 시작된다.

대충 읽어서 마치면 되는 것 같다.


△ 음성인식률을 높이기 위한 본격적인 설정은 프로파일 트레이닝에서 한다.

Default Speech Profiles에 덮어씌우든지 아니면 새로 만들고 Train Profile 을 눌러 트레이닝시키면 된다.


△ 트레이닝 텍스트 창에 보이는 문장을 읽어서 마지막 단계까지 마쳐야 된다.

단계는 좀 긴 편이다. 간단한 단어나 짧은 문장 인식률은 첫 트레이닝 단계로 충분할듯 하다. 잘 알아듣는다.

어려운 단어나 긴 문장같은 발음의 음성인식률을 더 높이기위해선 첫 코스를 마친 후 advanced 코스를 눌러 계속 트레이닝 해나가면 된다고 한다. 코스가 진행될 수록 문장도 복잡해지고 단어도 어려워진다.


발음이 그리 좋지못하다면 문장을 읽을 때 다양한 억양과 구성으로 인식시켜주면 인식률이 더 좋아지는 것 같다.

예를 들면 L발음이나 R 발음이 대표적인데 문장에 어떤 문장은 한국식+독일식으로, 어떤 문장은 정확한 발음이 아니더라도 혀를 매우 꼬아주면 된다. ㅡㅡ;; All 이라는 단어라면 한글 발음인 올을 그대로 읽어버리고, 어떤 문장에서는 가능한 정확한 발음으로 읽어준다. 그러면 all이든 올이든 몽땅 다 알아듣는다..

물론 단점으로 인식정확도가 떨어져 길고 어려운 문장 인식률은 감소한다.


△ 텍스트를 음성으로 읽어주는 Text-to-Speech 설정은 위에서 하면 된다.

David(남성)과 Zira(여성)가 있음.


△ 음성인식 관련 모든 설정을 마치면 '시간 및 언어' > '지역 및 언어'에서 'Windows 표시 언어'를 한국어로 다시 바꿔주고 재부팅 또는 로그아웃 후 로그인하면 된다.

△ 재부팅 후 다시 '지역 및 언어' 설정으로 들어가 우측 '관련 설정'에 있는 '관리 언어 설정'을 누른다.

'국가 또는 지역' 설정창이 뜨면 '시스템 로캘 변경'을 눌러 시스템 로캘 언어를 '한국어(대한민국)'/Korean(Korean) 을 선택한 후 다시 윈도우 재시작하면 된다.

시스템 로캘 언어까지 변경해야 영문 윈도우에 한글팩을 설치해 사용할 때 한글 깨짐 현상이 발생하지 않음. 로캘 설정 아래에 있는 'Beta: Unicode UTF-8 사용' 옵션은 기본값 그대로 체크해제. (체크하면 한글 깨짐)

음성 언어 설정이 활성화되어 있는지 확인.

△ 코타나 관련 설정은 '접근성' > '음성 명령' 과 아래 스샷의 '개인 정보' > '음성, 수동 입력 및 입력' 에서 하는 것 같다.

코타나는 비활성화하고 다른 써드파티 프로그램을 사용해도 된다.




GAVPI 사용법

- https://github.com/baykovr/AVPI

+ 다운로드 -  https://github.com/baykovr/AVPI/releases/tag/17.03.15



△ GAVPI를 다운받아 적당한 곳에 압축해체한 후 실행만 하면 된다.


△ 프로파일 폴더에 xml 파일로 프로파일이 저장되는데 메모장으로 수정 가능하다.

샘플 프로파일이 있어서 프로그램을 어떻게 사용하는지 알아볼 수 있음.


△ 프로파일을 메모장으로 열어본 모습.

프로파일 만들고 저장할 때 Associate with로 특정게임과 연결했다면 <Database /> 바로 위에 관련 줄이 포함되는데,  만든 프로파일을 저장한 후 중간에 게임링크를 없애고 글로벌로 적용되게 변경하면 정상작동하지 않는다.

그럴때는 xml을 메모장으로 열어 <gavpi><Database /> 사이에 있는 줄을 모두 삭제해버려야 된다.


또 프로그램 실행창에 등록하는 영역의 스크롤바가 제대로 작동하지 않아 명령어수가 많아지면 제대로 사용할수가 없을 정도다. 그럴때는 xml파일을 메모장으로 열어 저장된 값을 참고해 수동으로 입력해줘야 한다.

수동입력 시 필요한 줄은 세가지다.

<action_sequence ...> ... </action_sequence> 부분, <trigger ...> ... </trigger> 부분, <trigger_event ... > ... </trigger_event>

위 세 줄에서 처음은 키입력 부분이고 그 다음은 음성명령, 그리고마지막은 두 값을 연결시키는 이벤트 부분임.

name은 하나라도 겹쳐서는 안되고, 종류별로 줄을 비워서 구분해두면 나중에 수정하기 편함.


open profile을 눌러 프로파일을 불러올 수 있다.

옆의 프로파일 메뉴의 modify에서 수정하면 됨.


Settings에 들어가 알맞게 설정한다.


프로파일을 눌러 New 클릭


ActionSequence 영역을 우클릭해서 New Sequence 를 만든다.


Sequence name를 알아보기 쉽게 만든 후, key/mouse Press 를 선택하고 Add New Action 을 클릭


△ 키 액션창이 뜨면 타입Keypress로 선택하고


From Press 를 누르고 할당할 키를 키보드로 눌러준다.

ctrl키나 shift키는 반응하지 않는데 스크롤메뉴에서 상단에 있는 shift, control key를 지정해주면 된다.

동시키는 나란히 두 키만 등록해주면 된다.


keydown은 누른 상태고 keyup은 뗀 상태므로 keypress와 같은 작동을 하게하려면 keydown을 먼저 등록한 뒤 timing을 약 300ms 정도 주고 keyup을 등록해주면 된다.

게임 내 어떤 키들은 keypress 스위치 한번만으로 작동을 안하는 경우가 있는데 (유로트럭2의 activate인 엔터키) 그럴때 keydown과 keyup 사이에 일정 시간을 지정해주면 된다.

음성명령으로 연속해서 여러 키가 눌러지도록 할 때에도 timig값을 사이사이에 적절한 시간으로 넣어줘야 동시입력으로 인식하지 않는다. 연속 입력 매크로 키 타이밍은 일반적으로 300ms를 많이 사용하는 것 같다.



save를 눌러 저장.


ActionSequence를 만들었다면 연동되는 음성명령 트리거를 만들어야 된다. (순서는 상관없음)

Triggers 영역을 우클릭해서 New > Phrase 를 만든다.


트리거이름을 알아보기 쉽게 만들고 Speach Recognition Word or Phrase음성명령어를 입력한다.


△ 키시퀀스와 음성트리거를 만들고 난 후,

ActionSequence에 등록된 키시퀀스를 우클릭해서 Add to Trigger 를 누른다.


Add to Trigger 창에서 음성명령과 키를 링크시키면 된다.


△ 하나의 작업이 끝나면 위와 같이 된다. 트리거를 클릭하면 트리거이벤트창에 위처럼 정보가 나와야 됨.

명령어가 너무 많아 실수로 Add to Trigger 작업을 안한게 있다면 트리거 이벤트창에 아무런 정보가 안나온다.

메모장을 열어두고 테스트를 하면 된다. 음성인식은 되는데 메모장에서 아무런 키가 입력되지 않는다면 링크가 안된 경우임.


△ 키시퀀스에는 여러가지 키보드/마우스조합도 가능하고 사운드파일도 재생할 수 있다.

유로트럭같은 경우 인테리어 좌우보기 외에도 경로관리자 키들을 등록해두면 편리하다. 다른 키들은 수동조작하는 맛이 없어져서 별로다.

네비게이션모드, 직업모드, 현재 차량 상태 등을 키로 등록해놓고 그 아래에 액션타입을 Speak Action 으로 선택한 후 추가해주면 된다.

그리고 입력창이 뜨면 Speak 선택 후 David이나 Zira 목소리로 들을 말을 입력해주면 된다. 그러면 navigation이라고 명령하면 경로관리자 1번 네비 모드로 바뀌는 동시에 위에 입력한 map mode 가 음성으로 출력된다.

setting에서 한국어 Heami로 지정하면 한글로도 가능함.






△ 작업을 다 마치면 save를 눌러 저장.


△ 불러온 프로파일은 아래 상태표시줄에 표시된다.

Listen을 눌러 활성화시킨 후 유로트럭2를 실행하면 된다.


△ 키시퀀스에 음성사운드 파일이나 speak 등록을 해놨다면 간혹 다른 음성명령어와 겹치기도하고 잘못 인식해서 다른 키가 작동하기도 한다.

그럴때는 윈도우 볼륨믹서의 볼륨 조절을 약간 줄여주면 됨.


listen을 눌러놓고 만든 프로파일을 테스트하면 된다.

메모장도 같이 띄워놓고 키가 정확히 입력되는지도 확인하면 된다.

음성 인식이 안되면 ? 로 뜬다. 정확한 발음을 까다롭게 요구한다면 음성인식 제어판에서 더 트레이닝시켜주면 될 것 같다.



- 비프 사운드 (Beep Sounds) 모음

Beep Sounds.zip



- 음성명령을 사용한 대표적인 게임 영상 (아르마3)

2018/01/10 - [게임&스포츠] - Arma3 대위 승급 심사





** 위 프로그램보다는 ui와 사용법이 간편한 voicemacro 프로그램이 더 나은 것 같다. 기능도 더 많고 초보부터 고급사용자까지 사용할 수 있게 잘 만들어진 프로그램같다. 최근업데이트로 조이스틱 패드도 지원됨.

https://www.voicemacro.net/