달력

3

« 2024/3 »

  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28
  • 29
  • 30
  • 31
반응형

보안 연구자들은 저렴한 이모티브(Emotiv) 헤드셋을 사용하여 자극에 대한 사용자들의 잠재적인 반응을 캡처하고 있다. 그리고 두뇌로부터 나온 데이터를 통해서 직접 비밀을 알아내는데 사용되고 있다. 이것은 프라이버시와 보안이라는 점에서 이론적으로 위험한 것이다. 왜냐하면 이것이 기술의 더 큰 발전과 함께 중요한 역할을 할 것이기 때문이다.

해커들이 마음을 읽어서 은행계좌 정보와 PIN 코드를 액세스할 수 있을까? 그것은 쉬운 일은 아니지만 컴퓨터 과학자들이 299달러에 달하는 Emotiv의 Epoc와 같은 무선 EEG 헤드셋을 사용한다면 이론적으로 가능하다는 것을 알게 되었다. 이것은 아직 대량으로 생산되는 기기는 아니지만 게임을 즐기거나 휠체어와 같은 기기를 제어하기 위해서 헤드셋을 사용하는 사람들은 자신들의 뇌를 해킹당할 수 있게 될지도 모른다.

Oxford 대학의 Ivan Martinovic은 이번 달 초 시애틀에서 열린 Usenix 보안 심포지엄에서 자신이 연구하고 있는 이 아이디어에 대하여 발표하였다. 연구팀에는 Berkeley의 California대학과 Geneva 대학이 함께 참여하였으며, ‘뇌-컴퓨터 인터페이스에 대한 부채널 공격의 가능성(On the Feasibility of Side-Channel Attacks with Brain-Computer Interface)’이라는 논문이 발표되었다.

연구의 한 가지 목표는 EEG 헤드셋이 개인정보보호에 위협이 되는지를 검토하는 것이다. 이와 같이 유용한 헤드셋이 많이 있지만, 그들은 Emotiv 기기를 사용하였다. 이것은 저가이며, 회사는 연구자들에게 유용한 API를 만들어주고, 개발자들을 위한 SDK(software development kit)를 가지고 있기 때문이다.

연구자들이 수십년 동안 뇌전도(electro-encephalogram)를 연구해온 의학 분야 외에, EEG 헤드셋은 게임과 애플리케이션 제어를 위해 가장 많이 사용되고 있다. 예를 들어, 어떤 사람은 Arena 게임에서 가상의 불덩이를 던지기 위해서 뇌파를 사용할 수 있으며, 실제 장난감 헬리콥터를 제어하기 위해서 사용할 수도 있다. 일반적으로 제어 과정은 한 번에 하나의 명령만을 마스터링하며, 윙크나 웃음과 같은 얼굴 표현이 사용될 수 있다.

이 외에도 두뇌는 외부자극에 자연스럽게 반응하게 된다. 가장 유용한 것 중 하나는 사용자가 관련된 무언가를 인식한 뒤에 약 30ms에 최고조에 이르는 P300 인식 응답이다. 연구팀이 개발한 인식 모델은 그들이 알지 못하는 테스트 주제 사진을 보여주면서 그들이 알고 있는 오바마의 얼굴을 보여주도록 하는 것이다.

그리고 나서 알지 못하는 데이터를 감지하도록 노력할 수 있다. 예를 들어, 집에 관한 테스트 주제와 사진을 갖게 된다면 그들이 사진을 보고 인식 응답을 찾아서 누가 살고 있는지를 알아내게 될 것이다. 연구팀은 주어진 시간의 60% 정도 내에서 집을 정확히 찾을 수 있었다.

신용카드, PIN과 관련된 사람의 영상을 보여줌으로써 해커는 개인 은행계좌 정보를 발견할 수 있게 될지도 모른다. 연구자들은 이러한 것을 했다고 주장하지 않았다. 그러나 Martinovic은 완전한 무작위 추측보다 실질적으로 더 잘 실행하고 있으며 더 세밀한 공격을 조사하고 있다고 심포지엄에서 말했다.

또한 이 시스템은 시장 연구 또는 질문 목적을 위해서 사용될 수 있다. 예를 들어 살인 장면 또는 강간 희생자들의 사진을 가지고 용의자를 테스트할 수 있는 것이다.

Martinovic은 “우리는 잠재의식 반응에 관심이 있다. 만약 당신이 거짓말을 하려고 한다면, 더 많은 주의를 필요로 할 것이다. 그리고 이것은 감지할 수 있는 더 좋은 신호들을 만들어낼 것”이라고 말했다.

뇌파는 추적하기에 매우 복잡하며, 잡음들로부터 신호를 추출하기 위해서 해야 할 많은 선처리작업이 요구된다. 또한 Emotiv와 같은 EEG 헤드셋은 P300 신호를 캡처하는데 적합하지 않다. 그러나 언젠가 두뇌 해커들은 얼굴과 두뇌 스캐닝의 결합에 의한 공동작업 없이도 유용한 신호를 갖게 될 것이다. 그렇게 된다면 실제로 개인정보보호에 대한 큰 위협으로 작용하게 될 것이다.

자료를 가져가실 때에는 출처 : KISTI 미리안글로벌동향브리핑(GTB)』를 밝혀 주시기 바랍니다.


반응형
:
Posted by 째시기
반응형

자동화된 스피치 인식을 새로운 양상으로 바꿀 수 있도록 하는 사전학습에 의하여 규정된 표준이 없이도 특정 언어를 인식할 수 있도록 하는 새로운 기술이 개발되어 선보였다. 현재의 컴퓨터 기술로 키보드가 아닌 음성만으로 명령수행이 가능한 시스템을 작동하여 수행하기 위해서는 거의 하루 이상의 시간이 소요될 수도 있을 것이다.

모바일폰을 통한 말에 의한 검색은 이미 대다수의 사람들에게 일상적인 부분인데, 이번에 개발된 기술은 인터넷을 통하여 특정 오디오 파일이나 영화 동영상 파일 등을 검색할 때 유용한 것으로 전해지지만, 상당한 수준의 스피치 인식을 달성하는 상당히 어려운 작업이다. 구어체는 일상적인 문어체와는 여러 측면에서 차이가 있고 개인별로 나타나는 편차 또한 큰 것이 사실이기 때문이다.

노르웨이 소재 VERDIKT ICT의 핵심역량과 가치창출에 관한 프로그램의 후원으로 노르웨이 과학기술대학의 일련의 연구진이 개발한 이번의 방법은 매우 혁신적인 방법으로, 차세대 음성인식 기술을 새로이 개발한 것으로 평가받고 있다. 노르웨이 연구팀은 전 세계에는 수많은 언어가 존재하지만 언어패턴이 발생하는 방법에 있어서는 근본적인 공통점이 있다는 것을 증명하였는데, 이와 같은 방법을 통하여 특정 머신들에 대하여 각각의 개별언어들에 대한 음성 데이터들을 제공하지 않으면서 다양한 언어에 적용 가능한 방법을 개발하여 선보인 것으로 전문가들은 해석하고 있다.

연구팀은 자신들의 기술 개발을 위한 접근방법에 있어서 음성학에 기반을 두고 수행하였는데, 다시 말하자면 인간 언어 사운드에 대한 광범위한 연구 자료들을 바탕으로 작업들을 수행한 것으로 전해진다. 연구진은 추가적인 스피치와 언어 관련 지식들을 시스템에 통합시켰는데, 예를 들어 사운드 주파수와 단어들 간의 상관관계와 단어들이 문장에서 어떤 식으로 조합되는지에 관한 부분들을 총체적으로 포함하고 있는 것으로 전해진다.

Svendsen 박사외 연구진이 개발한 본 방법에는 언어 기관의 어떠한 부분들이 마이크로폰이 캡처할 수 있는 음파의 압력에 대한 분석을 통하여 수행할 수 있는지도 포함하고 있는 것으로 전해진다. 현재까지는 언어 인식 시스템에 대한 두 가지 접근방법들이 가장 우세한 것으로 전해지고 있다. 한 가지 접근방법은 컴퓨터로 하여금 개별적인 사항을 기반으로 서로 다른 언어들을 인식시키도록 만드는 스피치 데이터와 소스 텍스트의 사용에 주로 기반을 두고 있는 것으로 전해진다.

또 다른 접근방법은 개별 사용자의 단어들과 사운드를 관찰하여 컴퓨터에 입력될 수 있는 일련의 규칙들을 유추하는 방식을 취하도록 하는 것인데, 예를 들어 보컬 코드에 있어서 사운드의 생산 동안 진동이 일어나는지의 여부와 더불어 해당 사운드가 어떤 식으로 전달될 수 있는 지까지 포함하여 사용자에게 제공되도록 만드는 것을 의미하고 있다.

연구진은 작은 언어 세그먼트를 분석하면서 특정 사운드가 약 750에서 1200헤르츠의 공명을 가지고 움직이게 되면, 이것이 "a"라는 문자를 포함하는 것이라고 제시하고 있으며, 350에서 800헤르츠로 범주가 나타나게 되면, `u`자를 의미하는 것이라고 언급한다. 또 다른 접근방법은 컴퓨터로 하여금 상당한 분량의 자료들을 입력하여 지속적인 트레이닝 효과를 거둘 수 있도록 지원하는 것이라고 연구진은 제시한다.

본질적으로, 컴퓨터라는 기계는 모든 사운드 자체를 동일한 것으로 인지하게 되는데, 데이터 드리븐 학습이 지속되면, 보다 높은 주파수가 발생하게 되면서 보다 적은 확률적인 부분으로 연결되어 제공되는 것이라고 연구진은 설명한다. 이와 같은 유형의 접근방법은 연구진이 인간 사용자 기반의 접근방법을 사용하는 것보다 더 많은 스피치 데이터를 처리할 수 있도록 만드는데, 일반적으로 인간 사용자가 취급할 수 있는 데이터의 분량에는 한계가 있기 때문인 것으로 여겨진다.

연구진은 이와 같은 접근방법에 대한 고찰을 통하여 통계적인 접근방법을 통한 어떠한 선택적인 방법이 유리한지에 대해 확신할 수 있었던 것으로 파악되고 있다. 현실 속의 언어에 존재하는 일련의 예측성 패턴에 대한 고려를 통하여 연구진은 시스템에 관련된 정보들을 포함하면서 데이터 드리븐 학습과 규칙 기반의 접근방법을 혼합시킬 수 있었던 것으로 여겨지고 있다.

일상적인 언어패턴들은 개인들의 심리, 방언, 교육수준, 건강상태에 따라 다양하게 나타나게 되는데, 이와 같은 모든 부분들이 종합되어 음성과 문장구조의 생성에 영향을 미치게 된다. 기계 자체가 언어를 이해하는 방식을 학습할 수 있도록 만들기 위해서는 일상적인 스피치와 언어에 있어서 가장 공통적으로 나타날 수 있는 변이체계에 대한 구분이 필요한 것으로 전해진다.

연구진은 현재 음성 생성에 있어서 존재하거나 부재하는 고유한 특성들이 무엇이고, 이에 대한 확률들을 결정지을 수 있는 요소가 무엇인지에 대한 컴퓨터 프로그램을 개발하고 있는데, 예를 들어 보컬 코드 진동이 발생하게 되면, 어떤 음성이 필요한지를 종합적으로 분석하게 된다. 이를 통하여 음성 자체를 분류할 수 있는 기준들을 만들 수 있었다고 제시한다.

노르웨이 연구진이 향후에 추진하여야 할 다음 단계의 노력은 경쟁력 있는 음성 인식 제품을 설계하는데 있어서 사용 가능한 특정 언어에 대한 독립적인 모듈 자체를 개발하는 것이다. 본 솔루션은 시간과 비용이라는 관점에서 상당한 절감이 가능할 것으로 여겨지는 중요한 기술로, 노르웨이어와 같은 소수어를 사용하는 사용자들에게도 커다란 이익이 될 것으로 기대된다고 말한다.

제품 개발을 통한 또 다른 부산물로 이와 같은 유형의 기술들은 다양한 언어들이 사용되는 문맥 자체에 있어서 갖가지 우수한 효과를 가질 수 있을 것으로 기대되는데, 특정 언어를 인식하는데 있어서 30초에서 60초만에 이를 수행할 수 있도록 지원할 수 있을 것으로 기대되어, 특정언어에서 언급된 프레젠테이션이 다른 프레젠테이션에서 인용될 때 이를 어떻게 연결시킬 수 있는지도 지원할 수 있을 것으로 기대된다. 특정 개인이 말하는 것을 신속하게 인지할 수 있는 연구로서 노르웨이 연구진의 연구는 가치가 있을 것으로 기대된다.

자료를 가져가실 때에는 출처 : KISTI 미리안글로벌동향브리핑(GTB)』를 밝혀 주시기 바랍니다.

반응형
:
Posted by 째시기
반응형

호주의 신생 벤처기업인 biNu사는 클라우드 컴퓨팅을 사용하여 일반폰 사용자들이 속도가 느린 네트워크에서도 웹에 손쉽게 접속할 수 있도록 만드는 새로운 기술을 개발하여 다음과 같이 선보이고 있다. 초고속 모바일 네트워크에 접속하지 못하거나 스마트폰을 소유하지 못한 사용자들의 경우에는 자신의 일반폰을 보다 스마트하게 만들고, 보다 빠르게 작동하도록 만드는 방법에 대하여 고심하고 있는 것이 현재 상황이다. 본 기업은 아직까지 개발도상국을 중심으로 일상적으로 사용되고 있는 2G 무선 네트워크나 일반 피처폰을 사용하여 페이스북이나 트위터를 업데이트하고 뉴스를 읽고, 웹을 검색하는 일련의 행위들을 수행 가능하도록 하는 소프트웨어를 이번에 개발하였다.

스마트폰이 아닌 일반폰에서 이와 같은 행위들을 수행하기 위해서는 모바일 브라우저를 사용해야 했지만, biNU사의 공동창업자인 Gour Lentell은 자사가 개발한 소프트웨어가 휴대폰 상의 데이터 처리 기능에 의존하지 않고 원격 서버를 통하여 구동되기 때문에 속도가 더 빠르고 데이터 효율성이 보장되고 있다는 장점을 역설하고 있다. 전세계에서 사용 중인 대다수의 휴대폰들은 아직까지 일상적인 피처폰 형태인 `dumb(통화만 가능한)` 수준의 휴대폰들이다. IT & 리서치 컨설팅 기업인 가트너사의 통계자료에 따르면, 전 세계에 존재하는 약 43억 대의 휴대폰 중에서 25퍼센트만이 스마트폰이고, 2012년 한 해 동안 약 18억 5천만 대의 휴대폰이 판매될 것이며 이 중 45퍼센트가 스마트폰이 될 것이라고 예측치를 제시하고 있다.

이와 같은 소프트웨어를 개발한 biNU사에게 향후 잠재적인 사용자들이 상당할 것으로 기대되는데, 지난 2010년 말 서비스를 시작하면서 약 4백만 명의 사용자들을 확보한 것으로 전해지는데, 이 중 대다수가 인도, 방글라데시, 나이지리아, 에티오피아, 짐바브웨를 포함한 아시아와 아프리카 국가로 조사되었다고 언급한다. 해당 지역의 사용자들은 biNU사에게 직접적으로 요금을 지불하기 보다는 선불폰 형식으로 자신들이 사용하는 데이터 분량만큼 요금을 지불하는 형식을 취하고 있는 것으로 조사되고 있다.

브로드밴드 연결망을 사용하여 랩톱이나 데스크톱 컴퓨터를 사용하여 웹을 서핑하는 것은 모바일 기반의 기기를 사용하여 서핑하는 것보다 상대적으로 수월한 것이 사실이다. 이는 브라우저가 해당 기기의 스크린 상에 수신되는 JTML이나 일련의 데이터들을 제공하기 위한 충분한 작업 수행이 가능하기 때문이고, 스마트폰을 통하여 모바일 브라우저를 구동하는 것은 상대적으로 낮은 연결속도로 인하여 일상적인 웹 형식보다 보다 단순화된 모바일에 특화된 페이지 형태로 운용되는 형식을 취하고 있기 때문인 것으로 해석된다. 그렇지만 일반 피처폰을 사용하여 웹사이트를 서핑하게 된다면, 가장 단순한 형식의 WAP 사이트라 할지라도 상당한 인내심이 요구된다. 이는 일반 피처폰이 가지고 있는 제한된 처리용량 때문이고, 피처폰을 가지고 2G 네트워크에서 필요한 작업을 수행하게 된다면 더 큰 인내심이 요구된다.

BiNu사가 이번에 개발한 소프트웨어에서는 다른 접근방법을 취하고 있는데, biNu사의 애플리케이션을 통하여 특정 애플리케이션 자체를 사용할 때 사용자의 스크린을 통하여 볼 수 있는 각각의 단어들이 분리된 상태에 제공되고 이와 같은 조작들이 작은 이미지 파일 형태로 원격 서버에 저장되고 스크린 상에 구동되어야만 할 때, 원격서버로부터 사용자의 휴대폰에 이를 무선으로 전송하는 방식을 취하게 되는 것이다. 이와 같은 파일들이 전송되면, 각각의 문자들은 일련의 텍스트 형태로 스크린 상에 제공되는데, biNu사의 소프트웨어는 이를 완전한 형태의 이미지로 볼 수 있도록 지원하게 된다. biNU사는 자사의 뉴스 리더 애플리케이션 상에 뉴스 기사와 같은 일련의 텍스트를 캐시 형태로 저장하여 보관하고 있어, 사용자가 자신의 스크린 상의 헤드라인을 클릭하게 되면 훨씬 빠른 속도의 로딩이 가능하도록 지원할 수 있게 된다.

아직까지는 biNU사의 유튜브 애플리케이션을 사용하여 동영상을 시청하거나, 게임을 구동하는 것 자체가 쉽지 않지만, BiNU사의 관계자는 일반폰 상의 표준적인 브라우저를 사용하는 것보다 10배 이상의 빠른 속도와 더불어 데이터 소모량을 1/10배 이하로 줄일 수 있는 장점이 존재하는 것은 사실이라고 언급한다. 데이터 사용에 있어서 상대적으로 효율적인 방법을 제공하기 때문에, 최종사용자가 지불해야 하는 비용은 기존의 방식을 사용하여 필요한 행위를 수행하는 것보다 상당 부분 줄어들 수 있다고 언급한다.

가트너의 관계자는 본 소프트웨어가 스마트폰처럼 확산될 것인지에 대하여는 다소 회의적인 시각을 보이고 있는데, 이는 트위터나 페이스북과 같은 소셜 네트워크 측에서 자신들의 네트워크 상에서 만들어지는 제3자 기업들의 콘텐츠에 부과하는 규칙들과 연계되어 나타날 수 있을 것이라고 언급한다. 장기적으로 이와 같은 기술이 제 역할을 수행하게 될지에 대하여는 미지수이지만, 단기적인 측면에서는 상당히 흥미로운 솔루션임에는 틀림없다고 의견을 피력하고 있다.

자료를 가져가실 때에는 출처 : KISTI 미리안글로벌동향브리핑(GTB)』를 밝혀 주시기 바랍니다.

반응형
:
Posted by 째시기