달력

4

« 2025/4 »

  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28
  • 29
  • 30
반응형
MIT 신경학자들은 최근 연구에서 인간이 집중을 하고 있을 때 우리가 보고 있는 것을 더욱 잘 기억해내는 신경회로의 원리를 밝혀냈다. 특히, 상기 신경 회로가 신경 전달 과정에서 오랫동안 생각하는 것에 대한 기억 향상을 돕는 특정 뇌 세포의 형태에 의존한다는 것을 신경학 연구팀은 발견하였다. 뇌가 집중을 하면, 성상세포(astrocyte)라 불리는 세포들은 어떤 시각 정보에 대해서도 강하게 반응하는 시각피질의 신경에 메시지를 전달한다. “2012년 9월 마지막 주에 미국 국립과학원 회보(Proceedings of the National Academy of Sciences, PNAS)에 게재된 본 논문의 결과는 성상세포가 감각 정보 처리에 핵심적인 역할을 한다는 증거를 최초로 제시한다”고 본 논문의 상급 저자이자 MIT 폴 E. 및 릴라흐 뉴턴 신경학과 교수(Paul E. and Lilah Newton Professor)인 므리간카 서(Mriganka Sur)는 말했다.

서 교수의 연구실은 성상세포에 대해 지난 5년간 연구를 수행해 오고 있으며, 피질에 존재하는 서로 다른 형태의 세포 기능을 밝히는 연구에 오랫동안 관심을 가져왔다. “별 모양의 성상세포는 150년 전에 최초로 발견되었지만, 지금까지 그 역할에 대해서는 밝혀진 바가 없다”고 학습 및 기억을 연구하는 MIT 피코워 연구소(MIT’s Picower Institute)의 일원이자 사회적 관점에서 뇌를 연구하는 MIT의 시몬스 센터(Simons Center)장인 서 교수는 말했다. 본 연구의 주저자는 대학원생인 나이얀 첸(Naiyan Chen) 및 연구 과학자인 히로키 수기하라(Hiroki Sugihara)이다. 그 외에 연구 과학자인 지텐드라 샤르마(Jitendra Sharma), 박사 후 연구원 게르트루디스 페리(Gertrudis Perea), 제레미 페트라비츠(Jeremy Petravicz), 기술 보조원 추웅 레(Chuong Le)가 본 논문을 공동 저술하였다.

반응을 강화시키는 집중(Attention strengthens response): 연구진은 본 연구에서 특정 시각 자극에 대해 뇌가 집중할 때 성상세포가 어떻게 반응하는지에 대해 집중하였다. 인간이 어떤 대상에 대해 집중하면, 눈 뒤쪽의 뇌 깊은 곳에 위치한 신경 기저(basalis)는 아세틸콜린(acetylcholine)이라는 신경 전달물질을 뇌에 쏟아낸다. 이러한 아세틸콜린의 일부는 시각피질의 성상세포에 전달된다. 성상세포가 본 자극에 어떻게 반응하는지를 밝히기 위해, 연구진은 서로 다른 방향을 가지는 평행한 선으로 구성된 일부 시각 패턴을 쥐에게 보여주면서 시각피질에 어떤 일이 발생하는지를 측정하였다. 하나의 시각 패턴에 대해, 연구진은 신경 기저가 동시에 아세틸콜린을 방출하도록 유도하였다. 본 과정은 성상세포 내에 칼슘의 농도를 급격히 증가시켰고, 이것은 뇌의 활동성이 높아지는 것을 의미한다.

쥐들에게 몇 분 후 같은 자극을 가하자, 다른 패턴에 비해 이전에 보았던 패턴을 보여주었을 때 시각 피질의 신경에서 더 강한 아세틸콜린 반응이 감지되었다. 그런 다음, 연구진은 성상세포가 작동하지 않도록 유전자 조작된 쥐들을 이용하여 동일한 실험을 반복하였다. 실험 결과, 신경 기저에 의한 시각 자극에 따른 신경 반응이 강하지 않다는 결과를 연구진은 얻었다. “만약 당신이 어떤 대상에 대해 집중하면, 아세틸콜린이 다량 방출될 것이고, 본 자극에 대해 장기간 기억할 수 있다. 하지만, 성상세포를 제거하면 본 현상은 나타나지 않는다”고 서 교수는 말했다.

선택된 반응에 대해 초기 활동성 수치 정도의 반응으로 신경이 돌아가는 데는 몇 십 분이 소요되었고, 그 동안 기억은 뇌에 강하게 남아 있게 된다. “본 연구는 지금까지 나온 어떤 결과보다 성상세포의 역할을 직접적으로 보여주며, 가소성에 대한 성상세포의 결정적인 역할을 보여준다. 다시 말해, 본 연구는 성상세포의 역할을 아주 명명백백하게 보여주고 있다”고 본 연구에 참여하지 않은 캘리포니아 대학교 신경학과 명예 교수인 마이클 메르제니치(Michael Merzenich)는 말했다.

뇌 기능 장애에 대한 중추 역할(‘Major players in brain disorders’):알츠하이머 병을 앓고 있는 환자들의 뇌에 아세틸콜린 수치가 낮다는 것은 이미 알려진 사실이다. 사실, 알츠하이머 환자들의 기억력을 향상시키기 위해 일반적으로 이용하는 치료법은 아세틸콜린 농도 저하를 막는 약을 처방하는 것이다. 연구진은 향후, 알츠하이머 병을 앓고 있는 쥐를 대상으로 성상세포의 역할을 연구할 계획이다. 서 교수의 연구실은 신경 억제 상황의 신경 기저 자극 효과에 대해서도 연구 중이다. 본 효과는 단기간에 일어나거나 불과 몇 초 동안 지속될 것이라 생각해 왔다. “성상세포와 같은 신경 억제 세포 형태가 뇌 기능 장애에 핵심적인 역할을 할 것이라고 아무도 예측하지 못하였듯이, 뇌의 피질층 기능에 대한 기본 메커니즘을 이해하지 않고서는 뇌 기능 장애를 이해할 수 없다”고 서 교수는 말했다. 본 연구는 미국 국립보건원(NIH) 및 시몬스 기금(Simons Foundation)의 지원으로 수행되었다.

1. 출처: MIT news(Sep. 27, 2012)
2.그림설명: 인간 성상세포. (출처: 위키피디아/브루노 파스칼)
자료를 가져가실 때에는 출처 : KISTI 미리안 글로벌동향브리핑(GTB)』를 밝혀 주시기 바랍니다.


반응형
:
Posted by 째시기
반응형

보안 연구자들은 저렴한 이모티브(Emotiv) 헤드셋을 사용하여 자극에 대한 사용자들의 잠재적인 반응을 캡처하고 있다. 그리고 두뇌로부터 나온 데이터를 통해서 직접 비밀을 알아내는데 사용되고 있다. 이것은 프라이버시와 보안이라는 점에서 이론적으로 위험한 것이다. 왜냐하면 이것이 기술의 더 큰 발전과 함께 중요한 역할을 할 것이기 때문이다.

해커들이 마음을 읽어서 은행계좌 정보와 PIN 코드를 액세스할 수 있을까? 그것은 쉬운 일은 아니지만 컴퓨터 과학자들이 299달러에 달하는 Emotiv의 Epoc와 같은 무선 EEG 헤드셋을 사용한다면 이론적으로 가능하다는 것을 알게 되었다. 이것은 아직 대량으로 생산되는 기기는 아니지만 게임을 즐기거나 휠체어와 같은 기기를 제어하기 위해서 헤드셋을 사용하는 사람들은 자신들의 뇌를 해킹당할 수 있게 될지도 모른다.

Oxford 대학의 Ivan Martinovic은 이번 달 초 시애틀에서 열린 Usenix 보안 심포지엄에서 자신이 연구하고 있는 이 아이디어에 대하여 발표하였다. 연구팀에는 Berkeley의 California대학과 Geneva 대학이 함께 참여하였으며, ‘뇌-컴퓨터 인터페이스에 대한 부채널 공격의 가능성(On the Feasibility of Side-Channel Attacks with Brain-Computer Interface)’이라는 논문이 발표되었다.

연구의 한 가지 목표는 EEG 헤드셋이 개인정보보호에 위협이 되는지를 검토하는 것이다. 이와 같이 유용한 헤드셋이 많이 있지만, 그들은 Emotiv 기기를 사용하였다. 이것은 저가이며, 회사는 연구자들에게 유용한 API를 만들어주고, 개발자들을 위한 SDK(software development kit)를 가지고 있기 때문이다.

연구자들이 수십년 동안 뇌전도(electro-encephalogram)를 연구해온 의학 분야 외에, EEG 헤드셋은 게임과 애플리케이션 제어를 위해 가장 많이 사용되고 있다. 예를 들어, 어떤 사람은 Arena 게임에서 가상의 불덩이를 던지기 위해서 뇌파를 사용할 수 있으며, 실제 장난감 헬리콥터를 제어하기 위해서 사용할 수도 있다. 일반적으로 제어 과정은 한 번에 하나의 명령만을 마스터링하며, 윙크나 웃음과 같은 얼굴 표현이 사용될 수 있다.

이 외에도 두뇌는 외부자극에 자연스럽게 반응하게 된다. 가장 유용한 것 중 하나는 사용자가 관련된 무언가를 인식한 뒤에 약 30ms에 최고조에 이르는 P300 인식 응답이다. 연구팀이 개발한 인식 모델은 그들이 알지 못하는 테스트 주제 사진을 보여주면서 그들이 알고 있는 오바마의 얼굴을 보여주도록 하는 것이다.

그리고 나서 알지 못하는 데이터를 감지하도록 노력할 수 있다. 예를 들어, 집에 관한 테스트 주제와 사진을 갖게 된다면 그들이 사진을 보고 인식 응답을 찾아서 누가 살고 있는지를 알아내게 될 것이다. 연구팀은 주어진 시간의 60% 정도 내에서 집을 정확히 찾을 수 있었다.

신용카드, PIN과 관련된 사람의 영상을 보여줌으로써 해커는 개인 은행계좌 정보를 발견할 수 있게 될지도 모른다. 연구자들은 이러한 것을 했다고 주장하지 않았다. 그러나 Martinovic은 완전한 무작위 추측보다 실질적으로 더 잘 실행하고 있으며 더 세밀한 공격을 조사하고 있다고 심포지엄에서 말했다.

또한 이 시스템은 시장 연구 또는 질문 목적을 위해서 사용될 수 있다. 예를 들어 살인 장면 또는 강간 희생자들의 사진을 가지고 용의자를 테스트할 수 있는 것이다.

Martinovic은 “우리는 잠재의식 반응에 관심이 있다. 만약 당신이 거짓말을 하려고 한다면, 더 많은 주의를 필요로 할 것이다. 그리고 이것은 감지할 수 있는 더 좋은 신호들을 만들어낼 것”이라고 말했다.

뇌파는 추적하기에 매우 복잡하며, 잡음들로부터 신호를 추출하기 위해서 해야 할 많은 선처리작업이 요구된다. 또한 Emotiv와 같은 EEG 헤드셋은 P300 신호를 캡처하는데 적합하지 않다. 그러나 언젠가 두뇌 해커들은 얼굴과 두뇌 스캐닝의 결합에 의한 공동작업 없이도 유용한 신호를 갖게 될 것이다. 그렇게 된다면 실제로 개인정보보호에 대한 큰 위협으로 작용하게 될 것이다.

자료를 가져가실 때에는 출처 : KISTI 미리안글로벌동향브리핑(GTB)』를 밝혀 주시기 바랍니다.


반응형
:
Posted by 째시기
반응형

자동화된 스피치 인식을 새로운 양상으로 바꿀 수 있도록 하는 사전학습에 의하여 규정된 표준이 없이도 특정 언어를 인식할 수 있도록 하는 새로운 기술이 개발되어 선보였다. 현재의 컴퓨터 기술로 키보드가 아닌 음성만으로 명령수행이 가능한 시스템을 작동하여 수행하기 위해서는 거의 하루 이상의 시간이 소요될 수도 있을 것이다.

모바일폰을 통한 말에 의한 검색은 이미 대다수의 사람들에게 일상적인 부분인데, 이번에 개발된 기술은 인터넷을 통하여 특정 오디오 파일이나 영화 동영상 파일 등을 검색할 때 유용한 것으로 전해지지만, 상당한 수준의 스피치 인식을 달성하는 상당히 어려운 작업이다. 구어체는 일상적인 문어체와는 여러 측면에서 차이가 있고 개인별로 나타나는 편차 또한 큰 것이 사실이기 때문이다.

노르웨이 소재 VERDIKT ICT의 핵심역량과 가치창출에 관한 프로그램의 후원으로 노르웨이 과학기술대학의 일련의 연구진이 개발한 이번의 방법은 매우 혁신적인 방법으로, 차세대 음성인식 기술을 새로이 개발한 것으로 평가받고 있다. 노르웨이 연구팀은 전 세계에는 수많은 언어가 존재하지만 언어패턴이 발생하는 방법에 있어서는 근본적인 공통점이 있다는 것을 증명하였는데, 이와 같은 방법을 통하여 특정 머신들에 대하여 각각의 개별언어들에 대한 음성 데이터들을 제공하지 않으면서 다양한 언어에 적용 가능한 방법을 개발하여 선보인 것으로 전문가들은 해석하고 있다.

연구팀은 자신들의 기술 개발을 위한 접근방법에 있어서 음성학에 기반을 두고 수행하였는데, 다시 말하자면 인간 언어 사운드에 대한 광범위한 연구 자료들을 바탕으로 작업들을 수행한 것으로 전해진다. 연구진은 추가적인 스피치와 언어 관련 지식들을 시스템에 통합시켰는데, 예를 들어 사운드 주파수와 단어들 간의 상관관계와 단어들이 문장에서 어떤 식으로 조합되는지에 관한 부분들을 총체적으로 포함하고 있는 것으로 전해진다.

Svendsen 박사외 연구진이 개발한 본 방법에는 언어 기관의 어떠한 부분들이 마이크로폰이 캡처할 수 있는 음파의 압력에 대한 분석을 통하여 수행할 수 있는지도 포함하고 있는 것으로 전해진다. 현재까지는 언어 인식 시스템에 대한 두 가지 접근방법들이 가장 우세한 것으로 전해지고 있다. 한 가지 접근방법은 컴퓨터로 하여금 개별적인 사항을 기반으로 서로 다른 언어들을 인식시키도록 만드는 스피치 데이터와 소스 텍스트의 사용에 주로 기반을 두고 있는 것으로 전해진다.

또 다른 접근방법은 개별 사용자의 단어들과 사운드를 관찰하여 컴퓨터에 입력될 수 있는 일련의 규칙들을 유추하는 방식을 취하도록 하는 것인데, 예를 들어 보컬 코드에 있어서 사운드의 생산 동안 진동이 일어나는지의 여부와 더불어 해당 사운드가 어떤 식으로 전달될 수 있는 지까지 포함하여 사용자에게 제공되도록 만드는 것을 의미하고 있다.

연구진은 작은 언어 세그먼트를 분석하면서 특정 사운드가 약 750에서 1200헤르츠의 공명을 가지고 움직이게 되면, 이것이 "a"라는 문자를 포함하는 것이라고 제시하고 있으며, 350에서 800헤르츠로 범주가 나타나게 되면, `u`자를 의미하는 것이라고 언급한다. 또 다른 접근방법은 컴퓨터로 하여금 상당한 분량의 자료들을 입력하여 지속적인 트레이닝 효과를 거둘 수 있도록 지원하는 것이라고 연구진은 제시한다.

본질적으로, 컴퓨터라는 기계는 모든 사운드 자체를 동일한 것으로 인지하게 되는데, 데이터 드리븐 학습이 지속되면, 보다 높은 주파수가 발생하게 되면서 보다 적은 확률적인 부분으로 연결되어 제공되는 것이라고 연구진은 설명한다. 이와 같은 유형의 접근방법은 연구진이 인간 사용자 기반의 접근방법을 사용하는 것보다 더 많은 스피치 데이터를 처리할 수 있도록 만드는데, 일반적으로 인간 사용자가 취급할 수 있는 데이터의 분량에는 한계가 있기 때문인 것으로 여겨진다.

연구진은 이와 같은 접근방법에 대한 고찰을 통하여 통계적인 접근방법을 통한 어떠한 선택적인 방법이 유리한지에 대해 확신할 수 있었던 것으로 파악되고 있다. 현실 속의 언어에 존재하는 일련의 예측성 패턴에 대한 고려를 통하여 연구진은 시스템에 관련된 정보들을 포함하면서 데이터 드리븐 학습과 규칙 기반의 접근방법을 혼합시킬 수 있었던 것으로 여겨지고 있다.

일상적인 언어패턴들은 개인들의 심리, 방언, 교육수준, 건강상태에 따라 다양하게 나타나게 되는데, 이와 같은 모든 부분들이 종합되어 음성과 문장구조의 생성에 영향을 미치게 된다. 기계 자체가 언어를 이해하는 방식을 학습할 수 있도록 만들기 위해서는 일상적인 스피치와 언어에 있어서 가장 공통적으로 나타날 수 있는 변이체계에 대한 구분이 필요한 것으로 전해진다.

연구진은 현재 음성 생성에 있어서 존재하거나 부재하는 고유한 특성들이 무엇이고, 이에 대한 확률들을 결정지을 수 있는 요소가 무엇인지에 대한 컴퓨터 프로그램을 개발하고 있는데, 예를 들어 보컬 코드 진동이 발생하게 되면, 어떤 음성이 필요한지를 종합적으로 분석하게 된다. 이를 통하여 음성 자체를 분류할 수 있는 기준들을 만들 수 있었다고 제시한다.

노르웨이 연구진이 향후에 추진하여야 할 다음 단계의 노력은 경쟁력 있는 음성 인식 제품을 설계하는데 있어서 사용 가능한 특정 언어에 대한 독립적인 모듈 자체를 개발하는 것이다. 본 솔루션은 시간과 비용이라는 관점에서 상당한 절감이 가능할 것으로 여겨지는 중요한 기술로, 노르웨이어와 같은 소수어를 사용하는 사용자들에게도 커다란 이익이 될 것으로 기대된다고 말한다.

제품 개발을 통한 또 다른 부산물로 이와 같은 유형의 기술들은 다양한 언어들이 사용되는 문맥 자체에 있어서 갖가지 우수한 효과를 가질 수 있을 것으로 기대되는데, 특정 언어를 인식하는데 있어서 30초에서 60초만에 이를 수행할 수 있도록 지원할 수 있을 것으로 기대되어, 특정언어에서 언급된 프레젠테이션이 다른 프레젠테이션에서 인용될 때 이를 어떻게 연결시킬 수 있는지도 지원할 수 있을 것으로 기대된다. 특정 개인이 말하는 것을 신속하게 인지할 수 있는 연구로서 노르웨이 연구진의 연구는 가치가 있을 것으로 기대된다.

자료를 가져가실 때에는 출처 : KISTI 미리안글로벌동향브리핑(GTB)』를 밝혀 주시기 바랍니다.

반응형
:
Posted by 째시기