본문 바로가기

과학,IT,TECH

사용하는 언어에 관계없이 뇌 활동으로부터 단어를 번역하는 AI가 등장!

728x90
반응형

뇌활동으로부터 음성을 해독하는 AI를 개발! 뇌에 전극을 꽂을 필요는 없다


미래의 번역은 전부 뇌 활동의 측정만으로 이루어질 수도 있습니다.

미국의 메타 AI사에서 진행된 연구에 따르면 뇌 활동을 뇌 자장이나 뇌파를 측정해서 인간이 듣거나 말하는 음성이나 단어를 맞출 수 있는 AI를 개발했다고 합니다.

이 기술이 발전한다면 언어에 구애받지 않는 번역이 가능해집니다.

미래에는 뇌 활동으로부터 읽힌 데이터를 의미가 있는 음성으로 변환함으로써 마비 등으로 인해 언어를 통한 의사소통이 불가능해진 환자들의 말을 전달하는 수단으로써 제공하는 것도 가능해질 것입니다.

뇌 활동과 음성의 링크는 뇌와 컴퓨터를 연결하는 브레인 컴퓨터 인터페이스를 구현하는 새로운 방법으로 기대되고 있습니다.

본 연구 내용의 자세한 것은 2022년 8월 25일에 프리 프린트 서버인 'arXiv'에서 공개하고 있습니다.

요약

  • 뇌에 전극을 꽂지 않고 몸에 해가 없는 방법으로 뇌 활동을 해독하다
  • '이상한 나라의 앨리스'와 '노인과 바다'를 적용하여 AI를 테스트하다
  • 뇌에 갇힌 사람과의 의사소통도 가능해진다



뇌에 전극을 꽂지 않고 몸에 해가 없는 방법으로 뇌 활동을 해독하다


우리의 뇌는 거대한 생체 전자 기계이며, 모든 정보 처리가 뇌 속 네트워크를 연결하는 전기를 통해 이루어지고 있습니다.

인간이 언어를 말하거나 들을 때 뇌 속에서는 활발한 전기 활동이 관측됩니다.

따라서 이전부터 뇌의 활동을 측정함으로써 인간이 말하고 들은 말을 특정하려는 시도가 이루어져 왔습니다.

그러나 기존의 뇌 활동을 말로 변환하는 기술의 대부분은 뇌에 전극을 매립하는 등의 위험한 뇌외과 수술을 필요로 했습니다.

예를 들어 '마우스'라는 말을 들었을 때 발생하는 뇌파를 측정하는 경우에 뇌에 전극을 심은 경우에는 상당히 정확한 측정 데이터를 얻을 수 있습니다.

반면 뇌파나 뇌 자장 등 머리 바깥쪽의 뇌 활동을 측정하는 경우 위험한 수술은 필요 없지만 노이즈가 많아서 정확성이 떨어지는 데이터밖에 얻지를 못했습니다.

그래서 이번에 메타 AI 연구자들은 AI 기술을 이용해서 노이즈를 극복하고 몸에 부담이 없는 방법(뇌파와 뇌 자장)으로도 뇌 활동으로부터 말을 읽을 수 있는 방법을 개발하기로 했습니다.

(※ 뇌파는 뇌에 발생한 전기 활동을 측정하고 뇌 자장은 전기 활동의 발생과 동시에 형성되는 자기장을 측정했습니다. 모두 머리를 절개하지 않고 머리를 덮는 측정기로 조사할 수 있습니다.)

개발에 앞서 우선 AI에게 학습 교재를 주기 위해 피험자가 특정 음성을 들었을 때 관측된 뇌 활동을 53개 언어로부터 5만 6000시간에 걸쳐 수집했습니다.


53개 언어를 사용하여 AI에게 음성과 뇌 활동의 관계를 학습시켰다


교재가 모이자 연구자들은 AI(뉴럴 네트워크)에게 피험자가 들은 음성과 그 순간에 발생한 뇌 활동의 관계를 대응시키도록 학습을 반복하게 했습니다.

예를 들어 위 그림에서는 'once upon a taime(옛날 옛날)'이라는 음성을 들었을 때 발생하는 뇌 활동을 측정하고 뇌 활동과 음성의 관계를 대응시키는 학습이 이루어지는 과정을 보여줍니다.


뇌 활동의 패턴을 AI가 학습해 나가다


뉴럴 네트워크는 컴퓨터의 가상공간에 뇌를 본뜬 뉴런을 설치하고 학습을 반복함으로써 올바른 판단을 할 수 있는 의사적인 뇌를 만들어 냄으로써 기능합니다.

학습을 반복하는 것으로 뉴럴 넷은 우수함을 더하며, 특기 있는 분야에서는 인간을 훨씬 웃도는 판단력을 가지기도 합니다.

이번 연구에서 AI에게 요구된 것은 인간에게는 판별이 불가능한 방대한 뇌파와 뇌 자장의 데이터를 인간의 음성으로 연결시키는 어려운 일이었습니다.

AI는 이 걷잡을 수 없는 수치 데이터와 인간의 음성을 연결 지을 수 있었던 것일까요?


'이상한 나라의 앨리스'와 '노인과 바다'를 적용하여 AI를 테스트하다


단어 선정을 반복함으로써 보다 정밀도를 높여 간다


AI는 뇌 활동과 음성을 지원받았을까요?

학습 결과를 알아보기 위해 연구자들은 AI의 성능을 측정하는 테스트 문제를 만들기로 했습니다.

테스트 측정에 있어서는 169명의 피험자들에 대해서 '이상한 나라의 앨리스'나 '노인과 바다'와 같은 다양한 이야기나 문장을 듣게 해서 그때의 뇌 활동(뇌파와 뇌 자기장)을 초당 1000개소에서 측정했습니다.

이 테스트는 영어 단어의 의미를 답하는 테스트와 비슷합니다.

테스트에서 AI에게는 피험자로부터 채취한 3초간의 뇌 활동 데이터가 제시되며, 그때의 피험자가 듣던 음성(793가지 단어)을 맞히기 위해 몇 가지 후보를 내놓게 됩니다.

(※ 793 단어에는 하루에 사용되는 대부분의 단어가 포함되어 있습니다.)

테스트 결과 뇌 자장 측정 데이터를 사용했을 경우 AI가 추측한 상위 10위에 정답 음성이 포함돼 있을 확률이 73%로 판명됐습니다.

또 한 연구자는 나중에 AI가 추측해 선정한 1위가 정답과 일치할 확률이 44%에 이른다는 사실을 보고했습니다.

(※ 한편 뇌파 측정 데이터를 사용한 경우 AI가 추측한 상위 10위에 정답 음성이 포함될 가능성은 30%에 미치지 못했습니다)

이 결과는 AI가 뇌 활동을 읽고 의미 있는 음성으로 어느 정도 정확도를 가지고 변환할 수 있음을 나타냅니다.


뇌에 갇힌 사람과의 의사소통도 가능해진다


뇌에 갇힌 사람과의 의사소통도 가능해진다


이번 연구를 통해 뇌 활동을 측정함으로써 인간이 들었던 음성을 맞출 수 있는 AI를 개발하는 데 성공했습니다.

뇌 활동 측정은 몸에 손상을 주지 않는 방법으로 할 수 있기 때문에 많은 사람들이 건강위험에 신경 쓰지 않고도 실행할 수 있게 되었습니다.

또 추가 연구를 통해 학습 교재의 영역과 학습 반복도를 늘림으로써 정확도를 높일 수 있는 것으로 나타났습니다.

연구자들은 더 큰 규모의 뇌 활동과 음성 데이터가 있다면 더욱 AI를 고정밀도로 만들 수 있다고 말합니다.

뇌 활동을 직접적으로 음성으로 변환하는 기술이 있다면 입을 움직이지 않고도 문장을 써서 메일로 보내는 등의 마치 텔레파시와 같은 커뮤니케이션을 가능하게 합니다.

연구자들은 미래에는 마비 등으로 인해 뇌와 몸의 연결이 불편한 사람들이 다시금 다른 사람과의 소통하는 것이 가능해진다고 말합니다.

관련원문은 아래링크를 참고하세요.

Decoding speech from non-invasive brain recordings



https://www.stylec.co.kr/short/gSv3G9AIkB

[STYLE C] 닌텐도 스위치 라이트 본체 코럴 및 5칼라

27% OFF → 249,000원, 공유판매 시 1% 추가 적립!

stylec.onelink.me


728x90
반응형