“Мне это показалось увлекательным”, - говорит Гопала Ануманчипалли,
нейротехник из Калифорнийского университета в Беркли, который не принимал
участия в исследовании.
В отличие от имплантируемых устройств, которые недавно показали себя
многообещающими, новая система не требует хирургического вмешательства.
И в отличие от других внешних подходов, он создает непрерывные потоки слов
вместо того, чтобы иметь более ограниченный словарный запас.
В ходе нового исследования три человека пролежали внутри громоздкого
аппарата магнитно-резонансной томографии не менее 16 часов каждый. Они
слушали истории, в основном из подкаста Моз, в то время как функциональная
магнитно-резонансная томография выявляла изменения в кровотоке в головном
мозге. Эти изменения являются показателями мозговой активности, хотя и
медленными и несовершенными.
Располагая этими нейронными данными, специалисты по вычислительной
нейробиологии Александр Хут и Джерри Тан из Техасского университета в
Остине и их коллеги смогли сопоставить паттерны мозговой активности с
определенными словами и идеями. Подход основывался на языковой модели,
построенной с помощью GPT, одного из предшественников, который позволил
использовать сегодняшних чат-ботов с искусственным интеллектом.
Как только исследователи узнали, какие паттерны мозговой активности
соответствуют словам в историях, команда смогла работать в обратном
направлении, используя паттерны мозга для предсказания новых слов и идей.
Процесс продвигался постепенно, итеративно. Декодер оценивал вероятность
появления слов после предыдущего слова, затем использовал паттерны
мозговой активности, чтобы помочь выбрать победителя и в конечном итоге
уловить суть идеи.
“Это определенно не соответствует каждому слову”, - говорит Хут. Частота
дословных ошибок на самом деле была довольно высокой - от 92 до 94
процентов. “Но это не объясняет того, как он перефразирует вещи”, - говорит
он. “Это наводит на размышления”. Например, когда человек слышал: “У меня
еще нет водительских прав”, декодер выдавал: “Она еще даже не начала учиться
водить машину”.
Такие ответы дали понять, что дешифровщики испытывают трудности с
местоимениями, хотя исследователи не знают почему. “Он не знает, кто с кем
что делает”, - сказал Хут на брифинге для прессы 27 апреля.
Декодеры также могли приблизительно воспроизводить истории из мозга людей
в двух различных сценариях: когда люди молча рассказывали про себя
отрепетированную историю и когда они смотрели немые фильмы. Тот факт, что
эти ситуации можно было расшифровать, был захватывающим, говорит Хут,
потому что “это означало, что то, чего мы добиваемся с помощью этого
декодера, - это не низкоуровневый языковой материал”. Вместо этого: “мы
приближаемся к идее этой штуки”.
“Это исследование очень впечатляющее, и оно дает нам представление о том,
что может быть возможным в будущем”, - говорит Сара Ванделт, специалист по
вычислительной нейробиологии из Калифорнийского технологического
института, которая не принимала участия в исследовании.
Стремительный прогресс в расшифровке мозга может подстегнуть дискуссии о
неприкосновенности частной жизни, к чему исследователи обратились в новом
исследовании. “Мы знаем, что это может показаться жутким”, - говорит Хут.
“Странно, что мы можем поместить людей в сканер и считывать, о чем они
думают”.
Но команда обнаружила, что новый метод не является универсальным: каждый
декодер был достаточно персонализирован и работал только для человека,
данные мозга которого помогли его создать. Более того, человек должен был
добровольно сотрудничать с декодером, чтобы идентифицировать идеи. Если
человек не обращал внимания на аудиоисторию, декодер не мог распознать эту
историю по сигналам мозга. Участники могли помешать попыткам
подслушивания, просто проигнорировав рассказ и подумав о животных, решая
математические задачи или сосредоточившись на другой истории.
“Я рад, что эти эксперименты проводятся с целью понимания
конфиденциальности”, - говорит Ануманчипалли. “Я думаю, мы должны быть
внимательны, потому что после свершившегося факта трудно вернуться назад и
приостановить исследования”.